配置Hadoop1.2.1

1.从Apache官网上下载1.2.1,地址:http://apache.dataguru.cn/Hadoop/common/hadoop-1.2.1/hadoop-1.2.1-bin.tar.gz
 2.拷贝文件到虚拟机下(vm9下直接拖拽就可以)
 3.到Hadoop的目录下的conf找到hadoop-env.sh,找到这行:# export JAVA_HOME=/usr/lib/j2sdk1.5-sun,解注并改成JAVA正确的路径
 4.修改core-site.xml。默认只有<configuration></configuration>,需要修改成为:
 <configuration>
 <property>
 <name>fs.default.name</name>
 <value>hdfs://master:9000</value>
 </property>
 <property>
 <name>hadoop.tmp.dir</name>
 <value>/home/master/hadoop-1.2.1/tmp</value>
 </property>
 </configuration>
 注:要在hadoop下新建tmp文件夹,用于存放临时文件,如果不设置,hadoop默认成/tmp文件夹,这样重启后hadoop就会报错
 5.修改hdfs-site.xml.默认只有<configuration></configuration>,需要修改成为:
 <configuration>
 <property>
 <name>dfs.replication</name>
 <value>2</value>
 </property>
 </configuration>
 
6.修改mapred-site.xml.默认只有<configuration></configuration>,需要修改成为:
 <configuration>
 <property>
 <name>mapred.job.tracker</name>
 <value>master:9001</value>
 </property>
 </configuration>
 
7.修改masters,改成master(主机名)
 
8.修改slaves,改成slave1(主机名)
 
9.切换到root用户下,修改/etc/hosts文件,增加master和slave1的IP
 192.168.37.1    master
 192.168.37.2    slave1
 
10.配置完成之后,ping master和ping slave1
 
11.把master节点下配置好的hadoop复制到slave1节点下:scp -r ./hadoop-1.2.1 slave1@slave1:/home/slave1
 
12.修改slave1节点下的/etc/hosts文件和master节点一致
 192.168.37.1    master
 192.168.37.2    slave1
 
13.格式化名称节点,即master节点,切换到hadoop目录,执行命令:bin/hadoop namenode -format
 
14.在正式启动hadoop之前,要把自己的公匙放到authorized_keys,这样自动连自己才会不用输入密码。方法是:
 cat id_rsa.pub 然后把里面的内容复制出来,vi authorized_keys 把内容粘到里面,保存;两台机器都一样的做法。
 
15.改完之后,ssh master,看看是否还需要密码
 
16.如果之前已经运行过启动hadoop,但因为14没有做,需要把hadoop的进程杀掉,方法:进行JAVA主目录,
 运行./bin/jps命令,看有哪些hadoop的进程在运行,然后用kill -9 11133把屏幕显示的进程杀掉,这样才能顺利的启动。
 
17.最后启动:bin/start-all.sh
 
18.检查hadoop是否安装成功:在JDK目录下运行-bin/jps,出现
 11002 SecondaryNameNode
 10832 NameNode
 11076 JobTracker
 11237 Jps
 说明安装成功

--------------------------------------分割线 --------------------------------------

--------------------------------------分割线 --------------------------------------

相关推荐