配置Hadoop1.2.1

小李子栏

2014-06-09

1.从Apache官网上下载1.2.1，地址：http://apache.dataguru.cn/Hadoop/common/hadoop-1.2.1/hadoop-1.2.1-bin.tar.gz
2.拷贝文件到虚拟机下（vm9下直接拖拽就可以）
3.到Hadoop的目录下的conf找到hadoop-env.sh，找到这行：# export JAVA_HOME=/usr/lib/j2sdk1.5-sun，解注并改成JAVA正确的路径
4.修改core-site.xml。默认只有<configuration></configuration>，需要修改成为：
<configuration>
<property>
<name>fs.default.name</name>
<value>hdfs://master:9000</value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/home/master/hadoop-1.2.1/tmp</value>
</property>
</configuration>
注：要在hadoop下新建tmp文件夹，用于存放临时文件，如果不设置，hadoop默认成/tmp文件夹，这样重启后hadoop就会报错
5.修改hdfs-site.xml.默认只有<configuration></configuration>，需要修改成为：
<configuration>
<property>
<name>dfs.replication</name>
<value>2</value>
</property>
</configuration>

6.修改mapred-site.xml.默认只有<configuration></configuration>，需要修改成为：
<configuration>
<property>
<name>mapred.job.tracker</name>
<value>master:9001</value>
</property>
</configuration>

7.修改masters，改成master(主机名)

8.修改slaves，改成slave1(主机名)

9.切换到root用户下，修改/etc/hosts文件，增加master和slave1的IP
192.168.37.1 master
192.168.37.2 slave1

10.配置完成之后，ping master和ping slave1

11.把master节点下配置好的hadoop复制到slave1节点下：scp -r ./hadoop-1.2.1 slave1@slave1:/home/slave1

12.修改slave1节点下的/etc/hosts文件和master节点一致
192.168.37.1 master
192.168.37.2 slave1

13.格式化名称节点，即master节点，切换到hadoop目录，执行命令：bin/hadoop namenode -format

14.在正式启动hadoop之前，要把自己的公匙放到authorized_keys，这样自动连自己才会不用输入密码。方法是：
cat id_rsa.pub 然后把里面的内容复制出来，vi authorized_keys 把内容粘到里面，保存；两台机器都一样的做法。

15.改完之后，ssh master，看看是否还需要密码

16.如果之前已经运行过启动hadoop，但因为14没有做，需要把hadoop的进程杀掉，方法：进行JAVA主目录，
运行./bin/jps命令，看有哪些hadoop的进程在运行，然后用kill -9 11133把屏幕显示的进程杀掉，这样才能顺利的启动。

17.最后启动：bin/start-all.sh

18.检查hadoop是否安装成功：在JDK目录下运行-bin/jps，出现
11002 SecondaryNameNode
10832 NameNode
11076 JobTracker
11237 Jps
说明安装成功

--------------------------------------分割线 --------------------------------------

hadoop

安科网

配置Hadoop1.2.1

小李子栏

小李子栏

相关推荐

Hadoop3.2.0集群搭建常见注意事项

为什么Java仍将是未来的主流语言？

hadoop伪分布式环境搭建

_服役新节点，退役旧节点，多目录配置。+_HDFS2.x的新特性

Hadoop（一）安装

第四周练习

Hadoop小练习

hadoop框架三大组件hdfs、mapreduce、yarn 内容

Hadoop基础（三十三）：Zookeeper 分布式安装部署

Hadoop基础（二十二）：Shuffle机制（三）

hdfs、hive、hbase的搭建总结

NameNode和Zookeeper的format作用

hadoop集群的启动与停止

JStorm介绍

Hadoop2.7.7 centos7 完全分布式配置与问题随记

Hadoop Yarn工作机制 Job提交流程

【赵强老师】大数据工作流引擎Oozie

Hadoop

入门大数据---Spark开发环境搭建

hadoop创建目录

小李子栏