分布式Hadoop1.2.1集群的安装
安装其实很简单,把下载下来的Hadoop文件拷贝到相应的目录下,然后接压缩即可,关键是先要安装好JDK,前期的Linux要配置好。
--------------------------------------分割线 --------------------------------------
--------------------------------------分割线 --------------------------------------
下面我把我的操作过程记录如下,供大家参考:
登录到HadoopSrv01机器上,进行如下操作:
1: su - grid
2: tar -xvf hadoop-1.2.1-bin.tar.gz
3: 解压缩后,会在/home/grid目录下 增加一个hadoop-1.2.1 目录
4: cd hadoop-1.2.1 创建tmp目录 mkdir tmp
5: cd conf目录,对hadoop-env.sh, core-site.xml, hdfs-site.xml,mapred-site.xml ,masters,slaves文件进行配置
6:修改hadoop-env.sh 文件,只需要设置 export JAVA_HOME=/usr/java/jdk1.8.0 即可,其他不需要修改。
7:修改core-site.xml 文件,增加以下内容
<property>
<name>fs.default.name</name>
<value>hdfs://HadoopSrv01:9000</value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/home/grid/hadoop-1.2.1/tmp</value>
</property>
8:修改hdfs-site.xml,根据你自己的datanode节点数,设置复制因子。
<property>
<name>dfs.replication</name>
<value>2</value>
</property>
9:修改mapred-site.xml文件
<property>
<name>mapred.job.tracker</name>
<value>HadoopSrv01:9001</value>
</property>
10:修改masters,slaves 增加namenode,datanode节点配置。
masters:
HadoopSrv01
slaves:
HadoopSrv02
HadoopSrv03
以上操作完毕后,就可以对Hadoop集群进行格式化,格式化的命令如下:
11: bin/hadoop namenode -format 记得要看清楚是否格式化成功
12:启动集群 bin/start-all.sh
13:检查各个节点 后台进程是否OK /usr/java/jdk1.8.0/bin/jps 正常应该包括以下后台进程:
NameNode,JobTracker,DataNode,TaskTracker
如果以上都能看到,就说明Hadoop分布式环境已经搭建OK。