Hadoop文件系统如何快速安装？

renzhixin

2010-06-04

本节向大家介绍一下Hadoop文件系统的快速安装与使用，希望通过本节的介绍大家能够掌握Hadoop文件系统安装与使用方法，欢迎大家一起来学习。

Hadoop文件系统（HDFS）快速安装与使用技术文档

准备3台机器，一台作为Namenode，命名为master，两台作为dataNode，命名为slave01,slave02
在3台机器上都设置hadoop用户。

设置hadoop用户从master到slavessh不需要密码，设置方法参见“设置SSH服务器只采用密钥认证”一文。
注意：
（1）authorized_keys文件的访问权限应该设置为644，否则可能导致无密码登录失败。
（2）从master到master登录也需要配置无密码登录，否则会导致Namenode启动失败
下载并安装JDK，并在/etc/profile配置相应的环境变量，比如
JAVA_HOME=/usr/java/jdk1.6.0_18
CLASSPATH=.:$JAVA_HOME/lib
PATH=$JAVA_HOME/bin:$PATH
exportJAVA_HOMECLASSPATHPATH
在三台机器上创建相同的目录路径，为HDFS运行准备环境，比如在/data目录下创建hadoop目录，将其属主改成hadoop，然后在下面如下创建4个目录：
install：Hadoop源码解压后，放在该目录下
name：HDFS的名字节点存放目录
data01,data02：HDFS的数据存放目录，当然也可以是一个。
tmp：临时空间
注意：name目录只存放在master上，且权限为755，否则会导致后面的格式化失败。

编辑Hadoop文件系统HDFS配置文件，所有节点都要保持一致，共有四个：
core-site.xml:核心配置
hdfs-site.xml：站点多项参数配置
masters：主节点，在HDFS中就是Namenode的名称
slaves：数据节点（Datanode）名称

各个配置文件举例
核心配置：core-site.xml
<configuration>
<property>
<name>fs.default.name</name>
<value>hdfs://master:9000</value>
</property>
</configuration>

站点节点配置：hdfs-site.xml

<configuration> 



<property> 




<name>dfs.replication</name> 




<value>2</value> 




</property> 




<property> 




<name>dfs.name.dir</name> 




<value>/data/hadoop/name</value> 




</property> 




<property> 




<name>dfs.data.dir</name> 




<value>/data/hadoop/data01,/data/hadoop/data02</value> 




</property> 




<property> 




<name>dfs.tmp.dir</name> 




<value>/data/hadoop/tmp</value> 




</property> 




</configuration>

主节点名称：masters
master

数据节点名称：slaves
master
slave01
slave02
注意：(1)如需要，可以在hadoop-env.sh中配置JAVA_HOME变量，比如：
exportJAVA_HOME=/usr/java/jdk1.6.0_18

(2)保证Hadoop文件系统各个节点上配置文件的一致性。
初始化namenode节点
登录到namenode上，cd/data/hadoop/install/bin，然后格式化Image文件的存储空间：
./hadoopnamenode-format
如果出错，就查看/data/hadoop/install/logs下的日志文件。

启动HDFS服务
在/data/hadoop/install/bin下有很多命令，
*start-all.sh启动所有的Hadoop守护，包括namenode,datanode，jobtracker，tasktrack，secondarynamenode。
*stop-all.sh停止所有的Hadoop。
*start-mapred.sh启动Map/Reduce守护，包括Jobtracker和Tasktrack。
*stop-mapred.sh停止Map/Reduce守护
*start-dfs.sh启动HadoopDFS守护，Namenode和Datanode。
*stop-dfs.sh停止DFS守护

hadoop hdfs

安科网

Hadoop文件系统如何快速安装？

renzhixin

renzhixin

相关推荐

hadoop伪分布式环境搭建

hadoop框架三大组件hdfs、mapreduce、yarn 内容

hdfs、hive、hbase的搭建总结

hadoop集群的启动与停止

hadoop创建目录

[AWS][大数据][Hadoop] 使用EMR做大数据分析

Hadoop

大数据期末复习重点

Hadoop之hadoop fs和hdfs dfs、hdfs fs三者区别

hadoop两个namenode都是standby问题

Hadoop之HDFS入门实战

hadoop 数据处理总结

Hadoop简介

hadoop hdfs csv导入hive表

Hadoop3.2.0集群搭建常见注意事项

为什么Java仍将是未来的主流语言？

_服役新节点，退役旧节点，多目录配置。+_HDFS2.x的新特性

Hadoop（一）安装

第四周练习

Hadoop小练习

renzhixin