对集群进行集中管理

李春春

2018-08-21

一、目前存在的问题

在阅读这篇文章之前，你应该先阅读：简单认识namenode和datanode.

在之前，我们启动Hadoop集群的时候，首先是启动namenode，然后启动datanode. 注意：我们之前的做法是手动的将启动datanode的命令发送给所有的datanode，显然如果在集群很庞大的时候，这种做法是不合适的.我们希望通过start-dfs.sh的方式启动所有的节点.那么我们就需要配置namenode机器上面的slaves文件，这个文件管理着这个namenode下面所有的datanode.这个文件的位于：${hadoop_home}/etc/hadoop,其中${hadoop_home}是Hadoop的安装目录.

二、配置namenode机器上slaves文件

1. 运行cd /usr/local/hadoop/hadoop-2.7.3/etc/hadoop 进入到slaves文件所在的目录

对集群进行集中管理

2. 运行 vim slaves命令，添加slave机器名称, 保存并退出。

对集群进行集中管理

三、配置免密SSH远程登陆

1. 在namenode机器上面，进入/root/.ssh目录下面，运行命令: ssh-keygen -t rsa

对集群进行集中管理

2. 将namenode机器上面的公钥copy到npfdev1(本机),npfdev2,npfdev3,npfdev4上面.

运行如下命令：

ssh-copy-id npfdev1

ssh-copy-id npfdev2

ssh-copy-id npfdev3

ssh-copy-id npfdev4

四、在namenode机器上运行start-dfs.sh启动集群

1. 启动完成之后，查看：

注意：start-dfs.sh会默认启动secondarynamenode

对集群进行集中管理

五、在namenode机器上运行stop-dfs.sh启动集群

1. 停止完成之后，查看：

对集群进行集中管理

六、启动和关闭Hadoop集群命令步骤总结：

1. 修改master上/etc/hadoop/slaves文件，每一个slave占一行.

2. 配置免密SSH远程登陆.

3. start-dfs.sh启动集群.

4. stop-dfs.sh停止集群.

注意：如果你出现类似的错误，

对集群进行集中管理

解决方法是在hadoop-env.sh和yarn-env.sh中添加如下两行：

export HADOOP_COMMON_LIB_NATIVE_DIR=${HADOOP_PREFIX}/lib/native
export HADOOP_OPTS="-Djava.library.path=$HADOOP_PREFIX/lib"

参考文献：

1. Hadoop 2.2.0集群安装

font-size font hadoop

安科网

对集群进行集中管理

李春春

一、目前存在的问题

二、配置namenode机器上slaves文件

三、配置免密SSH远程登陆

四、在namenode机器上运行start-dfs.sh启动集群

五、在namenode机器上运行stop-dfs.sh启动集群

六、启动和关闭Hadoop集群命令步骤总结：

李春春

相关推荐

Linux解压文件

VS Code + PlantUML实现跨平台设计

让数据处理更简单？百度EasyData推出首个高级智能数据清洗功能

css常用的简写技巧_css background简写、css border 简写、css font属性简写等

数据科学家、开发者的新神器 Amazon SageMaker正式上线中国区

虹软开放平台算法上新助力全面拓展人脸识别细分化场景

代码（移动端rem初始化设置1rem=15px）

十大常见的Linux邮件客户端

2020年机器学习领域的五个潮流

什么是真正的架构设计？十年Java经验让我总结出了这些，不愧是我

使用Eclipse在Fedora上进行 PHP 开发

12个提高JavaScript技能的概念

一篇带给你Linux磁盘管理和Shell编程

Linux环境变量配置全攻略

Golang GinWeb框架-快速入门/参数解析

秒杀系统挂了，凌晨1点紧急救场！

16个你可能不知道的JavaScript调试技巧

技术｜轻量级人脸检测算法实现大盘点

13张IT架构图！从数字化转型，到数据架构

一篇文章教会你理解Scrapy网络爬虫框架的工作原理和数据采集过程

李春春