Hadoop集群的快速部署

我的集群部署在局域网内部,与外网隔离开来。这个主要处于安全性考虑,在公网使用一段时间linux,你用sudocat/var/log/secure查看安全日志会发现,每天都有一大堆居心不良的人在试探你的sshd服务。当然这个可以通过配置sshd来避免,不过还是谨慎为妙。

闲话少说,步入正题。我的网络结构是这样的:我的机器通过多IP配置与集群在一个网段,也可以在另一个网段通过拨号上网。我机器的操作系统是Fedora13,集群上的机器是CentOS。

我快速部署的思路是这样的:在我的机器上下载cloudera.com上的hadoop安装包,然后在自己的机器上配置一个yum源,集群通过yum来批量升级和安装hadoop。

第一步,下载安装包和相关文件。

其实cloudera就有一个yum源,查看一下http://archive.cloudera.com/redhat/cdh/3/,yum源的结构就很清晰了。

wget-mchttp://archive.cloudera.com/redhat/cdh/3/

在当前文件夹下就有一个archive.cloudera.com的文件夹。

第二步,配置本地源。

mkdir/var/www/html/cloudera-hadoop

cp-rarchive.cloudera.com/redhat/cdh/3/var/www/html/cloudera-hadoop

这里是将对应的安装包和文件考到web目录下。

注意这里需要使用的httpd服务,没开启服务的话,使用servicehttpdstart开启,没有apache软件的话,使用sudoyuminstallapache安装。

然后自己做一个repo文件:

vicloudera-hadoop.repo

内容:

[cloudera-cdh3]

name=Cloudera'sDistributionforHadoop,Version3

baseurl=http://192.168.0.240/cloudera-hadoop/3/

gpgcheck=0

192.168.0.240是我机器在集群网段的IP。

第三步,集群yum配置。

将cloudera-hadoop.repo拷到集群机器的/etc/yum.repos.d/目录下。

然后在集群机器上更新yum:sudoyumupdateyum

在列表中看到hadoop的rpm包就差不多了。

接着,yuminstallhadoop-0.20//安装hadoop主文件

yuminstallhadoop-0.20-<daemontype>//安装hadoop相关配置

sudoyuminstall<CDH3-component-name>//安装hadoop相关组件

这里可以参考cloudera官网的有关说明:

https://docs.cloudera.com/display/DOC/CDH3+Installation

除了主节点外,其他节点配置相同可以用集群管理命令psh批量安装。