HadoopOnDemand配置项详解
本节向大家介绍一下HadoopOnDemand配置方面的内容,主要介绍一些中HadoopOnDemand常用的配置项,相信通过本节的介绍大家对HadoopOnDemand的配置有新的认识,让我们一起来学习吧。
3.4HadoopOnDemand中ringmaster的配置项
work-dirs:这是一个由逗号分隔的路径列表,这些路径将作为HOD产生和传递给Hadoop,用于存放DFS和Map/Reduce数据的目录的根目录。例如,这是DFS数据块存放的路径。一般情况下,有多少块磁盘就指定多少路径,以确保所有的磁盘都被利用到。temp-dir变量的限制和注意事项在这儿同样适用。
max-master-failures:hadoop主守护进启动前可以失败的次数,超出这个次数后,HOD会让这次集群分配失败。在HOD集群中,有时候由于某些问题,比如机器没安装java,没有安装Hadoop,或者Hadoop版本错误等,会存在一个或几个“坏”节点。当这个配置项被设为正整数时,只有当hadoopmatser(JobTracker或者NameNode)在上述的坏节点上,由于上面提到的种种原因启动失败的次数超过设定的值时,RingMaster才会把错误返回给客户端。如果尝试启动的次数没有超过设定值,当下一个HodRing请求运行一个命令时,同一个hadoopmaster会指定给这个HodRing。这样,即使集群中存在一些坏的节点,HOD也会尽全力使这次分配成功。
3.5HadoopOnDemand中gridservice-hdfs的配置项
external:如果被置为false,HOD必须在通过allocate命令分配的节点上自己创建HDFS集群。注意,在这种情况下,如果集群被回收,HDFS集群会停止,所有数据会丢失。如果被置为true,它会尝试链接外部的已配置的HDFS系统。通常,因为在作业运行之前作业的输入需要被放置在HDFS上,并且作业的输出需要持久保留,在生产环境中一个内部的HDFS集群意义不大。
host:外部配置好的NameNode的主机名。
fs_port:NameNodeRPC服务绑定的端口。
info_port:NameNodewebUI服务绑定的端口。
pkgs:安装目录,其下有bin/hadoop可执行文件。可用来使用集群上预先安装的Hadoop版本。
server-params:一个逗号分割的hadoop配置参数列表,每一项为key-value对形式。这些将用于产生被NameNode和DataNode使用到的hadoop-site.xml文件。
final-server-params:除会被标记为final外和上面相同。
3.6HadoopOnDemand中gridservice-mapred的配置项
external:如果被置为false,HOD必须在通过allocate命令分配的节点上自己创建Map/Reduce集群。如果被置为true,它会尝试链接外部的已配置的Map/Reduce系统。
host:外部配置好的JobTracker的主机名。
tracker_port:JobTrackerRPC服务绑定的端口。
info_port:JobTrackerwebUI服务绑定的端口。
pkgs:安装目录,其下有bin/hadoop可执行文件。
server-params:一个逗号分割的hadoop配置参数列表,每一项为key-value对形式。这些将用于产生被JobTracker和TaskTracker使用到的hadoop-site.xml文件。
final-server-params:除会被标记为final外和上面相同。