1、hadoop初步

HDFS      --------     GFS

MapReduce   --------   Mapreduce(PageRank)

HBase     -------  BigTable(列式数据表)

参考文档:复制虚拟机

安装模式:单机模式、伪分布模式、完全分布模式。

伪分布模式:单个节点同时启动:namenode、datanaode、jobtracker、tasktracker、secondarynode;

完全分布模式:至少三个节点

配置文件:

hadoop-env.sh

核心配置文件:

core-site.xml

hdfs-site.xml

mapred-site.xml

ssh:远程连接到其他节点。(所有节点之间免密码登陆)