1、hadoop初步
HDFS -------- GFS
MapReduce -------- Mapreduce(PageRank)
HBase ------- BigTable(列式数据表)
参考文档:复制虚拟机
安装模式:单机模式、伪分布模式、完全分布模式。
伪分布模式:单个节点同时启动:namenode、datanaode、jobtracker、tasktracker、secondarynode;
完全分布模式:至少三个节点
配置文件:
hadoop-env.sh
核心配置文件:
core-site.xml
hdfs-site.xml
mapred-site.xml
ssh:远程连接到其他节点。(所有节点之间免密码登陆)