集群安装完毕，该如何测试和使用集群-Hadoop单机（伪分布）

shenghaomail

2016-06-12

集群安装完毕，该如何测试和使用集群：

运行Hadoop首先进入hadoop所在目录，第一次执行要格式化文件系统bin/hadoop namenode –format
启动bin/start-all.sh
用jps命令查看进程，显示：
root@Ubuntu:/usr/hadoop/hadoop-1# jps
6449 DataNode
6998 TaskTracker
33851 Jps
6200 NameNode
6765 JobTracker
6683 SecondaryNameNode

少一个都不对
还有就是使用web接口访问

http://localhost:50030
可以查看JobTracker的运行状态

集群安装完毕，该如何测试和使用集群-Hadoop单机（伪分布）

http://localhost:50060
可以查看TaskTracker的运行状态

集群安装完毕，该如何测试和使用集群-Hadoop单机（伪分布）

http://localhost:50070

可以查看NameNode以及整个分布式文件系统的状态，浏览分布式文件系统中的文件以及log等。

集群安装完毕，该如何测试和使用集群-Hadoop单机（伪分布）

运行测试实例wordcount
注意：1.注意wordcount大小写，这里都是小写
2.复制命令可能会出现命令不识别，尽量手写
copyFromLocal: Unknown command
Usage: java FsShell
[-ls <path>]
.......
[-help [cmd]]

这里使用附带jar包里的wordcount
(1)先在本地磁盘建立两个输入文件file01 和 file02:
$ echo "Hello World Bye World" > file01
$ echo "Hello Hadoop Goodbye Hadoop" > file02
(2)在hdfs 中建立一个input目录：
$ hadoop fs –mkdir input
(3)将file01 和 file02 拷贝到hdfs中：
$ hadoop fs –copyFromLocal file0* input
(4)执行wordcount：
$ hadoop jar hadoop-examples-1.2.0.jar wordcount input output
(5)完成之后，查看结果：
$ bin/hadoop fs -ls . 查看已有的文件列表
$ hadoop fs -cat output/part-r-00000 查看结果
结果为：可见把单词都统计了
Bye 1
Goodbye 1
Hadoop 2
Hello 2
World 2

hadoop

安科网

集群安装完毕，该如何测试和使用集群-Hadoop单机（伪分布）

shenghaomail

shenghaomail

相关推荐

Hadoop3.2.0集群搭建常见注意事项

为什么Java仍将是未来的主流语言？

hadoop伪分布式环境搭建

_服役新节点，退役旧节点，多目录配置。+_HDFS2.x的新特性

Hadoop（一）安装

第四周练习

Hadoop小练习

hadoop框架三大组件hdfs、mapreduce、yarn 内容

Hadoop基础（三十三）：Zookeeper 分布式安装部署

Hadoop基础（二十二）：Shuffle机制（三）

hdfs、hive、hbase的搭建总结

NameNode和Zookeeper的format作用

hadoop集群的启动与停止

JStorm介绍

Hadoop2.7.7 centos7 完全分布式配置与问题随记

Hadoop Yarn工作机制 Job提交流程

【赵强老师】大数据工作流引擎Oozie

Hadoop

入门大数据---Spark开发环境搭建

hadoop创建目录

shenghaomail