hadoop profiling

ououlal

2010-12-20

和debug task一样，profiling一个运行在分布式hadoop环境下的mapredeuce job是比较困难的。但在hadoop中，是可以让用户针对某些tasks进行profiling采集的，当这些task执行完后，将这些profiling日志保存的文件发送到作业的提交client机器上，然后用户就可以用自己熟悉的工具来分析这些profiling日志，进行tasks执行瓶颈的分析。

使用方法：

在JobConf中，有几个配置选项是可以用来控制task profiling行为的。比如对一个job，想要开启对其tasks的profiling功能，并设置profiling相应的HPROF参数，可以按如下方式：

conf.setProfileEnabled(true);

conf.setProfileParams("-agentlib:hprof=cpu=samples,heap=sites,depth=6,"+

"force=n,thread=y,verbose=n,file=%s");

conf.setProfileTaskRange(true, "0-2");

第一行表示打开profiling task的功能，该功能默认情况下是关闭的。调用该接口相当于设置配置选项 mapred.task.profile=true，可以利用这种方式在hadoop job提交命令行上动态指定。

第二行是通过conf接口来设置对tasks进行HPROF 的profiling的采集参数，采用profiling enable的方式运行的tasks，会采用每个task一个独立的JVM的运行方式运行（即使enable了job的jvm reuse功能）。HPROF相关的采集参数设置，可以见其他资料。该选项也可以通过设置 mapred.task.profile.params 选项来指定。

第三行表示对job的哪些tasks需要进行profiling采集，第一true参数表示采集的是map tasks的性能数据，false的话表示采集reduce的性能数据，第二个参数表示只采集编号为0,1,2的tasks的数据，（默认为0-2）。如果想要采集除2,3,5编号的tasks，可以设置该参数为: 0-1,4,6-

只需在jobtracker上设置。

Example

还是拿wordcount来举例，提交job命令如下：

bin/hadoop jar hadoop-examples-0.20.2-luoli.jar wordcount \

-Dmapred.reduce.tasks=10\

-Dkeep.failed.task.files=fales\

-Dmapred.task.profile=true\

-Dmapred.task.profile.params="-agentlib:hprof=cpu=samples,heap=sites,depth=6,force=n,thread=y,verbose=n,file=%s"\

$input\

$output

这样，当job运行时，就会对前三个task进行profiling的采集，采集信息包括cpu的采样信息，内存分配的信息数据，stack trace 6层的堆栈信息。这里需要注意的是，由于前三个tasks被进行了HPROF的性能采样，所以这几个tasks的执行效率会受到一定的影响，profiling的信息越详细，性能影响就越大。如下图，前三个map就明显比其他的map运行的要慢很多。

hadoop profiling

不过这种运行方式通常都不是线上运行方式，而是用来进行优化调试，所以关系不大。

而当job运行完成后，这三个tasks对应的profiling日志也会会传到提交机器上，供用户分析判断。如下图：

hadoop profiling

与此同时，tasks在tasktracker上也将这些profiling日志信息记录到了一个profile.out的日志文件中，该文件通常位于tasktracker机器上的上${HADOOP_HOME}/logs/userlogs/${attempt_id}下，和该task的stderr，stdout，syslog保存在同一个目录下，如下图：

hadoop profiling

该文件中的内容，还可以通过taskdetails.jsp的页面查看到。如下图：

hadoop profiling

有了这些信息，相信对于任何一位hadoop应用程序的开发者来说，就拥有了足够的定位job瓶颈的信息了。MR的应用程序开发同学，请优化您的job吧~~

hadoop tasks

安科网

hadoop profiling

ououlal

ououlal

相关推荐

Hadoop3.2.0集群搭建常见注意事项

为什么Java仍将是未来的主流语言？

hadoop伪分布式环境搭建

_服役新节点，退役旧节点，多目录配置。+_HDFS2.x的新特性

Hadoop（一）安装

第四周练习

Hadoop小练习

hadoop框架三大组件hdfs、mapreduce、yarn 内容

Hadoop基础（三十三）：Zookeeper 分布式安装部署

Hadoop基础（二十二）：Shuffle机制（三）

hdfs、hive、hbase的搭建总结

NameNode和Zookeeper的format作用

hadoop集群的启动与停止

JStorm介绍

Hadoop2.7.7 centos7 完全分布式配置与问题随记

Hadoop Yarn工作机制 Job提交流程

【赵强老师】大数据工作流引擎Oozie

Hadoop

入门大数据---Spark开发环境搭建

hadoop创建目录

ououlal