利用Ant构建Hadoop高效开发环境
最近Hadoop的研究中,都是利用Mockito来模拟数据进行,下一个阶段需要在Hadoop服务器上做大量的运行进行验证,同时也要为正式使用做准备。
今天考虑使用Ant来搭建一个Hadoop的开发和调试环境,不使用hadoop自带的插件。
思路如下:
1、 利用Ant在开发机器上将代码编译、打包,最终得到可执行的jar包。
2、 利用Ant的SSH属性,将jar包传到hadoop服务器的指定工作目录。
这样就开发机器做为编码客户端,与执行服务器之间关联,代码部署的时间基本不用考虑,开发效率可以提高,也利于在真实环境进行验证程序。
再扩展开来,可以利用Ant操作hadoop服务器,实现与开发客户端的交互,因为Ant可以通过SSH实现Linux服务器的命令操作。
如下是根据需要改造的Ant的bulid.xml文件,实现了:目录清理、目录构建、编译、打包、SFTP上传功能:
<?xml version="1.0" encoding="UTF-8"?> <project name="AntTest" default="all" basedir="."> <property name="src" location="./src" /> <property name="build" location="./build/classes" /> <property name="dist" location="./lib" /> <path id="project.classpath"> <fileset dir="D:\Project\Java\OpenSource\Hadoop\hadoop-0.20.205.0-bin\hadoop-0.20.205.0\lib"> <include name="*.jar" /> </fileset> </path> <target name="all" depends="clean,sshexec"></target> <!-- Generate directory --> <target name="init"> <tstamp /> <mkdir dir="${build}" /> <mkdir dir="${dist}" /> </target> <!-- compile java --> <target name="compile" depends="init"> <javac srcdir="${src}" destdir="${build}" includeantruntime="no"> <compilerarg line="-encoding GBK " /> <!-- 给编译器指定编码,防止出现:"警告: 编码 GBK 的不可映射字符"--> <classpath refid="project.classpath" /> </javac> </target> <!-- jar --> <target name="dist" depends="compile"> <mkdir dir="${dist}" /> <jar jarfile="${dist}/hadoop_project.jar" basedir="${build}" /> </target> <!-- clean --> <target name="clean"> <delete dir="${build}" /> <delete dir="${dist}" /> <echo message="clean dir"> </echo> </target> <!-- run --> <target name="run" depends="dist"> <java classpath="${build}" classname="demo.guide.chp7.HelloWorld"> <classpath refid="project.classpath" /> <!-- <classpath refid="${build}" /> --> </java> </target> <!-- sftp --> <target name="sshexec" depends="run"> <scp todir="root:****@192.168.9.181:/tmp/" trust="true"> <fileset dir="${dist}" /> </scp> </target> </project>在Ant改造中,遇到了以下几个问题,特记录如下:
1、 Includeantruntime 问题:
运行报错:
compile:
[javac]D:\Project\Java\hadoop_workspace\hadoop_project\bulid.xml:37: warning:'includeantruntime' was not set, defaulting to build.sysclasspath=last; set tofalse for repeatable builds
[javac] Compiling 1 sourcefile to D:\Project\Java\hadoop_workspace\hadoop_project\build\classes
原因及解决方法:
新版本的Ant需要设置Includeantruntime属性:
includeantruntime :指出是否应在类路径中包括 Ant 运行时程序库,默认为 yes。
这里设置为“no”即可解决。
2、 Error running javac.execompiler的错误
编译的时候,出现build.xml:32 Errorrunning javac.exe compiler 或者 build.xml:97: Unable tofind a javac compiler 的错误。
原因及解决方法:
这个原因是没有正确指定JRE的路径,javac找不到导致的。在Eclispe里面打开后,发现是默认到JRE的安装目录,这里修改为指向到JDK的目录即可解决。
修改的菜单路径为: Window-->Preferences-->Java-->InstalledJRES
增加JDK的目录并选中即可(取消之前的JRE目录的选择)。
3、 实现SFTP遇到Could notload a dependent class com/jcraft/jsch/Logger 的错误:
使用SFTP的时候,遇到Could not load a dependent class com/jcraft/jsch/Logger的错误,错误信息如下:
Could not load a dependent classcom/jcraft/jsch/Logger
It is not enough to have Ant's optional JARs
you need theJAR files that the optional tasks depend upon.
Ant's optional task dependencies arelisted in the manual.
原因及解决方法:
Ant自带的jsch的jar包存在问题,需要从官方网站下载后重新引入。
下载地址为:http://www.jcraft.com/jsch/index.html
下载后,在Window-->Preferences-->Ant-->Runtime中,添加外部jar引用,增加新的jsch的jar包即可。
4、 警告:编码UTF-8 的不可映射字符
Ant可以编译成功,但出现警告:编码 UTF-8 的不可映射字符
原因为项目编码为GBK的问题,两个办法可以解决:
1、 修改项目编码格式
2、 在ant的javac的编译节点中,增加以下属性:
<compilerargline="-encodingGBK "/>
<!-- 给编译器指定编码,防止出现:"警告: 编码 UTF-8 的不可映射字符"-->