在XP系统下配置eclipse集成hadoop开发
一、目的:
由于hadoop只能在Linux环境下运行,所以对于在windwos系统下使用IDE工作的开发人员来说,调试是件麻烦的工作,所以我们今天要配置的Hadoop开发环境是在WindowsXP系统下,并集成eclipse使开发人员在做hadoop开发时更容易调试。
二、本人配置的版本信息:
windowsXP系统,
jdk1.6.0_05,
eclipse-jee-indigo-win32Release3.7.0,
cygwin1.7.9-1,
hadoop-0.20.2,
三、配置步骤:
1、安装cygwin:
cygwin网上的资料很多,这里就不再详述。
2、JAVA安装
对于JAVA的安装与环境配置这里也不再详述,如果不清楚的话,百度一下你就知道了。
JAVA_HOME=C:/Java/jdk1.6.0_05
3、配置Hadoop
3.1、配置hadoop-env.sh文件,设置exportJAVA_HOME=C:/Java/jdk1.6.0_05
3.2、配置HADOOP_HOME=D:\adsitcloud\hadoop-0.20.2
3.3、配置core-site.xml
<?xmlversion="1.0"?>
<?xml-stylesheettype="text/xsl"href="configuration.xsl"?>
<configuration>
<property>
<name>fs.default.name</name>
<value>hdfs://localhost:9000</value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/adsitcloud/temporary</value>
</property>
</configuration>
3.4、配置hdfs-site.xml
<?xmlversion="1.0"?>
<?xml-stylesheettype="text/xsl"href="configuration.xsl"?>
<!--Putsite-specificpropertyoverridesinthisfile.-->
<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
</configuration>
3.5、配置mapred-site.xml
<?xmlversion="1.0"?>
<?xml-stylesheettype="text/xsl"href="configuration.xsl"?>
<configuration>
<property>
<name>mapred.job.tracker</name>
<value>localhost:9001</value>
</property>
</configuration>
3.6、Hadoop启动和一些基本命令
在cygwin环境中,进入Hadoop安装目录,
cd/cygdrive/d/adsitcloud/hadoop-0.20.2
a、格式化hadoop命名节点:bin/hadoopnamenode-format
b、启动Hdfs和MapReduce,在这里可以全部启动:bin/start-all.sh
c、以下是基本命令
bin/hadoopdsfadmin–report查看运行状况,验证配置是否成功,查看datanodes中正常和不正常的个数
bin/hadoopdfs–mkdiryesq创建名为yesq的目录
bin/hadoopdfs–put.bin/*.txtyesq把上一目录下所有的txt文件上传到yesq目录
bin/hadoopdfs–lsyesq列出yesq目录下的文件,输出文件列表信息,此时可以看到刚上传的txt文件。表时已经配置成功。
3.7、输入以下网址查看是否配置成功。
http://localhost:50070/dfshealth.jsp
点击:Browsethefilesystem,并一直点击目录文件,此时也可以看到刚才上传的txt文件。
四、安装eclipse以hadoop-eclipse-plugin
4.1、eclipse的下载安装这里不再详述,如果不清楚的话,google一下你就知道的太多了。
4.2、安装hadoop-eclipse-plugin
a、在eclipse的安装目录下新建文件夹:links
b、新建链接文件,hadoop.link,内容为:path=E:\\eclipsePlugins\\hadoop
c、在path目录下新建文件夹:plugins,并把hadoop-eclipse-plugin-0.20.3-SNAPSHOT.jar放在该目录下,即:E:\eclipsePlugins\hadoop\plugins,hadoop-0.20.2的插件一定要用这个,如果用本身自带的0.20.2插件的话,eclipse调试时无法弹出RunonHadoop
d、删除E:\ProgramFiles\eclipse\configuration下的org.eclipse.update文件夹
五、Eclipse结合Hadoop环境
a、启动eclipse
b、点击OpenPerspective>Other,此时可以看到Map/Reduce的小蓝像,点击选择,此时可以看到DFSLocations的一个树形目录,下面有localhost的大象以及在上面新建的目录,以及该新建目录下的txt文件。
c、点击左下角的ShowViewasaFastView,再点击Other,此时可以看到Map/ReduceLocations的小黄色大象,
此时右建选择NewHadooplocation...,弹出圣诞框。
d、点击General选项卡>输入Locationname:localhost>Map/ReduceMaster下Host:localhostPort:9001>
DFSMaster下输入Port:9000>在Username下输入yesq>点击Finish。
e、在eclipse下配置HADOOPHOME,选择Window>Preferences>选择HadoopMAP/Reduce>点击Browse...选择Hadoop安装目录,我的安装目录是:D:\adsitcloud\hadoop-0.20.2>点击OK。
六、结束语
到此在XP系统下配置eclipse集合Hadoop已经配置完成,可以进行开发了,在FileNew的时候可以看到Map/Reduce等图标。