nutch二次开发环境搭建

本文在总结使用nutch1.2框架做二次开发实验中总结出开发环境的一些设置,详细步骤如下:

一、从apache网站下载apache-nutch-1.2-bin.zip。如果需要分析hadoop也可以顺便下载hadoop-0.21.0.tar.gz,解压以上两个文件。解压后文件分别为nutch-1.2、hadoop-0.21.0。

二、新建web工程,引入nutch-1.2.jar以及nutch-1.2/lib中(可根据需要筛选)的.jar文件。

三、拷贝plugins到src目录下。

四、nutch-1.2/conf中的文件拷贝到src目录下。

以上步骤完成后就可以在二次开发的代码中整合nutch以及hadoop了。

相关推荐