第一次使用nutch
Nutch 是一个基于Lucene开发的诞生不久的开放源代码(open-source)的web搜索引擎.
尽管Web搜索是漫游Internet的基本要求,但是现有web搜索引擎的数目却在下降.并且这很有可能进一步演变成为一个公司垄断了几乎所有的web搜索为其谋取商业利益.这显然不利于广大Internet用户.
Nutch为我们提供了这样一个不同的选择.相对于那些商用的搜索引擎,Nutch作为开放源代码搜索引擎将会更加透明,从而更值得大家信赖.现在所有主要的搜索引擎都采用私有的排序算法,而不会解释为什么一个网页会排在一个特定的位置.除此之外,有的搜索引擎依照网站所付的费用,而不是根据它们本身的价值进行排序.与它们不同,Nucth没有什么需要隐瞒,也没有动机去扭曲搜索的结果.Nutch将尽自己最大的努力为用户提供最好的搜索结果.
Nutch致力于让每个人能很容易,同时花费很少就可以配置世界一流的Web搜索引擎.为了完成这一宏伟的目标,Nutch必须能够做到:
---每个月取几十亿网页
---为这些网页维护一个索引
---对索引文件进行每秒上千次的搜索
---提供高质量的搜索结果
---以最小的成本运作
相关推荐
tanxinwhu 2019-08-26
crazyhulu 2014-09-29
ach 2014-03-16
Junzizhiai 2014-03-12
wawaboss 2017-03-22
zxiaozhuT 2013-02-28
hanwentan 2011-06-13
liubang000 2011-06-10
繌子 2011-04-17
喜糖 2011-02-22
shgege 2011-01-21
xiajlxiajl 2010-11-20
superdullwolf 2016-10-31
kuihan0 2016-10-28
leshem 2016-02-17
Harper 2014-12-16
ShareCode 2013-12-31
文洲 2013-08-04