更新频率与页面相似度(seo思考之一)
seo的最高境界是:经过了seo优化,却看不出来有任何seo痕迹,这也是高手追求的目标。
我用实例来说明更新频率与页面的相似度问题。
百度蜘蛛和google机器人对站点的更新频率或页面的更新频率高的网站比较青睐,如果一个站的更新频率比较高,搜索引擎快照就会更新频繁,网站的权重自然会提高,那么如何让一个刚上线的站点达到快照的每日更新呢?下面介绍一些我的经验。
一、站点的更新
A、人工更新。由人每天写原创文章,发布到网站,这个可能不太现实,太累了,再说那有人能天天发布几篇原创文章呢,如果你做到,一定会收到非常好的效果,大家可以去看一下月光博客就明白了。
B、机器抓取发布。就是用程序到相关网站上去找与本站相关的文章,添加到自己的文章库中,再在页面中呈现,这种方法一般会让搜索引擎认为是非原创,会降低网页级别。常用工具有windows上的火车头软件,配置好站点,页面,及抓取规则就可以实现,很可惜,该软件在linux服务器上无法运行,我一般都是自已写抓取器,实现方法后期博客将介绍。
机器抓取最大的问题是如何调整文章,改成伪原创。
至于什么时候更新网站文章,我和一些seo高手交流过,据他们的经验,每天更新时间要固定,一般时差不要超过1个小时。我们可以用操作系统的定时任务实现。
二、页面的更新
每一张页面也要有一定的更新频度,有人可能会问,页面内容已经定死,怎么会有更新呢?其它,只要你肯想,办法还是有的,我的做法:A、文章页面增加热门文件排行榜,增加新新发布文章列表,这样,一有文章发布,页面内容就会发生变化,更新频率会高。B、文章中加入用户评论,只要有用户评论,页面就会产生变化,这点我是有教训的。曾经我用ajax来实现评论的加载,虽然可以应对高负载和较好的用户体验,但的确忽略了seo。
三、页面相似度
我们站的的页面,同一类型的文章,其它是从数据库中查出来,用el表达式显示到页面上的,这样,很多相似页面间,除了文章内容外,其它的都相同,因为是一个模板套出来的哦。
那么,在这种情况下,如何让页面站的相似度比较大呢?还是我以前的办法,页面上加最新文章排行榜,热文排行等内容,但是,问题又出现了,多个页面上的最新文章排行榜,热文排行又都是一样的,都是当前最新、最热的文章列表,如何解决这个问题呢?很简单,每篇文章上仅列出该文章发布的最新排行及热文,其它,用页面静态化,就不存在这个问题。
还有一招降低相似度的方法,你可以在页面中加入【相关文章】链接,不仅可以降低页面的相似度,还可以提高内联,一举两得。文章相似度的算法,要用到分词,网络上也有相应的开源的框架,我目前正在研究中,有兴趣的朋友可以和我讨论(注:最好是java版框架)。
世界是平的,长尾理论的书,老大推荐了,但还没时间去看,要是又有理论,又有实践,一定会事半功倍。