浅谈百度地域性影响因素

以下为百度站长俱乐部中先前网友的提问:
  网友提问:百度是不是针对地区性的搜索提高了地方性网站的权重?(竞价存在这样的问题,我这里问的是自然搜索)。这种情况也是偶尔见到,想问下,这个现象是不是随着发展 会逐渐显现明显?
  百度工程师回答:如果你在中关村,搜“银行”,然后结果全是中关村周围的银行网点,按距离你的远近排序,这听上去不是一件很美妙的事情吗?呵呵。我也希望那一天尽早到来。
  从对话中,可以看到百度的工程师很想实现地域性搜索结果,但是在技术上目前还不是很成熟。
  很多朋友说到百度地域性搜索结果是想到的是,百度首先获取搜索这的IP地址,然后给他推荐搜索者IP地址所在的城市的网站,那么怎样才能判别一个网站是属于哪个城市呢?有哪些因素可以供参考。
  一、网站信息
  服务器IP地址信息。
  域名Whois信息
  备案信息
  二、页面信息
  标题、描述中是否包含城市关键词
  内面内容的分析中是否可以抽取城市关键词
  外链或者内链的锚文字是否包好城市关键词
  三、 访客信息
  网站访客的IP地址信息。
  四、其他因素
  竞价投放选择的城市
  网站页面上存在的联系方式(地址或者电话)
  接下来我们就对上面罗列的参考条件从程序可信度和程序复杂度两个方面进行分析。
  1、网站IP所在城市,以我的个人博客为例,很容易找到服务器所在的城市。

  从程序可行性来说获取一个网站的服务器IP地址是件很容易的事情,但是从可信度的角度,很大部分站长把服务器托管在IDC手中,很多IDC都不是当前城市的。对于大一些的网站,如果有CDN的话,一个网站的服务器可能遍布全国,所以这个信息存在的很多的不确定因素。
  可信度:低 复杂度:易
  2、域名Whois信息
  还是以我的域名为例:

  Whois中的 省市、邮编、手机号归属地、固定电话区号等都可以用来做参考。考虑到很多域名有Agent和域名的拥有者所在的城市并不一定是网站内容的所在城市,所以此部分信息对于搜索引擎来说不是很有用。
  可信度:低 复杂的:易
  3、域名备案信息
  刚上备案网查了下我的博客的备案,发现现在查询不到网站备案者的详细信息了,也就作罢,这个因素不考虑。
  4、页面中含有城市关键词
  这个因素很多人会想到,不管是标题、描述或者正文内容,肯定会给地域性的判定加分,但是是不是有这个条件就够了?其中最重要的就是标题了,这应该是个重要因素比如“名城苏州”肯定是苏州的地方站了,但是如果标题中不出现城市名如何判断呢,那就要看词频了,如果某个城市词出现的频率很高也可以判断,但是最好一个页面有多个城市多次的出现。这个是百度不期望看到的。同样的外链中如果含有城市关键词的话应该和标题一样的原理。
  可信度:高 复杂度:低
  5、访客信息
  百度收集用户在百度的点击行为大加都应该知道,同样这些数据可以运用到百度地域性搜索结果中,设想一下,如果从百度进入一个网站的用户80%的用户IP来源于一个城市,是不是可以确定这个网站是个城市站呢?通过用户行为去提升百度的搜索结果是百度一直在做的,比如很多人通过刷点击来提高百度的排名。对访客行为进行分析对百度来说既方便又比较实在,也只百度一直在做的。
  可信度:高 复杂度:中
  6、其他方面
  考虑到有些信息获取起来不是很全,比如很多网站没有此类信息,所以不做参考。
  以上为关于百度可能会做参考的因素,暂时只想到这么多,还需要大家一起思考和补充。接下来就要谈一下此地域性的触发规则了,有N多网站都满足这些规则,到底哪个要排在前面呢?原因在排名中靠前的排在前面或是其他?比如说进入这个网站的访客的浏览量比较大?这个还需大家一起来思考。