五十个你必须知道的SEO概念
如果你拥有一个网站或独立博客,或者你的工作多少和互联网有关,那你一定耳濡目染多多少少对SEO(搜索引擎优化)有一定了解。本文将列举50个SEO领域最常用的概念和名词,如果你打算熟悉和了解他们请继续阅读。当然,如果你已经无所不晓,那你可以权当补习功课。
1.关键词(keywords)
通过输入关键词可以命令搜索引擎寻找任何内容,所以关键词的内容可以是:人名、网站、新闻、小说、软件、游戏、星座、工作、购物、论文等。关键词,可以是任何中文、英文、数字,或中文英文数字的混合体。
2.长尾关键词(Long tail keywords)
网站上非目标关键词但也可以带来搜索流量的关键词,称为长尾关键词。 长尾关键词的特征是比较长,往往是2-3个词组成,甚至是短语,存在于内容页面,除了内容页的标题,还存在于内容中。搜索量非常少,并且不稳定。长尾关键词带来的客户,转化为网站产品客户的概率比目标关键词高很多。存在大量长尾关键词的大中型网站,其带来的总流量非常大。长尾关键词基本属性是:可延伸性、针对性强、范围广。
3.关键词密度(Keyword Density)
关键字密度就是一个关键字或一个关键词在网页上出现的总次数与其他文字的比例。相对于页面总字数而言,关键字出现的次数越多,那么总的关键字密度也就越大。其他文字出现的次数越多,关键字的比例就越低,则关键字密度越小。
4.分词技术
分词技术是搜索引擎针对用户提交查询的关键词串进行的查询处理后用各种匹配方法进行的一种技术。如用户提交的字符串没有超过3个的中文字,就会直接到数据库索引词汇。超过4个中文字的,首先用分隔符比如空格,标点符号,将查询串分割成若干子查询串。举几个例子:“不知道你在说什么”分割成“不,知道,你在,说,什么”这种从右到左的分词方法叫做反向匹配法;“不知道你在说什么”分割成“不知道,你,在,说什么”这种从左至右的方法方法叫做正向匹配法;“不知道你在说什么”分割成“不知道,你在,说什么”这种方法叫做最短路径分词法。除了这些分词法之外还有词义分词法和统计分词法。
5.关键词权重
决定关键字权重的参数主要有:1、网页PR值及这个网页主域名的PR值;2、关键字在网页标题中的比重和位置;3、关键字在元标签中是否被提及;4、网页内是否有很多与该关键字相关的关键字词组;5、关键字在网页上的密度(3-8%)为佳,显眼度(加粗、变大、换字体等),位置(h1,h2,还是网页底部?)6、以这个关键字链接向本页面的外部链接和内部链接数量。分别按一个阻尼指数线性叠加。通俗说法是,一个外部链接投一票。这6个参数重要性相当,都为这个网页在某个“关键字”中的排名起到大概六份一的力量。其中2-5点告诉搜索引擎该关键字在这个页面中的重要性。
5.关键词堆砌(Keword Stuffing)
关键字堆砌是黑帽seo方法中的一种,通过在网页中大量重复关键词,提高关键词的密度,达到提高关键词排名的效果。这类网页看起来更像是一连串的关键字,而不像是别的什么东西。关键词堆砌的另一形式就是将关键字或关键词尽可能多次的填入页面的 title标签中。搜索引擎通常会降低这类网页的搜索排名,或者完全忽略这些关键字。这两种结果对网站都没有什么好处。关键字堆砌的桥页(doorway pages)或隐形页面(cloaked pages)不仅是过度使用关键字的例子,而且还是因自身原因而受到惩罚的因素。在所有导入链接(inbound links)中频繁使用相同的链接锚文本,也会被看作是关键词堆砌的一种形式。
6.反向链接(Backlinks)
反向链接是指,在网页A 上有一个链接指向网页B,则网页A 上的链接是网页B 的反向链接。某些SEO文章中谈到反向链接又叫导入链接(Backlinks),外部链接。这种说法是不正确的,因为反向链接也包括站内和站外的导入链接,也包括内部链接。
7.外部链接(inbound links)
外部链接是指非本站外的其他站点对本站的链接。通常高质量的外部链接指:和您的网站建立链接的网站知名度高,访问量大,同时相对的外部链接较少,有助与快速提升您的网站知名度和排名的其他网站的友情链接。
8.内部链接(inside links)
与外部链接相反,内部链接是指同一网站域名下的内容页面之间互相链接。如频道、栏目、终极内容页之间的链接,乃至站内关键词之间的Tag链接都可以归类为内部链接,因此内部链接我们也可以称之为站内链接,对内部链接的优化其实就是对网站的站内链接的优化。
9.导入链接(Backlinks)
导入链接是由其他网站指向你的网站的链接。导出链接刚好相反。导入链接是搜索引擎特别是google衡量一个网站受欢迎程度的重要因素之一。导入链接的常见方法有:友情链接、加入网站分类目录或网址导航、其他站点引用并链接我方文章等。
10.导出链接(outbound links)
导出链接就是网站或者页面中有指向别的网站的链接,是单向的。导出链接会导致网站的权重流向对方网站,PR还会传递到对方站,导出链接包括友情链接的交换和文章中的链接以及其他非本站的链接。
11错误链接(erro links)
根本不存在的链接,就是错误链接。错误链接可能是由于用户的疏忽,请求的链接不存在。如用户对域名拼写错误;URL地址书写错误;URL后缀多余了或缺少了斜杆;URL地址中出现的字母大小写不完全匹配。
12.死链接(Dead links)
简单地讲,死链接指原来正常,后来失效的链接。出现死链接时,服务器会返回404错误页面。一般出现死链接的情况如下:动态链接在数据库不再支持的条件下,变成死链接;某个文件或网页移动了位置,导致指向它的链接变成死链接;网页内容更新并换成其他的链接,原来的链接变成死链接;网站服务器设置错误。
13.绝对地址(Absolute Address)
互联网上的独立地址,在任何网站通过这个地址可以直接到达目标网页。包含主域名和目录地址。如***.org根目录下有个404.html页面,那么此页面的绝对地址就是www.***.org/404.html。首页的每个链接要使用绝对地址,包括其他一些变动不大的链接也要使用绝对地址,如文章内链接。对于一些独立IP的网站,使用绝对地址可以防止网站被其他域名镜像。
14.相对地址(Relative address)
相对于网站的地址,当域名改变时,相对地址的“绝对地址”也发生变化。如***.org根目录下有个404.html页面,那么此页面的相对地址就是/404.html,你的主域名发生改动,相对地址会跟随变动。相对地址较为短小,也有利于SEO蜘蛛爬取,一般在变动较大的链接中会采取这种方式。
15.Nofollow标签
nofollow是一个html标签,它的作用是告诉搜索引擎”不要追踪此网页上的链接”或”不要追踪此特定链接。这个标签的意义是告诉搜索引擎这个链接不是经过作者自己编辑的,所以这个链接不是一个信任票。简单的说就是,如果A网页上有一个链接指向B网页,但A网页给这个链接加上了 rel=”nofollow” 标注,则搜索引擎不把A网页计算入B网页的反向链接。搜索引擎看到这个标签就会取消链接的投票权重。
16.Alt标签(Alter)
在网页设计中,图片的属性ALT标签用于对图片进行命名等描述说明。ALT标签众多关键词信息在搜索引擎优化中曾发挥了一定作用,常被用于增加网页关键词密度,因此在ALT中合理添加与主题有关的关键词属于搜索引擎优化中考虑的一个因素。对于图片搜索引擎来说,Alt标签的作用更为明显,所以给每一个图片加上Alt标签是一种非常好的习惯。
17.元标签(Meta Tag)
元标签是使用在网页的head标签之间的一种HTML标签。与其它的HTML标签不同,元标签不会在页面的任何地方显示出来,所以绝大多数的访问者并不会看到它的存在。不同的元标签起着不同的作用,但都是用来提供关于页面的附加信息。有没有元标签的区别在于对搜索引擎的友好度,其他方面没有任何区别。元标签通常包括标题标签(Title Tag)、描述标签(Description Tag)、关键词标签(Keywords Tag)、publisher tag、copyright tag、robots tag 等等。
18.标题标签(Title Tag)
常用元标签的一种。排在搜索引擎搜索结果前几页的网页或网站中,一般是这个网页或网站的标题中包含着搜索关键词。所以,反过来,要让自己网页或网站排到搜索结果的前列,网页的标题标签非常重要。网页的标题标签有效长度是64个字节,汉语是32个字。长出来的部分无益有弊。
19.描述标签(Description Tag)
常用元标签的一种。描述标签对百度来说不是很重要,对谷歌、雅虎等国外搜索来说相对重要。认真对待描述标签,总比没有或者随便写描述标签要好一些。描述经常会显示在搜索结果页面上,直接了当告诉搜索用户网页上的信息。良好的描述标签是网页的“广告词”,直接吸引用户点击你的链接。描述标签给搜索引擎提供了一个很好的参考,缩小了搜索引擎对网页关键词的判断范围。描述标签里往往可以让关键词出现1-3次,从而增加关键词密度。
20.关键词标签(Keywords Tag)
常用元标签的一种。用来描述一个网页的属性,只不过要列出的内容是“关键词”,而不是网页的介绍。这就意味着,要根据网页的主题和内容选择合适的关键词。在选择关键词时,除了要考虑与网页核心内容相关之外,还应该是用户易于通过搜索引擎检索的,过于生僻的词汇不太适合做META标签中的关键词。META标签常用于增加关键词密度,本身的权重已经非常之低。
21.锚文本(Anchor Text)
锚文本可以简单的理解为链接文本。页面添加的链接一般来说都应该跟页面有直接相关的联系,搜索引擎可以根据指向某一个网页的链接的锚文本描述来判断该网页的内容属性。锚文本对搜索引擎起的作用还表现为可以收集一些搜索引擎不能索引的文件。由此可见,在网页设计中选择合适的锚文本,会让所在网页和所指向网页的重要程度有所提升。锚文本在数量巨大的情况下可以直接影响搜索引擎的结果。
22.黑帽(blackhat)
简单的说,所有使用作弊手段或可疑手段的,都可以称为黑帽。黑帽SEO获利主要的特点就是短平快,为了短期内的利益而采用的作弊方法。同时随时因为搜索引擎算法的改变而面临惩罚。目前,大量的垃圾站和SEO公司的惯用手段都是黑帽手法。
23.白帽(whitehat)
白帽,即常规的正常SEO手段。白帽网站不用担心会被搜索引擎封掉,一个白帽SEO所关注的更多的是长远利益。
24.障眼法(Cloaking)
指对某一个网页制作了两个版本,让搜索引擎和浏览者分别看到不同的网页内容(采用识别访问者身份的技术)。搜索引擎抓取这个网页时,获得的是纯粹为了优化某些关键词而组织的内容,而网页浏览者看到的是另一个截然不同的内容。障眼法是典型的SEO作弊,搜索引擎一旦识别就会对网站进行严厉惩罚。搜索引擎看到的那个页面也称之为隐形页面(cloaked pages)。
25.隐藏链接和文本(invisible link & text)
采用隐藏的手段在网页上放置许多文本和链接,浏览者看不到隐藏文本而搜索引擎可以爬取到,从而欺骗搜索引擎对网页关键词的判断。这些手段包括:将文本和链接的颜色设置与背景一样;将文本堆积在图片后;使用 CSS 隐藏文本,如:字体大小设置为0;通过 CSS 隐藏链接,如:链接的像素为1;把链接隐藏在小字符里,如:逗号等。
26.桥页(Doorway Pages)
桥页有时也叫门页、跳页。通常是用软件自动生成大量包含关键词的网页,然后从这些网页做自动转向到主页。目的是希望这些以不同关键词为目标的桥页在搜索引擎中得到好的排名。当用户点击搜索结果的时候,会自动转到主页。有的时候是在桥页上放上一个通往主页的链接,而不自动转向。
27.动态页面(Dynamic URL)
我们经常会看到,在地址栏里有一些网址特别长,而且还带有“?”,这样的链接一般是动态链接,其所对应的页面就是动态页面。在技术上,动态页面具有这些特征:动态页面是以ASP、PHP、JSP、ASP.net、Perl、或CGI等编程语言制作的;动态页面实际上并不是独立存在于服务器上的网页文件,只有当用户请求时服务器才返回一个完整的网页;动态页面上的内容存在于数据库中,根据用户发出的不同请求,其提供个性化的网页内容;动态页面内容不是存在于页面上,而是在数据库中,从而大大降低网站维护的工作量;采用动态网页技术的网站可以实现更多的功能,如用户注册、用户登录、在线调查、用户管理、订单管理等等;静态页面则无法实现这些功能。
28.静态页面(Static Page)
一般情况下,我们说一个URL链接对应一个网页。当访问者在任何时间内向那个URL链接发送请求,都返回同样的网页内容。可以认为这样的网页是静态页面。在技术上,静态页面的特征是:静态页面的URL链接是以.html、htm、.shtml、.xml为链接后缀;静态页面是存在于服务器上的一个文件,每个网页都是一个独立的文件(动态页面的内容存在数据库中);客户端加载静态页面时,并没有操作数据库,只是直接提取一个文件。所以静态页面的加载速度比动态网页快很多;因为静态页面内容存在于文件中、是稳定的,所以内容更新不方便是静态页面最大的弊端。(当然,用程序模拟人工修改静态页面是一个不错的办法,比如DZ)
29.ALEXA排名
Alexa为全球网站提供访问量排名统计服务,你在这里可以查询到你的网站在全球网站中的排名位置,以及全球乃至各国网站访问量排行榜。Alexa统计主要依据是以有多少安装了Alexa工具条的用户访问了你的网站来计算的,当然这不意味着你动员你的所有朋友和同事都安装了Alexa工具条来访问你的网站,你的网站的排名就一下子上去了,Alexa还有更具体的统计算法,但没有Alexa工具条它肯定是没办法统计的。
30.PR值 (PageRank)
PR值全称为PageRank(网页级别),取自Google的创始人LarryPage。它是Google排名运算法则(排名公式)的一部分,是Google用来标识网页的等级/重要性的一种方法,是Google用来衡量一个网站的好坏的一项重要标准。Google会参考PageRank来调整结果,使那些更具“等级/重要性”的网页在搜索结果中令网站排名获得提升,从而提高搜索结果的相关性和质量。PR值的级别从1到10级,10级为满分。PR值越高说明该网页越受欢迎(越重要)。例如:一个PR值为1的网站表明这个网站不太具有流行度,而PR值为7到10则表明这个网站非常受欢迎(或者说极其重要)。一般PR值达到4,就算是一个不错的网站了。Google把自己的网站的PR值定到10,这说明Google这个网站是非常受欢迎的,也可以说这个网站非常重要。
31.Robot探测器 (Robots.txt)
Robot英文直译是机器人, crawler(爬行器),spider(蜘蛛),都是探测器之一,只是叫法不同。Robot是搜索引擎用来抓取网页的工具。它是一个软件或者说一系列自动程序(显然,不是一部机器)。不同的搜索引擎给他们自己的探测器(Robot)起不同的名字。谷歌:googlebot 百度:baiduspider MSN:MSNbot Yahoo:Slurp (yahoo家的这位比较特殊,没有带“姓”,并且用的是一个拟声词。Slurp,中文理解是机器人吃东西时发出的啧啧的声音)关于Robot,需要关心的主要是Robots.txt,以及网站日志中包含的以上几个名字。
32.百度蜘蛛(Baiduspider)
百度用以抓取互联网上数以亿计的网页的程序叫做Baiduspider – 百度蜘蛛。它是一个程序,夜以继日得在互联网上找寻新的URL,接着抓取URL上的内容,返回到百度的网页暂存数据库。百度用来抓取网页内容的程序,叫做Baiduspider,抓取其他内容的蜘蛛,则是新的名字:
产品名称 对应user-agent
网页搜索 Baiduspider
无线搜索 Baiduspider-mobile
图片搜索 Baiduspider-image
视频搜索 Baiduspider-video
新闻搜索 Baiduspider-news
百度搜藏 Baiduspider-favo
百度联盟 Baiduspider-cpr
我们可以在自己的网站日志里看到这些蜘蛛的名称,比如Baiduspider-cpro,现在我们明白它是百度联盟蜘蛛,用以百度联盟程序匹配相应的广告。
33.谷歌机器人(Googlebot)
Googlebot 我们一般称为Google 机器人或Google 探测器。Google “派遣”了不同的Googlebot 对网页内容进行获取。主要包括:
对应user-agent 产品应用
Googlebot 网页搜索和新闻搜索
Googlebot-Mobile 手机搜索
Googlebot-Image 图片搜索
Mediapartners-Google 谷歌分析Google Adsense
Adsbot-Google 谷歌联盟Google AdWords
34.DMOZ开放目录
DMOZ也叫ODP(Open Directory Project开放目录工程)。由于由全球成千上万的志愿者在维护和管理这个非赢利性网站,Dmoz被认为是互联网上最重要的网站目录导航。搜索引擎认为,Dmoz是最有信用的目录站,能够被收录到Dmoz的分类中,将大大提升这个网站在搜索引擎相关网站分类中的地位。谷歌则把Dmoz当作是网站收录的重要参考。google的网页目录数据则全部来自Dmoz。Dmoz每半年可以提交一次,如果没有被收录,需等6个月之后再次提交。
35.网站地图(Sitemap)
Sitemap 可方便管理员通知搜索引擎他们网站上有哪些可供抓取的网页。最简单的 Sitepmap 形式,就是 XML 文件,在其中列出网站中的网址以及关于每个网址的其他元数据(上次更新的时间、更改的频率以及相对于网站上其他网址的重要程度为何等),以便搜索引擎可以更加智能地抓取网站。搜索引擎机器人通常会通过网站内部和其他网站上的链接查找网页。Sitemap 会提供此数据以便允许支持 Sitemap 的抓取工具抓取 Sitemap 提供的所有网址,并了解使用相关元数据的网址。使用 Sitemap 协议并不能保证网页会包含在搜索引擎中,但可向网络抓取工具提供一些提示以便它们更有效地抓取网站。
36.沙盒效应(Sandbox)
新站在刚上线的几个月内在谷歌很难有好的排名,甚至没有排名。这个现象我们称为:沙盒效应。一个新的网站,即使已经做了很好的SEO优化:丰富的相关内容,大量的高质量外部链接,网站URL搜索引擎友好,网站结构用户体验友好等。但在刚上线的几个月内,在谷歌几乎找不到好的排名。谷歌的沙盒效应一般会持续6个月,这6个月内新站应该不断完善各方面SEO,沙盒效应过后,一般会有不错的排名。百度对新站也有一个“建立信任期”,一般是2个月。这两个月内,过多得修改网站结构,修改文章标题,会造成百度对站点信任度的降低。
37.链接养殖场
链接养殖场是指这样一个网站:这个网站的每一个网页都没有有价值的信息,除了人为罗列一个个指向其他网站的链接外,没有其他内容或者极少内容。链接养殖场的任务就是交换链接,寄希望通过链接互相传递PageRank来提升这个网页的PR值。这个网页,或者数个网页的内容不一定和你的网站内容相关,甚至没有一点相关。同样,内容也不一定和它链接的其他网站的内容相关,甚至没有一点相关。SEO角度来讲,这样的纯粹用于交换链接、添加链接数量的网页或者网站(Link Farm 链接养殖场)是一种典型的SEO SPAM(SEO作弊)。与链接养殖场相互链接的网站有被搜索引擎封掉,并拒绝收录的危险。如果只是链接养殖场单方面链接你的站点,则对你并有没有什么弊端,不会造成影响。
38.链接诱饵(Link baiting)
链接诱饵简单的说是指的是创建有用、有趣、吸引眼球的内容,从而吸引吸引其他站长、博主的注意力,生成的外部链接。常见方法有,网络软文、公益赞助、免费工具、炒作八怪、病毒营销、知识链接等等。
39.着陆页面(Landing page)
着陆页面是指当用户利用搜索引擎搜索后显示的网页。一般这个页面会显示搜索结果链接相关的扩展内容,而且这个页面应该是针对某个关键词做过搜索引擎优化的。SEO的目标是能让用户能有更多的机会到达目标网页。
40.自然SEO(organic SEO)
自然SEO也就是非付费的优化工作。非自然的SEO造成的结果比如竞价排名,百度框数据,百度框应用,搜索引擎自身产品权重的人工调整等。
41.RSS(Really Simple Syndication)
RSS也叫聚合RSS是在线共享内容的一种简易方式(也叫聚合内容,Really Simple Syndication)。通常在时效性比较强的内容上使用RSS订阅能更快速获取信息,网站提供RSS输出,有利于让用户获取网站内容的最新更新。网络用户可以在客户端借助于支持RSS的聚合工具软件,在不打开网站内容页面的情况下阅读支持RSS输出的网站内容。
42.Feedfetcher
Feedfetcher是谷歌阅读器和谷歌个性主页订阅器的robot(机器人)。用户在谷歌阅读器或谷歌个性主页订阅了你的博客时,谷歌的Feedfetcher就会定时地随着rss地址去找你的站点爬取feed。Feedfetcher爬取的数据对我们网站的谷歌索引更新意义很大。如果我们的博客有很多谷歌阅读器的读者,那我们站点的权重就会提升。
43.转化路径(Transformation Path)
访问者从进入网站到完成转化之间浏览的网页。
44.Cookie
Cookie,有时也用其复数形式Cookies,指某些网站为了辨别用户身份、进行session跟踪而储存在用户本地终端上的数据(通常经过加密)。服务器可以利用Cookies包含信息的任意性来筛选并经常性维护这些信息,以判断在HTTP传输中的状态。Cookies最典型的应用是判定注册用户是否已经登录网站,用户可能会得到提示,是否在下一次进入此网站时保留用户信息以便简化登录手续,这些都是Cookies的功用。另一个重要应用场合是“购物车”之类处理。用户可能会在一段时间内在同一家网站的不同页面中选择不同的商品,这些信息都会写入Cookies,以便在最后付款时提取信息。
45.301重定向
301重定向是当用户或搜索引擎向网站服务器发出浏览请求时,服务器返回的HTTP数据流中头信息(header)中的状态码的一种,表示本网页永久性转移到另一个地址。从搜索引擎优化角度出发,301重定向是网址重定向最为可行的一种办法。当网站的域名发生变更后,搜索引擎只对新网址进行索引,同时又会把旧地址下原有的外部链接如数转移到新地址下,从而不会让网站的排名因为网址变更而收到丝毫影响。当然各个搜索引擎对301的处理方式是不一样的。
经常会碰到这样的情况,其他网站链接你的站点时,会用下面的链接:www.***.org,***.org,www.***.org/index.html,**.org/index.php而这样导致:你站点主域名的pr值分散到其他几个URL了。如果用301重定向把其他三个URL转到www.***.org,PR也就集中在主域名:www.***.org 了。
46.404错误
404页面就是当用户输入了错误的链接时,返回的页面。目的是告诉浏览者其所请求的页面不存在或链接错误,同时引导用户使用网站其他页面而不是关闭窗口离开。很多开源系统包括CMS系统、Blog系统等不提供404页面或提供的404页面并未达到SEO的要求,这让网站的权威性大打折扣。404页面该达到怎么样的效果才符合SEO要求?搜索引擎通过HTTP状态码来识别网页的状态。当搜索引擎获得了一个错误链接时,网站应该返回404状态码,告诉搜索引擎放弃对该链接的索引。而如果返回200或302状态码,搜索引擎就会为该链接建立索引,这导致大量不同的链接指向了相同的网页内容。结果是,搜索引擎对该网站的信任度大幅降低。——很多网站存在这个问题:404页面返回的是200或302状态码而不是404状态码。
47. 标准链接(Canonical URL)
标准链接(Canonical URL)是指一个网页的链接要符合规范和标准。
48.A/B划分
网络上的A / B测试,即你设计的页面有两个版本(A和B),A为现行的设计(称为控制) , B是新的设计。比较这两个版本之间你所关心的数据(转化率,业绩,跳出率等) 。最后,您选择效果最好的版本。
49.标签云
标签云是一套相关的标签以及与此相应的权重。典型的标签云有30至150个标签。权影响使用的字体大小或其他视觉效果。同时,直方图或饼图表是最常用的代表约12种不同的权数。因此,标签云彩能代表更多的权,尽管不那么准确。此外,经常地,标签云是可以交互的:标签是典型的超连结,让用户可以仔细了解他们的内容。