电话:010-64681504 010-64684094
传真:010-64673024
邮箱:888@edo2008.com
手 机: 013693193565
理解爬行、索引和排名原理,对搜索引擎优化人员很有用处,可以帮助决定该采取什么行动达到目标。这里主要讨论谷歌、雅虎和必应搜索引擎的运行方式,不一定适用于其他搜索引擎,比如百度和NAVER。
搜索引擎有几个主要目标和功能:
(一)爬行和索引网上可以访问的亿万文件。
(二)对用户查询做出反应,提供相关结果列表。
我们从非技术角度简单介绍这些功能,先从搜索引擎怎样寻找和发现内容开始。
爬行和索引
可以把互联网想象成一个有很多站长的大型城市地铁系统。每一站相当于一个独特的文件。搜索引擎需要采用某种方式来爬过整个城市,找到所有地铁站,所以它们就使用现在的最佳途径:网页之间的链接。
互联网的链接结构将所有页面连接真情为。通过链接,搜索引擎的自动机器人,又称为爬行器或蜘蛛,可以接触到互相连接的亿万个文件。
搜索引擎找到这些页面后,下一个工作是分析其中的代码,然后把页面上选出来的消息存入大量硬盘阵列以便查询时调用这些信息。要存储能在瞬息间被访问的亿万网页是个相当庞大的任务,搜索引擎建造了大量的数据中心来处理这些数据。
在建立搜索引擎中关键概念之一是决定从网上的什么地方开始爬行。虽然从理论上说可以从网上很多不同地方开始,但理想情况是从一些被信任的网站开始爬行。你可以根据网站是最被信任的网站之间的点击距离来评估该网站的信任度。
检索和排名
对大部分搜索用户来说,对知识的寻求开始于搜索。
第二步是搜索引擎按照最可能满足用户的顺序返回网上相关网页的列表。这个过程要求搜索引擎在它们的亿万个文件组成的资料库中寻找文件,并做两件事:第一,只返回与用户查询有关的结果;第二,按重要度对结果进行排名。搜索引擎优化就是影响查询结果相关度与重要度的过程。
相关度就是返回的文件内容与用户查询意图相匹配的程度。一个文件的相关度在下面这些情况下会提高;用户查询的词或词组在文件中出现多次,在文件标题或重要的小标题中出现;页面有来自相关页面并使用相关锚文字的链接。
相关度是文件被选出的第一步。如果文件与查询不相关,搜索引擎根本不会在搜索结果中考虑这个页面。我们在“确认搜索意图及返回相关、新鲜内容”部分再详细讨论相关度是怎样确定的。
与用户查询匹配的文件的重要度或受欢迎程度指的是相对重要性,通过引用次数来衡量。一个文件被其他文件参考引用的次数越多,它的受欢迎程度越高。在学术领域,这个概念被称为引用分析。
重要度是从相同相关的一组网页中确定哪一个应排在搜索结果的第一,哪一个排第二等等的方法。网站的相对权威度和搜索引擎给予的信任度是重要的决定因素。当然,计算公式肯定比上面说的要复杂得多,而且并不是所有的页面都有同样的相关度。最终,相关度和重要度综合决定了排名顺序。
受欢迎程度和相关度不是人工决定的。搜索引擎设计复杂的数学议程式算法来挑选页面,然后按质量来排序。这些算法经常包含数百个要素,在搜索营销领域经常将它们称为排名因素或算法排名标准。
下一篇:垂直结果怎样融入搜索结果页面