电话:010-64681504 010-64684094
传真:010-64673024
邮箱:888@edo2008.com
手 机: 013693193565
搜索引擎抓取操作是整个搜索操作的起点,资料抓取操作的有略关系到搜索品质的好坏。搜索引擎抓取操作因为全球网页的大量资料、频繁的更新频率的动态页面的产生,而使得抓取操作越来越困难。搜索引擎的策略会有以下的组合。
(1) 选择策略,到底该获取那些网页。
(2) 重访策略,多久重新获取已经访问过的网页。
(3) 并行策略,如何安排分散式的资料获取。
(4) 不扰策略,如何在获取资料时,不影响网站的效能。
并行策略与搜索引擎优化没有太大的关联,我们不再深入讨论。后续就来谈搜索引擎的选择策略、重访策略与不扰策略。
不同的搜索引擎有不同的资料获取策略,不过最终目的都是希望把力气花在优秀的资料上,如果余力再去获取其他的资料。因此选择策略就主宰了获取优秀资料的重任。
计算机不会知道什么样的资料才是优秀的资料,因此起点就由人来决定。多数搜索引擎会由可以信赖的第三方开始,这个可以信赖的第三方就是具有公信力的目录网站、学术单位、公家单位与非营利的组织团体。因此被这个可以信赖的第三方所连接的网站就具备较优势的起点,但是并非保证能够有优秀的结果。
因此许多人认为被目录网站或被学术单位收录可以有较好的搜索结果,其实只是一个误会,最后结果是否能过如愿,ahi牵涉太多的因素。有太多网站没有被信赖的第三方连接,却比被信赖的第三方连接的网站有更优秀的搜索结果。
不管如何,有个优势的起点总是好事,因此搜索引擎优化操作还是尽量要被信赖的第三方连接。如果还是无法被连接的话,那么使用各搜索引擎的登录网站也是一个方法。
上一篇:各搜索引擎的登录网站