首页 --> 网站优化
成功案例分类
自助网站型    更多案例

一点通案例

手工定制网站

WAP手机网站

行业门户网站

商城网站案例

联系我们

电话:010-64681504 010-64684094

传真:010-64673024

邮箱:888@edo2008.com

24小时值班热线

手 机: 013693193565


文件分析和语义联系

  在文件分析中,搜索引擎查看搜索词是否出现在文件的重要区域——标题、元标签、H标签和页面文字。搜索引擎也根据文件分析和其他因素尝试自动衡量文件的质量。

  对如今的搜索引擎来说,仅仅依靠文件分析是不够的,所以它们也要考虑语义联系。语义联系指的是通常相互关联的词或词组。例如,当你看到夏威夷就会把它与美国联系起来,而不是华盛顿。搜索引擎构建自己的同义词库和字典,帮助确定某些词或话题之间有什么样的关系。搜索引擎可以扫描它们的网上内容数据库,使用模糊集合理论和某些方程式将词语联系起来,开始像人类一样理解页面及网站。

  专业SEO人员不一定需要使用语义联系测量工具来优化网站,不过更高级的SEO人员会尽力充分利用每一个因素,语义联系测量对下面这些方面有帮助。

  一、衡量选择什么词组作为关键词。
  二、衡量有关某个话题的页面上应该包括什么关键词组。
  三、衡量其他高排名网站或网页上的文字之间的关系。
  四、寻找能提供相关主题链接的页面。

  这些资料技术性太强了,SEO人员只需要了解获得有价值的信息的原则。要知道,虽然IR领域有成百上千个技术用语,其中很多难以理解,不过就算是SEO新手也可以区分和理解这些术语。

  IR模型使用模糊集合理论来发现两个词之间的语义关系。IR系统并非使用同义词典或字典来找出两个词之间是否有关系,而是使用自己的海量内容数据库来推测出词之间的关系。

  这个过程虽然听起来复杂,但原理很简单。搜索引擎需要依靠机器逻辑判断,机器逻辑相对人类有它的优势,但机器逻辑不能像人类一样思考。对人类来说很直观的事情,对计算机来说可能非常难以理解。

  机器要理解这一点以及其他比此类似的概念,语义联系是关键。网上大量的人类知识可以被收录进索引库,并且从中分析出人类已经建立起来的联系。所以机器扫描索引库中“香蕉”和“橘子”这两个词出现的地方,注意到“圆形”和“香蕉”很少同时出现,而“橘子”和“圆形”经常同时出现,机器就知道橘子是圆的,而香蕉不是圆的。

  这就是模糊逻辑发挥作用的地方。只要分析词语以何种频率一起出现,在什么情况下一起出现,模糊集合理论就可以帮助计算机理解词语之间是怎样相关的。

  一个在此基础上有所扩展的相关概念是潜在语义分析。通过研究亿万网页的海量索引,搜索引擎可以“学习”哪些词之间有联系,哪些概念之间有联系。

  某些形式的LSA计算成本太高。现在的搜索引擎还不能像麻省理工学院的最新型学习计算机那样聪明地学习。例如:搜索引擎无法从它们的索引库中学到,斑马和老虎都是带条纹的动物,虽然它们能意识到“条纹”和“斑马”比“条纹”和“鸭子”更有语义关系。

  潜在语义索引将主义分析更进一步,可以分辨相关联的网页。例如搜索引擎可能注意到一个页面是关于doctor的,另一个页面是关于physician的,根据这两个页面上经常共同出现的其他词,搜索引擎认定这两个页面有一定关系。所以,搜索physician时,谈论doctor的页面也可能出现。

  搜索引擎公司在这些技术上投资已经很多年了。这些应用使我们认识到搜索引擎怎样分辨网上词汇、词组以及概念之间的联系。随着语义联系成为搜索引擎算法越来越重要的部分,可以预期,页面、网站和链接的主题将会越来越受重视。未来搜索引擎将更有能力理解概念和主题,分辨哪些内容、链接、页面与整个网站的主题不太吻合。