电话:010-64681504 010-64684094
传真:010-64673024
邮箱:888@edo2008.com
手 机: 013693193565
有时候你希望能仔细地控制搜索引擎蜘蛛访问网站时看到的内容。一般来说,搜索引擎将显示不同内容给蜘蛛和用户。这称为隐藏页面,这违反搜索引擎的使用条款,被认为是作弊。
不过这个概念也有合法使用,对搜索引擎来说并没有欺骗性也无恶意。
什么是Cookie
Cookie是网站留在访问者硬盘上的一个小的文本文件,协助网站跟踪这个用户。Cookie是ws818.com在你每次访问时能记住你的用户名的原因。Cookie数据通常包括你上次什么时候访问网站,一个ID号码,还可能有你的访问信息。
网站开发人员可以使用Cookie记住访问者,用于跟踪目的,或者根据用户行为或偏好显示不同信息。常见用途包括记住用户名、维护购物车、记录访问过的内容。例如,如果你注册了SEOmoz帐号,在“我的帐户”页面可以选择要怎样看博客,下次访问时程序就会记住。
什么是Session ID
Session ID的功能与Cookie几乎完全相同。最大的区别是,一旦关掉浏览器,Session ID信息就不再存储在你的硬盘里了。与你互动的网站可以记住你的数据或行动,但是不能从刚开机的电脑重新获取以前的Session ID。实质上,Session ID就像是暂时的Cookie。
虽然,从技术说,Session ID是一种没有过期日期的Cookie,给Session ID设置类似Cookie的过期日期是可能的。从这个意义上来说,它们和Cookie完全一样。不过关于Session ID有一个重要的警告:它们经常以URL字符串形式传递,这将给搜索引擎制造严重问题。一个简单的解决方法是使用canonical标签告诉搜索引擎你希望它们忽略Session ID。
搜索引擎怎样理解Session ID和Cookie
它们不理解。搜索引擎蜘蛛不能保持Cookie和Session ID,就如同这个功能被关掉的浏览器一样。然而,和不接受Cookie的浏览器不一样的是,由于一些站长希望搜索引擎蜘蛛有时候可以访问被隔离的内容。很多网站页面要求Cookie和Session必须打开,但是为搜索引擎蜘蛛设置了特殊规则,允许它们访问内容。虽然技术上说这是隐藏页面,但是有一种形式被称为“第一次点击免费”,一般被搜索引擎所允许。
除了偶尔允许搜索引擎访问通过Cookie/Session设限的页面,大部分Cookie和Session ID的使用造成内容、链接和页面的访问受限制。网站开发人员可以充分利用“第一次点击免费”概念建立更智能的网站和页面,为人和搜索引擎提供最优化功能。
为什么要用Cookie和Session ID控制搜索引擎访问
有很多潜在技术可以充分利用Cookie和Session ID控制搜索引擎。下面是可以应用这些工具的一些主要策略。
显示多种导航路径的同时控制链接权重的流动
网站访问者经常希望有多种查看和访问内容的方式。提供多个访问内容的路径,你的网站可能从中获益。但是PR或链接权重最好集中在一个搜索引擎友好的导航结构里。这很重要,因为这些不同的排序可能被当做复制内容。
你可以要求用户打开Cookie才能访问一个页面的多种排序版本,阻止搜索引擎索引相同内容的多个页面。一个替代方案是使用canonical标签告诉搜索引擎这些排序方式其实与原始页面内容相同。
页面内容的一部分不让搜索引擎索引
很多页面可能包含你希望显示给搜索引擎的内容以及你只想显示给网站访问者的内容。这可能包括广告、需要登录才能看到的信息、链接甚至多媒体。同样,对非Cookie用户显示一个简洁版本,接受Cookie的用户才显示扩充信息可能很有价值。这经常与登录联合使用,所以只有注册用户能访问完整内容。对雅虎来说,你也可以使用robots-nocontent标签指明雅虎应该忽略的页面部分。
允许访问需要登录的页面
和内容摘要一样,你经常需要限制搜索引擎访问整个页面或网站的一部分。这可以通过Cookie和Session简单实现,还可以帮助带来可能转化为注册用户的搜索流量。例如,如果你有希望限制的内容,可以创建一个摘要页面,然后提供注册后能够继续阅读的选项,注册后在同一个URL允许访问完整内容。
避免复制内容问题
Cookie和Session最有效的用法之一是禁止蜘蛛访问同样内容的多个版本,同时允许访客访问他们想要的任何版本。例如,在SEOmoz,登录用户可以在博客首页看到完整博客帖子,但搜索引擎和非法注册用户只能看到摘要。这防止内容被列在多个页面上,同时给会员提供好的用户体验。
上一篇:内容传送和搜索蜘蛛控制
下一篇:怎样在自己网站上避免复制内容