电话:010-64681504 010-64684094
传真:010-64673024
邮箱:888@edo2008.com
手 机: 013693193565
讨论一下搜索引擎不喜欢哪几类内容也是很有意义。
例如,虽然搜索引擎能检测到你在显示一张图片,但是就像前面讨论的,它不知道这张图片显示的到底是什么,除非你用ALT属性提供信息。不过,搜索引擎可以识别像素颜色,很多时候可以根据JPGE图片中肉色的多少确定图片是否含有色情内容。所以搜索引擎无法分辨一张图片中描述的是辛普森还是一条路,是一幢房子还是龙卷风。另外,搜索引擎也无法辩认图片中的文字。目前,搜索引擎在尝试使用光学字符识别技术从图片中提取文字,但是这项技术还没有在搜索引擎中广泛使用。
另外,常规SEO观念一直认为,搜索引擎不能读取FLASH文字,这个有点过时了。搜索引擎正开始从FLASH中提取信息。当然,搜索引擎要确认FLASH里有什么并非易事。最大的一个问题是,就算搜索引擎查看FLASH文件内部,它们还是在寻找文字性内容,但是FLASH是以图像为主的媒介,对一个设计师来说,在FLASH里放文字并没有什么好处。就算HTML和FLASH一起使用,在HTML文件中能够出现的语言提示也都不见了。
第三种搜索引擎看不到的内容是FLASH包含的任何图像性质的东西,FLASH中的这类内容与图片完全一样。例如当文字被转化为向量轮廓线时,搜索引擎能读取的文字性信息就丢失了。
音频和视频文件也不容易被搜索引擎读取。和图片一样,这种数据难以解析。有几种例外情况搜索引擎能提取一些很有限的数据,比如MP3文件中AD3标签,使用AAC格式内嵌文字性说明的图片和章节标记的增强型播客。不过归根结底,某视频文件是关于足球比赛还是关于森林大火,搜索引擎是分辨不出来的。
搜索引擎也不能读取程序里面的内容。搜索引擎寻找的是人能够在页面源代码中看到的文字。你能在浏览器显示的页面上看到的内容,搜索引擎不一定能看到——只有页面源代码中可见可读取的信息搜索引擎才能看到。
一个明显的,人能看到但搜索引擎不能看到的内容是AJAX。AJAX是一种基于JavaScript的方法,从数据库获取数据后,直接在页面动态显示内容,而不需要刷新整个页面。这种技术经常见于线上工具,用户输入一些信息,AJAX工具获取并显示正确的内容。
在用户输入信息后运行于客户端计算机的脚本才能获得的内容,这种情况可以导致很多不同的输出。另外,在用户输入信息之前,内容在页面HTML代码中并不存在,所以搜索引擎也看不到。
一些其他形式的JavaScript脚本也有相似问题,在用户采取某种行动之前,HTML中并没有相关内容。
在HTML5标准中,一种称为嵌入标签EMBED的结构允许在页面中放入插件。插件是安装在用户计算机中的软件,不是安装在网站中服务器上。这个标签经常用来在页面上放入视频或音频文件。EMBED标签告诉插件应该在哪里寻找要用的数据文件。插件中包含的内容,搜索引擎完全看不见。
FRAME和IFRAME是从其他网页调用内容的方法。IFRAME比FRAME更常用于从其他网站调用内容。
上一篇:文件分析和语义联系