通过 UserAgent 欺骗搜索引擎?
作者:郑凯
[url=http://www.chedong.com/]车东[/url]的一篇[url=http://www.chedong.com/tech/google.html]Google Friendly的网站设计[/url]看了很多遍,整个 blog 的制作过程也在一直考虑这个问题,有些东西,比方说把网页弄的看起来跟静态,既科学又美观,很好接受,所以一直在用,可其他的问题不太容易解决:链接要限制在 100 个以内,事实上在很多 Blog 里都有大量超过 100 个链接的页面,不要以为这很困难,首先日历要占用将近 20 个左右,半年的按月排序的 archives 归类和目录归类又是 10 个,而每条 Blog 又起码要占用三条(本身链接、评论、TrackPing),我计划是 20 条,这样就要占用 60 个链接了,这基本就满了,于是就无法在导读里加入链接、不可以有友情或反向链接、不可以有最新回复,因为一切的这些都可能会导致你的正文链接被排到 100 个之后而无法被检索到,我看车东用了一个还不错的方法是换了一个 skin,让不重要的链接排在右边,实际在 HTML 源码里就是排在后面,不过总不能因此要求所有的 Blog 排版设计都按这个规则吧?[url=http://hedong.3322.org/]竹笋炒肉[/url]我看了一下,有 147 个链接 -_- 另外一点是标题,说是通常检索前 40 个字符,我现在的格式是按照中文的习惯来的,是“Soulogic.com - Blog - Archives: 正文标题”这样的格式,可为了 Google 我就必须改成英语的习惯,“正文标题 - Blog - Soulogic.com”这样,让我很是不喜欢,于是就想到一个问题,为何不用 UserAgent 来欺骗搜索引擎?看起来似乎是一个完美无缺的办法,每次 Google 检索过来的时候,我只要看到“Mediapartners-Google/2.1 (+http://www.googlebot.com/bot.html)”(它目前的 UserAgent 名称)就输出一个极为简单的页面,不用有表格和图片,也不用有 CSS,只有文字和链接,标题也写成最清晰的,至于 TrackPing 则可以根本不显示出来,总之一切都是为了能让 Google 更好的索引我网站的内容(或许会被无聊的人去优化或者说伪造页面?),或者有些网站提供打印版,那就可以直接在识别到 bot 后显示打印版。