垃圾信息


作者:郑凯

偶然看到一个 Blog 抱怨垃圾回复并不得不因此暂时关闭回复功能想到而觉得有必要开始说一下这个问题了。在这个 Blog 刚开始写之前就一直在产生这样的疑问,track ping 这样的东西,如果被大量的用在垃圾指向上呢?如果有 robot 可以完成这件事是否会在很短的时间内就迅速提高自己的 pagerank(被大量网页所引用)?既然有很多小网站都声称可以提高 [url=http://www.google.com/search?q=Google+%22%E5%B7%A6%E4%BE%A7%E6%8E%92%E5%90%8D%22&num=50&hl=zh-CN&ie=UTF-8&oe=UTF-8]Google 左侧排名[/url],那么他们也一定对这样的方法感兴趣。关于垃圾回复还可以举个例子,[url=http://www.arkbook.com/info.php?id=C306]鱼以前做的方舟书店的一本书的评论页[/url],其实每个论坛都会碰到,只不过大多很快被管理员清除掉罢了。

设定过滤列表的方法是无能为力的,首先设定一个列表比直接删除一条要麻烦不少,再者,列表最后会有多大?几 M 还是几十 M?每个帖子都要这么过滤一下,什么主机都得垮了。同时还需要持续不断的维护、也不够及时——假设一个留言本上被贴了一堆法轮功或者地下六合彩的信息,而不巧你那段时间你正在旅游、没时间管理,那会怎样?我几乎可以肯定,那些垃圾回复和垃圾邮件一样,在通过 spider 进行无休止的搜索,只要碰到有 <textarea> 的 <form> 就立刻 submit。

很不幸,这个难题我看不到解决的希望。就像满大街的性病、召妓或者办证的小广告一样。