标记说明:转载原创

July 17, 2006

谁来预测一下第 2 & 3 亿张 flickr 图片产生的时间?  

铂 Platinum

最早是发现 http://www.flickr.com/photos 每次刷新都不一样,于是穷极无聊的写了一个正则分析页面的一段 code,每三秒抓一次,取得那页的 16 个图片的 id,保留最大和最小的两个(这两个 id 的平均差距在 97 左右)。当时是想搞清楚他这页的规律或者说机制,可分析可比抓取要难的多,而且我无法抓取全部时段,因为我保证不了这东西一直运行。中途 5 月份因为数据表出错结果隔了一个月才发现。

这个表列举的是每次抓取所能得到的最大 id,如果花点时间,还是可以从这个残缺的表里找出规律的。另外我觉得 worldcup 这类事件也会导致 flickr 增长速度的波动。

Posted by Platinum at 10:29 AM | Continue reading (3.8 KB) | Comments (0)

July 13, 2006

留言加了个反 spam 手段,不确定是否工作正常  

铂 Platinum

方法以前就想过,不过当时 spam 不是很多,也就懒得弄,直到最近过分了点,不得不去加上这个小手段

方法比较老土,是用的 md5(可能说到这有些人就不需要解释了),在提交留言的 form 里,多发一个隐藏项,值是时间戳,类似这样:

<input type="hidden" name="checkTime" value="1152777009" />

而正常填写项的 name (我这里有 guest、email、content 等几项)是 md5(checkTime + 原name,如“email”+ 私钥,可能这个名字不太合适),就是说根据 checkTime 变化而变化。

结果就是,我原来可能是这样:

<form method="post">
<input type="text" name="guest" />
<input type="text" name="email" />
<input type="text" name="url" />
<textarea name="content"></textarea>
</form>

现在变成了这样:

<form method="post">
<input type="hidden" name="checkTime" value="1152777009" />
<input type="text" name="3776712a3f4f8acae3bd9a133b65616b" />
<input type="text" name="6548f70199d1f079a92732da6bc3140d" />
<input type="text" name="5d8d2cd0fd97e5e90b41055e851f93a9" />
<textarea name="c3d1c5cdbd2caef5cddfee48b337f55e"></textarea>
</form>

因此除非 spammer 每次都现抓我的网页,否则他不知道提交的变量的名字(虽然变量的内容是他早已准备好的),也就无法自动的、大批量的发送 spam

checkTime 作为一个校验值,一是用来推导表单各项的名字,一是用来保证过期(这里我要做一个假设,没人会花一个小时的时间去留言,如果你觉得这个假设不好,改成一天也成)。这是为了防止 spammer 搞明白你的表单项名称后继续一劳永逸

这个方法仅仅是为了不受普通机械的 spam 折磨,人肉 spam 无效,但我觉得到这一步已经算胜利了,人肉 spam 的成本太高,而且删比填要省事。这只是个初始想法,还可以再加点干扰项(放置一堆额外的 <input type="text",通过拐弯抹角的 css 来让这些隐藏项目,没有或者非空都算有问题)什么的,比起验证码什么的要好太多(成本、对用户干扰等等方面)。

如果这个东西出问题了,留言者可能会看到我留给 spammer 的话或者提交后没任何响应,还是提交前的页面。如果有空的话,请帮忙留言测试一下(老实说,如果换成我是观众,我可能会置之不理),如果出了问题并肯花时间告诉我,gmail 信箱,用户名 zheng.kai,不胜感激。

Posted by Platinum at 04:48 PM | No more content | Comments (7)

July 10, 2006

杂念 2006.07.10  

铂 Platinum

稚气未脱的青年人,尤其是没毕业的学生,尤其要看世界杯,这是现实主义的经典影片,虽然戏拖的长了点。

假设这么一个场景,脚稍微一抖,导致球飞出 15 米后偏了 7 厘米,打在门柱上弹出,你距离世界一流球星就差距这么 7 厘米。你整个后半生都可能只因为这么 7 厘米。

虽然从慢镜头回放中发现裁判是错判,但是很可惜,你们依然因此在 16 强就被淘汰了,虽然有“如果”的话,你们会打进决赛拿个亚军,回国后受到英雄般的礼遇。我们会追究责任,让这个裁判降级,但是你们也没有如果了。

可能就是一个进球,就可以改变所有人的看法,让嘲讽有加顷刻变成极献媚之能事。我喜欢这种成败论英雄,必须承认这才是所有人的行为准则。

就像一段时间前,真是闲的足够无聊了,高考也值得拿来说事?学多了吧,你指望一种具有数学般精确的判断?或者说你觉得这种考试不合理?那么,凡人,你来想一种方法给近千万考生做一个有理有据的排序并说服十几亿人来接受?

Posted by Platinum at 11:11 PM | Continue reading (3.1 KB) | Comments (1)

July 7, 2006

偏执一例  

铂 Platinum

郑凯 2006年07月07日 15:21:57
就比方说这么个图

郑凯 2006年07月07日 15:22:22

正常色板是这种

郑凯 2006年07月07日 15:22:44

最好的色板是这种

郑凯 2006年07月07日 15:23:27
区别就是第二种没有丢失任何一种颜色,尽管肉眼可能分辨不出这些不同的过渡绿色

Posted by Platinum at 04:30 PM | Continue reading (1.8 KB) | Comments (0)

    July 2006    
1
2345678
9101112131415
16171819202122
23242526272829
3031

[ Show the Last 10 Archives ]


按分类归档


按月归档

[ More Archives ... ]



链接

其他

Search in Soulogic.com
Google

访客来源列表


用户名
密码