同事问我了解布隆过滤器么,我说 07 年的时候从谷歌黑板报知道有这东西,但从来没用过
后面的对话就成了我告诉他为什么不要在一个小的应用上使用布隆过滤器,场景完全不合适。他觉得数据很大,“几十个 G 啊“,我心想,”才几十个 G 啊“,而且实际都是关系型的查询,用了布隆过滤器也只能作为前置检测,最关键的是,qps 太低
而且布隆过滤器是有误判率的
想起曹政 04 或 05 年给我们做培训的时候,说起怎么做非常大的 IP 黑名单:(当时只有 ipv4)分配 4G 内存,每个地址 1 bit
同事问我了解布隆过滤器么,我说 07 年的时候从谷歌黑板报知道有这东西,但从来没用过
后面的对话就成了我告诉他为什么不要在一个小的应用上使用布隆过滤器,场景完全不合适。他觉得数据很大,“几十个 G 啊“,我心想,”才几十个 G 啊“,而且实际都是关系型的查询,用了布隆过滤器也只能作为前置检测,最关键的是,qps 太低
而且布隆过滤器是有误判率的
想起曹政 04 或 05 年给我们做培训的时候,说起怎么做非常大的 IP 黑名单:(当时只有 ipv4)分配 4G 内存,每个地址 1 bit