HyperLogLog用于计数唯一项。它可以用很少的内存计算大量项目。但是,返回的基数不是精确的,而是近似为
standard error。
0.81% 是
standard error,不是误报。对于您的实例,您可以调用
PFCOUNTHLL获取放入中的唯一项目的近似数量
HyperLogLog。返回的数字应在的范围内
[10000 * (1 - 0.81%), 10000 * (1+ 0.81%)]。
PFADD如果在执行命令后更改了估计的基数,则返回1。否则返回0。它与无关
false positive。
似乎您需要的是Bloom
Filter,它可以告诉您数据集中是否存在某个项目,且误判为假。
BloomFilter当然,您可以使用Redis 来实现。为此,应该有一些开源项目。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)