- 产生随机字串
- 对于所有字符串,使用http://www.dotnetperls.com/levenshtein之类的算法计算它们与该随机共享字符串的距离
如果字符串与参考字符串等距,则它们很可能彼此相似。然后您就可以对字符串进行局部敏感哈希实现。
您可以为一定距离范围创建不同的哈希桶。
编辑: 您可以尝试字符串距离的其他变体。一个更简单的算法只会返回“否”。两个字符串之间的共同字符。
欢迎分享,转载请注明来源:内存溢出
如果字符串与参考字符串等距,则它们很可能彼此相似。然后您就可以对字符串进行局部敏感哈希实现。
您可以为一定距离范围创建不同的哈希桶。
编辑: 您可以尝试字符串距离的其他变体。一个更简单的算法只会返回“否”。两个字符串之间的共同字符。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)