万事万物都有自身存在的道理,虽然在python中有些代码我们并不常见。经常会觉得不是常用,就可以避之,但是大家好像都遗忘了一件事情,就是“真理都掌握在少数人手中”,往往最不起眼的库,经常能给我们带来高效率,最适宜的使用过程,好啦,下面就给大家讲下FuzzyWuzzy库啦~
前置条件
l Python3
l python-Levenshtein
安装方法:
通过Pip安装
pip install fuzzywuzzy
导入库:
fromfuzzywuzzy import fuzz
做个简单的测试:
fuzz.ratio("Let’sdo a simple test", "Let us do a simple test")
如结果所示,“93”表示这两个字符串有93%的相似性,这相当高了。
当有一个字符串列表,想要搜索所有的字符串,FuzzyWuzzy将帮助提取最相关的字符串及其相似性。
fromfuzzywuzzy import processchoices = ["Data Visualisation", "DataVisualization", "Customised Behaviours", "CustomizedBehaviors"]process.extract("data visulisation", choices,limit=2) process.extract("custom behaviour", choices, limit=2)
想必大家如果想要进行“模糊”搜索及才测试,选择Wuzzy库肯定是最优的选择,上述代码给大家演示了实际的效果,感兴趣的可以自己尝试。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)