【python科研数据处理】FuzzyWuzzy模糊匹配在多字段中一一对应匹配的场景应用中拓展(优化)

【python科研数据处理】FuzzyWuzzy模糊匹配在多字段中一一对应匹配的场景应用中拓展(优化),第1张

FuzzyWuzzy字符串模糊匹配算法拓展(优化)
  • 1 问题:
  • 2 问题解决
  • 3 函数完善

1 问题:

之前在python实现vlookup字符串模糊匹配及在实战中的应用(FuzzyWuzzy库)一文中详细介绍了FuzzyWuzzy的使用,以及封装了模糊匹配的函数,在今天的测试调用中发现了一个问题如下


仔细的观察可以发现,这里明明两个字段的数据不是相似或者相同,最后结果竟然匹配上了,原因就是在于之前的那个算法是基于待匹配字段的全部内容(df2),也就是说匹配时是拿左侧的字段的逐一元素(df1),与右侧的待匹配的全部字段中的元素进行模糊匹配的,核心代码中对应下面这部分


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/langs/724439.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-04-26
下一篇 2022-04-26

发表评论

登录后才能评论

评论列表(0条)

保存