为了获得启发,请看Levenshtein距离算法。这将为您提供合理的机制来加权比较。
我还要补充一点,以我的经验,您绝对不能绝对将两个任意数据匹配到同一实体中。您需要向用户提供合理的匹配条件,然后用户才能确定1920 E.
Pine上的John Smith是否与East Pine Road 192上的Jon Smith是同一个人。
欢迎分享,转载请注明来源:内存溢出
为了获得启发,请看Levenshtein距离算法。这将为您提供合理的机制来加权比较。
我还要补充一点,以我的经验,您绝对不能绝对将两个任意数据匹配到同一实体中。您需要向用户提供合理的匹配条件,然后用户才能确定1920 E.
Pine上的John Smith是否与East Pine Road 192上的Jon Smith是同一个人。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)