您已经实现了我能想到的最简单的方法。我唯一要进行的更改就是对循环进行修改-正在使用更简洁的版本
min。
seen = defaultdict(lambda: 1) # `lambda: float('inf')` if scores can be > 1for score, url in s: seen[url] = min(seen[url], score){(v,k) for k,v in seen.items()}# {(0.33, 'http://www.bar.com'), (0.5, 'http://www.foo.com')}
如我所说,如果您真的想要一个更短的解决方案,这不是最简单的方法,但是它是一个简单的方法。大部分挑战是交换URL和分数,以便在删除重复项时可以将URL用作密钥。不用说,排序是这里的前提条件(这就是为什么我不喜欢上面的解决方案的原因)。
{(v, k) for k, v in dict(sorted(((v, k) for k, v in s), reverse=True)).items()}# {(0.33, 'http://www.bar.com'), (0.5, 'http://www.foo.com')}
如果
s看起来像这样,此解决方案将变得更短:
s2 = {(v,k) for k, v in s}s2 # {('http://www.bar.com', 0.33), ('http://www.bar.com', 0.66), ...}
您只需要这样做
list(dict(sorted(s2, reverse=True)).items())# [('http://www.foo.com', 0.5), ('http://www.bar.com', 0.33)]
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)