如果您只需要“计数”事物(并且假设数据文件包含所有必需的“哈希”级别),那么就可以解决问题:
import collectionsresult = collections.defaultdict(int)with open("beast","rt") as f: for line in f: hashes = line.split() key = '-'.join(hashes) result[key] += 1print result
产生结果:
defaultdict(<type 'int'>, {'Mammals-whales-Male': 1, 'Birds-Eagle-Female':2})
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)