input = [{'dept': '001','sku': 'foo','transID': 'uniqueID1','qty': 100},{'dept': '001','sku': 'bar','transID': 'uniqueID2','qty': 200},'transID': 'uniqueID3','qty': 300},{'dept': '002','sku': 'baz','transID': 'uniqueID4','qty': 400},'transID': 'uniqueID5','qty': 500},'sku': 'qux','transID': 'uniqueID6','qty': 600},{'dept': '003','transID': 'uniqueID7','qty': 700}]
期望的聚合输出:
output=[{'dept': '001','qty': 900},'qty': 700}]
或平均:
output=[{'dept': '001','avg': 200},'avg': 450},'avg': 600},'avg': 700}]
我发现了这个:Group by and aggregate the values of a list of dictionaries in Python但它似乎没有给我我想要的东西.
解决方法 获得汇总结果from itertools import groupbyfrom operator import itemgettergrouper = itemgetter("dept","sku")result = []for key,grp in groupby(sorted(input_data,key = grouper),grouper): temp_dict = dict(zip(["dept","sku"],key)) temp_dict["qty"] = sum(item["qty"] for item in grp) result.append(temp_dict)from pprint import pprintpprint(result)
产量
[{'dept': '001','qty': 200,'sku': 'bar'},'qty': 400,'sku': 'foo'},'qty': 900,'sku': 'baz'},'qty': 600,'sku': 'qux'},'qty': 700,'sku': 'foo'}]
要获得平均值,您可以简单地更改for循环内的内容,就像这样
temp_dict = dict(zip(["dept",key))temp_List = [item["qty"] for item in grp]temp_dict["avg"] = sum(temp_List) / len(temp_List)result.append(temp_dict)
产量
[{'avg': 200,'dept': '001',{'avg': 200,{'avg': 450,'dept': '002',{'avg': 600,{'avg': 700,'dept': '003','sku': 'foo'}]
建议:无论如何,我会在这样的dict中添加qty和avg
temp_dict = dict(zip(["dept",key))temp_List = [item["qty"] for item in grp]temp_dict["qty"] = sum(temp_List)temp_dict["avg"] = temp_dict["qty"] / len(temp_List)result.append(temp_dict)
产量
[{'avg': 200,'sku': 'foo'}]总结
以上是内存溢出为你收集整理的python – 按多个键分组并汇总字典列表的值/平均值全部内容,希望文章能够帮你解决python – 按多个键分组并汇总字典列表的值/平均值所遇到的程序开发问题。
如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)