将组ID返回到pandas数据框

将组ID返回到pandas数据框,第1张

将组ID返回到pandas数据框

很多方便的东西存储在

DataframeGroupBy.grouper
对象中。例如:

>>> df = pd.Dataframe({'Name': ['foo', 'bar'] * 3,        'Rank': np.random.randint(0,3,6),        'Val': np.random.rand(6)})>>> grouped = df.groupby(["Name", "Rank"])>>> grouped.grouper.grouped.grouper.agg_series        grouped.grouper.indicesgrouped.grouper.aggregate         grouped.grouper.labelsgrouped.grouper.apply  grouped.grouper.levelsgrouped.grouper.axis   grouped.grouper.namesgrouped.grouper.compressed        grouped.grouper.ngroupsgrouped.grouper.get_group_levels  grouped.grouper.nkeysgrouped.grouper.get_iterator      grouped.grouper.result_indexgrouped.grouper.group_info        grouped.grouper.shapegrouped.grouper.group_keys        grouped.grouper.sizegrouped.grouper.groupings         grouped.grouper.sortgrouped.grouper.groups

所以:

>>> df["GroupId"] = df.groupby(["Name", "Rank"]).grouper.group_info[0]>>> df  Name  Rank       Val  GroupId0  foo     0  0.302482        21  bar     0  0.375193        02  foo     2  0.965763        43  bar     2  0.166417        14  foo     1  0.495124        35  bar     2  0.728776        1

grouper.group_info[0]
潜伏在某个地方可能会有更好的别名,但是无论如何这应该起作用



欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/5630490.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-16
下一篇 2022-12-16

发表评论

登录后才能评论

评论列表(0条)

保存