很多方便的东西存储在
DataframeGroupBy.grouper对象中。例如:
>>> df = pd.Dataframe({'Name': ['foo', 'bar'] * 3, 'Rank': np.random.randint(0,3,6), 'Val': np.random.rand(6)})>>> grouped = df.groupby(["Name", "Rank"])>>> grouped.grouper.grouped.grouper.agg_series grouped.grouper.indicesgrouped.grouper.aggregate grouped.grouper.labelsgrouped.grouper.apply grouped.grouper.levelsgrouped.grouper.axis grouped.grouper.namesgrouped.grouper.compressed grouped.grouper.ngroupsgrouped.grouper.get_group_levels grouped.grouper.nkeysgrouped.grouper.get_iterator grouped.grouper.result_indexgrouped.grouper.group_info grouped.grouper.shapegrouped.grouper.group_keys grouped.grouper.sizegrouped.grouper.groupings grouped.grouper.sortgrouped.grouper.groups
所以:
>>> df["GroupId"] = df.groupby(["Name", "Rank"]).grouper.group_info[0]>>> df Name Rank Val GroupId0 foo 0 0.302482 21 bar 0 0.375193 02 foo 2 0.965763 43 bar 2 0.166417 14 foo 1 0.495124 35 bar 2 0.728776 1
grouper.group_info[0]潜伏在某个地方可能会有更好的别名,但是无论如何这应该起作用。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)