我认为现在(pandas 0.20.2)函数
transform未
dict使用具有类似功能的列名实现
agg。
如果函数返回的
Series长度相同:
df1 = df_test.set_index('a').groupby('a').agg({'b':np.cumsum,'c':np.cumprod}).reset_index()print (df1) a c b0 1 3 21 1 90 222 2 50 303 1 2970 244 2 2500 34
但是如果集合长度不同,则需要
join:
df2 = df_test[['a']].join(df_test.groupby('a').agg({'b':my_fct1,'c':my_fct2}), on='a')print (df2) a c b0 1 16.522712 81 1 16.522712 82 2 0.000000 173 1 16.522712 84 2 0.000000 17
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)