使用
groupby和
agg,并通过调用
Series.unique以下命令仅汇总唯一值:
df.astype(str).groupby('prop1').agg(lambda x: ','.join(x.unique())) prop2 prop3 prop4prop1 K20 12,1,66 travis,leo 10.0,4.0L30 3,54,11,10 bob,john 11.2,10.0
df.astype(str).groupby('prop1', sort=False).agg(lambda x: ','.join(x.unique())) prop2 prop3 prop4prop1 L30 3,54,11,10 bob,john 11.2,10.0K20 12,1,66 travis,leo 10.0,4.0
如果处理NaN很重要,请
fillna提前致电:
import redf.fillna('').astype(str).groupby('prop1').agg( lambda x: re.sub(',+', ',', ','.join(x.unique()))) prop2 prop3 prop4prop1 K20 12,1,66 travis,leo 10.0,4.0L30 3,54,11,10 bob,john 11.2,10.0
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)