您不需要groupby根据几列删除重复项,而可以指定一个子集:
df2 = df.drop_duplicates(["date", "cid"])df2.groupby('date').cid.size()Out[99]: date2005 32006 102007 2272008 522009 1422010 572011 2192012 992013 2382014 146dtype: int64
欢迎分享,转载请注明来源:内存溢出
您不需要groupby根据几列删除重复项,而可以指定一个子集:
df2 = df.drop_duplicates(["date", "cid"])df2.groupby('date').cid.size()Out[99]: date2005 32006 102007 2272008 522009 1422010 572011 2192012 992013 2382014 146dtype: int64
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)