考虑以下数据集:
df = pd.DataFrame(data=np.array([['a',1,2,3],['a',4,5,6],['b',7,8,9],10,11,12]]),columns=['ID','A','B','C']) ID A B C a 1 2 3 a 4 5 6 b 7 8 9 b 10 11 12
我需要按ID对数据进行分组,并在每个组中复制第一行并将其添加到数据集,如下面的数据集:
ID A B C A B C a 1 2 3 1 2 3 a 4 5 6 1 2 3 b 7 8 9 7 8 9 b 10 11 12 7 8 9
我非常感谢你的帮助.
我做了以下步骤,但我无法扩展它:
df1 = df.loc [0:0,'A' :'C']df3 = pd.concat([df,df1],axis=1)解决方法 首先使用groupby,然后将df与此结果连接:
v = df.groupby('ID').transform('first')pd.concat([df,v],1) ID A B C A B C0 a 1 2 3 1 2 31 a 4 5 6 1 2 32 b 7 8 9 7 8 93 b 10 11 12 7 8 9总结
以上是内存溢出为你收集整理的python – 将重复的行添加到DataFrame全部内容,希望文章能够帮你解决python – 将重复的行添加到DataFrame所遇到的程序开发问题。
如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)