python – 重塑Pandas Dataframe的最佳方法

python – 重塑Pandas Dataframe的最佳方法,第1张

概述我有一个这样的一维数据帧设置: [A1,B1,C1,A2,B2,C2,A3,B3,C3,A4,B4,C4,A5,B5,C5,A6,B6,C6] 在我的程序A1,…中,C6将是从csv读取的数字. 我想将它重塑为2d数据帧,如下所示: [A1,B1,C1][A2,B2,C2][A3,B3,C3][A4,B4,C4][A5,B5,C5][A6,B6,C6] 我可以使用循环来制作它,但它会使程 我有一个这样的一维数据帧设置:

[A1,B1,C1,A2,B2,C2,A3,B3,C3,A4,B4,C4,A5,B5,C5,A6,B6,C6]

在我的程序A1,…中,C6将是从csv读取的数字.
我想将它重塑为2d数据帧,如下所示:

[A1,C1][A2,C2][A3,C3][A4,C4][A5,C5][A6,C6]

我可以使用循环来制作它,但它会使程序减慢很多,因为我会多次进行这种转换.以这种方式重塑数据的最佳命令是什么?我查看了一堆重构数据帧问题,但找不到任何具体的内容.提前致谢.

解决方法 解析列表时使用步幅(步骤),假设数据采用您提供的格式.

s = [A1,C6]

请注意,如果s最初是一个包含一行和18列的数据框,则可以通过以下方式将其转换为列表:

s = s.T.iloc[:,0].toList()

然后通过以下方式将结果转换为所选维度的数据框:

df = pd.DataFrame({'A': s[::3],'B': s[1::3],'C': s[2::3]})

更普遍:

s = range(18)cols = 3>>> pd.DataFrame([s[n:(n + cols)] for n in range(0,len(s),cols)])    0   1   20   0   1   21   3   4   52   6   7   83   9  10  114  12  13  145  15  16  17
总结

以上是内存溢出为你收集整理的python – 重塑Pandas Dataframe的最佳方法全部内容,希望文章能够帮你解决python – 重塑Pandas Dataframe的最佳方法所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/langs/1194401.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-06-03
下一篇 2022-06-03

发表评论

登录后才能评论

评论列表(0条)

保存