所以in general, 正如Bren说的。。。Pandas/numpy structures are fundamentally not suited for efficiently growing.
Matti 和 arynaq说的是两种常见的对付这个问题的方法。。。我想Matti实际的意思是把要加的rows收集成起来然后concatenate, 这样只copy一次。arynaq的方法就是预先分配内存比较好理解。。。
如果你真的需要incrementally build a dataframe的话,估计你需要实际测试一下两种方法。。。
我的建议是,如有可能,尽力避免incrementally build a dataframe, 比如用其他data structure 收集齐所有data然后转变成dataframe做分析。。。
python中的list叫做列表,可以通过append方法在列表的末尾添加单个元素x = [1,2,3]
x.append(4)
或者使用extend方法在列表末位添加多个元素,参数就变成了列表
x.append([4,5,6])
或者使用insert方法在任意位置添加元素,第一个参数是插入元素的位置,第二个参数是插入元素的值
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)