概述我一直在通过 *** 纵在线获得的大型csv文件来了解熊猫的来龙去脉,这些文件是财务数据的时间序列.到目前为止,我已经想出了如何使用HDFStore来存储和 *** 作它们,但是我想知道是否存在更新文件的更简单方法,而无需重新下载整个源文件? 我问,因为我正在使用12~300 MB的文件,每15分钟更新一次.虽然我不需要更新是连续的,但是不要下载我已经拥有的内容. Continuum的 Blaze库应该可以帮到你 我一直在通过 *** 纵在线获得的大型csv文件来了解熊猫的来龙去脉,这些文件是财务数据的时间序列.到目前为止,我已经想出了如何使用hdfstore来存储和 *** 作它们,但是我想知道是否存在更新文件的更简单方法,而无需重新下载整个源文件?
我问,因为我正在使用12~300 MB的文件,每15分钟更新一次.虽然我不需要更新是连续的,但是不要下载我已经拥有的内容.
解决方法 Continuum的 Blaze库应该可以帮到你.你可以找到介绍 here. 总结
以上是内存溢出为你收集整理的python – 更新不在磁盘上的大型DataFrame对象.全部内容,希望文章能够帮你解决python – 更新不在磁盘上的大型DataFrame对象.所遇到的程序开发问题。
如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。
评论列表(0条)