如何在不耗尽内存的情况下通过sql查询创建大熊猫数据框？

posche • 2022-11-14 • 随笔 • 阅读 8

如何在不耗尽内存的情况下通过sql查询创建大熊猫数据框？

更新：请确保检查以下答案，因为Pandas现在具有对分块加载的内置支持。

您可以简单地尝试逐块读取输入表，然后从各个部分组装完整的数据框，如下所示：

import pandas as pdimport pandas.io.sql as psqlchunk_size = 10000offset = 0dfs = []while True:  sql = "SELECt * FROM MyTable limit %d offset %d order by ID" % (chunk_size,offset)   dfs.append(psql.read_frame(sql, cnxn))  offset += chunk_size  if len(dfs[-1]) < chunk_size:    breakfull_df = pd.concat(dfs)

整个数据帧也可能太大而无法容纳在内存中，在这种情况下，除了限制选择的行数或列数之外，您别无选择。

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/zaji/4984863.html

数据内存选择分块大熊猫

打赏

微信扫一扫

支付宝扫一扫

posche 一级用户组

如何使程序返回到代码顶部而不是关闭[重复]

上一篇 2022-11-14

gtk treeview：在行上放置图像按钮

下一篇 2022-11-14

发表评论

登录后才能评论

评论列表（0条）