如何在不耗尽内存的情况下通过sql查询创建大熊猫数据框?

如何在不耗尽内存的情况下通过sql查询创建大熊猫数据框?,第1张

如何在不耗尽内存的情况下通过sql查询创建大熊猫数据框?

更新:请确保检查以下答案,因为Pandas现在具有对分块加载的内置支持。

您可以简单地尝试逐块读取输入表,然后从各个部分组装完整的数据框,如下所示:

import pandas as pdimport pandas.io.sql as psqlchunk_size = 10000offset = 0dfs = []while True:  sql = "SELECt * FROM MyTable limit %d offset %d order by ID" % (chunk_size,offset)   dfs.append(psql.read_frame(sql, cnxn))  offset += chunk_size  if len(dfs[-1]) < chunk_size:    breakfull_df = pd.concat(dfs)

整个数据帧也可能太大而无法容纳在内存中,在这种情况下,除了限制选择的行数或列数之外,您别无选择。



欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/4984863.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-11-14
下一篇 2022-11-14

发表评论

登录后才能评论

评论列表(0条)

保存