如何将Parquet文件读入Pandas DataFrame？

calibration • 2022-12-16 • 随笔 • 阅读 15

pandas 0.21引入了Parquet的新功能：

pd.read_parquet('example_pa.parquet', engine='pyarrow')

要么

pd.read_parquet('example_fp.parquet', engine='fastparquet')

上面的链接说明：

这些引擎非常相似，应该读取/写入几乎相同的镶木地板格式文件。这些库的不同之处在于它们具有不同的基础依赖性（使用numba进行快速拼写，而pyarrow使用c库）。

欢迎分享，转载请注明来源：内存溢出

读入拼写依赖性写入新功能

打赏

微信扫一扫

支付宝扫一扫

上一篇 2022-12-16

下一篇 2022-12-16

登录后才能评论