pandas 0.21引入了Parquet的新功能:
pd.read_parquet('example_pa.parquet', engine='pyarrow')
要么
pd.read_parquet('example_fp.parquet', engine='fastparquet')
上面的链接说明:
这些引擎非常相似,应该读取/写入几乎相同的镶木地板格式文件。这些库的不同之处在于它们具有不同的基础依赖性(使用numba进行快速拼写,而pyarrow使用c库)。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)