使用Java API将Parquet格式写入HDFS,而无需使用Avro和MR

使用Java API将Parquet格式写入HDFS,而无需使用Avro和MR,第1张

使用Java API将Parquet格式写入HDFS,而无需使用Avro和MR

实际上,没有外部框架的帮助,没有太多可用于读取/写入Apache Parquet文件的示例。

木地板库的核心是镶木地板列,您可以在其中找到一些直接读取/写入的测试文件:https :
//github.com/apache/parquet-mr/blob/master/parquet-column/src/test/java/org/
apache / parquet / io / TestColumnIO.java

更新:响应API弃用的部分:应将AvroWriteSupport替换为AvroParquetWriter,我检查ParquetWriter是否已弃用并且可以安全使用。

问候



欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/5565645.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-14
下一篇 2022-12-14

发表评论

登录后才能评论

评论列表(0条)

保存