如何将.txt.csv文件转换为ORC格式

如何将.txt.csv文件转换为ORC格式,第1张

如何将.txt / .csv文件转换为ORC格式

您可以使用Spark数据帧非常轻松地将定界文件转换为orc格式。您还可以指定/施加模式并过滤特定列。

public class OrcConvert {   public static void main(String[] args) {    SparkConf conf = new SparkConf().setAppName("OrcConvert");    JavaSparkContext jsc = new JavaSparkContext(conf);    HiveContext hiveContext = new HiveContext(jsc);    String inputPath = args[0];    String outputPath = args[1];    Dataframe inputDf = hiveContext.read().format("com.databricks.spark.csv") .option("quote", "'").option("delimiter", "01") .load(inputPath);    inputDf.write().orc(outputPath);  }}

确保满足所有依赖关系,配置单元也应运行以使用HiveContext,目前仅HiveContext支持Spark ORC格式。



欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/5616111.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-15
下一篇 2022-12-15

发表评论

登录后才能评论

评论列表(0条)

保存