如何将.txt.csv文件转换为ORC格式

chromeos下载 • 2022-12-15 • 随笔 • 阅读 19

如何将.txt / .csv文件转换为ORC格式

您可以使用Spark数据帧非常轻松地将定界文件转换为orc格式。您还可以指定/施加模式并过滤特定列。

public class OrcConvert {   public static void main(String[] args) {    SparkConf conf = new SparkConf().setAppName("OrcConvert");    JavaSparkContext jsc = new JavaSparkContext(conf);    HiveContext hiveContext = new HiveContext(jsc);    String inputPath = args[0];    String outputPath = args[1];    Dataframe inputDf = hiveContext.read().format("com.databricks.spark.csv") .option("quote", "'").option("delimiter", "01") .load(inputPath);    inputDf.write().orc(outputPath);  }}

确保满足所有依赖关系，配置单元也应运行以使用HiveContext，目前仅HiveContext支持Spark ORC格式。

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/zaji/5616111.html

格式文件施加特定单元

打赏

微信扫一扫

支付宝扫一扫

chromeos下载一级用户组

0 0

带有自动换行功能的Android EditText，但无固定回报

上一篇 2022-12-15

是否缓存了ArrayList.size（）方法？

下一篇 2022-12-15

发表评论

登录后才能评论

如何将.txt.csv文件转换为ORC格式

发表评论

评论列表（0条）