Spark DataSet有效地获取整行的长度大小

工作量法 • 2022-11-18 • 随笔 • 阅读 7

Spark Dataframe UDF的一个很好的解决方案，我曾经获得过Bytes长度，这对于我的情况来说更好：

static UDF1 BytesSize = new UDF1<String, Integer>() {    public Integer call(final String line) throws Exception {        return line.getBytes().length;    }};private void saveIt(){sparkSession.udf().register("BytesSize",BytesSize,DataTypes.IntegerType);    dfToWrite.withColumn("fullLineBytesSize",callUDF("BytesSize",functions.concat_ws( ",",columns)) ).write().partitionBy(hivePartitionColumn)         .option("header", "true")         .mode(SaveMode.Append).format(storageFormat).save(pathTowrite);}

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/zaji/5165363.html

长度获取大小解决方案情况

打赏

微信扫一扫

支付宝扫一扫

工作量法一级用户组

0 0

Java Swing-导致伪像的半透明组件

上一篇 2022-11-18

如何获取URL的路径

下一篇 2022-11-18

发表评论

登录后才能评论

Spark DataSet有效地获取整行的长度大小

发表评论

评论列表（0条）