使用udf在PySpark数据框中将纪元转换为日期时间

使用udf在PySpark数据框中将纪元转换为日期时间,第1张

使用udf在PySpark数据框中将纪元转换为日期时间

您不需要

udf
为此的功能

您只需要将 double epoch列强制转换为

timestampType()
,然后使用
data_format
如下功能

from pyspark.sql import functions as ffrom pyspark.sql import types as tdf.withColumn('epoch', f.date_format(df.epoch.cast(dataType=t.TimestampType()), "yyyy-MM-dd"))

这会给你一个字符串日期

root |-- epoch: string (nullable = true) |-- var1: double (nullable = true) |-- var2: double (nullable = true)

您可以使用

to_date
以下功能

from pyspark.sql import functions as ffrom pyspark.sql import types as tdf.withColumn('epoch', f.to_date(df.epoch.cast(dataType=t.TimestampType())))

这将使你

date
作为
datatype
epoch

root |-- epoch: date (nullable = true) |-- var1: double (nullable = true) |-- var2: double (nullable = true)

我希望答案是有帮助的



欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/zaji/5642938.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-16
下一篇 2022-12-16

发表评论

登录后才能评论

评论列表(0条)

保存