如何将嵌套的Struct列展开为多列?

如何将嵌套的Struct列展开为多列?,第1张

如何将嵌套的Struct列展开为多列?

您可以选择

data.bar.baz
bar.baz

df.show()+-------+|   data|+-------+|[3,[2]]|+-------+df.printSchema()root |-- data: struct (nullable = false) |    |-- foo: long (nullable = true) |    |-- bar: struct (nullable = false) |    |    |-- baz: long (nullable = true)

在pyspark中:

import pyspark.sql.functions as Fdf.select(F.col("data.foo").alias("foo"), F.col("data.bar.baz").alias("bar.baz")).show()+---+-------+|foo|bar.baz|+---+-------+|  3|      2|+---+-------+


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/5096353.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-11-16
下一篇 2022-11-16

发表评论

登录后才能评论

评论列表(0条)

保存