在PySpark中爆炸

在PySpark中爆炸,第1张

在PySpark中爆炸

explode
split
是SQL函数。两者都在SQL上运行
Column
split
将Java正则表达式作为第二个参数。如果要在任意空格上分离数据,则需要这样的 *** 作:

df = sqlContext.createDataframe(    [('cat nn elephant rat n rat cat', )], ['word'])df.select(explode(split(col("word"), "s+")).alias("word")).show()## +--------+## |    word|## +--------+## |     cat|## |elephant|## |     rat|## |     rat|## |     cat|## +--------+


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/5675095.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-16
下一篇 2022-12-16

发表评论

登录后才能评论

评论列表(0条)

保存