如何在PySpark 2.1.0中的事件时间窗口上定义UDAF

正定政府 • 2022-12-16 • 随笔 • 阅读 18

如何在PySpark 2.1.0中的事件时间窗口上定义UDAF

在Spark <2.3中，您不能执行此 *** 作。

对于Spark> = 2.3，这对于分组数据是可行的，但对于使用“带有Pys的PySpark UDAF的Windows”而言，尚不可行。

当前，PySpark无法在Windows上运行UserDefined函数。

这是一个对此有一个很好描述的SO问题：在PySpark中的GroupedData上应用UDF（带有可运行的python示例）

这是添加了此功能的JIRA票证-https:
//issues.apache.org/jira/browse/SPARK-10915

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/zaji/5648166.html

可行带有运行票证示例

打赏

微信扫一扫

支付宝扫一扫

正定政府一级用户组

使用python OpenCV实时接收webRTC视频流

上一篇 2022-12-16

打包最大长度为n的可变长度列表的惯用方式

下一篇 2022-12-16

发表评论

登录后才能评论

评论列表（0条）