Spark shuffle的两个调优参数

Spark shuffle的两个调优参数,第1张

Spark shuffle的两个调优参数
# 文件输出流内存缓冲区大小 默认32k 增加可以可以减少创建shuffle文件时候进行磁盘搜索和系统调用次数,建议64k
spark.shuffle.file.buffer shuffle
# 拉取的数据量大小 默认48m 增加可以减少reduce拉取数据的次数 建议96m
spark.reducer.maxSizeInFilght reducetask 

欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/zaji/5682468.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-17
下一篇 2022-12-17

发表评论

登录后才能评论

评论列表(0条)

保存