map

tobacco • 2022-11-11 • 随笔 • 阅读 16

map

比如说作业中大部分都完成了，但是总有几个reduce一直在运行

这是因为这几个reduce中的处理的数据要远远大于其他的reduce，可能是因为对键值对任务划分的不均匀造成的数据倾斜

解决的方法可以在分区的时候重新定义分区规则对于value数据很多的key可以进行拆分、均匀打散等处理，或者是在map端的combiner中进行数据预处理的 *** 作

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/zaji/4882596.html

数据分区预处理作业打散

打赏

微信扫一扫

支付宝扫一扫

tobacco 一级用户组

以下是某移动端社交APP一周的每日活跃用户数，该APP主要用户群是年轻学生，请回答以下两个问题（图见下方）a)从数据中，你看到了什么问题？你觉得背后的原因是什么？b)要验证这些原因，你会怎么做？请简述

上一篇 2022-11-11

请说说快速失败和安全失败的区别？

下一篇 2022-11-11

发表评论

登录后才能评论

评论列表（0条）