SparkSQL比MapReduce快的原因

企业一卡通 • 2022-12-17 • 随笔 • 阅读 26

粗粒度资源调度：一次性申请所有的资源
细粒度资源调度：每个Task执行时才会申请资源

spark两个shuffle的中间结果不需要落地
MR两个shuffle的中间结果需要落地到HDFS，第二个shuffle的map端要重新读取HDFS上面的文件。

欢迎分享，转载请注明来源：内存溢出

调度资源粒度落地两个

打赏

微信扫一扫

支付宝扫一扫

上一篇 2022-12-17

下一篇 2022-12-17

登录后才能评论