SparkSQL比MapReduce快的原因

SparkSQL比MapReduce快的原因,第1张

SparkSQL比MapReduce快的原因
  • 1.spark可以将数据缓存在内存中进行计算(cache)
  • 2.spark是粗粒度资源调度,MR是细粒度资源调度。

粒度资源调度:一次性申请所有的资源
细粒度资源调度:每个Task执行时才会申请资源

  • 3.DAG有向无环图

spark两个shuffle的中间结果不需要落地
MR两个shuffle的中间结果需要落地到HDFS,第二个shuffle的map端要重新读取HDFS上面的文件。

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/5696310.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-17
下一篇 2022-12-17

发表评论

登录后才能评论

评论列表(0条)

保存