【Hive、Spark Sql中为什么说group by是distinct的优化?】

【Hive、Spark Sql中为什么说group by是distinct的优化?】,第1张

【Hive、Spark Sql中为什么说group by是distinct的优化?】

Hive、Spark Sql中为什么说group by是distinct的优化?
  • 用LogicalPlan带你一探究竟
    • group by
    • distinct
    • 看图说话

用LogicalPlan带你一探究

无论是Hive还是SparkSql都会生成LogicalPlan,PhysicalPlan只要我们明白了 他在底层如何转换如何优化的就能知道group by和distinct有何区别。

group by

sql: “select name from student group by name”

distinct

sql:“select distinct name from student”

看图说话

我们会发现distinct的逻辑计划在底层生成的优化后的逻辑化转换成了group by的逻辑计划

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/5678866.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-17
下一篇 2022-12-17

发表评论

登录后才能评论

评论列表(0条)

保存