Hive中的多种优化方案

Hive中的多种优化方案,第1张

Hive中的多种优化方案

文章目录
  • 企业级优化
  • 1、Fetch抓取
  • 2、本地模式
  • 3、执行计划
  • 4、表的优化
    • 4.1 小表大表join
    • 4.2 大表join大表
        • 空key过滤
        • 空key转换
        • Sort Merge Bucket join(SMB)
    • 4.3 MapJoin
    • 4.4 Group by
    • 4.5 Count(Distinct) 去重统计
    • 4.6 行列过滤
  • 5、合理设置Map和Reduce数
    • 5.1 复杂文件增加Map数
    • 5.2 小文件合并
    • 5.3 合理设置Reduce数
  • 6、并行执行<

欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/zaji/5688260.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-17
下一篇 2022-12-17

发表评论

登录后才能评论

评论列表(0条)

保存