Hive的调优策略

Hive的调优策略,第1张

Hive的调优策略

1.Featch抓取,某些情况可以不用MapReduce计算

2.开启Hive的本地模式,小数据在本地处理即可

3.开启Hive的并行执行

4.Hive的严格模式

        (1)分区表,只用where过滤分区字段

        (2)order by,必须使用limit

        (3)限制笛卡尔积的查询

5.JVM的重用,同一个job重新使用N次

6.开启Hive的推测执行

7.数据压缩(gzip,lzo,snappy,bzip2)

8.表的优化

        (1)小表join大表 Mapjoin

        (2)大表join大表-空key过滤,空key转换

        (3)行、列过滤

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/5590531.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-15
下一篇 2022-12-14

发表评论

登录后才能评论

评论列表(0条)

保存