hive 为了避免全表查询,从而引进分区,将数据按目录进行划分,减少不必要的查询,从而提高效率
mysql的分区字段用的是表内字段,hive的分区字段采用表外字段,也就是使用伪字段,分区字段在创建表的时候指定
hiveexecdynamicpartition=true; 是否允许动态分区
hiveexecdynamicpartitionmode=strict/nostrict; 动态区模式为严格模式
hiveexecmaxdynamicpartitions=1000; 允许最大的动态分区
hiveexecmaxdynamicpartitionspernode=100; 单个节点允许最大分区
strict:严格模式,最少需要一个静态分区列(指定固定值)
nostrict:费严格模式,允许所有的分区字段都为动态。
hive的静态分区:分区数据已知
hive的动态分区:分区数据未知(不知道有多少个分区)
hive的混合分区:有动态有静态
分区使用表外的字段,分桶使用表内字段
分区可以使用load加载数据,而分桶就必须要使用insert into方式加载数据
分区常用;分桶少用。
以上就是关于Hive分区参考全部的内容,包括:Hive分区参考、、等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)