hive分桶表实践

hive分桶表实践,第1张

一、建表:分区分桶表,对日期分区,再对id分4个桶

二、设置强制分桶

三、执行插入语句,插入1到8这几个id

四、效果

五、表抽样

-- 语法:

例如下面从对表从桶1开始查,每次间隔1个桶,得到桶1和桶3的全部数据

六、作用

1、抽样查询

2、map-side join,两个对相同字段做了同样分桶规则的表关联,可以实现在map端join,提高效率。

3、控制文件数量

5.1添加数据

5.1.1添加单条(记录)数据

数据表创建好后,可以使用“Insert

into”语句往表中添加单条(记录)数据,其语句格式如下:

INSERT INTO 表名[(字段名1,字段名2,……)] VALUES(值1,值2,……)

该语句格式中,“Insert into”后的“表名”用于给出要添加数据的表,其后“[]”里的“(字段名1,字段名2,……)”用于给出表中需要插入数据的字段列表,它可以是全部的字段列表,也可以是其中一部分字段的列表,在给出时各个字段间应以“,”分隔,并且外面的“[]”不需要给出, “[]”里面的“(字段名1,字段名2,……)”也可以省掉的,省掉时默认要插入数据的是所有字段。“VALUES(值1,值2,……)”用于对应给出前面字段列表“(字段名1,字段名2,……)”中各个字段的值,当前面是省掉字段列表时,应按各字段在表中的顺序对应给出每一个字段的值。

1、双击打开MySQL软件,在左侧中找到【表】并且右击选择【新建表】

2、选择新建表之后,在界面右侧可以添加数据,点击【添加栏目】就可以在下方再添加一行数据

3、点击【另存为】,会d出一个【表名】窗口,输入表名,比如Class,点击【确定】按钮

4、在表的下方就会出现一个名为Class的表


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/bake/11668371.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-17
下一篇 2023-05-17

发表评论

登录后才能评论

评论列表(0条)

保存