hive创建表怎样加上对字段的描述信息?

hive创建表怎样加上对字段的描述信息?,第1张

create table table_name (colume_1 type comment '第一列',....)

其中comment就是添加字段描述

例如

create table test (id bigint comment '序号', name string comment '姓名')

excel表格中数据很多,为了便于表格阅读人的理解与编辑修改,想添加注释,一个一个注释有点不太可能,我们可以利用批注来快速添加。下面就跟我一起看看吧。

excel表格用批注添加注释的步骤

1、首先我们打开一个工作样表作为例子。

2、在工作薄中有需要创建注释的地方,比如说栏目标题,这里我们可以任意单元格上使用鼠标右键单击,选择插入批注。

3、在d出的注释窗口中,我们添加详细的叙述文字,这样可以便于表格阅读人的理解与编辑修改。

4、默认情况下添加完成批注的单元格会在单元格的右上方出现一个红色的小三角,当鼠标移动到此单元格停留时会出现注释,不在其上时,注释不会显示。

5、重新移动鼠标到批注单元格上,再次按鼠标右键,会出现删除批注选项,这个时候我们只要单击这个选项,就可以删除掉批注了。

6、同样的 *** 作邮件面板中还有显示/隐藏批注选项,大家如果需要批注随时保持显示,只需要在这个选项进行切换即可。这种时候比较适用于发送调查样表给用户的情况。

excel批注添加注释的相关 文章 :

1. excel2013如何添加批注功能

2. Excel表格中怎么添加批注

参数说明:

EXTERNAL:创建外部表,在建表的同时可以指定源数据的路径(LOCATION),创建内部表时,会将数据移动到数据仓库指向的路径,若创建外部表不会有任何改变。在删除表时,内部表的元数据和源数据都会被删除,外部表不会删除源数据。

COMMENT:为表和列增加注释

PARTITIONED BY:创建分区表,

——PARTITIONED BY(dt STRING, country STRING)

CLUSTERED BY:创建分桶表

SORTED BY:创建排序后分桶表(不常用)

——CLUSTERED BY(userid) SORTED BY(viewTime) INTO 32 BUCKETS

ROW FORMAT DELIMITED:是用来设置创建的表在加载数据的时候,支持的列分隔符。Hive默认的分隔符是\001,属于不可见字符,这个字符在vi里是^A

—— ROW FORMAT DELIMITED FIELDS TERMINATED BY '\001';

STORED AS:指定存储文件类型 sequencefile (二进制序列文件)、textfile(文本)、rcfile(列式存储格式文件)、ORC

如果文件数据是纯文本,可以使用 STORED AS TEXTFILE。

如果数据需要压缩,使用 STORED AS SEQUENCEFILE。

LOCATION:指定表在 hdfs 上的存储位置

注意:若是外部表,则还需要删除文件(hadoop fs -rm -r -f hdfspath)

注意:INPATH后面的文件路径不能和hive表路径在hdfs上一致,最好是两个不同的文件路径,在加载过程中,源路径下的文件会被移动到hive表所在路径下,如果一致,会找不到文件错误;

Hive支持内置和自定义开发的文件格式。以下是Hive内置的一些格式:

默认是文本格式.

textfile 存储空间消耗比较大,并且压缩的text 无法分割和合并查询的效率最低,可以直接存储,加载数据的速度最高.

sequencefile 存储空间消耗最大,压缩的文件可以分割和合并查询效率高,需要通过text文件转化来加载.

rcfile 存储空间最小,查询的效率最高 ,需要通过text文件转化来加载,加载的速度最低.

相比传统的行式存储引擎,列式存储引擎具有更高的压缩比,更少的IO *** 作而备受青睐(注:列式存储不是万能高效的,很多场景下行式存储仍更加高效),尤其是在数据列(column)数很多,但每次 *** 作仅针对若干列的情景,列式存储引擎的性价比更高。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/bake/11884479.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-19
下一篇 2023-05-19

发表评论

登录后才能评论

评论列表(0条)

保存