其中,各字段代表含义如下:
• Owner(表的属主)。
• Project:纤州表所属的项目空间。
• CreateTime:创建时间。
• LastDDLTime:最后一次DDL *** 作时间。
• LastModifiedTime:表中昌含的数据最后一次被改动的时间。
• InternalTable:表示被描述的毁迅蔽对象是表,总是显示YES。
• Size:表数据所占存储容量压缩后的大小,压缩比一般为5倍,单位Byte。
• Native Columns:非分区列的信息,包括列名、类型和备注。
• Partition Columns:分区列信息,包括分区名、类型和备注。
• Extended Info:外部表StorageHandler 、Location等信息。
在insert overwrite到一张乎告分区表时,可以在语句中指定分区到值。也可以用另一种更加灵活到方式,在分区中指定一个分区列名但不给出值。相应的,在SELECT子句中的对应列来提供分区的值。
ODPS SQL支持在一个语句中插入不同的结果表或者分区。
注意:where子句,如果在in/not in 条件后加子查询,子查询只能返回一列值,且返回值的数量不能超过1000条记录。
使用情景:一基备个大表和一个或多个小表做join。
基本原理:将用户指定的小表全部加载到搏顷毁执行join *** 作的程序内存中,从而加快join的执行数据。
将两个或者多个SELECT *** 作返回的数据集联合成一个数据集
把数据按照一定条件分成多组称为开窗,每个组称为一个窗口,partirion by部分用来指定开窗的列。
分区列的值相同的行被视为在同一个窗口内order by用来指定数据在一个窗口内如何排序。
windowing_clause部分可以用rows指定开窗方式,有两种方式:
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)