说明:hive 的表存放位置模式是由 hive-sitexml 当中的一个属性指定的,默认是存放在该配置文件设置的路径下,也可在创建数据库时单独指定存储路径。
数据库有一些描述性的属性信息,可以在创建时添加:
查看数据库的键值对信息
修改数据库的键值对信息
与mysql查询语句是一样的语法
删除一个空数据库,如果数据库下面有数据表,那么就会报错
强制删除数据库,包含数据库下面的表一起删除(请谨慎 *** 作)
[]里的属性为可选属性,不是必须的,但是如果有可选属性,会使 sql 语句的易读性更好,更标准与规范。
例如:[comment '字段注释信息'][comment '表的描述信息']等,[external]属性除外
1 CREATE TABLE
创建一个指定名字的表,如果相同名字的表已存在,则抛出异常提示:表已存在,使用时可以使用IF NOT EXISTS语句来忽略这个异常。
如果创建的表名已存在,则不会再创建,也不会抛出异常提示:表已存在。否则则自动创建该表。
2 EXTERNAL
顾名思义是外部的意思,此关键字在建表语句中让使用者可以创建一个外部表,如果不加该关键字,则默认创建内部表。
外部表在创建时必须同时指定一个指向实际数据的路径(LOCATION),Hive在创建内部表时,会将数据移动到数据仓库指向的路径;
若创建外部表,仅记录数据所在的路径,不对数据的位置作任何改变。
内部表在删除后,其元数据和数据都会被一起删除。
外部表在删除后,只删除其元数据,数据不会被删除。
3 COMMENT
用于给表的各个字段或整张表的内容作解释说明的,便于他人理解其含义。
4 PARTITIONED BY
区分表是否是分区表的关键字段,依据具体字段名和类型来决定表的分区字段。
5 CLUSTERED BY
依据column_name对表进行分桶,在 Hive 中对于每一张表或分区,Hive 可以通过分桶的方式将数据以更细粒度进行数据范围划分。Hive采用对列值哈希,然后除以桶的个数求余的方式决定该条记录存放在哪个桶当中。
6 SORTED BY
指定表数据的排序字段和排序规则,是正序还是倒序排列。
7 ROW FORMAT DELIMITED FIELDS TERMINATED BY ' '
指定表存储中列的分隔符,这里指定的是' ',也可以是其他分隔符。
8 STORED AS SEQUENCEFILE|TEXTFILE|RCFILE
指定表的存储格式,如果文件数据是纯文本格式,可以使用STORED AS TEXTFILE,如果数据需要压缩,则可以使用STORED AS SEQUENCEFILE。
9 LOCATION
指定 Hive 表在 hdfs 里的存储路径,一般内部表(Managed Table)不需要自定义,使用配置文件中设置的路径即可。
如果创建的是一张外部表,则需要单独指定一个路径。
1 使用create table语句创建表
例子:
2 使用create table as select语句创建表
例子:
使用 create table as select 语句来创建新表sub_student,此时sub_student 表的结构及表数据与 t_student 表一模一样, 相当于直接将 t_student 的表结构和表数据复制一份到 sub_student 表。
注意:
(1) select 中选取的列名(如果是 则表示选取所有列名)会作为新表 sub_student 的列名。
(2) 该种创建表的方式会改变表的属性以及结构,例如不能是外部表,只能是内部表,也不支持分区、分桶。
如果as select后的表是分区表,并且使用select ,则分区字段在新表里只是作为字段存在,而不是作为分区字段存在。
在使用该种方式创建时,create 与 table 之间不能加 external 关键字,即不能通过该种方式创建外部目标表,默认只支持创建内部目标表。
(3) 该种创建表的方式所创建的目标表存储格式会变成默认的格式textfile。
3使用like语句创建表
例子:
注意:
(1) 只是将 t_student 的表结构复制给 sub1_student 表。
(2) 并不复制 t_student 表的数据给 sub1_student 表。
(3) 目标表可以创建为外部表,即:
没做过类似的迁移,以个人的意见供参考。
获取sqlserver的所有值
得到 假设id,username为变量分别存储
sql语句是用mysql中的格式写的,oracle没用过,所以语句格式不详,思路却一样。
sql=inster into table (p_id,p_name) values
循环 {
sql += (id,username)
}
直接将数据变成sql语句,当数据量大,可以设置每1000条为一条语句,然后再oracle数据库中插入。
首先,两台服务器如果可以连通,那么直接使用数据导入导出功能,先在sql2005创建你要的数据库,然后,导入数据,导入时,会提示你要导入那些数据库对象,你可以选择全部对象,然后就ok啦。这是最方便快捷的方式。
导完数据库之后,进系统测试一下,看看有什么错误没有,或者那些数据库对象没有拷贝过去。然后,手动添加过去。
=======================================
你这样做是不行的。sql2000的数据文件,是不能用附加的方式附加到sql2005上去的。我还是不知道你的2台服务器是否能连通,能连通的话,直接在sql2005连接到sql2000,这是可以的,数据库的版本向下兼容。然后在sql2000连接节点中,找到你要导出的数据库,然后右键--任务--导出数据。。。一步一步 *** 作下去就ok,很简单问题,被你搞的这样纠结。。。。。。
以上就是关于Hive 数据库表的基本 *** 作,必须掌握的基本功全部的内容,包括:Hive 数据库表的基本 *** 作,必须掌握的基本功、关于不同数据库,不同表名,不同字段的数据迁移问题、关于服务器中数据库的迁移。等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)