Hive 数据库表的基本 *** 作，必须掌握的基本功_sql

说明：hive 的表存放位置模式是由 hive-site.xml 当中的一个属性指定的，默认是存放在该配置文件设置的路径下，也可在创建数据库时单独指定存储路径。

数据库有一些描述性的属性信息，可以在创建时添加：

查看数据库的键值对信息

修改数据库的键值对信息

与mysql查询语句是一样的语法

删除一个空数据库，如果数据库下面有数据表，那么就会报错

强制删除数据库，包含数据库下面的表一起删除(请谨慎 *** 作)

[]里的属性为可选属性，不是必须的，但是如果有可选属性，会使 sql 语句的易读性更好，更标准与规范。

例如：[comment '字段注释信息'][comment '表的描述信息']等，[external]属性除外

1. CREATE TABLE

创建一个指定名字的表，如果相同名字的表已存在，则抛出异常提示：表已存在，使用时可以使用IF NOT EXISTS语句来忽略这个异常。

如果创建的表名已存在，则不会再创建，也不会抛出异常提示：表已存在。否则则自动创建该表。

2. EXTERNAL

顾名思义是外部的意思，此关键字在建表语句中让使用者可以创建一个外部表，如果不加该关键字，则默认创建内部表。

外部表在创建时必须同时指定一个指向实际数据的路径（LOCATION），Hive在创建内部表时，会将数据移动到数据仓库指向的路径；

若创建外部表，仅记录数据所在的路径，不对数据的位置作任何改变。

内部表在删除后，其元数据和数据都会被一起删除。

外部表在删除后，只删除其元数据，数据不会被删除。

3. COMMENT

用于给表的各个字段或整张表的内容作解释说明的，便于他人理解其含义。

4. PARTITIONED BY

区分表是否是分区表的关键字段，依据具体字段名和类型来决定表的分区字段。

5. CLUSTERED BY

依据column_name对表进行分桶，在 Hive 中对于每一张表或分区，Hive 可以通过分桶的方式将数据以更细粒度进行数据范围划分。Hive采用对列值哈希，然后除以桶的个数求余的方式决定该条记录存放在哪个桶当中。

6. SORTED BY

指定表数据的排序字段和排序规则，是正序还是倒序排列。

7. ROW FORMAT DELIMITED FIELDS TERMINATED BY ' '

指定表存储中列的分隔符，这里指定的是' '，也可以是其他分隔符。

8. STORED AS SEQUENCEFILE|TEXTFILE|RCFILE

指定表的存储格式，如果文件数据是纯文本格式，可以使用STORED AS TEXTFILE，如果数据需要压缩，则可以使用STORED AS SEQUENCEFILE。

9. LOCATION

指定 Hive 表在 hdfs 里的存储路径，一般内部表（Managed Table）不需要自定义，使用配置文件中设置的路径即可。

如果创建的是一张外部表，则需要单独指定一个路径。

1. 使用create table语句创建表

例子：

2. 使用create table ... as select...语句创建表

例子：

使用 create table ... as select ...语句来创建新表sub_student，此时sub_student 表的结构及表数据与 t_student 表一模一样，相当于直接将 t_student 的表结构和表数据复制一份到 sub_student 表。

注意：

(1). select 中选取的列名（如果是 * 则表示选取所有列名）会作为新表 sub_student 的列名。

(2). 该种创建表的方式会改变表的属性以及结构，例如不能是外部表，只能是内部表，也不支持分区、分桶。

如果as select后的表是分区表，并且使用select *，则分区字段在新表里只是作为字段存在，而不是作为分区字段存在。

在使用该种方式创建时，create 与 table 之间不能加 external 关键字，即不能通过该种方式创建外部目标表，默认只支持创建内部目标表。

(3). 该种创建表的方式所创建的目标表存储格式会变成默认的格式textfile。

3.使用like语句创建表

例子：

注意：

(1). 只是将 t_student 的表结构复制给 sub1_student 表。

(2). 并不复制 t_student 表的数据给 sub1_student 表。

(3). 目标表可以创建为外部表，即:

需要用的资料以链接的形式给需要的同学。

我用的mysql版本为： Mysql-5.5.45-win64.msi 密码是：26zw

图形化工具 Navicat(前期不推荐用，直接手动敲)： Navicat 密码：c7fs

开始我的MySQL之旅吧始于2016.12.04

--WH

一、数据库的安装

这个就不在这里过多阐述了，因为网上实在是太多安装mysql的教程了，有了我给的mysql，在按照这个安装教程(MySQL安装教程)去看，就能够安装完好。

安装好mysql后，如果需要使用windows命令窗口(也就是cmd)来 *** 作mysql，那么就需要配置环境变量，在安装好的mysql下找到bin，将其目录放到环境变量path中去，就行了，检测成功与否的方法是在cmd命令窗口中输入mysql，就会出现一大段英文，就说明成功了，反之失败，如果不会的话就去百度搜教程。

二、数据库的基本 *** 作

1、开启mysql服务命令

net start mysql

2、进入mysql的两种方式

明文进入：mysql -uroot -proot格式：mysql -u帐号　-p密码

密文进入：mysql -uroot -p 按enter会提示你输入密码(Enter pssword:)，此时你写的密码就会显示为***这样。

3、查看mysql中所有的数据库(一般在固定的单词命令就会是用大写，这个要习惯，看多了敲多了就认识了)

前面四个数据库是mysql中自带的，也就是必须的.

SHOW DATABASES

4、创建名为test_1的数据库

格式：CREATE DATABASE 数据库名

CREATE DATABASE test_1

5、删除名为test_1的数据库

格式：DROP DATABASE 数据库名

DROP DATABASE test_1

总结：学习了对数据库的三个 *** 作，1、查看所有数据库 2、创建数据库 3、删除数据库

三、数据表的基本 *** 作

数据表和数据库还有Mysql三者的关系

mysql中保存了很多数据库、一个数据库中可以保存很多表。

对数据表的增(创建表)删(删除表)改(修改表字段)查(查询表结构)。注意：这里的 *** 作对象是表，对表的 *** 作也就是表的结构，和表中的字段的 *** 作(字段和记录要分清楚)

前提：表是在数据库下的，所以要先确实使用哪个数据库。

USE test_1

1、创建数据表

格式：CREATE TABLE 数据表名(

　字段名1数据类型[列级别约束条件],

　字段名2数据类型[列级别约束条件],

　字段名3数据类型[列级别约束条件]

　)　

注意：格式不一定需要这样隔着写，完全可以全部写成一行。但是那样写可观性非常差。我这样写只是为了可以看的更清晰。

解释：

1、[]中括号中的内容表示可以有可以没有，

2、列级别这个“列”一定要搞清楚说的是什么，一张表中有行有列，列表示竖，行表示横　

3、约束条件后面会讲到

1.1、创建没有约束的student表

　CREATE TABLE student( idINT(11), nameVARCHAR(12), ageINT(11) 　)

注释：SHOW TABLES 查询数据库底下的所有表。

1.2、创建有约束的student表

　六大约束：主键约束、外键约束、非空约束、唯一约束、默认约束、自动增加

1.2.1：主键约束

PRIMARY KEY(primary key)：独一无二(唯一)和不能为空(非空)，通俗的讲，就是在表中增加记录时，在该字段下的数据不能重复，不能为空，比如以上面创建的表为例子，在表中增加两条记录，如果id字段用了主键约束。则id不能一样，并且不能为空。一般每张表中度有一个字段为主键，唯一标识这条记录。以后需要找到该条记录也可以同这个主键来确认记录，因为主键是唯一的，并且非空，一张表中每个记录的主键度不一样，所以根据主键也就能找到对应的记录。而不是多条重复的记录。如果没有主键，那么表中就会存在很多重复的记录，那么即浪费存储空间，在查询时也消耗更多资源。

一般被主键约束了的字段度习惯性的称该字段为该表的主键

单字段主键约束

两种方式都可以

CREATE TABLE student(CREATE TABLE student(

idINT(11) PRIMARY KEY,idINT(11),

nameVARCHAR(12),nameVARCHAR(12),

ageINT(11) ageINT(11),

)　PRIMARY KEY(id) )

多字段主键约束(复合主键)

这个id和name都市主键，说明在以后增加的插入的记录中，id和name不能同时一样，比如说可以是这样。一条记录为id=1，name=yyy、另一条记录为：id=1，name=zzz。这样是可以的。并不是你们所理解的两个字段分别度不可以相同。

CREATE TABLE student(CREATE TABLE student(

idINT(11) PRIMARY KEY,idINT(11),

nameVARCHAR(12) PRIMARY KEY,　nameVARCHAR(12),

ageINT(11)　ageINT(11),

)PRIMARY KEY(id,name) )

1.2.2：外键约束

什么是外键举个例子就清楚了，有两张表，一张表是emp(员工)表，另一张表是dept(部门)表，一个员工属于一个部门，那么如何通过员工能让我们自己他在哪个部门呢？那就只能在员工表中增加一个字段，能代表员工所在的部门，那该字段就只能是存储dept中的主键了(因为主键是唯一的，才能确实是哪个部门，进而代表员工所在的部门，如果是部门名称，有些部门的名称可能是同名。就不能区分了。)，像这样的字段，就符合外键的特点，就可以使用外键约束，使该字段只能够存储另一张表的主键。如果不被外键约束，那么该字段就无法保证存储进来的值就一定是另一张表的主键值。

外键约束的特点：

1、外键约束可以描述任意一个字段(包括主键)，可以为空，并且一个表中可以有多个外键。但是外键字段中的值必须是另一张表中的主键。

2、这样被外键关联的两种表的关系可以称为父子表或者主从表。子表(从表)拥有外键字段的表，父表(主表)被外键字段所指向的表。

3、子表被外键约束修饰的字段必须和父表的主键字段的类型一样。

注意：一个表中有被外键修饰的字段，就称该表有外键(是“有外键”。而不是“是外键”)，并会给该表中的外键约束取一个名称，所以我们常说的这个表有没有外键，指的不是被外键约束修饰的字段名，而是指这个表是否有存在外键约束。也就是说，不能说这个表的外键是xxx(该表中被外键约束修饰的字段名)，这种说法是错误的，但是大多数人已经习惯了这样，虽然影响不大，但是在很多时候需要理解一个东西时，会造成一定的困扰。

格式：CONSTRAINT外键名称FOREIGN KEY(被外键约束的字段名称)REFERENCES 主表名(主键字段)

英文解释：CONSTRAINT:约束REFERENCES:参考

CREATE TABLE tableA

(

id INT(11),

name VARCHAR(22),

location VARCHAR(50),

PRIMARY KEY(id)

)

CREATE TABLE tableB

(

id INT(11),

name VARCHAR(22) NOT NULL,

deptId INT(11),

PRIMARY KEY(id),

CONSTRAINT tableA_tableB_1 FOREIGH KEY(deptId) REFERENCES tableA(id)

)

　解释：tableB中有一个名为tableA_tableB_1的外键关联了tableA和tableB两个表，被外键约束修饰的字段为tableB中的deptId，主键字段为tableA中的id　

1.2.3：非空约束

NOT NULL. 被该约束修饰了的字段，就不能为空，主键约束中就包括了这个约束

CREATE TABLE tableA

(

id INT(11),

name VARCHAR(22) NOT NULL,

location VARCHAR(50),

PRIMARY KEY(id)

)

1.2.4：唯一约束

UNIQUE 被唯一约束修饰了的字段，表示该字段中的值唯一，不能有相同的值，通俗点讲，就好比插入两条记录，这两条记录中处于该字段的值不能是一样的。

　 CREATE TABLE tableA

(

id INT(11),

name VARCHAR(22) UNIQUE,

location VARCHAR(50),

PRIMARY KEY(id)

)

也就是说在插入的记录中，每条记录的name值不能是一样的。

1.2.5：默认约束

Default 指定这一列的默认值为多少，比如，男性同学比较多，性别就可以设置为默认男，如果插入一行记录时，性别没有填，那么就默认加上男　

CREATE TABLE table

(

id INT(11) PRIMARY KEY,

name VARCHAR(22) NOT NULL,

deptId INT(11) DEFAULT 1111,

salary FLOAT

)

1.2.6：自动增加

AUTO_INCREMENT 一个表只能一个字段使用AUTO_INCREMENT，并且使用这个约束的字段只能是整数类型(任意的整数类型 TINYINT,SMALLIN,INT,BIGINT)，默认值是1，也就是说从1开始增加的。一般就是给主键使用的，自动增加，使每个主键的值度不一样，并且不用我们自己管理，让主键自己自动生成

CREATE TABLE table( id INT(11) PRIMARY KEY AUTO_INCREMENT, name VARCHAR(22) NOT NULL)

2、查询表结构

2.1、查看表基本结构语句

格式1：DESCRIBE 表名/DESC 表名这两个的功能是一样的，简写了单词describe

DESCRIBE　student

2.2、查看创建表的语句　

　格式：SHOW CREATE TABLE 表名

　SHOW CREATE TABLE student

这样显示的格式很不好，看不清楚，所以有了下面这个语句

格式：SHOW CREATE TABLE 表名\G

SHOW CREATE TABLE student\G

3、修改数据表

修改数据表包括：对表中字段的增加、删除、修改。在这个里面用的关键字为 ALTER

3.1、修改表名

格式：ALTER TABLE<旧表名>RENAME[TO]<新表名>

将student表名改为student1(改完后在改回来)

ALTER TABLE student RENAME TO student1

3.2、修改表中的字段名

格式：ALTER TABLE<表名>CHANGE<旧字段名><新字段名><新数据类型>

将student表中的name字段名改为 username

ALTER TABLE student CHANGE name username VARCHAR(30)

3.3、修改表中的数据类型

格式：ALTER TABLE<表名>MODIFY<字段名><数据类型>　

ALTER TABLE student MODIFY username VARCHAR(20)

解释：只能修改字段名的数据类型，但是其原理跟上面change做的事情一样，这里也有修改字段名的过程，只不过修改后的字段名和修改前的字段名相同，但是数据类型不一样。

3.4、修改字段的排列位置

　方式1：ALTER TABLE<表名>MODIFY<字段1><数据类型>FIRST|AFTER<字段2>

　解释：将字段1的位置放到第一，或者放到指定字段2的后面

　ALTER TABLE student MODIFY username VARCHAR(20) AFTER age

方式2：ALTER TABLE<表名>CHANGE<字段1><字段2><数据类型>FIRST|AFTER<字段3>　

解释：其实是一样的，将是字段2覆盖字段1，然后在进行排序

ALTER TABLE student CHANGE username username VARCHAR(20) AFTER age

总结

CHANGE和MODIFY的区别？

原理都市一样的，MODIFY只能修改数据类型，但是CHANGE能够修改数据类型和字段名，也就是说MODIFY是CHANGE的更具体化的一个 *** 作。可能觉得用CHANGE只改变一个数据类型不太爽，就增加了一个能直接改数据类型的使用关键字MODIFY来 *** 作。

3.5、添加字段

格式：ALTER TABLE<表名称>ADD<新字段名><数据类型>[约束条件][FIRST|AFTER<已存在的表名>]

解释：在一个特定位置增加一个新的字段，如果不指定位置，默认是最后一个。

ALTER TABLE student ADD sex VARCHAR(11)

3.6、删除字段

格式：ALTER TABLE<表名称>DROP<字段名>

ALTER TABLE student DROP sex

3.7、删除表的外键约束

格式：ALTER TABLE<表名称>DROP FOREIGN KEY<外键约束名>

注意：外键约束名指的不是被外键约束修饰的字段名，切记，而是我们在创建外键约束关系时取的名字。

3.8、更改表的存储引擎

格式：ALTER TABLE<表名>ENGINE=<更改后的存储引擎名>

这个存储引擎目前我自己也不太清楚，虽然知道有哪几种引擎，但是稍微深入一点就不清楚了，所以打算留到日后在说。

4、删除表

4.1、删除无关联表

格式：DROP TABLE<表名>；

ALTER TABLE student

4.2、删除被其他表关联的主表

这个是比较重要的一点，在有外键关联关系的两张表中，如果删除主表，那么是删不掉的，并且会报错。因为有张表依赖于他。那怎么办呢？针对这种情况，总共有两种方法

1、先删除你子表，然后在删除父表，这样就达到了删除父表的目的，但是子表也要被删除

2、先解除外键关系，然后在删除父表，这样也能达到目的，并且保留了子表，只删除我们不需要的父表。在3.7中就讲解了如何删除外键关系。

我们平时都是通过数据库管理工具 *** 作MYSQL数据表，那么如何在Intellij IDEA中 *** 作MYSQL数据表呢？下面我给大家分享一下。

工具/材料

Intellij IDEA

首先点击右侧的Data Source，选择下拉菜单中的MySQL选项，如下图所示

接下来在d出的Data Sources and Drivers界面中输入Mysql的用户名和密码进行数据库连接，如下图所示

连接成功MYSQL数据库以后，数据库中的表都会显示出来了，如下图所示，我们双击要 *** 作的数据表

然后在右侧就会显示此数据表的所有数据，在这里可以对数据表的数据进行相应的增删改查，如下图所示

接下来点击此数据表顶部的加号按钮进行数据行的增加，如下图所示

编辑完新的数据以后需要右键单击数据行，然后选择Submit New Row选项，如下图所示

接下来我们还可以在输入栏中通过列表进行数据的过滤，如下图所示

最后，如果你不习惯 *** 作界面，那么可以打开右侧的SQL窗口按钮，如下图所示

然后在工作区就会展现出SQL编辑区，我们就可以在里面输入SQL语句进行数据表的 *** 作，如下图所示

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/sjk/10034800.html

Hive 数据库表的基本 *** 作，必须掌握的基本功

发表评论

评论列表（0条）