hive常用 *** 作

hive常用 *** 作,第1张

hive常用 *** 作

展示数据库列表

show databases;

使用database数据库

use database;

创建数据库
数据库本质上是一个目录或命名空间,用于解决表命名冲突。

CREATE DATAbase IF NOT EXISTS test1
LOCATION ‘/hive/test1’
WITH DBPROPERTIES(‘creator’=‘John’,‘date’=‘2019-02-25’);

if not exists是可省的
LOCATION:指定数据库位于HDFS上的存储路径。若未指定,将使用${hive.metastore.warehouse.dir}定义值作为其上层路径位置

修改数据库信息

ALTER DATAbase test1 SET DBPROPERTIES(‘creator’=‘Marry’);

删除数据库

DROp DATAbase test1;

查看数据库信息(extended可选)

DESCRIBE DATAbase EXTENDED 数据库名;

创建表(这里是(用逗号隔开的,也可替换成空格,把引号里面改成空格)

create table (if not exists) 表名(xx string,xx int,xx text,xx float) row format delimited fields terminated by “,”;

向表中导入数据
导入hdfs中的数据

load data inpath ‘/001/hive/emp.csv(路径)’ into table 表名;

导入本地数据

load data local inpath ‘/home/root/002/hive/emp2.csv(本地路径)’ into table 表名;

删除表

drop table 表名;

一些函数
select 查询出指定信息
where 进行限定
like ‘%限定词%’,like *** 作符用于在WHERe子句中搜索列中的指定模式。%代表任意多个字符。

select * from 表名;//查询所有信息
select x from 表名 where xx == a and xxx > and …;

如,查询出工作职责涉及hive的并且工资大于8000的公司名称以及工作经验。

select workingExp,company_name from table1 where salary>8000 and
responsibility like ‘%hive%’;

group by
group by表示按照某些字段的值进行分组,有相同的值放到一起,需要注意的是select后面的非聚合函数字段必须出现在group by中;
聚合函数就是像avg(),sum(),count()这种
详细解释可以看这里

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/5700110.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-17
下一篇 2022-12-17

发表评论

登录后才能评论

评论列表(0条)

保存