本帖主要针对于伪分布式集群的Hive搭建
环境准备:Hive的文件包、且虚拟机中已经安装了mysql和hadoop
1.解压hive压缩文件包:这里使用的是Hive 1.x cdh版本,解压Hive包放置在/opt/soft/hive110目录下
tar -zxf hive-1.1.0-cdh5.14.2.tar.gz /opt/soft/hive110 --strip-components 1
2.解压后进入 hive110/conf 目录下,修改该目录下的 hive-site.xml 文件(如果该文件不存在,需要先创建一个)
Hive逻辑架构如下图所示:Hive本身不存放任何数据,它的元数据(即数据的信息,例如数据的大小、存放地址等)是存放在配置的关系型数据库中(默认存放在derby中),而Hive的数据则存放在HDFS上,因此需要对Hive进行相关的配置。
配置文件信息如下:
hive.metastore.warehouse.dir /hive110/warehouse hive.metastore.local false javax.jdo.option.ConnectionURL jdbc:mysql://192.168.100.155:3306/hive?createDatabaseIfNotExist=true javax.jdo.option.ConnectionDriverName com.mysql.jdbc.Driver javax.jdo.option.ConnectionUserName root javax.jdo.option.ConnectionPassword password hive.server2.authentication NONE hive.server2.thrift.client.user root hive.server2.thrift.client.password passwod
3.由于 hive 连接 mysql 时也属于第三方连接,因此需要将连接 mysql 所需要的jar包拖入hive的lib目录下,才能让 hive 通过调用相关 jar包启动 mysql
4.配置环境变量:vim /etc/profile
#hive environment export HIVE_HOME=/opt/soft/hive110 #hive所在路径 export PATH=$PATH:$HIVE_HOME/bin
5.保存后激活配置文件:source /etc/profile
6.启动 hadoop 集群,初始化hive元数据库
schematool -dbType mysql -initSchema
当显示如下信息时,说明 hive 数据库已搭建完成。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)