求问怎么设置sparksql读取hive的数据库_sql

历史上存在的原理，以前都是使用hive来构建数据仓库，所以存在大量对hive所管理的数据查询的需求。而hive、shark、sparlsql都可以进行hive的数据查询。shark是使用了hive的sql语法解析器和优化器，修改了执行器，使之物理执行过程是跑在spark上；而sparksql是使用了自身的语法解析器、优化器和执行器，同时sparksql还扩展了接口，不单单支持hive数据的查询，可以进行多种数据源的数据查询。

具体 *** 作步骤：

1、准备Spark程序目录结构。

2、编辑build.sbt配置文件添加依赖。

3、创建WriteToCk.scala数据写入程序文件。

4、编译打包。

5、运行。

参数说明：your-user-name：目标ClickHouse集群中创建的数据库账号名。

your-pasword：数据库账号名对应的密码。

your-url：目标ClickHouse集群地址。

/your/path/to/test/data/a.txt：要导入的数据文件的路径，包含文件地址和文件名。说明文件中的数据及schema，需要与ClickHouse中目标表的结构保持一致。

your-table-name：ClickHouse集群中的目标表名称。

欢迎分享，转载请注明来源：内存溢出

原文地址: https://outofmemory.cn/sjk/10001942.html

求问怎么设置sparksql读取hive的数据库

发表评论

评论列表（0条）