2021年安徽省大数据与人工智能应用竞赛本科组(省赛)

2021年安徽省大数据与人工智能应用竞赛本科组(省赛),第1张

2021年安徽省大数据与人工智能应用竞赛本科组(省赛) 第三部分:大数据分析 1、 创建一个数据库,以你的用户名命名,创建成功后使用use命令切换为该库,并执行set hive.cli.print.current.db=true;截图(2分)

1)命令截图:

2)执行命令结果截图

2、在HIVE中创建需要的表,并写出建表语句,表结构如下:(3分)

订单表 data_order

data_address 地址表 通过orderMainId字段与 data_order表中的order_id 字段关联

data_area 地区表 通过street_code字段与data_address表中的street_id字段关联

1) 创建hive表 语句截图:

2)创建成功,执行show tables;截图

3、将数据加载到表中,写出加载数据的语句(3分)

数据文件名称分别与表名称对应,(字段分隔符为$$),注意,linux系统和hive默认不支持中文,要自己设置成utf-8编码才可以支持中文。
1) 导入第2步 创建表中的语句截图;

2)执行 select * from table_name 并截图(其中table_name 为前面创建的表名)

4、使用所建的表,按照省市分组,统计 有效订单(subOrder=1)中的 订单总金额(sum),已支付的订单总金额(订单状态state =5、6、7 这三类的paymoney汇总),订单个数(count)(6分)。 输出的字段 包含


1)sql语句截图:

2)sql语句结果截图:

5、使用所建的表统计每个省订单数最多的3个市(6分)。 输出的字段 包含 省份名称,城市名称,订单个数

1)sql语句截图:

2)sql语句结果截图:

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/5618565.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-15
下一篇 2022-12-15

发表评论

登录后才能评论

评论列表(0条)

保存