1)命令截图:
2)执行命令结果截图
2、在HIVE中创建需要的表,并写出建表语句,表结构如下:(3分)订单表 data_order
data_address 地址表 通过orderMainId字段与 data_order表中的order_id 字段关联
data_area 地区表 通过street_code字段与data_address表中的street_id字段关联
1) 创建hive表 语句截图:
2)创建成功,执行show tables;截图
3、将数据加载到表中,写出加载数据的语句(3分)数据文件名称分别与表名称对应,(字段分隔符为$$),注意,linux系统和hive默认不支持中文,要自己设置成utf-8编码才可以支持中文。
1) 导入第2步 创建表中的语句截图;
2)执行 select * from table_name 并截图(其中table_name 为前面创建的表名)
4、使用所建的表,按照省市分组,统计 有效订单(subOrder=1)中的 订单总金额(sum),已支付的订单总金额(订单状态state =5、6、7 这三类的paymoney汇总),订单个数(count)(6分)。 输出的字段 包含
1)sql语句截图:
2)sql语句结果截图:
5、使用所建的表统计每个省订单数最多的3个市(6分)。 输出的字段 包含 省份名称,城市名称,订单个数1)sql语句截图:
2)sql语句结果截图:
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)