构建中小型电子商务网站最常用的数据库是

构建中小型电子商务网站最常用的数据库是,第1张

Access数据库好,他是美国Microsoft公司于1994年推出的微机数据库管理系统。界面友好、易学易用、开发简单、接口灵活等特点,是典型的新一代桌面数据库管理系统。

他完善地管理各种数据库对象,具有强大的数据组织、用户管理、安全检查等功能;强大的数据处理功能,在一个工作组级别的网络环境中,使用Access开发的多用户数据库管理系统具有传统的XBASE(DBASE、FoxBASE的统称)数据库系统所无法实现的客户服务器(Cient/Server)结构和相应的数据库安全机制,Access具备了许多先进的大型数据库管理系统所具备的特征,如事务处理/出错回滚能力等;)可以方便地生成各种数据对象,利用存储的数据建立窗体和报表,可视性好;作为Office套件的一部分,可以与Office集成,实现无缝连接。

关键的一点能够利用Web检索和发布数据,实现与Internet的连接。 Access主要适用于中小型应用系统,或作为客户机/服务器系统中的客户端数据库。

数据来源于Kaggle的电商数据集 The UCI Machine Learning Repository ,英国在线零售商在2010年12月1日到2011年12月9日的在线销售数据,该电商公司主要以销售各类礼品为主,多数客户都是批发商。

使用Oracle 对数据进行处理与清洗,通过RFM模型、复购率、消费生命周期等对用户维度进行分析,利用ABC分类、退货率等维度展开剖析,结合Excel图表进行可视化展示,为精准营销与个性化服务提供支持。

根据分析目的选择字段,数据集共8个字段,如果表格字段较多,视情根据分析目的的需要选择合适的字段。

创建备用表new_ecommerce,将旧表的数据去重添加进备用表。原有数据541909条, 去重后数据536641条,删除重复值5268条。

检查缺失值

CustomerID存在缺失值135037条,Description出现缺失值1454条。数据都很大,不可能全部删除。Description产品描述不是项目分析,不用处理。

在实际工作中,像CustomerID客户ID缺失,首先找业务部门或者数据来源部门确认信息并且补上。本项目只有单一数据,无法找到相关人员确认,暂且把NULL值替换为0。

51检查日期是否在范围内(2010年12月1日到2011年12月9日)

交易成功,销量不可能为负值或零值。如果销量为零或者负值情况,那么需要和业务/数据来源部门确认具体的原因。这里假设出现负值是客户退货情况。

检查发现交易销量小于0的发票编号大都是"C”开头的,有部分异常销量小于0但不是以"C"开头,这里做删除处理。

检查发现有单价为0的免费单,共计1174。暂且不分析免费单,直接删除免费单的数据。

检查发现两笔坏账,单价都是负值,故把它删除。

根据分析目的,我们处理InvoiceDate日期数据。这里只做日期分析,不分析小时分钟,故转换为日期格式。

根据分析目的,本次分析将采用RFM模型

在RFM模式中:

R:最近一次消费时间(最近一次消费到参考时间的间隔)

F:消费的频率(消费了多少次)

M:消费的金额 (总消费金额)

一般的分析型RFM强调以客户的行为来区分客户。

根据最近一次消费与客户数的分析结果显示最长的天数差是373天,最短0天;80%的客户在200天内都有交易记录,说明客户忠诚度不错。

分析显示,10次交易记录以内的客户占绝大部分,说明客户是很认可产品和服务。

在2010年12月1日到2011年12月9日期间,交易金额主要集中在 1000英镑以内和1000-3000英镑这两个范围内。

分析发现,该电商平台总交易客户数4372位。交易客户中,一般发展客户(可以说是新客户)最多,占总数的34%,其次是一般挽留客户(流失客户)29%,重要发展客户22%,重要价值客户10%,重要挽留客户5%和重要挽回客户016%。

每月新客数量及其占比

每月的新老客户的销售数量与销售金额

用户生命周期 = 最近一次购买时间 - 第一次购买时间

商品退货分析

结合ABC分类进行分析,选取退货率大于均值且为A级的商品(主要是综合上文提及的ABC分类和退货率计算,通过创建view的形式进行联结后筛选,创建退货率视图为view_return_rate,ABC分类视图为view_class),这里筛选出64个商品。

基于hadoop生态搭建的电商数据仓库,整体功能架构包含数据采集、数仓搭建、数据导出、数据可视化等。

github地址

电商数据仓库

详情学习攻略请查看

hadoop安装

hive安装

hive常用命令

完善中

项目踩坑请查看

Linux卸载安装Mysql踩坑

Linux报错只读文件系统(集群非法关机、断电)踩坑

sqoop拒绝连接

kafka manager启动失败解决方案

hive拒绝连接解决方案

系统数据流程如下图:

数仓分层如下图:

hive表关系图如下图:

完善中

完善中

以上就是关于构建中小型电子商务网站最常用的数据库是全部的内容,包括:构建中小型电子商务网站最常用的数据库是、电商销售数据分析案例(Oracle)、电商数据仓库项目简介等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/sjk/9447860.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-28
下一篇 2023-04-28

发表评论

登录后才能评论

评论列表(0条)

保存