用户信息表:用户的实名信息,支付宝账号和芝麻信用分等
帐户表:用户账户的余额,积分等数据
充值记录表:用户的充值记录、充值途径、金额、充值日期;
用车记录表:用户每次的骑行数据,包括起始时间、结束时间、距离等数据
反馈表:记录用户的反馈信息,报修信息等数据
其他的根据具体业务要求去扩充。
这个问题不对,应该是共享单车大数据是如何采集的又是如何运输和储存的。共享单车大数据是通过各个车辆上的二维码及用户手机连码来进行采集的。采集到的数据通过服务器来运输,保存共享单车数据,储存下来做数据分析。有了大数据技术的介入,对共享单车的投放和停放进行有序的调配,按照城市公共交通网络数据进行分析得出人员流动规律,从而进行单车的调配、投放、停放等地点的选取,进一步提高了单车的使用率,实现了资源利用的最大化。站在共享单车企业的角度来看,不但节约了管理成本,而且提升了用户的体验感,通过大数据进行分析,用最低的成本实现更高的管理回报。
基于互联网技术而生的大数据拥有海量的信息,只要让这些信息能够互联互通、实现共享,投放于市场的共享单车数量就可以轻松地被锁定,监管部门完全可以按图索骥地对投放于市场的共享单车,在数量方面精准监管。这种借助大数据的精准监管,除了可以让共享单车在市场上的数量始终保持在符合客观需求的动态平衡状态外,还可以从源头上最大限度地减少共享单车过度投放所带来的诸多城市治理难题,实现一举多赢的善治效果。享单车过度投放所带来的诸多城市治理难题,实现一举多赢的善治效果。
项目数据来源于kaggle项目 Bike Share Demand ,使用Python对数据进行了可视化分析:
1. 提出问题
影响共享单车租用数量的因素有哪些?影响程度如何?
2. 理解数据
变量说明:
3.数据清洗
1)数据预处理:数据完整无缺失值
2)特征工程:从datetime中提取年、月、日、时、星期等时间信息
4. 可视化分析
1)单车使用量在天气维度上的分析(天气、温度、湿度和风速相关性)
可以看到,整体租车量受天气影响较为明显,极端的天气租车数量减少。
4级天气看起来有些异常,于是统计数据条目:
可以看到,4级天气只有1条数据记录,这种极端天气情况出现的数据极少。
温度和使用量有正相关关系,湿度与使用量有负相关关系,风速和使用量几乎不相关。
由图像可看出,使用量与温度、湿度和风速的关系,相关性有限。
2)单车使用量在时间维度上的分析(月份、季节、时间、星期等相关性)
总量来看,节假日和周末/工作日的租车数量基本相同。
图1可以看出2012年共享单车的使用量高于2011年,消费人群增加了1.5~2倍。两年内租车量随月份变化的趋势相同,6、7、8月有明显的高需求。
图2可以看出租车时间高峰为上午7-8点,下午5-6点,符合上下班通勤的时间范围。季节上看,春天的租车辆明显少于其它三个季节。
图3可以看出工作日租车辆主要为上下班时间,周末租车辆主要集中在10am-4pm之间。
3)单车使用量与注册用户/非注册用户的相关性
注册人数使用量明显高于非注册人数,
非会员casual主要是周末出行,为了游玩会员registered主要是为了周一到周五上班。
5. 总结
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)