用户行为路径分析——附Python桑基图代码实现

用户行为路径分析——附Python桑基图代码实现,第1张

用户路径,就是用户在网站或 APP 中的访问行为路径,为了衡量网站/APP的优化升激效果或者营销推广效果,了解用户的行为偏好,要对访问路径的数据进行分析。

用户路径分析和转化分析有点类似,转化分析能告诉我们最终有多少用户成功转化,多少用户流失了。可这些流失的用户都去了哪?他们在流失前都有什么行为?这些问题转化分析都无法告诉我们,因此我们需要对用户的行为路径进行分析,以帮吵裂袜助我们更深入的了解流失背后的原因。行为路径分析相比于转化分析记录的信息要更广。

用户路径分析,以目标事件为起点|终点,通过描述用户的行为路径,可以查看某个事件节点用户的流向,科学的路径分析能够带来以下价值:

通过用户路径分析,可以将整个用户路径的上下游进行可视化展示。即可看到用户群体的登录,跳转、流失、成交等事件的情况。运营人员可通过用户整体的行为路径找到不同行为间的关系,挖掘规律并找到瓶颈。

路径分析对产品设计的优化与改进有着很大的帮助,了解用户从登录到购买整体行为的主路径和次路径,根据用户路径中各个环节的转化率,发现用户的行为规律和偏好,也用于监测和定位用户路径走向中存在的问题,判断影响转化的主要因素和次要因素,也可以发现某些冷门的功能点。

行为路径分析是用来追踪用户从某个事件开始到某个事件结束过程中的全部动线的分析方法。转化漏斗是人为定义的,而对于用户的行为路径,我们虽然可以通过产品设计进行引导,但却无法控制。因此我们分析用户的行为路径可以了解用户的实际 *** 作行为,让产品顺应用户,通过优化界面交互让产品用起来更加流畅和符合用户习惯,产出更多价值。

所以,简单来说:

漏斗分析:人为设定一条或者若干条漏斗,先有假设再数据验证。

路径分析:基于用户所有行为,挖掘出若干条重要的用户路径,先有数据再验证假设。

桑基图,它的核心是对不同点之间,通过线来连接。线的粗细代表流量的大小。

很多工具都能实现桑基图,比如 excel、tableau,我们今天要用 pyecharts 来绘制。

因为没有用户行为路径相关的公开数据,所以本次实现可视化是根据泰坦尼克号,其生存与遇难的人的数据,来分析流向路径。学会思路,你也可以换成自己公司的用户行为埋点数据。

从父类到子类, 每相邻的两个分类变量都需要计算, 使用pandas中数据透视表, 计算后的数据纵向合并成三列。

需要把所有涉及到的节点去重规整在一起。列表内嵌套字典的形式去重汇总。

数据从哪里流向哪里,流量(值)是多少,循环+字典来组织数据

桑基图是分析用户路径的有效方法之一, 桑基图能非常直观地展现用户旅程,

帮助我们进一源让步确定转化漏斗中的关键步骤,发现用户的流失点,找到有价值的用户群体,

看用户主要流向了哪里,发现用户的兴趣点,发现被忽略的产品价值,寻找新的机会。

相关精彩专题链接: 数做芹据成就更好的你

一、项目需求

本案例的数据为小程序运营数据,以行业常见指标对用户行为进行分析,包括UV、PV、新增用户分析、留存分析、复购分析等内容。

项目需求如下:

1.日访问量分析,并观察其走势

2.不同行为类型的访问量分析

3.一天中不同时间段的访问量分析(时间段按小时划分)

4.每日新增用户情况分析

5.用户留存分析

6.复购分析

7.商品排行榜分析

8.利用sqoop将数据分析结果导入mysql存储

二、数据介绍

1.用户行为信息表

2.查看具体的数据格式

a.用户信息:head -n 3 behavior.txt

b.去除首行,首行为标题行,hive导入数据时不需要此行:

sed -i "1d" behavior.txt

三、创建表

创建用户行为表(需结合数据格式)

四、用户行为分析:pv/uv

1.日访问量分析,并观察其走势

2.不同行为类型的访问量分析

3.一天中不同时间段的访问量分析(时间段按小时划分)

五、获客分析

获客分析:观察每日新增用户情况。新用户的定义:第一次访问网站

六、用户留存分析

留存定义:

1月1日,新增用户200人

次日留存:第2天,1月2日,这200人里面有100人活跃,则次日留存率为:100 / 200 = 50%

2日留存:第3天,1月3日,这返慎200名新增用户里面有80人活跃, 第3日新增留存率为:80/200 = 40%以此类推

留存分析结果如下:

例:2019-11-28日的新增漏胡敬7610个用户,次日这些新增用户有6026个再次访问网页,留存率为79.19%,第4天,有5980个用户再次访问,留存率为78.58%

七、复购分析

指在单位时间段内,重复购买率=再次购买人数/总购买人数。

例如在一个月内,有100个客户成交,其中有20个是回头客,则重复购买率为20%。

此处的回头客定义为:按天去重,即一个客户一天产生多笔交易付款,则算一次购买,除非在统计周期内另外一天也有购买的客户才是回头客。

1.用户的购买次数统计

2.复购率计算

八、商品排行榜信息

1.商品的销售数量top10,排名需考虑并列排名的情况

2.商品的浏览次数top10,排名需考虑并列排名的情况

3.商品的收藏次数top10,排名需考虑并列排名的情况

4.城市购买力排名

九、利用sqoop将数据分析结果导入mysql存储

1.在mysql创建一张表,字段类型、顺序都和hive中的表一样

2.测试sqoop连接mysql是否成功

3.利用sqoop将数据分析结果导入mysql存储

4.mysql中查询导入结果,看结果是否正确


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/yw/12340801.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-24
下一篇 2023-05-24

发表评论

登录后才能评论

评论列表(0条)

保存