【Python数据分析】数据探索+ 数据预处理_python

数据探索+ 数据预处理

一、数据探索
二、数据预处理
- *基于客户价值分析案例（类似用户画像）*
- 1. 基本理论
- - 1.1 RFM模型
  - - 获取 RFM
    - RFM：【用户的属性】
  - 1.2 聚类分析【RFM 结果数据】
  - 1.3 RFM聚类分析
- 2.RFM聚类分析优势

一、数据探索

统计量分析：

集中趋势的度量：均值、中位数、众数…
离散趋势的度量：极值、极差、标准差、方差、四分位数间距…

相关性分析：通过散点图获取相关系数

二、数据预处理 基于客户价值分析案例（类似用户画像） 1. 基本理论

RFM模型
聚类分析（机器学习里面的算法 =》结果标签
RFM聚类分析

1.1 RFM模型获取 RFM

根据用户属性进行打标签【进行分类】
=》

超级用户
普通用户
黑户

RFM：【用户的属性】

R: 最近一次消费距现在的时长【时差】 recency；
F：消费频率 frequency；
M：消费金额 mon。

eg:
	客户a ：
		R：180  F：1次/月 M：100块/月
	客户b ：
		R：3   F：10次/月 M：1000块/月
	RFM模型=> 
		b 超级用户 
		a 流式用户
	标准： 
		1.RFM 高 =》 【超级用户 、 重要价值用户】
			【R 表示最近消费时间很近 R值很小】
		2.R低 FM高= 》【保持客户】
		3.RM高 F低 =》 【发展客户】
		4.RF低 M高 =》 【挽留客户】

1.2 聚类分析【RFM 结果数据】

一个可以分类的工具
聚类分析方法：

层次聚类法
K-均值法（Kmeans）

1.3 RFM聚类分析

RFM 核心指标进行聚类分析
Kmeans =》用户进行分类 =》 4个类别
4个类别基于 RFM 对用户进行标注【对用户进行打标签】

2.RFM聚类分析优势

提供决策支持。

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/langs/718132.html

【Python数据分析】数据探索+ 数据预处理

发表评论

评论列表（0条）