大数据的特征(4V):
1. 数据的规模性
2. 数据结构多样性
3. 数据传播高速性
4. 大数据的真实性、价值性、易变性;
结构化数据、半结构化数据、非结构化数据
大数据处理的基本流程图
大数据关键技术:
1. 大数据采集
2. 大数据预处理
3. 大数据存储及管理
4. 大数据安全技术
5. 大数据分析与挖掘
6. 大数据展现与应用
二、大数据营销概论
Target 百货客户怀孕预测案例
大数据营销的特点:
1. 多样化、平台化数据采集: 多平台包括互联网、移动互联网、广电网、智能电视等
2. 强调时效性: 在网民需求点最高时及时进行营销
3. 个性化营销: 广告理念已从媒体导向转为受众导向
4. 性价比高: 让广告可根据时效性的效果反馈,进行调整
5. 关联性: 网民关注的广告与广告之间的关联性
大数据运营方式:
1. 基础运营方式
2. 数据租赁运营方式
3. 数据购买运营方式
大数据营销的应用
1. 价格策略和优化定价
2. 客户分析
3. 提升客户关系管理
4. 客户相应能力和洞察力
5. 智能嵌入的情景营销
6. 长期的营销战略
三、产品预测与规划
整体产品概念与整体产品五层次
整体产品概念: 狭义的产品: 具有某种特定物质形态和用途的物体。
产品整体概念(广义):向市场提供的能够满足人们某种需要的
一切物品和服务。
整体产品包含:有形产品和无形的服务
整体产品五层次:潜在产品、延伸产品、期望产品、形式产品、核心产品
大数据新产品开发模型:
1. 需求信息收集及新产品立项阶段
2. 新产品设计及生产调试阶段
3. 小规模试销及反馈修改阶段
4. 新产品量产上市及评估阶段
产品生命周期模型
传统产品生命周期划分法:
(1)销售增长率分析法
销售增长率=(当年销售额-上年销售额)/上年销售额×100%
销售增长率小于10%且不稳定时为导入期;
销售增长率大于10%时为成长期;
销售增长率小于10%且稳定时为成熟期;
销售增长率小于0时为衰退期。
(2)产品普及率分析法
产品普及率小于5%时为投入期;
普及率在5%—50%时为成长期;
普及率在50%—90%时为成熟期;
普及率在90%以上时为衰退期。
大数据对产品组合进行动态优化
产品组合
销售对象、销售渠道等方面比较接近的一系列产品项目被称为产品线。产品组合是指一个企业所经营的不同产品线和产品项目的组合方式,它可以通过宽度、长度、深度和关联度四个维度反映出来
四、产品定价与策略
大数据定价的基本步骤:
1. 获取大数据
2. 选择定价方法
3. 分析影响定价因素的主要指标
4. 建立指标体系表
5. 构建定价模型
6. 选择定价策略
定价的3C模式:成本导向法、竞争导向法、需求导向法
影响定价的主要指标与指标体系表的建立
影响定价因素的主要指标:
1. 个人统计信息:家庭出生、教育背景、所在地区、年龄、感情状况、家庭关系等。
2. 工作状况:行业、岗位、收入水平、发展空间等
3. 兴趣:健身与养生、运动和户外活动、娱乐、科技、购物和时尚等
4. 消费行为:消费心理、购买动机等。
定价策略:
精算定价: 保险、期货等对风险计算要求很高的行业
差异定价: 平台利用大数据对客户建立标签,分析对产品的使用习惯、需求判断客户的忠诚度,对不同客户进行差别定价
动态定价: 即根据顾客认可的产品、服务的价值或者根据供需状况动态调整服务价格,通过价格控制供需关系。动态定价在提高消费者价格感知和企业盈利能力方面起着至关重要的作用。
价格自动化 :根据商品成本、市场供需情况、竞争产品价格变动、促销活动、市场调查投票、网上协商、预订周期长短等因素决定自身产品价格
用户感知定价 :顾客所能感知到的利益与其在获取产品或服务中所付出的成本进行权衡后对产品或服务效用所做出的整体评价。
协同定价: 是大数据时代企业双边平台多边协同定价策略
价格歧视:
一级 :就是每一单位产品都有不同的价格,即商家完全掌握消费者的消费意愿,对每个消费者将商品价格定为其能够承受的最高出价;
二级 :商家按照客户的购买数量,对相同场景提供的、同质商品进行差别定价;
三级 :可视为市场细分后的定价结果,根据客户所处的地域、会员等级等个人属性进行差别定价,但是对于同一细分市场的客户定价一致。
五、销售促进与管理
促销组合设计概念
大数据促销组合设计流程
精准广告设计与投放
[if !supportLists]l [endif] 广告设计5M:任务(Mission),预算(Money),信息(Message),媒体(Media),测量(Measurement)。
通过用户画像的进一步挖掘分析,企业可以找出其目标消费群体的广告偏好,如平面广告的配色偏好,构图偏好,视频广告的情节偏好,配乐偏好,人物偏好等,企业可以根据这些偏好设计出符合目标消费群体审美的广告创意,选择消费者喜欢的广告代言人,做出能在目标消费群体中迅速传播开来的广告。
在媒体决策方面,利用大数据综合考虑其广告目的、目标受众覆盖率、广告信息传播要求、购买决策的时间和地点、媒体成本等因素后,有重点地采用媒体工具。企业可以在确定前述影响变量后,通过大数据的决策模型,确定相对最优的媒体组合。
六、客户管理
大数据在客户管理中的作用
1. 增强客户粘性
2. 挖掘潜在客户
3. 建立客户分类
客户管理中数据的分类、收集及清洗
数据分类:
描述性数据: 这类数据是客户的基本信息。
如果是个人客户,涵盖了客户的姓名、年龄、地域分布、婚姻状况、学历、所在行业、职业角色、职位层级、收入水平、住房情况、购车情况等;
如果是企业客户,则包含了企业的名称、规模、联系人和法人代表等。
促销性数据: 企业曾经为客户提供的产品和服务的历史数据。
包括:用户产品使用情况调查的数据、促销活动记录数据、客服人员的建议数据和广告数据等
交易性数据: 这类数据是反映客户对企业做出的回馈的数据。
包括历史购买记录数据、投诉数据、请求提供咨询及其他服务的相关数据、客户建议数据等。
收集:
清洗:
首先,数据营销人需要凭借经验对收集的客户质量进行评估
其次,通过相关字段的对比了解数据真实度
最后,通过测试工具对已经确认格式和逻辑正确数据进行测试
客户分层模型
客户分层模型 是大数据在客户管理中最常见的分析模型之一,客户分层与大数据运营的本质是密切相关的。在客户管理中,出于一对一的精准营销要求针对不同层级的客户进行区别对待,而客户分层则是区别对待的基础。
RFM客户价值分析模型
时间(Rencency):
客户离现在上一次的购买时间。
频率(Frequency):
客户在一定时间段内的消费次数。
货币价值(MonetaryValue):
客户在一定的时间内购买企业产品的金额。
七、 跨界营销
利用大数据跨界营销成功的关键点
1. 价值落地
2. 杠杠传播
3. 深度融合
4. 数据打通
八、精准营销
精准营销的四大特点
1. 可量化
2. 可调控
3. 保持企业和客户的互动沟通
4. 简化过程
精准营销的步骤
1. 确定目标
2. 搜集数据
3. 分析与建模
4. 制定战略
九、商品关联营销
商品关联营销的概念及应用
关联营销:
关联营销是一种建立在双方互利互益的基础上的营销,在交叉营销的基础上,将事物、产品、品牌等所要营销的东西上寻找关联性,来实现深层次的多面引导。
关联营销也是一种新的、低成本的、企业在网站上用来提高收入的营销方法。
关联分析的概念与定义
最早的关联分析概念: 是1993年由Agrawal、Imielinski和Swami提出的。其主要研究目的是分析超市顾客购买行为的规律,发现连带购买商品,为制定合理的方便顾客选取的货架摆放方案提供依据。该分析称为购物篮分析。
电子商务领域: 关联分析可帮助经营者发现顾客的消费偏好,定位顾客消费需求,制定合理的交叉销售方案, 实现商品的精准推荐 ;
保险公司业务: 关联分析可帮助企业分析保险索赔的原因,及时甄别欺诈行为;
电信行业: 关联分析可帮助企业发现不同增值业务间的关联性及对客户流失的影响等
简单关联规则及其表达式
事务:简单关联分析的分析对象
项目:事务中涉及的对象
项集:若干个项目的集合
简单关联规则 的一般表示形式是:前项→后项(支持度=s%,置信度=c%)
或表达为:X→Y(S=s%,C=c%)
例如:面包->牛奶(S=85%,C=90%)
性别(女)∩收入(>5000元)→品牌(A)(S=80%,C=85%)
支持度、置信度、频繁项集、强关联规则、购物篮分析模型
置信度和支持度
support(X→Y)= P(X∩Y)
confidence(X→Y)= P(Y|X)
十、评论文本数据的情感分析
商品品论文本数据挖掘目标
电商平台激烈竞争的大背景下,除了提高商品质量、压低商品价格外,了解更多消费者的心声对于电商平台来说也变得越来越有必要,其中非常重要的方式就是对消费者的文本评论数据进行内在信息的数据挖掘分析。评论信息中蕴含着消费者对特定产品和服务的主观感受,反映了人们的态度、立场和意见,具有非常宝贵的研究价值。
针对电子商务平台上的商品评论进行文本数据挖掘的目标一般如下:
分析商品的用户情感倾向,了解用户的需求、意见、购买原因;
从评论文本中挖掘商品的优点与不足,提出改善产品的建议;
提炼不同品牌的商品卖点。
商品评论文本分析的步骤和流程
商品评论文本的数据采集、预处理与模型构建
数据采集:
1、“易用型”:八爪鱼、火车采集器
2、利用R语言、Python语言的强大程序编写来抓取数据
预处理:
1文本去重
检查是否是默认文本
是否是评论人重复复制黏贴的内容
是否引用了其他人的评论
2机械压缩去词
例如: “好好好好好好好好好好”->“好”
3短句删除
原本过短的评论文本 例如:很“好好好好好好好好好好”->“好”
机械压缩去词后过短的评论文本 例如:“好好好好好好好好好好”->“好”
4评论分词
文本模型构建包括三方面:情感倾向分析、语义网络分析、基于LDA模型的主体分析
情感倾向分析:
基于情感词进行情感匹配
对情感词的倾向进行修正
对情感分析结果进行检验
语义网络分析:
基于LDA模型的主体分析
十一、大数据营销中的伦理与责任
大数据的安全与隐私保护
数据安全:一是保证用户的数据不损坏、不丢失;二是要保证数据不会被泄露或者盗用
大数据营销中的伦理风险:用户隐私、信息不对称下的消费者弱势群体、大数据“杀熟”
大数据伦理困境的成因:
用户隐私意识淡薄
用户未能清晰认知数据价值
企业利益驱使
] 管理机制不够完善
大数据伦理构建的必要性:企业社会责任、用户与社会群体的维系
这些是我按照老师讲的课本上的内容结合PPT总结出来的《大数据营销》的重点。
1.大数据与小数据
2.大数据的内涵
(1) 数据类型方面
(2) 技术方法方面
(3) 分析应用方面
3.大数据的特征
多样性:随着互联网的发展和传感器种类的增多,诸如网页、图片、音频、视频、微博类的未加工的半结构化和非结构化数据越来越多,以数量激增、类型繁多的非结构化数据为主。非结构化数据相对于结构化数据而言更加复杂,数据存储和处理的难度增大。
时效性:大数据的时效性是指在数据量特别大的情况下,能够在一定的时间和范围内得到及时处理,这是大数据区别于传统数据挖掘最显著的特征。只有对大数据做到实时创建、实时存储、实时处理和实时分析,才能及时有效的获得高价值的信息。
价值型:包含很多深度的价值,大数据分析挖掘和利用将带来巨大的商业价值。
4.大数据与传统数据的区别
5.大数据的产生背景
1.按照大数据结构分类
2. 按照大数据获取处理方式分类
3.按照其他方式分类
1.销售机会增多
0. 商业大数据的来源
1. 客户
2. 市场
3. 商品
4. 供应链
0. 数据来源
2. 市场与精准营销
3. 客户关系管理
4. 企业运营管理
5. 数据商业化
0. 数据来源
2. 付款定价
3. 研发
4. 新的商业模式
5. 公共健康
1. 营销
2. 服务
3. 运营
4. 风控
大数据金融是指运用 大数据技术和大数据平台 开展 金融活动和金融服务 ,对金融行业 积累的大数据以及外部数据 进行云计算等信息化处理,结合传统金融,开展资金融通、创新金融服务。
1. 呈现方式网络化
大量的金融产品和服务通过网络呈现。
2. 风险管理有所调整
风险管理理念 ——财务分析(第一还款来源)、可抵押财产或其他保证(第二还款来源)重要性将有所降低。
风险定价方式 ——更注重将交易行为的真实性、信用的可信度通过数据来呈现。
对客户的评价 ——全方位、立体的/活生生的。
风险管理的主要手段 ——基于数据挖掘对客户进行识别和分类。
3. 信息不对称降低
4. 金融业务效率提高
在合适的时间、合适的地点,把合适的产品以合适的方式提供给合适的消费者。
5. 金融企业服务边界扩大
由于效率提升,其经营成本必然随之下降,最适合扩大经营规模。
金融从业人员个体服务对象会更多。
6. 产品是可控的、可受的
通过网络化呈现的金融产品,对消费者而言,其收益或成本、产品的流动性是可以接受的,其风险是可控的。
7. 普惠金融
大数据金融的高效率性及扩展的服务边界,使金融服务的对象和范围也大大扩展,金融服务也更接地气。
1. 放贷快捷,精准营销个性化服务
立足长期大量的信用及资金流的大数据基础之上,在任何时点都可以通过计算得出信用评分,并采用网上支付方式,实时根据贷款需要及其信用评分等数据进行放贷。
2. 客户群体大,运营成本低
大数据金融是以大数据云计算为基础,以大数据自动计算为主,不需要大量人工,成本较低,整合了碎片化的需求和供给,服务领域拓展至更多的中小企业和中小客户。
3. 科学决策,有效风控
根据交易借贷行为的违约率等相关指标估计信用评分,运用分布式计算做出风险评估模型,解决信用分配、风险评估、授权实施以及欺诈识别等问题,有效地降低了不良贷款率。
基于 电商平台基础 上形成的网上交易信息与网上支付形成的金融大数据,利用云计算等先进技术对数据进行处理分析而形成的信用或订单融资模式。
典型代表有 阿里小贷 ,基于对电商平台的 交易数据、社交网络的用户交易与交互信息和购物行为习惯 等的大数据通过 云计算 来实时计算得分和分析处理,形成网络商户在电商平台中的累积信用数据,通过电商所构建的网络信用评级体系和金融风险计算模型及风险控制体系,来实时向网络商户发放订单贷款或者信用贷款,例如,阿里小贷可实现数分钟之内发放贷款。
企业利用自身所处的 产业链上下游 (原料商、制造商、分销商、零售商),充分整合供应链资源和客户资源,提供金融服务而形成的金融模式。
京东商城、苏宁易购是供应链金融的典型代表。
在供应链金融模式当中, 电商平台只是作为信息中介提供大数据金融 ,并不承担融资风险及防范风险等。—— 渠道商为核心企业。
【案例】恒丰银行——基于大数据的精准营销模型应用 https://mp.weixin.qq.com/s?src=3&timestamp=1500159788&ver=1&signature=pCHfpePVrKXUGp39JEg577lopIPT9KCdx9FqIL2LbRmunZMQ-86itFcexY XKcX3Vb1ypwGo8v0IU6fkNgcs QIafGAccsZFmMb6yBYcuPdqH63EKBvL88BGFaUrBBPQl0v*mpgzYxrTCkcaJGaX2iIFRHZEDNCmuM0qhqqN294=
本篇案例为数据猿推出的大型 “金融大数据主题策划” 活动 (查看详情) 第一部分的系列案例/征文;感谢** 恒丰银行** 的投递
作为整体活动的第二部分,2017年6月29日,由数据猿主办,上海金融信息行业协会、互联网普惠金融研究院合办,中国信息通信研究院、大数据发展促进委员会、上海大数据联盟、首席数据官联盟、中国大数据技术与应用联盟协办的 《「数据猿·超声波」之金融科技·商业价值探索高峰论坛》 还将在上海隆重举办 【论坛详情】 【上届回顾(点击阅读原文查看)】
在论坛现场,也将颁发 “技术创新奖”、“应用创新奖”、“最佳实践奖”、“优秀案例奖” 四大类案例奖
本文长度为 6000 字,建议阅读 12 分钟
如今,商业银行信息化的迅速发展,产生了大量的业务数据、中间数据和非结构化数据,大数据随之兴起。要从这些海量数据中提取出有价值的信息,为商业银行的各类决策提供参考和服务,需要结合大数据和人工智能技术。国外的汇丰、花旗和瑞士银行是数据挖掘技术应用的先行者。在国内的商业银行中,大数据的思想和技术逐步开始在业务中获得实践和尝试。
面对日趋激烈的行业内部竞争及互联网金融带来的冲击,传统的上门营销、电话营销,甚至是扫街营销等方式跟不上时代的节奏。利用精准营销可节约大量的人力物力、提高营销精准程度,并减少业务环节,无形中为商业银行节约了大量的营销成本。
虽然恒丰银行内部拥有客户的基本信息和交易等大量数据,但是传统的营销系统并没有挖掘出行内大量数据的价值,仍然停留在传统的规则模型。当下,恒丰银行接入了大量的外部数据,有着更多的维度,如果将内部数据与外部数据进行交叉,则能产生更大的价值。客户信息收集越全面、完整,数据分析得到的结论就越趋向于合理和客观。利用人工智能技术,建立精准营销系统变得可能且必要。
恒丰银行基于大数据的精准营销方案是利用大数据平台上的机器学习模型深入洞察客户行为、客户需求,客户偏好,挖掘潜出在客户,实现可持续的营销计划。
周期/节奏
2016.4-2016.5 完成需求梳理和业务调研,并在此基础上进行总体方案设计。
2016.5-2016.8 整理银行内、外部数据,根据营销需求制定客户标签和设计文档,实施用户画像。
2016.8-2016.10 在用户画像的基础上,构建理财产品个性化推荐系统。其中包括个性化推荐算法调研,模型对比等一系列工作。
2016.10-2017.1 客户需求预测并对客户价值进行建模,并完善整合精准营销应用模型。
2017.1-2017.3 用户画像、个性化推荐、客户价值预测等精准营销模型上线。
客户名称/所属分类
恒丰银行/客户管理
任务/目标
根据零售业务营销要求,运用多种数据源分析客户行为洞察客户需求,实现精准营销与服务,提高银行客户满意度和忠诚度。
针对不同的客户特征、产品特征和渠道特征,制定不同市场推广策略。为了完成以上任务,主要从以下几个方面构建精准营销系统:
1.用户画像: 结合用户的历史行为和基本属性给用户打标签。
2.精准推荐系统: 给用户推荐个性化理财产品, 例如在微信银行中给每个客户推荐他喜欢的产品,帮客户找到其最适合的产品,增加产品的购买率。
3.需求预测和客户价值: 新产品发售的时候,找到最有可能购买该产品的客户,进行短信营销,进而提高产品响应率。客户价值精准定位,根据客户价值水平制定不同的推荐策略。银行通过计算客户使用其产品与服务后所形成的实际业务收益,充分了解每一个客户的贡献度,为管理层提供决策支撑。
挑战
项目实施过程由用户画像,精准推荐系统,需求预测和客户价值建模三部分组成,采用TDH机器学习平台Discover所提供的算法和模型库进行开发和验证。
(一)用户画像的建立
客户标签主要包含客户基本属性,客户等级标签,客户偏好标签,客户交易特征,客户流失特征,客户信用特征,客户终身价值标签,客户潜在需求标签。
(二)精准推荐系统的建立
由于系统复杂,且篇幅有限,仅对其中最重要的理财推荐系统做详细阐述。精准推荐系统架构图如下。
2.1业务问题转化为机器学习问题
业务问题
银行理财产品个性化推荐给客户。 例如在微信银行中给每个客户推荐此客户喜欢的产品,帮客户找到其最适合的产品,增加产品的购买率。
将业务问题转化为机器学习问题
理财产品种类繁多,产品迭代速度很快,客户在繁多的产品中不能快速找到适合自己的产品,因此有必要建立一个自动化推荐模型,建立客户理财偏好,给客户推荐最适合的产品。
将银行理财产品推荐业务问题转化为机器学习问题,进而利用人工智能技术提高推荐产品的点击率和购买率。例如在恰当的时间,通过用户偏好的渠道给用户推荐产品,推荐的结果为用户购买或者未购买。这个问题可以看作一个典型机器学习二分类问题:基于历史营销数据来训练模型,让模型自动学到客户购买的产品偏好,并预测客户下次购买理财产品的概率。对模型预测出所有客户对所有产品的响应概率进行排序,可选择客户购买概率最高的topN个产品推荐给客户。
下面将叙述如何构建该推荐预测模型。
2.2数据源准备
在建立的一个理财推荐模型之前,可以预见到相似的客户可能会喜好相似的产品(需要表征客户和产品的数据),同一个人的喜好可能具有连续性(购买历史交易数据,包括基金国债等),他的存款、贷款资金可能决定了他能购买什么档次的理财等等。因此,我们需要准备以下数据。
客户基本属性:客户性别,年龄,开户时间,评估的风险等级等等。
产品基本属性:产品的逾期收益率,产品周期,保本非保本,风险等级等。
客户购买理财产品的历史:在什么时候购买什么产品以及购买的金额。
客户的存款历史: 客户历史存款日均余额等。
客户的贷款历史: 客户历史贷款信息等。
客户工资:客户工资的多少也决定了客户购买理财的额度和偏好。
用户画像提取的特征:用户的AUM等级,贡献度,之前购买基金,国债的金额等。
2.3特征转换和抽取
有了这么多数据,但是有一部分特征是算法不能直接处理的,还有一部分数据是算法不能直接利用的。
特征转换
把不能处理的特征做一些转换,处理成算法容易处理的干净特征。举例如下:
开户日期。就时间属性本身来说,对模型来说不具有任何意义,需要把开户日期转变成到购买理财时的时间间隔。
产品特征。从理财产品信息表里面可以得到风险等级,起点金额等。但是并没有标志这款产品是否是新手专属,是否是忠诚客户专属。这就需要我们从产品名字抽取这款产品的上述特征。
客户交易的时间信息。同客户的开户日期,孤立时间点的交易信息不具有任何意义,我们可以把交易时间转变为距离上次购买的时间间隔。
特征抽取
还有一部分数据算法不能直接利用,例如客户存款信息,客户交易信息。我们需用从理财交易和存款表中抽取可能有用的信息。
用户存款信息:根据我们的经验,客户购买理财之前的存款变动信息更能表明客户购买理财的真实想法,因此我们需要从客户历史存款数据抽取客户近三个月,近一个月,近一周的日均余额,以体现客户存款变化。
客户交易信息:客户最近一次购买的产品、购买的金额、及其相关属性,最近一个月购买的产品、购买的金额及其相关属性等等。
以上例举的只是部分特征。
2.4构造、划分训练和测试集
构造
以上说明了如何抽取客户购买理财的相关特征,只是针对正样本的,即客户购买某种理财时候的特征。隐藏着的信息是,此客户当时没有购买其他在发售的产品。假设把客户购买了产品的标签设为1,没有购买的产品样本设为0,我们大致有如下训练样本(只列举部分特征)。
其中客户是否购买产品是我们在有监督训练的标签,也就是我们建立的是一个预测客户是否会购买产的模型。
划分训练集和测试集
考虑到最终模型会预测将来的某时间客户购买某种产品的概率,为了更真实的测试模型效果,以时间来切分训练集和测试集。具体做法如下。假设我们有2016-09-01 ~ 2017-03-20 的理财购买相关数据。以2016-09-01 ~ 2017-03-19的理财交易数据作为训练,2017-03-20这一天的客户对每个产品是否购买的数据作为测试。以2016-09-01 ~ 2017-03-18的理财交易数据作为训练,2017-03-19这一天的客户对每个产品是否购买的数据作为测试,以此类推。
2.5模型训练
根据提取的特征,组成样本宽表,输入到分类模型,这里选择了TDH平台机器学习组件Discover所提供的近百个分布式算法进行建模和训练,同时我们还使用了特征的高阶交叉特性进行推荐的预测和分析。
2.6模型评估
评价推荐好坏的指标很多,比较常用的有
1.ROC曲线下面积(AUC)
2.logloss
3.推荐产品第一次命中rank的倒数(MRR)
4.TopN
针对银行的理财推荐实际业务,客户当天绝大多数是只购买了某一款理财,MRR(Mean Average Precision 的特殊情况)能反应这种情况下推荐的好坏。另一种直观的评价指标是TopN,假定我们只推荐N个模型认为客户最有可能购买的产品,并和真实情况比较,就能得到当天推荐的结果的混淆矩阵,TN,TP,FN,FP,recall,precision等。
我们在生产上验证了最近十天的推荐效果,即测试了2017-03-20, 2017-03-19,…… , 2017-03-11等十天的推荐效果,以下是这些结果的评价。
AUC
Logloss
MRR
0.89
0.45
0.78
也可以把新客户(之前没有购买理财)和老客户(至少购买过一次)分开评估效果。 新客户的购买占了整个理财购买的1/3 以上。
测试新客户的预测效果,可以看出模型对冷启动问题解决的好坏。
对新客户的预测效果
AUC
Logloss
MRR
0.80
0.73
0.32
对老客户的预测效果
AUC
Logloss
MRR
0.92
0.38
0.88
2.7模型优化
1.上线之前的优化:特征提取,样本抽样,参数调参
2.上线之后的迭代,根据实际的A/B testing和业务人员的建议改进模型
(三)需求预测和客户价值
“顾客终生价值”(Customer Lifetime Value)指的是每个购买者在未来可能为企业带来的收益总和。研究表明,如同某种产品一样,顾客对于企业利润的贡献也可以分为导入期、快速增长期、成熟期和衰退期。
经典的客户终身价值建模的模型基于客户RFM模型。模型简单的把客户划分为几个状态,有一定意义但不一定准确,毕竟RFM模型用到的特征不全面,不能很好的表征客户的价值以及客户银行关系管理。
为了方便的对客户终身价值建模,有几个假定条件。其一把客户的购买价值近似为客户为企业带来的总收益,其二把未来时间定义在未来一个季度、半年或者一年。也就是我们通过预测客户在下一个时间段内的购买价值来定义客户的终身价值。因此,我们将预测的问题分为两个步骤:第一步预测这个客户在下一个阶段是否会发生购买(需求预测)。第二步对预测有购买行为的客户继续建模预测会购买多大产品价值。
3.1需求预测
提取客户定活期存款、pos机刷卡、渠道端查询历史等特征,以这些特征作为输入预测用户在当前时间节点是否有购买需求,训练和测试样本构造如下:
1.历史用户购买记录作为正样本。
2.抽样一部分从未购买的理财产品的用户作为负样本集合Un,对于每一个正样本Un中随机选取一个用户构造负样本。
3.选取2016.04-201610 的购买数据作为训练样本,2016.11的数据作为测试样本。
使用机器学习算法进行分类训练和预测,重复上述实验,得到下列结果:
AUC: 0.930451274
precision: 0.8993963783
recall: 0.8357507082
fmeasure: 0.8664062729
进一步对客户分群之后,可以更好的对新客户进行建模,对于老客户我们可以进一步提取他们的历史购买特征,预测他们在下一段时间内购买的产品价值(数量,金额等),对于新客户,可以进根据他的存款量预测其第一次购买的产品价值,把存款客户变成理财客户。通过分析客户存款变动于客户购买理财的关系,我们发现客户购买理财的前一段时间内定活期的增加的有不同的模式,如下图。
根据需求预测模型,我们给出新客户最有可能购买的top N 列表,然后由业务人员进行市场推广。
3.2客户价值预测
进一步预测有购买需求的客户的购买价值高低。这是个回归问题,但是预测变量从二分类变量变为预测连续的金额值。训练的时候预测值取训练周期内(一个月或者季度)客户所购买的总金额。
算出客户的当前价值(即当前阶段购买的产品价值)和未来价值(预测的下一个阶段的客户价值)可以帮助我们鉴定客户处于流失阶段,或者上升阶段,或者是稳定阶段。当前价值取的是当前时间前三个月的交易量。对流失阶段高价值客户可以适当给予营销优惠,对于有购买意向的客户适当引导。如下图所示。
结果/效果
一是提高银行营销准确性。随着客户不断增加,理财产品也在不断推陈出新,在实时精准营销平台的帮助下,银行从以前盲目撒网式的营销方式转变到对不同客户精准触达,提高了理财产品的营销成功率,降低销售和运作成本。理财产品推荐的上线以来,产品推荐成功率比专家经验排序模型最高提升10倍。
二是增加银行获客数量。精准营销系统洞察客户潜在需求和偏好,提高了银行获取目标客户群的准确率。从数百万客户中,通过机器学习模型,找到最有可能购买产品的客户群,通过渠道营销,实现响应率提升。相比传统盲发模式,发送原38%的短信即可覆盖80%的客户。
通过构建基于大数据的精准营销方案,恒丰银行深入洞察客户行为、需求、偏好,帮助银行深入了解客户,并打造个性化推荐系统和建立客户价值预测模型,实现可持续的营销计划。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)