【案例】恒丰银行——基于大数据的精准营销模型应用 https://mp.weixin.qq.com/s?src=3&timestamp=1500159788&ver=1&signature=pCHfpePVrKXUGp39JEg577lopIPT9KCdx9FqIL2LbRmunZMQ-86itFcexY XKcX3Vb1ypwGo8v0IU6fkNgcs QIafGAccsZFmMb6yBYcuPdqH63EKBvL88BGFaUrBBPQl0v*mpgzYxrTCkcaJGaX2iIFRHZEDNCmuM0qhqqN294=
本篇案例为数据猿推出的大型 “金融大数据主题策划” 活动 (查看详情) 第一部分的系列案例/征文;感谢** 恒丰银行** 的投递
作为整体活动的第二部分,2017年6月29日,由数据猿主办,上海金融信息行业协会、互联网普惠金融研究院合办,中国信息通信研究院、大数据发展促进委员会、上海大数据联盟、首席数据官联盟、中国大数据技术与应用联盟协办的 《「数据猿·超声波」之金融科技·商业价值探索高峰论坛》 还将在上海隆重举办 【论坛详情】 【上届回顾(点击阅读原文查看)】
在论坛现场,也将颁发 “技术创新奖”、“应用创新奖”、“最佳实践奖”、“优秀案例奖” 四大类案例奖
本文长度为 6000 字,建议阅读 12 分钟
如今,商业银行信息化的迅速发展,产生了大量的业务数据、中间数据和非结构化数据,大数据随之兴起。要从这些海量数据中提取出有价值的信息,为商业银行的各类决策提供参考和服务,需要结合大数据和人工智能技术。国外的汇丰、花旗和瑞士银行是数据挖掘技术应用的先行者。在国内的商业银行中,大数据的思想和技术逐步开始在业务中获得实践和尝试。
面对日趋激烈的行业内部竞争及互联网金融带来的冲击,传统的上门营销、电话营销,甚至是扫街营销等方式跟不上时代的节奏。利用精准营销可节约大量的人力物力、提高营销精准程度,并减少业务环节,无形中为商业银行节约了大量的营销成本。
虽然恒丰银行内部拥有客户的基本信息和交易等大量数据,但是传统的营销系统并没有挖掘出行内大量数据的价值,仍然停留在传统的规则模型。当下,恒丰银行接入了大量的外部数据,有着更多的维度,如果将内部数据与外部数据进行交叉,则能产生更大的价值。客户信息收集越全面、完整,数据分析得到的结论就越趋向于合理和客观。利用人工智能技术,建立精准营销系统变得可能且必要。
恒丰银行基于大数据的精准营销方案是利用大数据平台上的机器学习模型深入洞察客户行为、客户需求,客户偏好,挖掘潜出在客户,实现可持续的营销计划。
周期/节奏
2016.4-2016.5 完成需求梳理和业务调研,并在此基础上进行总体方案设计。
2016.5-2016.8 整理银行内、外部数据,根据营销需求制定客户标签和设计文档,实施用户画像。
2016.8-2016.10 在用户画像的基础上,构建理财产品个性化推荐系统。其中包括个性化推荐算法调研,模型对比等一系列工作。
2016.10-2017.1 客户需求预测并对客户价值进行建模,并完善整合精准营销应用模型。
2017.1-2017.3 用户画像、个性化推荐、客户价值预测等精准营销模型上线。
客户名称/所属分类
恒丰银行/客户管理
任务/目标
根据零售业务营销要求,运用多种数据源分析客户行为洞察客户需求,实现精准营销与服务,提高银行客户满意度和忠诚度。
针对不同的客户特征、产品特征和渠道特征,制定不同市场推广策略。为了完成以上任务,主要从以下几个方面构建精准营销系统:
1.用户画像: 结合用户的历史行为和基本属性给用户打标签。
2.精准推荐系统: 给用户推荐个性化理财产品, 例如在微信银行中给每个客户推荐他喜欢的产品,帮客户找到其最适合的产品,增加产品的购买率。
3.需求预测和客户价值: 新产品发售的时候,找到最有可能购买该产品的客户,进行短信营销,进而提高产品响应率。客户价值精准定位,根据客户价值水平制定不同的推荐策略。银行通过计算客户使用其产品与服务后所形成的实际业务收益,充分了解每一个客户的贡献度,为管理层提供决策支撑。
挑战
项目实施过程由用户画像,精准推荐系统,需求预测和客户价值建模三部分组成,采用TDH机器学习平台Discover所提供的算法和模型库进行开发和验证。
(一)用户画像的建立
客户标签主要包含客户基本属性,客户等级标签,客户偏好标签,客户交易特征,客户流失特征,客户信用特征,客户终身价值标签,客户潜在需求标签。
(二)精准推荐系统的建立
由于系统复杂,且篇幅有限,仅对其中最重要的理财推荐系统做详细阐述。精准推荐系统架构图如下。
2.1业务问题转化为机器学习问题
业务问题
银行理财产品个性化推荐给客户。 例如在微信银行中给每个客户推荐此客户喜欢的产品,帮客户找到其最适合的产品,增加产品的购买率。
将业务问题转化为机器学习问题
理财产品种类繁多,产品迭代速度很快,客户在繁多的产品中不能快速找到适合自己的产品,因此有必要建立一个自动化推荐模型,建立客户理财偏好,给客户推荐最适合的产品。
将银行理财产品推荐业务问题转化为机器学习问题,进而利用人工智能技术提高推荐产品的点击率和购买率。例如在恰当的时间,通过用户偏好的渠道给用户推荐产品,推荐的结果为用户购买或者未购买。这个问题可以看作一个典型机器学习二分类问题:基于历史营销数据来训练模型,让模型自动学到客户购买的产品偏好,并预测客户下次购买理财产品的概率。对模型预测出所有客户对所有产品的响应概率进行排序,可选择客户购买概率最高的topN个产品推荐给客户。
下面将叙述如何构建该推荐预测模型。
2.2数据源准备
在建立的一个理财推荐模型之前,可以预见到相似的客户可能会喜好相似的产品(需要表征客户和产品的数据),同一个人的喜好可能具有连续性(购买历史交易数据,包括基金国债等),他的存款、贷款资金可能决定了他能购买什么档次的理财等等。因此,我们需要准备以下数据。
客户基本属性:客户性别,年龄,开户时间,评估的风险等级等等。
产品基本属性:产品的逾期收益率,产品周期,保本非保本,风险等级等。
客户购买理财产品的历史:在什么时候购买什么产品以及购买的金额。
客户的存款历史: 客户历史存款日均余额等。
客户的贷款历史: 客户历史贷款信息等。
客户工资:客户工资的多少也决定了客户购买理财的额度和偏好。
用户画像提取的特征:用户的AUM等级,贡献度,之前购买基金,国债的金额等。
2.3特征转换和抽取
有了这么多数据,但是有一部分特征是算法不能直接处理的,还有一部分数据是算法不能直接利用的。
特征转换
把不能处理的特征做一些转换,处理成算法容易处理的干净特征。举例如下:
开户日期。就时间属性本身来说,对模型来说不具有任何意义,需要把开户日期转变成到购买理财时的时间间隔。
产品特征。从理财产品信息表里面可以得到风险等级,起点金额等。但是并没有标志这款产品是否是新手专属,是否是忠诚客户专属。这就需要我们从产品名字抽取这款产品的上述特征。
客户交易的时间信息。同客户的开户日期,孤立时间点的交易信息不具有任何意义,我们可以把交易时间转变为距离上次购买的时间间隔。
特征抽取
还有一部分数据算法不能直接利用,例如客户存款信息,客户交易信息。我们需用从理财交易和存款表中抽取可能有用的信息。
用户存款信息:根据我们的经验,客户购买理财之前的存款变动信息更能表明客户购买理财的真实想法,因此我们需要从客户历史存款数据抽取客户近三个月,近一个月,近一周的日均余额,以体现客户存款变化。
客户交易信息:客户最近一次购买的产品、购买的金额、及其相关属性,最近一个月购买的产品、购买的金额及其相关属性等等。
以上例举的只是部分特征。
2.4构造、划分训练和测试集
构造
以上说明了如何抽取客户购买理财的相关特征,只是针对正样本的,即客户购买某种理财时候的特征。隐藏着的信息是,此客户当时没有购买其他在发售的产品。假设把客户购买了产品的标签设为1,没有购买的产品样本设为0,我们大致有如下训练样本(只列举部分特征)。
其中客户是否购买产品是我们在有监督训练的标签,也就是我们建立的是一个预测客户是否会购买产的模型。
划分训练集和测试集
考虑到最终模型会预测将来的某时间客户购买某种产品的概率,为了更真实的测试模型效果,以时间来切分训练集和测试集。具体做法如下。假设我们有2016-09-01 ~ 2017-03-20 的理财购买相关数据。以2016-09-01 ~ 2017-03-19的理财交易数据作为训练,2017-03-20这一天的客户对每个产品是否购买的数据作为测试。以2016-09-01 ~ 2017-03-18的理财交易数据作为训练,2017-03-19这一天的客户对每个产品是否购买的数据作为测试,以此类推。
2.5模型训练
根据提取的特征,组成样本宽表,输入到分类模型,这里选择了TDH平台机器学习组件Discover所提供的近百个分布式算法进行建模和训练,同时我们还使用了特征的高阶交叉特性进行推荐的预测和分析。
2.6模型评估
评价推荐好坏的指标很多,比较常用的有
1.ROC曲线下面积(AUC)
2.logloss
3.推荐产品第一次命中rank的倒数(MRR)
4.TopN
针对银行的理财推荐实际业务,客户当天绝大多数是只购买了某一款理财,MRR(Mean Average Precision 的特殊情况)能反应这种情况下推荐的好坏。另一种直观的评价指标是TopN,假定我们只推荐N个模型认为客户最有可能购买的产品,并和真实情况比较,就能得到当天推荐的结果的混淆矩阵,TN,TP,FN,FP,recall,precision等。
我们在生产上验证了最近十天的推荐效果,即测试了2017-03-20, 2017-03-19,…… , 2017-03-11等十天的推荐效果,以下是这些结果的评价。
AUC
Logloss
MRR
0.89
0.45
0.78
也可以把新客户(之前没有购买理财)和老客户(至少购买过一次)分开评估效果。 新客户的购买占了整个理财购买的1/3 以上。
测试新客户的预测效果,可以看出模型对冷启动问题解决的好坏。
对新客户的预测效果
AUC
Logloss
MRR
0.80
0.73
0.32
对老客户的预测效果
AUC
Logloss
MRR
0.92
0.38
0.88
2.7模型优化
1.上线之前的优化:特征提取,样本抽样,参数调参
2.上线之后的迭代,根据实际的A/B testing和业务人员的建议改进模型
(三)需求预测和客户价值
“顾客终生价值”(Customer Lifetime Value)指的是每个购买者在未来可能为企业带来的收益总和。研究表明,如同某种产品一样,顾客对于企业利润的贡献也可以分为导入期、快速增长期、成熟期和衰退期。
经典的客户终身价值建模的模型基于客户RFM模型。模型简单的把客户划分为几个状态,有一定意义但不一定准确,毕竟RFM模型用到的特征不全面,不能很好的表征客户的价值以及客户银行关系管理。
为了方便的对客户终身价值建模,有几个假定条件。其一把客户的购买价值近似为客户为企业带来的总收益,其二把未来时间定义在未来一个季度、半年或者一年。也就是我们通过预测客户在下一个时间段内的购买价值来定义客户的终身价值。因此,我们将预测的问题分为两个步骤:第一步预测这个客户在下一个阶段是否会发生购买(需求预测)。第二步对预测有购买行为的客户继续建模预测会购买多大产品价值。
3.1需求预测
提取客户定活期存款、pos机刷卡、渠道端查询历史等特征,以这些特征作为输入预测用户在当前时间节点是否有购买需求,训练和测试样本构造如下:
1.历史用户购买记录作为正样本。
2.抽样一部分从未购买的理财产品的用户作为负样本集合Un,对于每一个正样本Un中随机选取一个用户构造负样本。
3.选取2016.04-201610 的购买数据作为训练样本,2016.11的数据作为测试样本。
使用机器学习算法进行分类训练和预测,重复上述实验,得到下列结果:
AUC: 0.930451274
precision: 0.8993963783
recall: 0.8357507082
fmeasure: 0.8664062729
进一步对客户分群之后,可以更好的对新客户进行建模,对于老客户我们可以进一步提取他们的历史购买特征,预测他们在下一段时间内购买的产品价值(数量,金额等),对于新客户,可以进根据他的存款量预测其第一次购买的产品价值,把存款客户变成理财客户。通过分析客户存款变动于客户购买理财的关系,我们发现客户购买理财的前一段时间内定活期的增加的有不同的模式,如下图。
根据需求预测模型,我们给出新客户最有可能购买的top N 列表,然后由业务人员进行市场推广。
3.2客户价值预测
进一步预测有购买需求的客户的购买价值高低。这是个回归问题,但是预测变量从二分类变量变为预测连续的金额值。训练的时候预测值取训练周期内(一个月或者季度)客户所购买的总金额。
算出客户的当前价值(即当前阶段购买的产品价值)和未来价值(预测的下一个阶段的客户价值)可以帮助我们鉴定客户处于流失阶段,或者上升阶段,或者是稳定阶段。当前价值取的是当前时间前三个月的交易量。对流失阶段高价值客户可以适当给予营销优惠,对于有购买意向的客户适当引导。如下图所示。
结果/效果
一是提高银行营销准确性。随着客户不断增加,理财产品也在不断推陈出新,在实时精准营销平台的帮助下,银行从以前盲目撒网式的营销方式转变到对不同客户精准触达,提高了理财产品的营销成功率,降低销售和运作成本。理财产品推荐的上线以来,产品推荐成功率比专家经验排序模型最高提升10倍。
二是增加银行获客数量。精准营销系统洞察客户潜在需求和偏好,提高了银行获取目标客户群的准确率。从数百万客户中,通过机器学习模型,找到最有可能购买产品的客户群,通过渠道营销,实现响应率提升。相比传统盲发模式,发送原38%的短信即可覆盖80%的客户。
通过构建基于大数据的精准营销方案,恒丰银行深入洞察客户行为、需求、偏好,帮助银行深入了解客户,并打造个性化推荐系统和建立客户价值预测模型,实现可持续的营销计划。
SaaS 又称为“软件即服务”,是指通过互联网以服务形式交付应用程序,通过 SaaS 平台交付的软件也称为云软件、ASP、按需软件或托管软件。
Saas平台是运营saas软件的平台。SaaS提供商为企业搭建信息化所需要的所有网络基础设施及软件、硬件运作平台,并负责所有前期的实施、后期的维护等一系列服务,企业无需购买软硬件、建设机房、招聘IT人员,即可通过互联网使用信息系统。
SaaS 是一种软件布局模型,其应用专为网络交付而设计,便于用户通过互联网托管、部署及接入。
作为互联网软件企业者,软件产品不再需要经常性地去客户现场安装调试,我们的软件产品不需要自己想办法推广营销,我们的软件产品不需要用很长的时间去建立与客户的信任关系。
我们的软件也不需要开发很多相同的功能:登录,计费,日志,权限,支付等等。最重要的是,我们的软件转向为SAAS系统后,可以集中升级维护,集中收集需求。
以上内容参考:saas平台-百度百科
编辑导语:营销对于电商行业来说,是老生常谈的一个话题。尽管如此,我们还是不能忽略创新对于营销的重要性以及不断的学习对于营销转化的影响。本文作者对阿里、京东、美团、电通等电商行业的营销模型进行了汇总,看看这些大厂是如何做好营销的。
过去的2、3年是自己做产品经理比较有意思的一段时间,也是很重要的一段时间,因为这段时间除了做功能外会更多的去接触业务本身,从业务的初始和角度来做产品,我们对应的思考模型会不一样。
前段时间把霍普金斯的《科学的广告》又看了一遍,霍普金斯是谁?
即使没有学过广告的同学也可能对“奥美广告”或多或少有一些了解,然后稍微熟悉一点的可能知道“现代广告之父”是奥美广告的创始人——大卫·奥格威;然后,大卫·奥格威的师傅就是“霍普金斯”。
霍普金斯第一次把广告这个职业从一个野生的状态拉向了正规军,这也是《科学的广告》写作的初衷。做运营或者营销相关的同学可能对“新品试用”、”优惠券”已经再熟悉不过了,而根据资料记载,这些也都算是霍普金斯的发明。
工作时间久了,不管是做产品经理也好,做其他行业也罢,我们会经常谈到套路,其实“套路”就是对所做工作的一种高度概括而已,有些书上已经有人帮着总结了,有些“功夫在诗外”的东西其实需要自己去“悟道”。
《科学的广告》虽然是讲广告行业和广告策略的,但是里面许多的营销思路现在读来仍然是不过时的,按照霍普金斯的从业年代41岁从业算起,大概这些理论的总结应该成型于1920年代,也就是第一次世界大战期间。100年过去了,仍然振聋发聩。
同样,在整个营销界和营销史上,“营销模型”也是大家提及和使用比较多的工具,但是这个看似玄而又玄、虚而又虚的东西就跟霍普金斯的科学广告理念一样,虽然历经时代的渗透和幻化,但其本质的东西其实也未曾改变。
一、美国广告学家E.S.刘易斯:AIDMA法则
AIDMA法则是在1898年由美国广告学家E.S.刘易斯最先提出,AIDMA法则的含义为:A(Attention)引起注意、I (Interest)产生兴趣、D(Desire)培养欲望、M(Memory)形成记忆、A(Action)促成行动。
所谓AIDMA法则,是指在消费者从看到广告,到发生购物行为之间,动态式地引导其心理过程,并将其顺序模式化的一种法则。
其过程是首先消费者,注意到(attention)该广告,其次感到兴趣(in-terest)而阅读下去,再者产生想买来试一试的欲望(desire),然后记住 (memory)该广告的内容最后产生购买行为(action)。
二、日本电通:AISAS模式
AISAS模式是由电通公司针对互联网与无线应用时代消费者生活形态的变化,而提出的一种全新的消费者行为分析模型。
营销方式从传统的AIDMA营销法则(Attention 注意、Interest 兴趣、Desire 欲望、Memory 记忆、Action 行动),逐渐向含有网络特质的AISAS(Attention 注意、Interest 兴趣、Search 搜索、Action 行动、Share 分享)模式的转变。
在全新的营销法则中,两个具备网络特质的“s”——search(搜索),share(分享)的出现,指出了互联网时代下搜索(Search)和分享(Share)的重要性,而不是一味地向用户进行单向的理念灌输,充分体现了互联网对于人们生活方式和消费行为的影响与改变。
ISMAS模式,由北京大学刘德寰教授提出,根据移动互联时代人们生活形态的改变(尤其是用户主动性的增强),针对传统的理论模型提出的改进模型,即:Interest(兴趣)、Search(搜索)、mouth(口碑)、Action(行动)和Share(分享)。
三、社交媒体时代消费者行为模式:SIPS模式
2011年,日本电通公司提出的社交媒体时代消费者行为模式(Sympathize-Identify-Participate-Share&Spread,简称SIPS模式),将消费者的消费行为分为四个阶段:共鸣(Sympathize)、认同(Identify)、参与(Participate)、共享(Share&Spread)。
该模型深刻剖析了新时代消费者行为的发展与变化,为企业提供了更适用于社交媒体营销创意、消费者行为分析和传播效果评估的框架。
四、美团:基于生活方式的全新营销模型LIIS(Lifestyle-Identify-Interaction-Share)
美团的这个营销模型有两个很大的不同点,一是强调大数据,二是强调人与商家的交互。
但是逻辑比较好理解:通过线上线下的接触,我们获取到用户的身份信息,反过来我们也就更好地可以将与用户匹配度高的内容推荐给消费者,而在整个过程中的任何节点都可以实现用户的“分享”,从而保持整个流程的循环往复。
五、阿里:AIPL+FAST+GROW
AIPL:把品牌人群细分,将人群资产定量化,是品牌进行全域营销最重要的一环,其中AIPL代表的意思为:
1. FAST
FAST指标主要是有四部分组成,分别是消费者资产中的人群总量(F)、加深率(A),也就是消费者从认知,到兴趣,再到购买,并成为忠诚用户各个阶段转化率;超级用户数(S)是指对品牌而言具有高净值、高价值以及高传播力消费者,如品牌会员以及超级用户活跃度(T)。
这四个指标不仅评估消费者资产的数量(F和S),也包含消费者资产的质量(A和T)。FAST指标体系能够更加准确的衡量品牌营销运营效率,同时FAST也将品牌运营的视角从一时的GMV拉向了对品牌价值健康、持久的维护。
2. F(Fertility)
可运营人群数量-活跃消费者:该指标主要帮助品牌了解自身的可运营总量的情况。
首先利用GMV预测算法,预估品牌消费者总量缺口,然后基于缺口情况优化营销预算投入,站内外多渠道种草拉新,为品牌进行消费者资产扩充,并指导品牌进行未来的货品规划和市场拓展,多方位拓展消费者。
3. A(Advancing)
人群转化力-关系周加深率:多场景提高消费者活跃度,促进人群链路正向流转,多渠道种草人群沉淀后,进一步筛选优质人群,通过钻展渠道进行广告触达,品牌内沉淀人群细分,对消费者进行分层运营,差异化营销,促进整体消费者的流转与转化。
4. S(Superiority)
高价值人群总量-会员总量:会员/粉丝人群对于品牌而言价值巨大,能够为品牌大促提供惊人的爆发力,通过线上和线下联动,联合品牌营销,以及借助平台的新零售等场景如天猫U先,淘宝彩蛋,智能母婴室扩大品牌会员/粉丝量级,为后续的会员/粉丝运营打下基础。
5. T(Thriving)
高价值人群活跃度-会员活跃率:借助大促,提高会员/粉丝活跃度,激发会员/粉丝潜在价值,为品牌GMV目标完成提供助力,对会员/粉丝按照RFM指标进行分层运营,优化激活效率,千人千权触达惩戒,公私域结合,赋能会员/粉丝运营。
GROW增长,应该是营销人永恒的话题,特别是在互联网流量红利见顶下的存量时代,增长变得愈发‘难’。通常难在3个地方,找不到帮助品类增长的方向,缺乏明确的品牌增长抓手,品牌增长效率较低。
于是,作为如今定位为商业 *** 作系统的阿里,就提出了适用于母婴、食品、家清、美妆、医药保健和个护等几大一级品来的大快消行业增长“仪表盘”—–GROW模型,GROW中的4个单词代表着影响品类增长的“决策因子”:
渗透力(Gain):指消费者购买更多类型品类/产品对品牌总增长机会的贡献;复购力(Retain):指消费者更频繁/重复购买产品对品牌总增长机会的贡献;价格力(Boost):指消费者购买价格升级产品对品牌总增长机会的贡献;延伸力(Widen):指品牌通过提供现有品类外其他关联产品所贡献的总增长机会。其中:
母婴行业的品类渗透力明显高于其他因子;食品和家清的复购力机会突出;美妆和医药保健行业的价格力机会最大;个护行业各方面增长机会均匀,渗透力的机会略高;
六、京东:营销360体系之4A模型
4A模型:
认知(Awere):京东展位(聚效)、京东直投(dsp)、线下广告、合约占位;吸引(Appeal):京东展位(聚效)、京东直投(dsp)、线下广告、合约占位、京任务、京挑客;行动(Act):搜索品专、活动通、购物触点广告、京东快车、搜索店铺;拥护(Advocate):购物车触点广告、裂变广告、互动通;
七、总结
纵观整个营销模型的发展和变化,在新媒体出现之前之后的核心变化除了要促进用户“交易”之外,“分享”是之后一以贯之的重点;品牌的重要性不言而喻,但是现实中又并非所有企业都重视品牌的定位和宣传引导,这是最先接触用户的步骤;当然,随着疫情以来的变化,对品牌的认知也可能是发生在传播中的阶段,这个顺序的变化非常值得玩味和注意;大数据不只是说说而已,但是对于大数据的数据收集和数据建设其实是有一段很漫长的道路要走的;“人”、“货”、“场”各家的重视程度不一样:阿里由于数据积累的强大基础,因此对给予人的维度的营销设计虽然看似更为繁杂,但一定也是最为有效;并且,阿里对于货的层面也有一定的涉及;美团和京东其实重点更在“场”的维度,两者美团更优;货,似乎是大家不去刻意提及的,因为毕竟各家都是以平台为定位,或者说以一个大渠道的角色来规划,但是“货”的讨论却反而是无法避免的;最后,我们可以看到广告公司和电商平台在营销理论上虽然都在迭代,但是理论家跟实战家的区别也立竿见影。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)