风控评分卡模型

风控评分卡模型,第1张

评分卡是基于客户全方位的数据,用统计学习的方法建立的量化客户风险的工具,可以应用于多种金融风控场景进行风险管控。

一般传统评分卡的呈现方式为(示例):

通过评分卡,客户可以有一个分数代表客户的信用风险水平,一般情况下分数越高信用资质越好。芝麻信用分,微信支付分都是一种评分卡。

评分卡最常用的场景是信贷业务,比如xyk、消费分期、小额现金贷等。在信贷业务流程的不同阶段,评分卡所起的作用不同,因此也对应不同种类的评分卡。通常情况下,评分卡有三种:申请评分卡(Application Scorecard), 行为评分卡(Behavior Scorecard)和催收评分卡(Collection Scorecard), 即A卡、B卡和C卡,在信贷的不同阶段具有不同的用途。

1、申请评分卡

申请评分卡面向的客群是所有来申请贷款的客户,在申请时点评估客户的信用风险,辅助金融机构做出决策,通过、拒绝还是进一步审核。比如,评分650分以上的客户表示信用极好,可以直接通过申请,并给予较高的额度和较低的优惠利率;评分400分以下客户表示信用较差,可以直接拒绝;评分400-650之间的中间客群是最关键的,如何经营这部分客群最能体现金融机构的风控能力,因为头部客群是所有金融机构抢夺的对象,即使对他们授信通过,也可能因为额度和利率达不到他们的预期而投奔其它机构。

中间客群虽然具有一定的风险,但是经营的好也会带来较大的利润。从风险防控角度,可以进一步人工介入审核、让客户提供更多的数据或者提供一定的抵质押物做风险缓释。同时,需要根据评分卡量化评分,适当降低额度和提高利率。

2、行为评分卡

行为评分卡面向的客群是已经通过授信申请或者已经支用但是还没有结清贷款的客户,目的是评估客户未来一段时间潜在的逾期风险,金融机构可以提前采取一定的措施来防范风险的发生。

与申请评分卡相比,除了客群不唤纤同之外,行为评分卡有客户历史支用还款情况和额度使用情况等数据的支撑,所以对客户的风险评估更加精准。

行为评分卡可以在客户每次提款支用的时候进行评分,也可以定期每月(季)进行批量评分,取决于业务种类和金融机构的策略。如果行为评分较低,机构可以对额度降低或者冻结额度,提前结清款项等。

3、催收评分卡

催收评分卡面向的是已经出现逾期的客群,评估客户未来一定时间内可以回款的概率。催收评分卡的主要目的是通过优化催收流程来降低催收成本,同时提高逾期客户的回款率。例如,对于催收评分较高的客户回款概率较高,可以采取短信提醒或者机器人语音提醒的方式,相反对于催收评分较低的客户可以直接采取人工催收。

催收评分卡又可以根据催收阶段的不同有不同的类别,比如预催收、早期催收、晚期催收,可以在不同的阶段基于不同的客群开发单独的催收评分卡。预催收评分卡是对还没有发生逾期但是即将到期的客群评估逾期风险,对于逾期风险较高的客群可以提前发出预警或者提前催收;早期催收主要是提醒式催收,对于评分较低的客户可以介入人工催收;晚期催收整体催回概率不高,对于评分明悉低的客群可以提前做委外催收或者走法律程序,评分高的客户可以机构自己催收,从整体上达到尽可能高的提高回款率并降低催收成本。

不同信贷产品具有不同的业务风险点,评分卡只是基于数据学习出的量化模型,对数据质量要求较高。对于质量比较低的数据,并不适合作为评分卡的变量,但是不代表这部分数据是不重要的。因此,光靠评分卡做信贷风险管控是远远不够的,必须结合风险策略做全面的风险管理,相反,评分卡仅仅是策略中很小的一部分。对于信贷和槐仿策略,则是各个层面的全方位管控风险的规则集合,包括政策和制度层面的、专家经验层面的、数据层面的以及评分卡的规则集,并且需要快速迭代,而评分卡迭代频率要求并不高。关于策略方面后续我会慢慢讲解。

本文作为评分卡系列的开篇,可以让我们从宏观上对评分卡有个认识,后续文章我会从技术层面来讲解评分卡的开发构建流程,使我们对评分卡和风控有进一步更加深刻的认识。

一、问题准备

需要做出的决策和解决的问题

1、特定业务重点(过退,风险,动支。。。)确定好坏客户的标签定义

2、确定计划的评分卡范围、开发、实施的窗口

解释:

3、获取的数据范围和来源,确保能够获取到数据,内部,外部

可能不同的业务场景能获取到的数据不同,有些场景存在缺失

4、项目管理计划 时间、资源、人员

二、数据获取与整合

取得数据项,并且将其整合为适合进一步数据准备的形式

通常,数据表中的每一行代表一个账户

这是评分卡开发的首要任务

1、原始变量:

易于理解,可能不是最有效

2、衍生业务指标:

来源于原始变量,有明确业务含义,可能比原始变量更有效

3、分析变量:

原始数据进行转换和加工计算生成具有较高预测能力的变量

缺少简单或清晰的含义

建模视图包含以下变量:

1、记录标识散辩:唯一的符号或者识别变量

2、候选自变量:所有可能被用于预测模型中预测变量的字段,包括原始变量,衍生业务指标,分析变量

3、描述变量冲弊缺:包含其他字段取值的标识或描述的字段(将复杂的离散数据提取转换成简单的)

4、报告变量:并不直接用建模,但是用于作报告

(动支金额,逾期金额之类的,辅助判断模型的好坏)

5、标签状态字段:好坏客户

自变量包含如下三种类型:

1、分类变量,之间没有顺序和数量关系,这些值不能进行数学运算;性别,居住地...

2、顺序变量,在类别中定义了顺序的概念;等级 1,2,。。。

3、连续变量,取值表示真实数量规模的真正指标

数据来源

1、人口统计特征: 客户基本属性

2、征信数据,外卜肢部评分

3、交易记录 :某个时间窗口的频率和汇总值

4、其他产品的使用情况

建模窗口、实施窗口

数据校准


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/yw/12345394.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-24
下一篇 2023-05-24

发表评论

登录后才能评论

评论列表(0条)

保存