针对数据集的各个方面进行简单数据分析。
主要有
先说结论:
将逾期15天以上的贷款视为坏账,简化贷款质量
可以看出,坏账仅有不到8%,但是实际上的金额也是比较惊人的。
2011年后,贷款总额每年都在飙升
可以看出2012年后Lending Club飞速发展,客户飞速增加,虽然有波动,但总体再增加
各行各业的人都有,居然是老师最多,管理者次之。
工作年限越长越容易贷款吗,看来是了
这里将年收入大致分为三个区间
20000以下的视为低年收入,20000-60000视为中等,高于60000的就是高收入人群
大部分客户年收入都在20000以上
中等人群坏账数量最多
可以看出人们贷款主要是为了债务整合和xyk偿还,债务整合就是借xyk还其他xyk,和xyk偿还貌似没区别
一半客户按揭,四成客户租房。有房子的不足10%
看来有不良记录的人很难申请贷款
LC在2012-2015飞速发展,能发的钱越来越多
信用等级越低,贷款利率越高
DTI:每月还款占月收入的比例
大部分的贷款客户的DTI在35%以下,说明还款压力不是很大
一小部分客户DIT达到45%,存在风险
后续特征工程中将以35%为分界 分为两类
在右侧看不见的地方还存在极小一部分,,基本属于风险很大的贷款
LC平台以短期贷款为主,但长期贷款比例也不低
通俗地说,数据库是存放大量数据的仓库,而信息库是存放大量信息的仓库。数据库和信息库是不一样的。
从概念上讲,数据不等于信息。信息往往用数据来表示,信息要经过处理才成为有一定意义且具有某类形式的数据。例如,气象工程师利用各种仪器记录风向、风速、降雨量、温度、湿度等数据,再绘制成气象云图,从而获得气象信息,由此作出晴或多云等天气预报。数据是表示信息的,在计算机中信息是一组数字、字母或符号,计算机可以对它进行加工处理。
从组织形式看,数据库和信息库也有着各自不同的特点。
首先,数据库中存储的数据要求尽可能没有重复。例如:银行在办理存款、贷款等业务时,需要在文件上保存客户的姓名和地址。假定每个部门都有一个客户文件,那么这个客户的姓名和地址就要被存储三次。如果这个客户迁居到其他地方,那么就要在三个文件中修改这个客户的地址。若建立了客户数据库,此时姓名和地址仅需存储一次,修改时也只需要改一次。所以,用数据库方法能够减少数据的重复存储。但信息库中的大量信息却是可以有部分重复的。
其次,数据库中数据的存放是独立的,用户 *** 作启动应用程序时不必知道数据存放在什么地方和怎样存放,这些事都由计算机系统自动完成。这样,用户就能集中精力设计出好的应用程序。而对于存放在信息库中的信息,用户使用时必须清楚地了解存放信息的每一种设备放在哪里,随后才能存取。
再次,存储数据的数据库必须有一定格式,而存储在信息库中的信息无需格式,只注重于存储信息的各种设备,如胶卷、图片、磁盘、光盘等等。只要保证这些设备完好无损,就能保证信息的真实可靠。
贷后监管通过连接多个数据源来进行贷款的全生命周期管理和风险评估,常见的数据源有:1.信用信息数据库:包括个人和企业的信用和财务信息、征信报告、涉诉情况。
2.公安部门系统:用于核对借款者的身份信息、犯罪记录、涉案情况等。
3.税务系统:用于核算借款人的所得和还款能力。
4.地税系统:用于核实抵押物的合法性及其价值。
5.不动产登记机构:用于核实房屋所有权、权利状况、限制情况、登记信息等。
6.银行系统:借款人原有贷款信息和账户流水等。
7.保险公司等中介机构:保险信息、风险评级等。
8.司法局:用于核实借款人涉案记录和裁判文书等。
9.车管所:用于核查车辆的真实性和道路行驶情况。
10.电商平台和社交媒体:用于获取借款人消费和生活形态、交友圈等相关信息。
综上,贷后监管连接的数据源相当广泛,通过对这些数据进行分析、比对和整合,可以更好地把握借款人的风险及时进行预警及处理。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)