个人信用信息基础数据库采集个人信息是谁进行的

个人信用信息基础数据库采集个人信息是谁进行的,第1张

中国人民银行。个人信用信息基础数据库采集、整理、保存个人信用信息,为金融机构提供个人信用状况查询服务,为货币政策和金融监管提供有关信息服务。个人信用信息基础数据库是我国社会信用体系的重要基础设施,是在国务院领导下,由中国人民银行组织各商业银行建立的个人信用信息共享平台。个人信用信息基础数据库(简称个人征信系统),采集的主要信息包括:(一)个人基本信息,包括客户的基本身份信息、教育背景、婚姻信息、居住信息、职业信息等内容。

从数据采集角度来说,都有哪些数据源呢?

这四类数据源包括了:开放数据源、爬虫抓取、传感器和日志采集

开放数据源一般是针对行业的数据库。国内,贵州做了不少大胆尝试,搭建了云平台,逐年开放了旅游、交通、商务等领域的数据量

爬虫抓取,一般是针对特定的网站或 App。如果我们想要抓取指定的网站数据,比如购物网站上的购物评价等,就需要我们做特定的爬虫抓取。

第三类数据源是传感器,它基本上采集的是物理信息。比如图像、视频、或者某个物体的速度、热度、压强等。

最后是日志采集,这个是统计用户的 *** 作。我们可以在前端进行埋点,在后端进行脚本收集、统计,来分析网站的访问情况,以及使用瓶颈等

如何使用开放数据源

一个是单位的维度,比如政府、企业、高校;一个就是行业维度,比如交通、金融、能源等领域

如何使用爬虫做抓取

在 Python 爬虫中,基本上会经历三个过程。

1、使用 Requests 爬取内容。我们可以使用 Requests 库来抓取网页信息。Requests 库可以说是 Python 爬虫的利器,也就是 Python 的 HTTP 库,通过这个库爬取网页中的数据,非常方便,可以帮我们节约大量的时间。

2、使用 XPath 解析内容。XPath 是 XML Path 的缩写,也就是 XML 路径语言。它是一种用来确定 XML 文档中某部分位置的语言,在开发中经常用来当作小型查询语言。XPath 可以通过元素和属性进行位置索引。

3、使用 Pandas 保存数据。Pandas 是让数据分析工作变得更加简单的高级数据结构,我们可以用 Pandas 保存爬取的数据。最后通过 Pandas 再写入到 XLS 或者 MySQL 等数据库中。

Requests、XPath、Pandas 是 Python 的三个利器。当然做 Python 爬虫还有很多利器,比如 Selenium,PhantomJS,或者用 Puppteteer 这种无头模式。

目前,个人信用数据库已经采集的信息有以下几类:个人基本信息。包括个人的姓名、证件类型及号码、通讯地址、联系方式、婚姻状况、居住信息、职业信息等。贷款信息。包括贷款发放银行、贷款额、贷款期限、还款方式、实际还款记录、担保信息等。xyk信息。包括发卡银行、授信额度、还款记录等。信贷领域以外的信用信息。

截至2007年年底,个人信用数据库已经采集了部分地区的电信用户缴费信息,26个省(自治区、直辖市)共261个地(市)的个人住房公积金信息,9个城市的个人参加养老保险的信息。随着条件的成熟,个人信用数据库还将采集更多的信息,以全面反映个人的信用状况。包括个人缴纳水费、电费、燃气费等公用事业费用的信息、个人欠税的信息、法院判决信息等。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/9902379.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-03
下一篇 2023-05-03

发表评论

登录后才能评论

评论列表(0条)

保存