数据库脱敏系统与数据库加密系统类似,从数据脱敏到数据的恢复,都是以牺牲系统性能为代价的。一旦脱敏规则制定不好,系统性能会受到很大影响,系统性能降低,那么整个数据库业务系统也会随之受到影响,在数据连续性、高可用的环境下,可能会导致数据的丢失或者业务中断,影响整个生产过程。
要想在不影响数据库性能的前提下保证数据库的安全,我建议还是选用数据库审计系统,更为安全、可用,在这方面昂楷做得最好。
静态数据脱敏(SDM)在使用敏感数据当时进行脱敏。
静态数据脱敏(SDM)一般用在非生产环境,在敏感数据从生产环境脱敏完毕之后再在非生产环境使用,一般用于解决测试、开发库需要生产库的数据量与数据间的关联,以排查问题或进行数据分析等,但又不能将敏感数据存储于非生产环境的问题。
动态数据脱敏(DDM)一般用在生产环境,在访问敏感数据当时进行脱敏,一般用来解决在生产环境需要根据不同情况对同一敏感数据读取时需要进行不同级别脱敏的问题。
扩展资料:
根据列的数据属性,数据列通常可以分为以下几种类型:
可确切定位某个人的列,称为可识别列,如身份z号,地址以及姓名等。
单列并不能定位个人,但是多列信息可用来潜在的识别某个人,这些列被称为半识别列,如邮编号,生日及性别等。美国的一份研究论文称,仅使用邮编号,生日和性别信息即可识别87%的美国人。
包含用户敏感信息的列,如交易数额,疾病以及收入等。
其他不包含用户敏感信息的列。
所谓避免隐私数据泄露,是指避免使用数据的人员(数据分析师,BI工程师等)将某行数据识别为某个人的信息。数据脱敏技术通过对数据进行脱敏,如移除识别列,转换半识别列等方式。
使得数据使用人员在保证可对#2(转换后)半识别列,#3敏感信息列以及#4其他列进行数据分析的基础上,在一定程度上保证其无法根据数据反识别用户,达到保证数据安全与最大化挖掘数据价值的平衡。
参考资料来源:百度百科-数据脱敏
全部替换、散列化处理。
在pg数据库中,将需要脱敏的数据全部替换成固定的字符或字符串,例如将手机号码中的中间几位替换成""号。或者使用散列函数对需要脱敏的数据进行加密处理,将加密后的结果存储到数据库中,例如使用MD5加密算法对用户密码进行散列化处理。
pg是一种特性非常齐全的自由软件的对象-关系型数据库管理系统,是以加州大学计算机系开发的POSTGRES,42版本为基础的对象关系型数据库管理系统。
举例:
在名单中的姓名一列,只保留姓氏,可以使在新的一列里用=Left( ,1)函数,即可取出位于第一位的姓氏。
然后把这列姓氏Copy + Paste Value 到有姓名的列。
如果需要在姓氏后加星号,可以在姓氏列右边插进一个新列,里面填上。
然后再在一个新列里用=姓氏列+星号列 (比如 =A1+A2)的公式,将两列连起来。
最后Copy + Paste Value 到姓名列中。
身份z号脱敏处理一般隐藏哪几位
身份z号脱敏处理,一般情况下是隐藏年月日那六位数字
1)、数据脱敏是“指对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护。在涉及客户安全数据或者一些商业性敏感数据的情况下,在不违反系统规则条件下,对真实数据进行改造并提供测试使用,如身份z号、手机号、卡号、客户号等个人信息都需要进行数据脱敏。是数据库安全技术之一。”
2)、本文介绍的脱敏数据报表查询将利用润乾集算器编写 SPL 脚本,对敏感信息字段 (如: 姓名、证件号、银行账户、住址、电话号码、企业名称、工商注册号、纳税人识别号) 等通过预定义的脱敏规则进行数据脱敏、变形,实现敏感隐私数据的保护。
3)、润乾集算器能使脱敏工作变得的简单易行,同时可以减少大量重复性工作。通过集算器 SPL 脚本实现的脱敏数据,可直接作为报表数据集进行查询分析,也可以作为开发、测试和其它非生产环境或外包环境下的真实数据集使用。
11 数据脱敏介绍
根据百度词条的解释,数据脱敏是“指对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护。在涉及客户安全数据或者一些商业性敏感数据的情况下,在不违反系统规则条件下,对真实数据进行改造并提供测试使用,如身份z号、手机号、卡号、客户号等个人信息都需要进行数据脱敏。是数据库安全技术之一,数据库安全技术主要包括:数据库漏扫、数据库加密、数据库防火墙、数据脱敏、数据库安全审计系统。”
随着信息时代的发展,我们对数据信息的安全要求越来越重视,比如对非生产环境下的敏感数据的脱敏保护。在金融、运营商、政府、能源等部门,非生产环境下数据脱敏已列入监管部门的法规要求。非生产环境数据多用于开发、测试、培训以及第三方数据分析、挖掘,如果不能有效实施敏感数据保护,极易造成敏感数据的泄露。所以,保证非生产数据的安全已经成为一个重要的课题,要求我们能够通过对敏感信息进行脱敏、变形,实现有效的数据保护。
12 对数据脱敏工具的要求
数据脱敏工具应该具有对多种异构数据源的支持,从而将一个脱敏规则应用于不同的数据源,比如针对“客户名称”字段的修改,脱敏规则基本一致,所以应该可以在 Excel、TXT、Oracle、MS SQLServer、MySQL、Hadoop 等数据源上直接引用。另外,工具还应支持将脱敏数据完全不落地分发,提供文件到文件、文件到数据库、数据库到数据库、数据库到文件等方式,并且不需要在生产系统或本地安装任何客户端。
本文介绍的脱敏数据报表查询将利用润乾集算器编写 SPL 脚本,对敏感信息字段 ( 如: 姓名、证件号、银行账户、住址、电话号码、企业名称、工商注册号、纳税人识别号) 等通过预定义的脱敏规则进行数据脱敏、变形,实现敏感隐私数据的保护。
润乾集算器能使脱敏工作变得的简单易行,同时可以减少大量重复性工作。通过集算器 SPL 脚本实现的脱敏数据,可直接作为报表数据集进行查询分析,也可以作为开发、测试和其它非生产环境或外包环境下的真实数据集使用。
13 脱敏数据的特征
数据脱敏不仅要执行数据漂白,抹去数据中的敏感内容,同时也需要保持原有的数据特征、业务规则和数据关联性,保证开发、测试、培训以及大数据类业务不会受到脱敏的影响,达成脱敏前后的数据一致性和有效性:
l 保持原有数据特征
数据脱敏前后必须保证数据特征的保持,例如:身份z号码由十七位数字本体码和一位校验码组成,分别为区域地址码(6 位)、出生日期(8 位)、顺序码(3 位)和校验码(1 位)。那么身份z号码的脱敏规就需要保证脱敏后依旧保持这些特征信息。
l 保持数据之间的一致性
在不同业务中,数据和数据之间具有一定的关联性。例如:出生年月或年龄和出生日期之间的关系。同样,身份z信息脱敏后仍需要保证出生年月字段和身份z中包含的出生日期之间的一致性。
l 保持业务规则的关联性
保持数据业务规则的关联性是指数据脱敏时数据关联性以及业务语义等保持不变,其中数据关联性包括:主、外键关联性、关联字段的业务语义关联性等。特别是高度敏感的账户类主体数据往往会贯穿主体的所有关系和行为信息,因此需要特别注意保证所有相关主体信息的一致性。
l 多次脱敏之间的数据一致性
相同的数据进行多次脱敏,或者在不同的测试系统进行脱敏,需要确保每次脱敏的数据始终保持一致性,只有这样才能保障业务系统数据变更的持续一致性以及广义业务的持续一致性。
14 数据脱敏应用场景
一般常见的数据脱敏场景,是将生产数据或是生产数据文件按照脱敏规则,将数据不落地脱敏至测试数据库或是测试数据文件中,具体如下所示:
使用集算器的 SPL 可以按照业务场景要求自行定义和编写脱敏规则,比如针对上面的人员信息:姓名、身份z号、地址、电话号码、卡号等进行不落地脱敏,满足数据脱敏需要。
集算器是一个无框架,可快速部署开发的数据计算中间件工具,能够直接运行编写好的 SPL 数据脱敏脚本即时进行数据脱敏,支持各种常见的数据脱敏的处理方式,包括数据替换、无效化、随机化、偏移和取整、掩码屏蔽、灵活编码等,本文介绍的数据脱敏方法都可以在实际应用中混合替换使用
数据脱敏
数据脱敏的主要作用是对敏感数据按需进行漂白、变形、遮盖等处理,避免敏感信息泄露。可实现自动化发现源数据中的敏感数据,同时又能保证脱敏后的输出数据能够保持数据的一致性和业务的关联性。数据脱敏一般分为动态数据脱敏和静态数据脱敏。那么,两者之间有什么区别?分别在什么情况下使用呢?
数据脱敏
动态数据脱敏常用在访问敏感数据即时进行脱敏,一般用来解决在生产环境需要根据不同情况对同一敏感数据读取时进行不同级别脱敏的场景,如业务脱敏、运维脱敏、数据交换脱敏等场景。首先,业务脱敏主要针对不同权限业务用户访问敏感数据时,采取不同级别的脱敏规则。其次,在运维脱敏场景中,许多企业的数据库在运行中都面临以下几个问题:1 共享、临时账号滥用现象,导致运维身份不清。2 特权用户访问敏感数据,行为不受控。3 当运维人员误 *** 作,关键数据丢失,数据难以恢复。4 无法监控数据库内部 *** 作,无法进行追责溯源。面对上述问题,动态脱敏可以实现授权账号进行访问控制,对未授权的运维身份访问敏感数据实现动态脱敏功能。同时,保证数据库被误 *** 作后快速回复,并实时监控数据库内部 *** 作。最后,数据交换场景,是指通过API接口进行数据交换是非常常见的场景,通过API接口向特定平台提供数据时,需要对不同的用户信息提供不同的脱敏策略。
静态数据脱敏则一般应用在非生产环境或脱离原生业务系统使用。开发测试、数据共享、科学研究时静态数据脱敏的三个典型应用场景。首先,在开发测试场景中,比如银行证券等敏感信息系统中包含有姓名、身份、账号等敏感信息,但开发测试需要使用这些真实的数据,因此需要通过脱敏手段保证敏感数据不被泄露。其次,数据共享场景通常是在一些特定的需求下,将数据与其他部门或者外部企业共享。此时需要保留部分敏感数据,对特定的敏感数据进行处理。最后科学研究场景通常核心是将对数据进行统计分析,并将结果用于科学研究。那么就需要保证,对数据进行脱敏之后仍数据仍保留原本的特征和科学研究所所必须的内容。
不论是静态数据脱敏还是动态数据脱敏,都不会对敏感数据(核心数据)造成破坏,并且保持数据原有的可用性。换言之,即使数据进行了脱敏 *** 作(去掉了敏感信息),数据共享方仍然可以使用、可以处理、可以提取相应的特征价值。
需求: 11位手机号中间四位脱敏显示,例如:1871234
需求: 姓名脱敏处理,规则:3个字以内脱敏第一个字,4—6个字脱敏前两个字,大于6个字脱敏第3—6个字,示例:张三( 三)、张三水( 三水)、长孙无忌(无忌)、罗斯托罗司机格(罗斯XXXX格)
需求: 姓名脱敏处理,规则:2个字脱敏最后一个字,3个字脱敏中间两个字,大于3个字第一个和大于第4个字符
示例:比如:张三处理成张 ,李三思处理成李 思,王二麻子处理成:王 子
以上就是关于数据库脱敏有用吗会不会损坏重要数据全部的内容,包括:数据库脱敏有用吗会不会损坏重要数据、什么是静态数据脱敏、pg中文怎么脱敏等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)