我觉得大数据脱敏系统首先至少支持hive等大数据组件等,具体功能也应该包括1、敏感数据发现:能够按照用户指定的系统内置敏感数据特征或预定义的敏感数据特征,在执行任务过程中对抽取的数据进行自动识别和敏感数据发现;2、敏感数据梳理:具备敏感数据梳理能力,包含数据库敏感字段和文件敏感列的梳理和核实;3、数据子集管理:在许多场景下,并不需要将生产环境中的全部数据脱敏至目标环境使用,如统计分析场景则需要对全部数据进行合理采样,开发环境可能仅需要生产环境中1%的数据;4、脱敏方案管理:可以根据各类数据应用场景如系统开发、功能测试、性能测试、数据分析等,制定不同的脱敏方案;5、脱敏任务管理:脱敏任务可针对目标数据库系统或结构化文件进行;安华金和大数据脱敏系统推荐你了解下。
数据脱敏
数据脱敏的主要作用是对敏感数据按需进行漂白、变形、遮盖等处理,避免敏感信息泄露。可实现自动化发现源数据中的敏感数据,同时又能保证脱敏后的输出数据能够保持数据的一致性和业务的关联性。数据脱敏一般分为动态数据脱敏和静态数据脱敏。那么,两者之间有什么区别?分别在什么情况下使用呢?
数据脱敏
动态数据脱敏常用在访问敏感数据即时进行脱敏,一般用来解决在生产环境需要根据不同情况对同一敏感数据读取时进行不同级别脱敏的场景,如业务脱敏、运维脱敏、数据交换脱敏等场景。首先,业务脱敏主要针对不同权限业务用户访问敏感数据时,采取不同级别的脱敏规则。其次,在运维脱敏场景中,许多企业的数据库在运行中都面临以下几个问题:1 共享、临时账号滥用现象,导致运维身份不清。2 特权用户访问敏感数据,行为不受控。3 当运维人员误 *** 作,关键数据丢失,数据难以恢复。4 无法监控数据库内部 *** 作,无法进行追责溯源。面对上述问题,动态脱敏可以实现授权账号进行访问控制,对未授权的运维身份访问敏感数据实现动态脱敏功能。同时,保证数据库被误 *** 作后快速回复,并实时监控数据库内部 *** 作。最后,数据交换场景,是指通过API接口进行数据交换是非常常见的场景,通过API接口向特定平台提供数据时,需要对不同的用户信息提供不同的脱敏策略。
静态数据脱敏则一般应用在非生产环境或脱离原生业务系统使用。开发测试、数据共享、科学研究时静态数据脱敏的三个典型应用场景。首先,在开发测试场景中,比如银行证券等敏感信息系统中包含有姓名、身份、账号等敏感信息,但开发测试需要使用这些真实的数据,因此需要通过脱敏手段保证敏感数据不被泄露。其次,数据共享场景通常是在一些特定的需求下,将数据与其他部门或者外部企业共享。此时需要保留部分敏感数据,对特定的敏感数据进行处理。最后科学研究场景通常核心是将对数据进行统计分析,并将结果用于科学研究。那么就需要保证,对数据进行脱敏之后仍数据仍保留原本的特征和科学研究所所必须的内容。
不论是静态数据脱敏还是动态数据脱敏,都不会对敏感数据(核心数据)造成破坏,并且保持数据原有的可用性。换言之,即使数据进行了脱敏 *** 作(去掉了敏感信息),数据共享方仍然可以使用、可以处理、可以提取相应的特征价值。
安华金和数据库动态脱敏系统能够满足用户不同数据实时脱敏使用场景,常见的动态脱敏使用场景如下:
1内部数据分析使用数据不当
内部数据分析部门,直接访问生产环境数据进行数据分析,未经严格管控和敏感数据脱敏,极易造成敏感数据泄漏,在不影响日常运维行为的前提下,需要对查询结果集中的隐私和敏感数据进行实时自动遮蔽返回,保证敏感数据不泄漏,满足隐私信息保护要求
2内部高权限人员特权访问不当
通过内部高权限账户,部分特权人员对数据可以进行不受控制的访问,管理不当,造成敏感数据泄漏,需要对特权账户的访问进行严格的准入控制外,还支持根据特权账户的访问权限实现不同程度的数据脱敏,满足数据使用需求。
3业务应用系统账号不规范,或数据权限控制不严格
用户往往面临业务系统账号管理不规范,存在权限宽泛或数据权限控制不严格的情况,导致业务系统用户可以看到不应看到的敏感数据,造成敏感数据不安全隐患。所以需要在应用业务访问数据的过程中,对敏感数据实现动态脱敏,以防敏感数据实时访问过程中被泄漏。在实现动态脱敏的同时,还支持对应用用户访问权限进行管理,能根据不同的应用IP、应用用户赋予不同的敏感数据访问权限,例如高权限用户可看到未脱敏的原数据,外部访问用户或大屏展示可进行实时数据遮蔽脱敏,内部业务系统维护人员为了不影响业务流程的正常处理,则看到的是实时仿真脱敏后的数据。
对于这些场景,安华金和数据库动态脱敏系统能够提供不同的解决方案,满足用户敏感数据使用合规的同时,还能够协助用户解决实际敏感数据使用过程中的问题。
具体解决方案,以及安华金和数据库动态脱敏系统行业案例请参考如下链接:
>
静态数据脱敏(SDM)在使用敏感数据当时进行脱敏。
静态数据脱敏(SDM)一般用在非生产环境,在敏感数据从生产环境脱敏完毕之后再在非生产环境使用,一般用于解决测试、开发库需要生产库的数据量与数据间的关联,以排查问题或进行数据分析等,但又不能将敏感数据存储于非生产环境的问题。
动态数据脱敏(DDM)一般用在生产环境,在访问敏感数据当时进行脱敏,一般用来解决在生产环境需要根据不同情况对同一敏感数据读取时需要进行不同级别脱敏的问题。
扩展资料:
根据列的数据属性,数据列通常可以分为以下几种类型:
可确切定位某个人的列,称为可识别列,如身份z号,地址以及姓名等。
单列并不能定位个人,但是多列信息可用来潜在的识别某个人,这些列被称为半识别列,如邮编号,生日及性别等。美国的一份研究论文称,仅使用邮编号,生日和性别信息即可识别87%的美国人。
包含用户敏感信息的列,如交易数额,疾病以及收入等。
其他不包含用户敏感信息的列。
所谓避免隐私数据泄露,是指避免使用数据的人员(数据分析师,BI工程师等)将某行数据识别为某个人的信息。数据脱敏技术通过对数据进行脱敏,如移除识别列,转换半识别列等方式。
使得数据使用人员在保证可对#2(转换后)半识别列,#3敏感信息列以及#4其他列进行数据分析的基础上,在一定程度上保证其无法根据数据反识别用户,达到保证数据安全与最大化挖掘数据价值的平衡。
参考资料来源:百度百科-数据脱敏
尚学堂回答:敏感数据(如xyk号码)、个人识别信息(如社会安全号码)、医疗诊断和甚至非个人的敏感数据(例如公司财务信息和知识产权)的曝光,是由于企业员工和外部人士滥用职权或工作失误所致。”
数据脱敏技术的目是通过从客户端隐藏敏感数据,以防止这些数据的滥用。技术供应商提供了多种数据脱敏技术,例如用相似的字符替代一些字段;用屏蔽字符(例如,‘x’)替代字符;用虚拟的姓氏替代真正的姓氏,以及在数据库数列中对数据进行重组。数据脱敏也被称为数据混淆、数据保密、数据消毒、数据扰频、数据匿名化和数据认证。
采用数据脱敏技术,可以帮助企业提高安全性和保密等级,以防止其数据被滥用。与此同时,数据脱敏技术也可帮助企业满足安全性的规范要求,以及由管理/审计机关所要求的隐私标准。
以上就是关于哪位大神知道大数据脱敏系统具备哪些功能啊全部的内容,包括:哪位大神知道大数据脱敏系统具备哪些功能啊、动态数据脱敏和静态数据脱敏有什么区别如何选择、动态数据脱敏用在什么场景等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)