我觉得大数据脱敏系统首先至少支持hive等大数据组件等,具体功能也应该包括1、敏感数据发现:能够按照用户指定的系统内置敏感数据特征或预定义的敏感数据特征,在执行任务过程中对抽取的数据进行自动识别和敏感数据发现;2、敏感数据梳理:具备敏感数据梳理能力,包含数据库敏感字段和文件敏感列的梳理和核实;3、数据子集管理:在许多场景下,并不需要将生产环境中的全部数据脱敏至目标环境使用,如统计分析场景则需要对全部数据进行合理采样,开发环境可能仅需要生产环境中1%的数据;4、脱敏方案管理:可以根据各类数据应用场景如系统开发、功能测试、性能测试、数据分析等,制定不同的脱敏方案;5、脱敏任务管理:脱敏任务可针对目标数据库系统或结构化文件进行;安华金和大数据脱敏系统推荐你了解下。
数据脱敏
数据脱敏的主要作用是对敏感数据按需进行漂白、变形、遮盖等处理,避免敏感信息泄露。可实现自动化发现源数据中的敏感数据,同时又能保证脱敏后的输出数据能够保持数据的一致性和业务的关联性。数据脱敏一般分为动态数据脱敏和静态数据脱敏。那么,两者之间有什么区别?分别在什么情况下使用呢?
数据脱敏
动态数据脱敏常用在访问敏感数据即时进行脱敏,一般用来解决在生产环境需要根据不同情况对同一敏感数据读取时进行不同级别脱敏的场景,如业务脱敏、运维脱敏、数据交换脱敏等场景。首先,业务脱敏主要针对不同权限业务用户访问敏感数据时,采取不同级别的脱敏规则。其次,在运维脱敏场景中,许多企业的数据库在运行中都面临以下几个问题:1 共享、临时账号滥用现象,导致运维身份不清。2 特权用户访问敏感数据,行为不受控。3 当运维人员误 *** 作,关键数据丢失,数据难以恢复。4 无法监控数据库内部 *** 作,无法进行追责溯源。面对上述问题,动态脱敏可以实现授权账号进行访问控制,对未授权的运维身份访问敏感数据实现动态脱敏功能。同时,保证数据库被误 *** 作后快速回复,并实时监控数据库内部 *** 作。最后,数据交换场景,是指通过API接口进行数据交换是非常常见的场景,通过API接口向特定平台提供数据时,需要对不同的用户信息提供不同的脱敏策略。
静态数据脱敏则一般应用在非生产环境或脱离原生业务系统使用。开发测试、数据共享、科学研究时静态数据脱敏的三个典型应用场景。首先,在开发测试场景中,比如银行证券等敏感信息系统中包含有姓名、身份、账号等敏感信息,但开发测试需要使用这些真实的数据,因此需要通过脱敏手段保证敏感数据不被泄露。其次,数据共享场景通常是在一些特定的需求下,将数据与其他部门或者外部企业共享。此时需要保留部分敏感数据,对特定的敏感数据进行处理。最后科学研究场景通常核心是将对数据进行统计分析,并将结果用于科学研究。那么就需要保证,对数据进行脱敏之后仍数据仍保留原本的特征和科学研究所所必须的内容。
不论是静态数据脱敏还是动态数据脱敏,都不会对敏感数据(核心数据)造成破坏,并且保持数据原有的可用性。换言之,即使数据进行了脱敏 *** 作(去掉了敏感信息),数据共享方仍然可以使用、可以处理、可以提取相应的特征价值。
以上就是关于哪位大神知道大数据脱敏系统具备哪些功能啊全部的内容,包括:哪位大神知道大数据脱敏系统具备哪些功能啊、动态数据脱敏和静态数据脱敏有什么区别如何选择、等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)