什么是数据治理?

什么是数据治理?,第1张

什么是数据治理?

数据治理是流程、角色、政策、标准和指标的集合,可确保有效和高效地使用信息,使组织能够实现其目标。它建立了流程和职责,以确保整个企业或组织中使用的数据的质量和安全性。数据治理定义了谁可以对什么数据、在什么情况下、使用什么方法采取什么行动。

精心设计的数据治理策略对于任何处理大数据的组织来说都是基础,它将解释业务如何从一致、通用的流程和职责中受益。业务驱动因素强调在数据治理策略中需要谨慎控制哪些数据以及从这项工作中获得的预期收益。此策略将成为数据治理框架的基础。

例如,如果数据治理策略的业务驱动因素是确保医疗保健相关数据的隐私,则需要在患者数据流经业务时对其进行安全管理。将定义保留要求(例如,谁更改了哪些信息以及何时更改的历史记录)以确保符合相关政府要求,例如GDPR。

数据治理可确保明确定义与数据相关的角色,并在整个企业内就责任和问责制达成一致。精心规划的数据治理框架涵盖战略、战术和运营角色和职责。

数据治理不是什么

数据治理经常与其他密切相关的术语和概念混淆,包括数据管理和主数据管理。

数据治理不是数据管理

数据管理是指对组织全数据生命周期需求的管理。数据治理是数据管理的核心组成部分,将其他九个学科联系在一起,例如数据质量、参考和主数据管理、数据安全、数据库 *** 作、元数据管理和数据仓库。

数据治理不是主数据管理

主数据管理 (MDM) 侧重于识别组织的关键实体,然后提高这些数据的质量。它确保拥有有关客户、供应商、服务提供者等关键实体的最完整和准确的可用信息。由于这些实体在整个组织中共享,因此主数据管理是将这些实体的碎片化视图整合到一个视图中——超越数据治理的纪律。

但是,没有适当的治理就没有成功的 MDM。例如,数据治理计划将定义主数据模型(客户、产品等的定义是什么),详细说明数据的保留策略,并定义数据创作、数据管理和访问的角色和职责.

数据治理不是数据管理

数据治理可确保为合适的人员分配合适的数据职责。数据管理是指为确保数据准确、可控且易于被相关方发现和处理的必要活动。数据治理主要是关于战略、角色、组织和政策,而数据管理则是关于执行和运营。

数据管理员负责数据资产,确保实际数据与数据治理计划一致,与其他数据资产相关联,并在数据质量、合规性或安全性方面受到控制。

数据治理的好处

有效的数据治理策略可为组织带来许多好处,包括:

对数据的共同理解——数据治理为数据提供了一致的视图和通用术语,同时各个业务部门保留了适当的灵活性。

提高数据质量——数据治理创建了一个确保数据准确性、完整性和一致性的计划。

数据地图——数据治理提供了一种高级能力来了解与关键实体相关的所有数据的位置,这对于就像GPS可以代表物理景观并帮助人们在未知景观中找到方向一样,数据治理使数据资产变得可用并且更容易与业务成果联系起来。

每个客户和其他业务实体的360 度视图——数据治理建立了一个框架,以便组织可以就关键业务实体的“单一版本真相”达成一致,并在实体和业务活动之间建立适当的一致性级别。

一致的合规性— 数据治理提供了一个平台来满足政府法规的要求,例如数据安全法、个人信息保护法欧盟通用数据保护条例 (GDPR)和行业要求,例如 PCI DSS(支付卡行业数据安全标准)。

改进数据管理——数据治理将人的维度带入高度自动化、数据驱动的世界。它建立了数据管理的行为准则和最佳实践,确保传统数据和技术领域(包括法律、安全和合规等领域)以外的问题和需求得到一致解决。

主数据与参考数据是在企业数据管理中重要的两类数据,首先我们要明白主数据和参考数据的定义,详情请见下表:

定义

特征

距离

主数据(Master Data)

具有高业务价值的、可以在企业内跨流程跨系统被重复使用的数据、具有唯一、准确、权威的数据源

通常时业务时间的参与方,可以在企业内跨流程、跨系统重复调用;

取值不受限于预先定义的数据范围;

在业务时间发生之前就客观存在,比较稳定;

主数据的补充描述可归入主数据范畴。

实体型组织、客户、人员基础配置

参考数据(Reference Data)

用结构化的语言描述属性、用于分类活目录整编的数据

通常有一个有限的允许/可选值范围;

静态数据,非常稳定,可以用作业务/IT的开关、职责/权限的划分湖统计报告的维度

合同类型、职位、国家、币种

由此可见,主数据的错误可能会导致成百上千的事务数据错误,因此主数据的管理重点是确保同源多用、重点进行数据内容的校验等。而参考数据内容的变更通常会对现有流程、IT系统产生影响,因此参考数据的管理重点在于变更管理和统一标准管控。

在数据治理过程中,治理主数据必须要结合业务及数据的特点进行分析。举例说明,客户主数据治理的实践。客户数据是企业最重要的主数据之一,几乎贯穿所有业务经营活动。客户数据在全流程中的及时性、准确性、完整性、一致性、有效性、唯一性是业务高效运作、经营可控的重要保障。随着业务发展,华为客户数量迅速增长,客户数据种类复杂多样,因此要构建客户数据管理和服务化能力,以满足经营分析、交易打通、内外部遵从、客户价值挖掘等核心要求,支撑面向多BG的战略转变。

相信通过上述内容,大家对参考数据与主数据有了基本的了解。最后,企业业务活动中可能产生或使用的其他数据往往都基于主数据与参考数据。举个例子,事务数据是业务和流程中产生的记录。事务数据会调用主数据和基础数据。因此,事务数据的治理重点就是管理好事务数据对主数据和基础数据的调用,对于引用的基础数据和主数据,要尽可能调用而不是重新创建。由此可见,主数据与参考数据是企业打造数据帝国的基石,是企业数据治理之道的着手之处也是着力之处。

数据架构

1万左右一对的音箱选择,真力好还是丹拿好

精选推荐

广告

数据治理之参考数据与主数据管理

1012阅读·0评论·0点赞

2022年5月11日

干货丨一组图详解元数据、主数据与参考数据

5882阅读·1评论·4点赞

2019年5月10日

数据管理知识体系指南(第二版)-第十章——参考数据和主数据-学习笔记

897阅读·0评论·0点赞

2022年11月18日

数据库基础知识——参考数据库基本概念6版

238阅读·0评论·0点赞

2018年11月28日

先说说什么是主数据和参考数据?

1276阅读·0评论·0点赞

2022年7月23日

一文理解主数据和参考数据

5736阅读·1评论·1点赞

2021年12月14日

华为手机助手下载,终身免费!

精选推荐

广告

【数据治理】数据元、元数据、主数据、参考数据概述

7500阅读·0评论·8点赞

2022年4月24日

DAMA-第十章(参考数据与主数据)

578阅读·0评论·0点赞

2022年7月16日

第十章参考数据和主数据

1445阅读·0评论·0点赞

2021年11月25日

数据分类(数据视角)——主数据、交易数据、参考数据、统计分析数据、元数据...

3839阅读·0评论·0点赞

2018年4月8日

CDGA考试-第10章参考数据和主数据_重要知识点(17)

195阅读·0评论·0点赞

2022年5月6日

B树与B+详解

125阅读·0评论·0点赞

2018年6月26日

什么是主数据

8350阅读·2评论·8点赞

2021年7月21日

什么是数据、元数据、主数据和参考数据?

3749阅读·0评论·4点赞

2021年4月22日

【数据治理】数据治理之主数据管理

657阅读·0评论·1点赞

2022年7月2日

数据治理周周谈(二)—主数据管理

566阅读·0评论·0点赞

2022年5月13日

第十章 参考数据和主数据

485阅读·0评论·1点赞

2021年9月24日

华为数据分类管理框架及数据治理方法

402阅读·0评论·0点赞

2022年4月25日

企业数据治理之主数据管理

53阅读·0评论·0点赞

2022年10月15日

去首页

看看更多热门内容

从技术实施角度看,主要包含“理”“采”“存”“管”“用”这五个,即业务和数据资源梳理、数据采集清洗、数据库设计和存储、数据管理、数据使用。

数据资源梳理:数据治理的第一个步骤是从业务的视角厘清组织的数据资源环境和数据资源清单,包含组织机构、业务事项、信息系统,以及以数据库、网页、文件和 API 接口形式存在的数据项资源,本步骤的输出物为分门别类的数据资源清单。

数据采集清洗:通过可视化的 ETL 工具(例如阿里的 DataX,Pentaho Data Integration)将数据从来源端经过抽取 (extract)、转换 (transform)、加载 (load) 至目的端的过程,目的是将散落和零乱的数据集中存储起来。

基础库主题库建设:一般情况下,可以将数据分为基础数据、业务主题数据和分析数据。基础数据一般指的是核心实体数据,或称主数据,例如智慧城市中的人口、法人、地理信息、信用、电子证照等数据。主题数据一般指的是某个业务主题数据,例如市场监督管理局的食品监管、质量监督检查、企业综合监管等数据。而分析数据指的是基于业务主题数据综合分析而得的分析结果数据,例如市场监督管理局的企业综合评价、产业区域分布、高危企业分布等。那么基础库和主题库的建设就是在对业务理解的基础上,基于易存储、易管理、易使用的原则抽像数据存储结构,说白了,就是基于一定的原则设计数据库表结构,然后再根据数据资源清单设计数据采集清洗流程,将整洁干净的数据存储到数据库或数据仓库中。

元数据管理:元数据管理是对基础库和主题库中的数据项属性的管理,同时,将数据项的业务含义与数据项进行了关联,便于业务人员也能够理解数据库中的数据字段含义,并且,元数据是后面提到的自动化数据共享、数据交换和商业智能(BI)的基础。需要注意的是,元数据管理一般是对基础库和主题库中(即核心数据资产)的数据项属性的管理,而数据资源清单是对各类数据来源的数据项的管理。

血缘追踪:数据被业务场景使用时,发现数据错误,数据治理团队需要快速定位数据来源,修复数据错误。那么数据治理团队需要知道业务团队的数据来自于哪个核心库,核心库的数据又来自于哪个数据源头。我们的实践是在元数据和数据资源清单之间建立关联关系,且业务团队使用的数据项由元数据组合配置而来,这样,就建立了数据使用场景与数据源头之间的血缘关系。 数据资源目录:数据资源目录一般应用于数据共享的场景,例如政府部门之间的数据共享,数据资源目录是基于业务场景和行业规范而创建,同时依托于元数据和基础库主题而实现自动化的数据申请和使用。

质量管理:数据价值的成功发掘必须依托于高质量的数据,唯有准确、完整、一致的数据才有使用价值。因此,需要从多维度来分析数据的质量,例如:偏移量、非空检查、值域检查、规范性检查、重复性检查、关联关系检查、离群值检查、波动检查等等。需要注意的是,优秀的数据质量模型的设计必须依赖于对业务的深刻理解,在技术上也推荐使用大数据相关技术来保障检测性能和降低对业务系统的性能影响,例如 Hadoop,MapReduce,HBase 等。

商业智能(BI):数据治理的目的是使用,对于一个大型的数据仓库来说,数据使用的场景和需求是多变的,那么可以使用 BI 类的产品快速获取需要的数据,并分析形成报表,像派可数据就属于专业的BI厂商。

数据共享交换:数据共享包括组织内部和组织之间的数据共享,共享方式也分为库表、文件和 API 接口三种共享方式,库表共享比较直接粗暴,文件共享方式通过 ETL 工具做一个反向的数据交换也就可以实现。我们比较推荐的是 API 接口共享方式,在这种方式下,能够让中心数据仓库保留数据所有权,把数据使用权通过 API 接口的形式进行了转移。API 接口共享可以使用 API 网关实现,常见的功能是自动化的接口生成、申请审核、限流、限并发、多用户隔离、调用统计、调用审计、黑白名单、调用监控、质量监控等等。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/10004145.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-04
下一篇 2023-05-04

发表评论

登录后才能评论

评论列表(0条)

保存