《关于数据治理的读书笔记 - 数据治理、数据管理和数据管控的理解》我们了解了有关数据治理、数据管理和数据管控,这几个名词之间的区别和联系,回到数据治理的话题上,数据治理究竟是什么?
站在不同的角度,对数据治理的理解可能是不同的。
如果从管理者的角度,数据治理是企业发展战略的组成部分,是指导企业进行数字化转型的基石,他是一种策略。
如果是从业务人员的角度,可能很多人认为数据治理是IT部门的职责,业务部门只是配合一下,而且他们可能都不知道企业有什么数据?数据是怎么定义?数据有什么作用?业务人员怎么才能方便地使用?业务人员的痛点,引出了数据治理的三大要害,
(1) 要定义数据,让抽象的数据变成可读、可理解的信息。
(2) 要有一个完整的数据地图或数据资源目录,盘活企业的数据资产,方便用户随时找到想要的数据。
(3) 要做好数据质量管理,提升数据质量并提升数据的使用率。
如果从技术人员的角度,数据治理包含三个部分,
(1) ETL,数据的抽取、转换、加载,保障数据仓库内有数据可用。
(2) 对数据的处理、转换和融合,保障数据仓库内的数据准确、可用。
(3) 元数据管理,保障数据仓库内的数据可进行血统溯源和影响分析。
数据治理需要对业务系统进行治理,提高源头的数据质量,同时还需要将数据湖中的数据治理好,简化数据的 *** 作,提高数据访问的范围,降低数据访问的成本。
因此,站在不同的角度,需求不同、痛点不同,对数据治理的理解就可能不同,没有孰对孰错,其实从侧面,证明了数据治理对企业中不同角色不同岗位起着不同的作用、有着不同角度的需求。
无论何种理解,数据治理都是围绕着“数据”展开的,数据治理的目标是提升数据利用率和数据价值,通过有效的数据自愿管控手段,实现数据的看得见、找得到、管得住、用得好,提升数据质量和数据价值。
数据治理是企业实现数字化转型的基础,是企业的一个顶层策略,是管理体系,是技术体系,涵盖战略、组织、文化、方法、制度、流程、技术和工具等多个层面的内容。
数据治理是什么数据都治理?肯定不是,数据治理的对象必须是重要的数据资源,是关乎企业商业利益的数据资源,或者将这种数据资源称为“数据资产”。因此,准确来讲,数据治理是对“数据资产”的治理,是对数据资产所有利益相关方的协调和规范。可以提出和这句话相关的三个问题。
1. 什么是数据资产?
并非所有数据都是数据资产,数据资产是指企业过去的交易或者事项形成的,由企业拥有或者控制的,预期会给企业带来经济利益的数据资源,并且其价值和成本是可计量的。数据要成为数据资产,至少要满足4个核心条件,
(1) 数据资产是企业的交易或者事项形成的,例如电商平台、社交网站每天产生的数据。
(2) 由企业拥有或者控制,这就牵扯到数据的归属权、控制权、使用权的问题,有时候是比较模糊的。
(3) 预期会给企业带来经济利益,这个很好理解,数据有用,会产生价值,会带来经济利益,才需要更好地管理和使用。
(4) 成本或价值可衡量,数据的采集、管理、使用,都是要成本的,同时数据产生的价值和经济性,也是需要评估的,目的都是为了能最大限度地提高数据的应用价值。
2. 数据资产的利益相关方
包括以下几类,
(1) 数据的生产者,即通过业务交易或事项产生数据的人或组织。
(2) 数据的拥有者或控制者,生产数据的人不一定拥有数据。
(3) 数据价值和经济利益的受益者。
数据治理就是对数据生产者、拥有者或控制者、数据价值受益者进行规范和协调,让数据能够规范化、高质量输出。
3. 对利益相关方的协调和规范
(1) 数据的标准化,定义统一的数据标准,让数据资产的利益相关方用同一种“语言”沟通,包括几个层面,数据模型标准化,主数据和参考数据的标准化,指标体系的标准化。日常工作中,经常碰到上级单位要统计数据的需求,他说的“数据标准”和我们的理解就可能存在偏差,究其原因,还是没使用相同的数据标准沟通。如果连数据标准都不统一,更谈不上治理数据的可能了。
(2) 数据的确权,数据一旦成为了资产,就一定有拥有方或者实际控制方,统称为产权人,数据的产权可能会比较复杂,例如我们上网产生的数据,是归我们,还是互联网厂商?互联网的场景很复杂,如果是企业内的数据,其实可能存在相同的问题,某类用户的数据,几个部门都拥,是归这个部门,还是那个部门?这就要结合实际的业务场景,以及数据的各种要素,综合考量,才可能得到合适的方案。
(3) 流程的优化,通过业务流程优化,规范数据从产生、处理、使用到销毁的整个生命周期,以使数据在各阶段、各流程环节中安全可控、合规地使用。
让数据成为资产就是要让数据为企业创造价值,而做好数据治理才能更加方便、放心地使用数据,这是一个基本前提。
但通过上面描述的信息,可以说数据治理是个非常复杂的系统工程,
管理上,数据治理是企业战略层面的策略,而不是战术层面的方法。
业务上,通过数据治理要让数据能够管得住、看得见、找得到、用得好。
技术上,涉及数据建模、数据集成、数据交换、数据清洗、数据处理、数据质量管理的方方面面。
因此,要做好数据治理,不是一朝一夕就可以实现的,要通盘考虑,说起来容易,做起来难,但是肯定有意义,任重而道远,持续学习了。
近期更新的文章:
《关于数据治理的读书笔记 - 数据治理、数据管理和数据管控的理解》
《通过Java得到语句的执行计划》
《MySQL时间分区的实现》
《一道热热身的算术题》
《SQL Server生成随机日期模拟测试数据的需求》
文章分类和索引:
《公众号900篇文章分类和索引》
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)