数据架构__"数据质量"相关知识体系梳理及亮点分享

数据架构__"数据质量"相关知识体系梳理及亮点分享,第1张

《思维导图实战派》百度网盘pdf最新全集下载:

链接:>pwd=1eh5 提取码:1eh5

简介:一本一学就会的思维可视化工具之书,书中为读者们浓缩实战案例精华,击破学习思维导图过程中的难题,让你更好的了解思维导图模式!

《画出好成绩》(杨大宇)电子书网盘下载免费在线阅读

链接:> 提取码:6l38

书名:画出好成绩

作者:杨大宇

豆瓣评分:41

出版社:电子工业出版社

出版年份:2009

页数:208

内容简介:

提升学习成绩,是每个学生和家长的希望,可惜愿望加上努力并不等于结果。迅速提高学习成绩需要使用科学、系统的学习方法。在我们的大规模学生调查中,学生提到的有关学习的最大问题就是缺少科学的学习方法。

本书系统讲解的思维导图学习法是一种神奇的迅速提升成绩的学习方法。无论学生的学习基础如何、认知能力如何、过去的成绩如何,都能在思维导图学习法的指引下迅速提升成绩。通过上万名学生的亲身实践证明:思维导图学习法可以将学生的学习效率提升3倍,从而让学生们从题海战术、机械学习的苦海中解脱出来,真正享受学习的乐趣。

本书的读者对象是广大高中生、初中生及小学生。小学三年级以下的孩子,请在家长的指导下进行阅读。

作者简介:

杨大宇,中国思维导图教育专家。长期从事思维导图的培训和教育工作。经过其培训的学生和家长多达上万人,被学生和家长们称为解决学习问题的“及时雨”。

1998年开始从事思维导图的教学研究。

2001年,在吉林省重点中学任教,并开始了将思维导图与日常教学相结合的研究与实践。

2005年,担任上海《IT时报》特约撰稿人,主笔专栏“IT时评”。

2006年,开始正式进行思维导图的推广和培训工作。受到学生和家长的强烈欢迎。

2006年底,与哈尔滨出版社合作,出版《中学生必读的智理故事全集》一书,在学生和家长中产生了不俗的反响。

2007年,开设网络远程培训。其思维导图网络讲座《一步一步思考》和《思维导图基础讲座》在互联网反响极大,点击率达数万次之多。

2007,与中国发改委旗下的《中国中小企业》合作,担任特别撰稿人,为其撰写特约文章。

2008年,与武汉大学出版社合作,出版个人专著《有氧信息》。此书倡导了快乐学习和简单化学习的理念。

2009年,与电子工业出版社合作,出版个人教学专著《画出好成绩》。此书在出版前即受到广大学生和家长的广泛关注。

最难忘的时刻:第一次在千人礼堂作思维导图报告

杨老师的E-mail:ydy_135@yahoocomcn

2020年4月,中央文件将“数据”纳入生产要素,数据成为了与土地、劳动力、资本、技术等传统要素相并列的第5类生产要素 ,“数字化转型”、“数据治理”“数据资产”等也变得越来越热。虽然各个企业的数据平台/数据应用系统等开始雨后春笋般得构建起来,但相关数据平台是否实现良性运转、是否真正驱动或助力业务发展、是否真正给企业带来了良好的投资回报,相信很多企业无法给出满意的答卷。

阻碍“数据”真实变现的因素很多,“数据质量”是其中一个特别突出的基础性影响因素。 相信自己真正负责过数据中台 或 数据运营平台的朋友,都会认同"数据质量问题"是个非常要命的问题。个人理解,这个点也是 数据应用系统 和 常规 IT应用系统的关键差别之一:

- 对于常规的IT应用系统 ,某个新功能经过 UT(单元测试), SIT(系统集成测试), UAT(用户验收测试)等测试以后,多数问题被发现并一次性解决之后,基本上线后出问题的概率就很小了,在业务用户眼里,“这个IT系统是基本可用的”;

- 但对于数据应用系统 ,上线准备时完成相关功能测试,只代表功能可用、相关数据在"当时"有用。但真正在上线以后,E2E数据链路的各个环节容易受到各种因素影响,1个环节出问题,数据质量就无法保证,业务用户就会质疑“数据的可用性”,进而质疑“数据平台的可用性”。出上几次问题,业务用户也就不愿意用了。。。了解到有不少企业数据平台,在项目刚结束时的确可用,但过上几个月由于各种要素发生变化又不能及时应对,数据质量无法保障,数据平台就变得少人问津、束之高阁了。

“数据质量”会被很多人提及,但在很多企业里并没有给予充分重视、也不太清楚如何体系性地认识和解决数据质量问题。 本文尝试对主流知识体系的数据质量部分进行梳理和比较,并给出一些参考性建议,以期能方便大家快速了解“数据质量”相关知识及应对手段,包含下述3块内容:

一、本文涉及的数据质量相关3套知识体系/书籍-基本介绍

二、分享《华为数据之道》数据质量部分,值得借鉴的4个亮点

三、分享《DAMA-BoK2》方面值得参考的4点补充内容

为了方便EAGC架构社群的数据架构工作组成员进行学习交流,我们主要围绕2套国内比较主流的知识体系(DAMA BoK2 和 DCMM)以及 基于企业实践总结的《华为数据之道》,进行相关的梳理比较,作为交流探讨的靶子。相对来讲,《华为数据之道》主要是基于华为自身的数据质量实践梳理的,文章相关章节的连贯性较好,便于阅读。另外,基于个人多年的2B数据中台实践来看,《华为数据之道》写得相对更务实一些,可参考性及可 *** 作性相对较强,本文会先以它为主导进行相关亮点的分享,然后再补充其它知识体系的一些内容。

1 《华为数据之道》数据质量部分,涉及的相关内容

相关的目录及条目,简单梳理成思维导图如下,主要包含3部分内容,详见下图:

1) 基于PDCA的数据质量管理框架;

2) 全面监控企业业务异常数据;

3) 通过“数据质量综合水平”牵引质量提升;

2 《DAMA-BoK2》数据质量部分,涉及的相关内容

DAMA-BoK(数据管理知识体系指南)无论在国际还是国内,在数据管理领域都是主流知识体系。DAMA-BoK 第2版英文原版于 2017年发布以后,终于在2020年推出了中文版,里面包含了相对完整的数据管理知识体系 (对应的认证体系是 CDMP),建议对数据感兴趣的人士能拥有1本作为参考书。DAMA-BoK2的适用面较广,相关章节内容的主体结构,基本上是统一的。数据质量部分的主要内容如下,详见下图:

1) 引言;

2) 活动;

3) 工具;

4) 方法;

5) 实施指南;

6) 数据质量和数据治理;

(上图中,**背景的部分内容,会在下方分享《华为数据之道》的几个亮点以后,进行补充分享。)

3 《DCMM》数据质量部分,涉及的相关内容

DCMM(数据管理能力成熟度评估模型) 属于国标(GB/T 26073-2018),从2018年10月开始实施。书本相对较薄,40页左右,建议大家了解一下。相关章节内容的主体结构,基本统一。数据质量部分的主要内容如下,详见下图:

1) 数据质量需求;

2) 数据质量检查;

3) 数据质量分析;

4) 数据质量提升;

(上图中,每个部分都会涉及“概述”、“过程描述”、“过程目标”、“能力等级标准”四个部分。**背景部分涉及的是能力等级标准,个人认为是一个不错的点,分为5级,每级都给出了一个参考标准,便于各个企业判断自身大体处于什么水平。)

前面已经提到,这本书是基于企业的实践梳理和总结出来的。个人了解到华为在探索企业数据管理方面不仅受到高层重视,而且真正投入了大量的人力物力,邀请了众多顶尖的咨询公司参与和支持。即使是这样,一路走过来也并不是一帆风顺、一撮而就的。。。在2020年11月左右,《华为数据之道》从华为内部读物,变成一本对外公开发表和分享的书,个人拜读了之后感觉还是挺有受益的。篇幅所限,这里简列了比较值得借鉴的4个亮点,供大家参考。(若想了解更多详细内容,建议仔细翻看原书,JD也提供电子版)

1 数据质量整体框架

数据质量之所以是个老大难问题,是因为它会受到众多因素影响,某一个环节没有管控或把握到位,数据质量就会出问题。我们需要一个整体性的框架,来确保企业能体系性地应对和解决这个问题。下方的数据质量整体框架,通过3个方面的有机结合,给出了一个整体性解决思路:

1) 领导力;

2) 持续改进(PDCA);

3) 能力保障;

2 数据质量规则 (场景类型- 质量规则- 数据6性)

从哪些方面来判断数据质量,DAMA BoK2比较全面分享了全球的主要流派:如 Strong-Wang框架(1996, 分4大类15个指标), Thomas-Redman(1996,3大类20多个维度),Larry English (1999, 2大类, 15个特征)以及 DAMA UK白皮书 (2013, 6个核心维度)。个人认为,华为提到的数据6性 主要参考了 2013年由 DAMA UK发布的白皮书。

华为在数据6性的基础上,进一步梳理出15个具体的质量规则类型,并对应上了4个主要场景 (“单列”、“跨列”、“跨行”、“跨表”),一下子明晰了具体的 *** 作思路,值得点赞。为了能更清晰的体现 15个质量规则类型 和 4种场景、6种特性的对应关系,本人在原图的基础上,适当调整了相关规则类型的位置并增加了 规则类型到数据6性的箭头,如下:

(通过添加箭头指向,除了更明确地展示 某个规则类型和数据特性的对应关系,画出来以后也比较容易发现: “一致性”、“有效性” 这2个数据特性关联到的质量规则较多,需要重点关注。)

3 业务对象的数据质量度量

关于数据质量的度量,会涉及一些具体的计算方法。“业务对象”是我们在进行业务分析及数据分析时,一个非常重要的元素。(有兴趣的同学,可在微信公众号搜索“ EAGC 4A协同 ”文章,快速了解典型的 4A集成元模型中“业务对象”所处的位置及其与其他元素的关系) 在基于业务对象进行数据质量度量时,个人比较认可书上建议的思路, 为了避免某个逻辑实体的严重数据质量问题被掩盖,建议采用“平均值”的思路来统计和度量“业务对象”的数据质量 。详见下方截图,给出了具体示例进行对比说明,并添加了备注。

4 度量质量 (设计质量 + 执行质量)

在很多企业里,在度量数据质量的时候,主要考虑“执行质量”,较少考虑“设计质量” 。在《华为数据之道》中,给出了 “设计质量 40% + 执行质量 60%”的思路,个人觉得这是个非常棒的思路。

目前的很多企业,纷纷在进行 数据仓库 / 数据湖 / 数据中台 等等的建设,比较常规的做法都是想办法先把现有的各个应用的数据采集入仓或入湖,实现数据打通,并快速在局部开始数据应用。相信在用了一段时间以后,不少企业会不断发现“上游源系统”的变化及设计质量对数据平台的数据可用性会不断产生影响,很多问题在下游解决会非常费劲,而且有些数据质量问题在下游不一定能解决掉。。。

在DAMA BoK中也强调 “第1次就获取正确数据所投入的成本,远比获取错误数据并修复数据的成本要低” ,我们需要尽可能在“源头”确保数据质量,这就需要加强对"设计质量"环节的重视和管控(涉及 资产目录/ 数据模型/ 数据标准/ 数据分布)。

相对而言,DAMA BoK的知识体系比较完整,在上方列示了 《华为数据之道》的4个较有参考价值的亮点以后,借助DAMA BoK提供相关补充内容,供大家参考。

1 数据质量相关概念及应遵循的原则

与数据质量相关,DAMA BoK2 给出了10个基本概念,和10项基本原则,列示如下:

2 开发和部署数据质量 *** 作

关于如何开发和部署数据质量,DAMA BoK2 给出了 5个 *** 作步骤。尤其在 “测量和监控数据质量”和“制定数据质量服务水平协议”方面,给出了一些具体的计算公式和参考说明。

3 预防措施 & 纠正措施

与方法有关,DAMA BoK2关于 “预防措施”和“纠正措施”,也给出了一些具体说明,个人认为有一定的指导和参考价值。

4 数据质量制度

数据质量的提升,离不开数据治理。DAMA-BoK2有个小节专门介绍“数据质量和数据治理”,尤其强调了数据质量工作,需要有匹配的数据治理制度的支持。与此同时,也列出了“数据质量制度”,应该包含的6个方面,参见下图:

本文主要围绕《华为数据之道》、《DAMA BoK2》 和 《DCMM》的数据质量部分,进行了简单梳理和基本介绍,然后分享了《华为数据之道》较值得借鉴的4个亮点,最后利用DAMA-BoK知识体系的完善性,补充分享了4点参考内容。希望通过上面的介绍,能方便大家快速了解“数据质量”相关知识点及可参考的应对手段。大家如有兴趣进一步了解,建议购买相关书籍并抽空学习。

解决数据质量问题,是个复杂的系统性工程,往往需要比较深度的体系性思考以及相关要素的整体协同。有兴趣的同学,可有意识地观察企业中目前存在哪些数据质量相关的问题和隐患,并思考探索如何逐步改善。也欢迎大家关注数据架构, 关注"EAGC 企业架构社群",共同交流学习 ! 

学习UI设计,软件只是UI设计的第一阶段,新手或者零基础的小伙伴可以从软件入手,到后面的设计理论,规范,交互这些设计思维学起。

学习UI设计,首先要明白UI设计师需要做的工作,大致介绍就是界面、图标、动效、交互、切图、标注等,这些内容都需要用到不同的软件。

在这里主要列举UI设计常用的四款软件:PS,AI,AE、ARP、XD、另外还有一些辅助软件偶尔也会用到

Adobe Photoshop

Adobe Photoshop,简称“PS”,是由Adobe Systems开发和发行的图像处理软件。 Photoshop主要处理以像素所构成的数字图像。使用其众多的编修与绘图工具,可以有效地进行编辑工作。ps有很多功能,在图像、图形、文字、视频、出版等各方面都有涉及。PS可以用来从事,平面设计,网页设计,UI设计等多种设计工作。在UI设计中PS的使用率在90%以上,所以作为一个合格的UI设计师。PS是肯定得掌握的。PS可以在UI设计中,绘制界面设计,图标设计等

Adobe illustrator

Adobe illustrator是一种应用于出版、多媒体和在线图像的工业标准矢量插画的软件,作为一款非常好的处理工具,Adobe Illustrator广泛应用于印刷出版、海报书籍排版、专业插画、多媒体图像处理和互联网页面的制作等,也可以为线稿提供较高的精度和控制,适合生产任何小型设计到大型的复杂项目。在UI设计中AI的使用率也是非常之高,主要可以用来绘制图标,界面等设计,插画等

Adobe After Effects

Adobe After Effects简称“AE”是Adobe公司推出的一款图形视频处理软件,适用于从事设计和视频特技的机构,包括电视台、动画制作公司、个人后期制作工作室以及多媒体工作室。属于层类型后期软件。在UI设计中主要主要是用来做动效设计,交互效果,

Axure RP

Axure RP是美国Axure Software Solution公司旗舰产品,是一个专业的快速原型设计工具,让负责定义需求和规格、设计功能和界面的专家能够快速创建应用软件或Web网站的线框图、流程图、原型和规格说明文档。作为专业的原型设计工具,它能快速、高效的创建原型,同时支持多人协作设计和版本控制管理 。

Axure RP已被一些大公司采用。Axure RP的使用者主要包括商业分析师、信息架构师、可用性专家、产品经理、IT咨询师、用户体验设计师、交互设计师、界面设计师等,另外,架构师、程序开发工程师也在使用Axure。

在UI设计中主要起的作用主要是用来做交互原型图

Sketch

这里重点介绍一下Sketch,它是个很好的界面设计工具,很方便,完全就是为扁平化界面而生的。这在做做流行的扁平化界面设计方面确实方便,比ps效率会高,现在很多UI设计师都喜欢用,但是我们做设计,肯定会接触到各种东西,你可能要画个拟物图标,做个宣传海报,做个网站bannr,做个酷炫的字体效果,那就还是得乖乖打开ps,在图像处理方面目前地球上没有什么软件能超过ps,还有一点,目前Sketch只有mac版,如果公司没有给你配苹果电脑的话就还是安静的用Adobe公司的PS和XD吧,能做好东西就行,不要太纠结一定要用哪个工具。

Experience Design CC

Adobe XD官方版全称Adobe Experience Design CC,是Adobe旗下专业的交互原型设计工具。Adobe XD官方版跨平台支持Win10 与 macOS,并且所有用户均可免费下载使用。Adobe XD CC 2018可快速进行APP设计、网站设计,UX/UI 产品设计,是设计师、产品经理和开发者们必备的设计工具

Adobe Dreamweaver

简称“DW”,中文名称 "梦想编织者",最初为美国MACROMEDIA公司开发 ,2005年被Adobe公司收购。DW是集网页制作和管理网站于一身的所见即所得网页代码编辑器。利用对 HTML、CSS、JavaScript等内容的支持,设计师和程序员可以在几乎任何地方快速制作和进行网站建设。

Cinema 4D

UI设计师的附加软件,最近几年非常流行的建模软件,建模渲染效果特别好!因而,成为了设计创意工作者的效率生产工具。现在,无论是影视后期、还是工业设计、或平面设计行业,C4D软件都得到了广泛的运用。用来做一些平面软件达不到的3D效果,视觉效果,能做很多的概念设计,这个软件,能让你的设计表现力更丰富更有趣。

Mindjet MindManager简称思维导图

MindManager,中文商标译作C,俗称“脑图”,又叫“心智图”,是一款创造、管理和交流思想的通用标准的绘图软件,由美国Mindjet公司开发,界面可视化,有着直观、友好的用户界面和丰富的功能。在UI设计中主要用来整理交互逻辑思维层。

蓝湖

蓝湖,产品设计协作平台&原型制作工具。中文版、全免费,支持Mac、Web、iOS。 支持从Sketch一键分享、在线讨论、自动为设计图生成标注,而且只需简单几步就能将设计图变成一个可以点击的演示原型,支持分享给同事,让他也可以在手机中查看设计效果。蓝湖已经成为新一代产品设计的工作方式。

墨刀

一款在线原型设计与协同工具,借助墨刀,产品经理、设计师、开发、销售、运营及创业者等用户群体,能够搭建为产品原型,演示项目效果。墨刀同时也是协作平台,项目成员可以协作编辑、审阅 ,不管是产品想法展示,还是向客户收集产品反馈,向投资人进行Demo展示,或是在团队内部协作沟通、项目管理

最近终于下定决定搭建个人博客了,名为“项小月的个人博客”,地址为xiangxiaoyuecom,就是“项小月”三个字的拼音。

1为什么要搭建这个博客呢?

一来,像微信公众号这样的平台对发文内容的领域有限制,不能跨领域发。而我将来一定会跨领域写点东西,仅仅是在这样的平台写还不够,我更希望能拥有自己的博客。

二来,是为了接入“熊掌号”,扩大个人品牌的影响。

2为什么用别人的博客系统

之前学了Flask,但是学完之后,对于想要什么样的博客这个问题,感觉思绪很乱。

自己并不知道想要的是什么样的博客,需要什么功能,弄个什么样的界面,要怎么样的布局……

与其空想,不如在Github上到处看看,然后发现了Blog_mini这个博客系统,作者很用心,需要的功能都有(博文管理、评论管理,还有插件功能),部署也讲的很细。

我感觉这个就很好了,暂时就用它了,等以后有了别的想法再改改。(关键是别人写的是真好)

(我觉得插件管理功能可以用来添加第三方登录,毕竟源码还没看,所以只是这么猜想。)

3博客上会发布什么内容?

(1)先期发布互联网和IT领域的内容(尤其是互联网网赚的内容会先发,这方面内容好写,多写可以给网站提权),这部分内容也会发布到微信公众号、百家号、熊掌号、大鱼号、企鹅号、等平台上。

(2)过一段时间,可以分享一些读书笔记(可能会涉及不止一个领域),最好是用思维导图的形式分享。如果这方面的内容和IT和互联网相关的话,也会发到上面提到的平台,还有微博、Bilibili等。如果无关,则发布到微博、Bilibili和。

(3)等我的水准足够录制一些分享视频的话,也会同时分享到各大视频平台,包括今日头条。

(4)资源分享,这是我的博客,而不是资源分享网站,但我还是会在文章中放一些资源链接的。

(5)广告,不会把广告放在文章旁边影响体验的,而是专门准备一个目录,把推广链接放过去。

暂时就想这么多,剩下的以后再说,另外我会每天都在网站上更新点东西的。

以上就是关于《思维导图实战派》pdf下载在线阅读全文,求百度网盘云资源全部的内容,包括:《思维导图实战派》pdf下载在线阅读全文,求百度网盘云资源、《画出好成绩》epub下载在线阅读,求百度网盘云资源、数据架构__"数据质量"相关知识体系梳理及亮点分享等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/langs/8832404.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-22
下一篇 2023-04-22

发表评论

登录后才能评论

评论列表(0条)

保存