数据建模是一个用于定义和分析在组织的信息系统范围内支持商业流程所需的数据要求的过程。简单来说,数据建模是基于对业务数据的理解和数据分析的需要,将各类数据进行整合和关联,使得数据可以最终以可视化的方式呈现,让使用者能够快速地、高效地获取到数据中有价值的信息,从而做出准确有效的决策。
之所以数据建模会变得复杂且难度大,是因为在建模过程中会引入数学公式或模型,用于确定数据实体之间的关联关系。不同的业务逻辑和商业需求需要选择不同的数学公式或模型,而且,一个好的数据模型需要通过多次的测试和优化迭代来完成,这就使得数据建模的难度变得很高。但是,数据分析中的建模并没有想象中的那么高深莫测,人人都可以做出适合自己的模型。
数据建模总归是为了分析数据从而解决商业问题。如下图数据建模的流程图,数据建模核心部分是变量处理和模型搭建。
变量处理
在建模之前,首先要决定选择哪些变量进行建模,主要从业务逻辑和数据逻辑两方面来考虑。业务逻辑需要了解数据来源的背景,通过了解业务知识来判断哪些变量在业务上很有价值的,哪些变量是可以选择的。数据逻辑则是从数据的完整性,集中度,是否与其他变量强相关等角度来考虑。
除了选择变量,对于一些变量的重构也是需要在建模前进行。例如客户的满意度有“满意”“不满意”,可以将其重构成数字“0”和“1”,便于后续建模使用。除此以外,还有将变量单独计算(取平均值)和组合计算(如A*B)也是常用的重构方法,例如,缺失值以数据取平均值的方式替换。
模型搭建
在模型搭建时,会经历选择算法、设定参数、加载算法、测试结果四个过程。在这个过程中,测试结果会引导调整之前设定的参数,加载算法会对应调整之前选择的算法,而选择算法时会考虑到已定的变量,如果变量不满足算法要求,还需回到选择/重构变量,直至得到最合适的模型。
在优化模型的过程中,模型的解释能力和实用性会不断地提升。在结果输出之后,还需接收业务人员的反馈,看看模型是否解决了他们的问题,如果没有,还需进一步修改和调整。
MicroStrategy在数据领域深挖企业需求,经过多年的研究和沉淀,结合众多复杂的应用场景,不断更新体验,深入开发各种数据辅助功能,使客户可以一站式链接各类型数据资源,完成数据导入和数据建模。在MicroStrategy 平台中,既支持传统方式数据建模,即通过Project Schema 来进行建模,又支持自助式数据导入的建模方式。
数据库各级模式的形成过程 1.需求分析阶段:综合各个用户的应用需求 2.概念设计阶段:形成独立于机器特点,独立于各个DBMS产品的概念模式(E-R图) 3.逻辑设计阶段:首先将E-R图转换成具体的数据库产品支持的数据模型,如关系模型,形成数据库逻辑模式;然后根据用户处理的要求、安全性的考虑,在基本表的基础上再建立必要的视图(View),形成数据的外模式 4.物理设计阶段:根据DBMS特点和处理的需要,进行物理存储安排,建立索引,形成数据库内模式 。 数据库设计技巧 1. 设计数据库之前(需求分析阶段) 1) 理解客户需求,询问用户如何看待未来需求变化。让客户解释其需求,而且随着开发的继续,还要经常询问客户保证其需求仍然在开发的目的之中。 2) 了解企业业务可以在以后的开发阶段节约大量的时间。 3) 重视输入输出。 在定义数据库表和字段需求(输入)时,首先应检查现有的或者已经设计出的报表、查询和视图(输出)以决定为了支持这些输出哪些是必要的表和字段。问题一:数据库概念模型与什么有关 数据模型是对现实世界数据特征的抽象,其三要素是(数据结构,数据 *** 作,数据的约束条件)最常用的数据模型分为概念数据模型和基本数据模型
概念数据模型是按用户的观点对数据和信息建模,是现实世界到信息世界的第一层抽象。
基本数据模型是按计算机系统的观点对数据建模,是现实世界数据特征的抽象,用于DBMS的实现(层次模型,网状模型,关系模型)
问题二:数据库概念模型的基本概述 把面向对象的方法和数据库技术结合起来可以使数据库系统的分析、设计最大程度地与人们对客观世界的认识相一致。面向对象数据库系统是为了满足新的数据库应用需要而产生的新一代数据库系统。数据库概念模型实际上是现实世界到机器世界的一个中间层次。数据库概念模型用于信息世界的建模,是现实世界到信息世界的第一层抽象,是数据库设计人员进行数据库设计的有力工具,也是数据库设计人员和用户之间进行交流的语言。建立数据概念模型,就是从数据的观点出发,观察系统中数据的采集、传输、处理、存储、输出等,经过分析、总结之后建立起来的一个逻辑模型,它主要是用于描述系统中数据的各种状态。这个模型不关心具体的实现方式(例如如何存储)和细节,而是主要关心数据在系统中的各个处理阶段的状态。 实际上,数据流图也是一种数据概念模型。
问题三:数据库中概念模型的含义和作用 数据模型是对现实世界数据特征的抽象,其三要素是(数据结构,数据 *** 作,数据的约束条件) 最常用的数据模型分为概念数据模型和基本数据模型 概念数据模型是按用户的观点对数据和信息建模,是现实世界到信息世界的第一层抽象。 基本数据模型是按计算机系统的观点对数据建模,是现实世界数据特征的抽象,用于DBMS的实现(层次模型,网状模型,关系模型)
问题四:概念模型是什么? 也称信息模型,它是按用户的观点来对数据和信息建模。概念模型是现实世界到机器世界的一个中间层次。表示概念模型最常用的是实体-关系图。概念模型是对真实世界中问题域内的事物的描述,不是对软件设计的描述。概念的描述包括:记号、内涵、外延,其中记号和内涵(视图)是其最具实际意义的。概念模型用于信息世界的建模,它是世界到信息世界的第一层抽象,它数据库设计的有力工具,也是数据库开发人员与用户之间进行交流的语言。因此概念模型既要有较强的表达能力,应该简单、清晰、易于理解。目前最常用的是实体-联系模型。在管理信息系统中,概念模型:是设计者对现实世界的认识结果的体现,是对软件系统的整体概括描述。让读者更易理解,读时有个参考的东西。概念模型设计的常用方法是实体关系方法(E-R方法)。用实体关系方法对具体数据进行抽象加工,将实体 *** 抽象成实体类型,用实体间的关系反映现实世界事物间的内在关系。首先可以进行局部E-R模型,然后把各局部E-R模型综合成一个全局的E-R模型,最后对全局E-R模型进行优化,最后得到的。在数据仓库中的含义总的来说,数据仓库的结构采用了三级数据模型的方式,即概念模型、逻辑模型、物理模型。概念模型:也就是业务模型,由企业决策者,商务领域知识专家和IT专家共同研究和分析企业级的跨领域业务系统需求分析的结果。在数据仓库项目中,物理模型设计和业务模型设计象两个轮子一样有力地支撑着数据仓库的实施,两者并行不悖,缺一不可。实际上,这有意地扩大了物理模型和业务模型的内涵和外延,因为,在这里物理模型不仅仅是数据的存储,而且也包含了数据仓库项目实施的方法论、资源以及软硬件选型,而业务模型不仅仅是主题模型的确立,也包含了企业的发展战略,行业模本等等更多的内容。一个优秀的项目必定会兼顾业务需求和行业标准两个方面,业务需求既包括用户提出的实际需求,也要客观分析它隐含的更深层次的需求,但是往往用户的需求是不明确的,需要加以提炼甚至在商务知识专家引导下加以升华,和用户一起进行需求分析工作。如果不能满足用户的需求,项目也就失去了原本的意义。关于概念模型概念模型设计是在原有的业务数据库的基础上建立了一个较为稳固的概念模型。因为数据仓库是对原有数据库系统中的数据进行集成和重组而形成的数据 *** ,所以数据仓库的概念模型设计,首先要对原有数据库系统加以分析理解,看在原有的数据库系统中有什么、怎样组织的和如何分布的等,然后再来考虑应当如何建立数据仓库系统的概念模型。一方面,通过原有数据库的设计文档以及在数据字典中的数据库关系模式,我们可以对企业现有的数据库中的内容有一个完整而清晰的认识另一方面,数据仓库的概念模型是面向企业全局建立的,它为集成来自各个面向应用的数据库的数据提供了统一的概念视图。它的工作主要是界定系统的边界和确定主要的主题域。界定系统边界将决策者的数据分析的需求用系统边界的定义形式反映出来。确定主题域是对每个主题域的内容进行较明确的数据仓库建模技术在行业中的应用描述,其内容包括:主题域的公共码键、主题域之间的联系以及充分代表主题的属性组。
问题五:数据库设计概念模型图,逻辑模型图分别是什么? 1.1.概念模型(E-R图描述)
概念模型是对真实世界中问题域内的事物的描述,不是对软件设计的描述。
表示概念模型最常用的是实体-关系图。
E-R图主要是由实体、属性和关系三个要素构成的。在E-R图中,使用了下面几种基本的图形符号。
实体,矩形
E/R图三要素 属性,椭圆形
关系,菱形
关系:一对一关系,一对多关系,多对多关系。
E/R图中的子类(实体):
1.2.逻辑模型
逻辑数据模型反映的是系统分析设计人员对数据存储的观点,是对概念数据模型进一步的分解和细化。
1.3.物理模型
物理模型是对真实数据库的描述。数据库中的一些对象如下:表,视图,字段,数据类型、长度、主键、外键、索引、是否可为空,默认值。
概念模型到物理模型的转换即是把概念模型中的对象转换成物理模型的对象。
问题六:什么是数据库的概念结构 1. 数据库定义:数据库是长期储存在计算机内、有组织的、可共享的大量数据的 *** 。数据库中的数据按一定的数据模型组织、描述和储存,具有较小的冗余度、较高的数据独立性和易扩展性,并可为各种用户共享。2. 数据库管理技术发展的三个阶段:人工管理阶段,文件系统阶段,数据库系统阶段。3. DBMS(数据库管理系统)是位于用户与 *** 作系统之间的一层数据管理软件。主要功能:1,数据定义功能。2,数据组织、存储和管理。3,数据 *** 纵功能。4,数据库的事务管理和运行管理。5,数据库的建立和维护功能。6,其他功能。4. 什么是数据模型及其要素? (设计题): 数据模型是数据库中用来对现实世界进行抽象的工具,是数据库中用于提供信息表示和 *** 作手段的形式构架。一般地讲,数据模型是严格定义的概念的 *** 。这些概 念精确地描述系统的静态特性、动态特性和完整性约束条件。因此数据模型通常由数据结构、数据 *** 作和完整性约束三部分组成。 (1)数据结构:是所研究的对象类型的 *** ,是对系统的静态特性的描述。 (2)数据 *** 作:是指对数据库中各种对象(型)的实例(值)允许进行的 *** 作的 *** ,包括 *** 作及有关的 *** 作规则,是对系统动态特性的描述。 (3)数据的约束条件:是完整性规则的 *** ,完整性规则是给定的数据模型中数据及其联系所具有的制约和依存规则,用以限定符合数据模型的数据库状态以及状态的变化,以保证数据的正确、有效、相容。最常用的数据模型:层次模型,网状模型,关系模型,面积对象模型,对象关系模型。5.常用的数据模型有哪些(逻辑模型是主要的),各有什么特征,数据结构是什么样的。答:数据模型可分为两类:第一类是概念模型,也称信息模型,它是按用户的观点来地数据和信息建模,主要用于数据库设计。第二类是逻辑模型和物理模型。其中逻辑模型主要包括层次模型、层次模型、关系模型、面向对象模型和对象关系模型等。它是按计算机系统的观点对数据建模,主要用于DBMS的实现。物理模型是对数据最低层的抽象,它描述数据在系统内部的表示方式和存取方法,在磁盘或磁带上的存储方式和存取方法,是面向计算机系统的。物理模型是具体实现是DBMS的任务,数据库设计人员要了解和选择物理醋,一般用户则不必考虑物理级的细节。层次数据模型的数据结构特点:一是:有且只有一个结点没有双亲结点,这个结点称为根结点。二是:根 以外的其他结点有且只有一个双亲结点。优点是:1.层次 数据结构比较简单清晰。2.层次数据库的查询效率高。3.层次数据模型提供了良好的完整性支持。缺点主要有:1.现实世界中很多联系是非层次性的,如结点之间具有多对多联系。2.一个结点具有多个双亲等 ,层次模型表示这类联系的方法很笨拙,只能通过引入冗余数据或创建非自然的数据结构来解决。对插入和删除 *** 作的限制比较多,因此应用程序的编写比较复杂。3.查询子女结点必须通过双亲结点。4.由于结构严密,层次命令趋于程序化。可见用层次模型对具有一对多的层次联系的部门描述非常自然,直观容易理解,这是层次数据库的突出优点。网状模型:特点:1.允许一个以上的结点无双亲2.一个结点可以有多于一个的双亲。网状数据模型的优点主要有:1.能够更为直接地描述现实世界,如一个结点可以有多个双亲。结点
之间可以有多种上联第。2.具有良好的性能,存取效率较高。缺点主要有:1.结构比较复杂,而且随着应用环境的扩大,数据库的结构就变得越来越复杂,不利于最终 用户掌握。2.网状模型的DDL,DML复杂,并且要嵌入某一种高级语言中,用户不容易掌握,不容易使用。关系数据模型具有下列优点:1.关系模型与非关系模型不同,它是建立在严格的数学......>>
问题七:怎么用powerdesigner画数据库概念模型 怎么用powerdesigner画数据库概念模型方法/步骤
打开PowerDesigner,点击菜单“File”---->“New Model”
点击【OK】按钮后,将进入如下的画面,
系统将出现一个工具栏如下,用于在设计面板中设计模型,
单击Entity图标,然后在主面板中单击一次便可添加一个实体,
切换回一般鼠标模式,双击已经添加的实体,d出设置属性的对话框,
在General选项卡中可以设置实体的Name和Code等属性,
Code是实体在数据库中的实际名称,一般用英文,Name是显示的名称,一般用中文,方便理解。
切换到Attributes选项卡可以添加实体的属性,
问题八:数据库概念模型的关系模型 在关系模型中,数据的逻辑结构是一张二维表。在数据库中,满足下列条件的二维表称为关系模型:① 每一列中的分量是类型相同的数据;② 列的顺序可以是任意的;③ 行的顺序可以是任意的;④ 表中的分量是不可再分割的最小数据项,即表中不允许有子表;⑤ 表中的任意两行不能完全相同。关系数据库采用关系模型作为数据的组织方式。 关系数据库因其严格的数学理论、使用简单灵活、数据独立性强等特点,而被公认为最有前途的一种数据库管理系统。它的发展十分迅速,目前已成为占据主导地位的数据库管理系统。自20世纪80年代以来,作为商品推出的数据库管理系统几乎都是关系型的,例如,Oracle,Sybase,Informix,Visual FoxPro,mysql,sqlserver等。关系模型范式只有满足一定条件的关系模式,才能避免 *** 作异常。关系模式要满足的条件称为规范化形式,简称范式。下面介绍四种不同程度的范式,由低级向高级:1、第一范式(1NF)在关系模式R的每一个具体关系r中,如果每个属性值都是不可能再分的最小数据单元,则称R是第一范式。记为R∈1NF。1NF是关系数据库能够保存数据并且正确访问数据的最基本条件。2、第二范式(2NF)如果关系模式R(U,F)中的所有非主属性都完全函数依赖于任意一个候选关键字,则称关系R是属于第二范式。记为R∈2NF。3、第三范式(3NF)如果关系模式R(U,F)中所有非主属性对任何侯选关键字都不存在传递依赖,则称关系R是属于第三范式。记为R∈3NF。4、BCNF如果关系模式R(U,F)R属于1NF,对任何非平凡依赖的函数依赖X→Y(Y!→X)X均包含码。记为R∈BCNF。如果R是BCNF则一定是3NF;反之则不行。一个低级范式的关系模式,可以通过分解方法转换成若干个高一级范式的关系模式的 *** ,也可以说任何一个高层的范式,总是能够满足低层的范式。
问题九:模型的概念。数据库中的数据模型主要有哪些?数据模型的组成的要素有哪些? 数据库模型描述了在数据库中结构化和 *** 纵数据的方法,模型的结构部分规定了数据如何被描述(例如树、表等);模型的 *** 纵部分规定了数据的添加、删除、显示、维护、打印、查找、选择、排序和更新等 *** 作。
数据库模型的分类
1概念模型 2 层次模型
3 网状模型 4 关系模型
数据模型所描述的内容包括三个部分:数据结构、数据 *** 作、数据约束。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)