医学信息数据库的基本结构

医学信息数据库的基本结构,第1张

医学信息数据库的基本结构包括以下组成部分:

数据库管理系统(DBMS):负责管理和维护数据库,对数据库进行备份和恢复等 *** 作。

数据库模型:描述了数据如何组织和存储,支持结构化和半结构化的数据格式。

数据库表:是数据模型的基本组成单元,包含字段和记录等多个数据元素。

数据库索引:提高数据库的查询效率,加速特定查询条件下的数据访问。

数据库 *** 作语言(DML):用于对数据库中的数据进行新增、修改、删除等 *** 作。

数据库查询语言(SQL):用于查询数据库中的数据,包括简单查询和复合查询等。

数据库安全管理:包括用户身份验证、访问控制、数据加密、审计日志等,确保数据库的安全性和完整性。

1 数据库定义:数据库是长期储存在计算机内、有组织的、可共享的大量数据的集合。数据库中的数据按一定的数据模型组织、描述和储存,具有较小的冗余度、较高的数据独立性和易扩展性,并可为各种用户共享。2 数据库管理技术发展的三个阶段:人工管理阶段,文件系统阶段,数据库系统阶段。3 DBMS(数据库管理系统)是位于用户与 *** 作系统之间的一层数据管理软件。主要功能:1,数据定义功能。2,数据组织、存储和管理。3,数据 *** 纵功能。4,数据库的事务管理和运行管理。5,数据库的建立和维护功能。6,其他功能。4 什么是数据模型及其要素 (设计题): 数据模型是数据库中用来对现实世界进行抽象的工具,是数据库中用于提供信息表示和 *** 作手段的形式构架。一般地讲,数据模型是严格定义的概念的集合。这些概 念精确地描述系统的静态特性、动态特性和完整性约束条件。因此数据模型通常由数据结构、数据 *** 作和完整性约束三部分组成。 (1)数据结构:是所研究的对象类型的集合,是对系统的静态特性的描述。 (2)数据 *** 作:是指对数据库中各种对象(型)的实例(值)允许进行的 *** 作的集合,包括 *** 作及有关的 *** 作规则,是对系统动态特性的描述。 (3)数据的约束条件:是完整性规则的集合,完整性规则是给定的数据模型中数据及其联系所具有的制约和依存规则,用以限定符合数据模型的数据库状态以及状态的变化,以保证数据的正确、有效、相容。最常用的数据模型:层次模型,网状模型,关系模型,面积对象模型,对象关系模型。5常用的数据模型有哪些(逻辑模型是主要的),各有什么特征,数据结构是什么样的。答:数据模型可分为两类:第一类是概念模型,也称信息模型,它是按用户的观点来地数据和信息建模,主要用于数据库设计。第二类是逻辑模型和物理模型。其中逻辑模型主要包括层次模型、层次模型、关系模型、面向对象模型和对象关系模型等。它是按计算机系统的观点对数据建模,主要用于DBMS的实现。物理模型是对数据最低层的抽象,它描述数据在系统内部的表示方式和存取方法,在磁盘或磁带上的存储方式和存取方法,是面向计算机系统的。物理模型是具体实现是DBMS的任务,数据库设计人员要了解和选择物理醋,一般用户则不必考虑物理级的细节。层次数据模型的数据结构特点:一是:有且只有一个结点没有双亲结点,这个结点称为根结点。二是:根 以外的其他结点有且只有一个双亲结点。优点是:1层次 数据结构比较简单清晰。2层次数据库的查询效率高。3层次数据模型提供了良好的完整性支持。缺点主要有:1现实世界中很多联系是非层次性的,如结点之间具有多对多联系。2一个结点具有多个双亲等 ,层次模型表示这类联系的方法很笨拙,只能通过引入冗余数据或创建非自然的数据结构来解决。对插入和删除 *** 作的限制比较多,因此应用程序的编写比较复杂。3查询子女结点必须通过双亲结点。4由于结构严密,层次命令趋于程序化。可见用层次模型对具有一对多的层次联系的部门描述非常自然,直观容易理解,这是层次数据库的突出优点。网状模型:特点:1允许一个以上的结点无双亲2一个结点可以有多于一个的双亲。网状数据模型的优点主要有:1能够更为直接地描述现实世界,如一个结点可以有多个双亲。结点

之间可以有多种上联第。2具有良好的性能,存取效率较高。缺点主要有:1结构比较复杂,而且随着应用环境的扩大,数据库的结构就变得越来越复杂,不利于最终 用户掌握。2网状模型的DDL,DML复杂,并且要嵌入某一种高级语言中,用户不容易掌握,不容易使用。关系数据模型具有下列优点:1关系模型与非关系模型不同,它是建立在严格的数学概念的基础上的。2关系模型的概念单一。3关系模型的存取路径对用户透明,从而具有更高的数据独立性,更好的安全保密性,也简化了程序员的工作和数据库开发的建立 的工作。主要的缺点是:由于存取路径房租明,查询效率往往不如非关系数据模型。因此为了提高性能,DBMS必须对用户的查询请求进行优化。因此增加 了开发DBMS的难度,不过用户不必考虑这些系统内部的优化技术细节。6三级体系结构,外模式,模式 ,内模式定义是什么?模式也称逻辑模式,是数据库中全体数据的逻辑结构和牲的描述,是所有用户的公共数据视图。 外模式也称子模式或用户模式,它是数据库用户能够看见和使用的局部数据的逻辑结构和特征的描述,是数据库用户的数据视图是与某一应用有关的数据的逻辑表示。 内模式也称存储模式 ,是一个数据库只有一个内模式。它是数据物理结构和存储方式的描述,是数据在数据库内部的表示方式。7两级映像和两级独立性,为什么叫物理独立性和逻辑独立性。当模式改变时由数据库管理员对各个外模式、模式的映像亻相应改变,可以使外模式保持不变。应用程序是依据数据的外模式编写的,从而应用程序不必修改,保证了数据与程序的逻辑独立生,简称数据的逻辑独立性。当数据库的存储结构改变了,由数据库管理员对模式、内模式映像作 相应改变,可以使模式保持不变,从而应用程序也不必改变。保证了数据与程序的物理独立性,简称数据的物理独立性。8数据库系统一般由数据库、数据库管理系统 (及其开发工具)、应用系统和数据库管理员构成。9关系的完整性(实体完整性、参照完整性、和用户定义的完整性)三部分内容,其中前二者是系统自动支持的,DBMS完整性控制子系统的三个主要功能?:提供定义完整性约束条件的机制,提供完整性检查的方法,违约处理。16SQL的定义;即结构化查询语言,是关系数据库的标准语言,是一个通用的、功能极强的关系数据库语言。分类(交互式和嵌入式)17group by 和having子句的作用20视图的概念:视图是从一个或几个基本表导出的表。及相关 *** 作:定义视图,查询视图,更新视图。视图更新有什么 *** 作:插入,删除,和修改。22数据库规范化的方法函数依赖的定义什么叫1NF2NF3NF BCNF定义:关系数据库中的关系是要满足一定要求的,满足不同程度要求的为不同范式。满足最低要求的叫第一范式,简称1NF。在第一范式中满足进一步要求的为第二范式,其余以此类推。各种范式之间的联系有:5NF(4NF(BCNF(3NF(2NF(1NF。25数据库设计的几个阶段,每个阶段常用的方法和简要的内容:六个阶段:需求分析、概念结构设计、罗织结构设计、物理设计、数据库实施、数据库运行和维护。28事务的概念?事务有哪些基本属性commit roll back含义:事务:是用户定义的一个数据库 *** 作序列,这些 *** 作要么全做,要么全不做,是一个不可分割的单位。四个特性:原子性,一致性,隔离性,持续性。Commit(提交:提交事务的所有 *** 作) rollback(回滚:在事务运行的过程中发生了某种故障,事务不能继续执行,系统将事务中对数据库的所有已完成的 *** 作全部撤销,回滚到事务开始时的状态。 29什么叫数据库系统的可恢复性?:数据库管理系统具有把数据库从错误状态恢复到某一已知的正确状态的功能,这就是数据库系统的可恢复性。数据库故障的种类:事务内部的故障,系统故障(软故障),介质故障(硬故障),计算机病毒。30不进行并发控制可能产生的问题?:多个事务对数据库并发 *** 作可能造成事务ACID特点遭到在破坏。如何解决(三个):1,丢失修改 2,不可重复读 3,读“脏”数据。31三级封锁协议?能解决什么问题?:一级封锁协议:事务T在修改数据R之前必须先对其加X锁,直到事务结束才释放。事务结束包括正常结束(COMMIT)和非正常结束(ROLLBACK)。一级封锁协议中,如果是读数据不修改,是不需要加锁的,可防止丢失修改。二级封锁协议:在一级封锁协议基础上,加上事务T在读数据R之前必须先对其加上S锁,读完后即可释放S锁。在二级封锁协议中,由于读完数据后即可释放S锁,所以它不能保证可重复读。三级封锁协议:一级封锁协议加上事务T在读取数据R之前必须先对其加S锁,直到事务结束才释放。三级封锁协议除了防止了丢失修改和不读“脏”数据外,还进一步防止了不可重复读。上述三级协议的主要区别在于:什么 *** 作需要申请封锁,以及何时释放锁。一般采取哪三种措施?插入呢?删除呢?:1,拒绝执行(不允许该 *** 作执行),2,级连 *** 作(当删除或修改被参照表的一个元组造成了与参照表的不一致,则删除或修改参照表中的所有造成不一致的元组),3,设置为空值(当删除或修改被参照表的一个元组时造成了不一致,则将参照表中的所有不造成不一致的元组的对应属性设置为空值)。38视图对数据库安全性的作用?:1,视图能够简化用户的 *** 作,2,视力使用户能以多种角度看待同一数据,3,视图对重构数据库提供了一定程度的逻辑独立性,4,视图能够对机密数据提供安全保护,5,适当的利用视图可以更清晰的表达查询。数据库:储存在计算机内,永久存储、有组织、有共享的大量数据的集合。数据管理技术的发展阶段:1人工管理阶段:数据不保存,应用程序管理数据,数据不共享,数据不具有独立性。2文件系统阶段:数据可以长期保存,由文件系统管理数据;数据共享性太差,冗余度大,数据独立性差。3数据库系统阶段:出现数据库管理系统。数据库系统的特点:数据结构化(本质区别);数据共享性高、冗余度低、易扩充;数据独立性高;数据有DBMS统一管理和控制。数据库管理系统:1定义:DBMS,是位于用户与 *** 作系统之间的一层数据管理软件。2功能:数据定义功能;数据组织、存储和管理;数据 *** 纵功能;数据库的事务管理和运行管理;数据库的建立和维护功能;通信功能、数据转换功能、互访和互 *** 作功能。数据库系统:1概念:DBS,是指在计算机系统中引入数据库后的系统。2组成:一般由数据库、数据库管理系统、应用系统、数据库管理员构成。3分类:集中式,C/S式,并行式,分布式。数据模型:1定义:现实世界数据特征的抽象。2组成,三要素:数据结构、数据 *** 作、数据的完整性约束。两类数据模型为1)概念模型2)逻辑模型和物理模型。数据结构:描述数据库的组成对象以及对象之间的联系,主要描述与对象的类型、内容、性质有关的对象和与数据之间联系有关的对象。常用的数据模型:1层次模型,用树形结构表示各类实体以及实体间的联系。2网状模型,允许一个以上的结点无双亲,允许一个结点可以有多于一个的双亲。3关系模型,包含单一数据结构

DAL 数据访问层:主要看你的数据层里面有没有包含逻辑处理,实际上他的各个函数主要完成对各个对数据的 *** 作。 BLL 业务逻辑层:主要负责对数据层的 *** 作。也就是说把一些数据层的 *** 作进行组合。 U I表示层:主要对用户的请求接受,以及数据的返回,为客户端提供应用程序的访问,比如界面等。

1

数据库定义:数据库是长期储存在计算机内、有组织的、可共享的大量数据的集合

数据库中的数据按一定的数据模型组织、描述和储存,具有较小的冗余度、较高的数据独立性和易扩展性,并可为各种用户共享

2

数据库管理技术发展的三个阶段:人工管理阶段,文件系统阶段,数据库系统阶段

3

DBMS(数据库管理系统)是位于用户与 *** 作系统之间的一层数据管理软件

主要功能:1,数据定义功能

2,数据组织、存储和管理

3,数据 *** 纵功能

4,数据库的事务管理和运行管理

5,数据库的建立和维护功能

6,其他功能

4

什么是数据模型及其要素(设计题):数据模型是数据库中用来对现实世界进行抽象的工具,是数据库中用于提供信息表示和 *** 作手段的形式构架

一般地讲,数据模型是严格定义的概念的集合

这些概念精确地描述系统的静态特性、动态特性和完整性约束条件

因此数据模型通常由数据结构、数据 *** 作和完整性约束三部分组成

(1)数据结构:是所研究的对象类型的集合,是对系统的静态特性的描述

(2)数据 *** 作:是指对数据库中各种对象(型)的实例(值)允许进行的 *** 作的集合,包括 *** 作及有关的 *** 作规则,是对系统动态特性的描述

(3)数据的约束条件:是完整性规则的集合,完整性规则是给定的数据模型中数据及其联系所具有的制约和依存规则,用以限定符合数据模型的数据库状态以及状态的变化,以保证数据的正确、有效、相容

最常用的数据模型:层次模型,网状模型,关系模型,面积对象模型,对象关系模型

5

常用的数据模型有哪些(逻辑模型是主要的),各有什么特征,数据结构是什么样的

答:数据模型可分为两类:第一类是概念模型,也称信息模型,它是按用户的观点来地数据和信息建模,主要用于数据库设计

第二类是逻辑模型和物理模型

其中逻辑模型主要包括层次模型、层次模型、关系模型、面向对象模型和对象关系模型等

它是按计算机系统的观点对数据建模,主要用于DBMS的实现

物理模型是对数据最低层的抽象,它描述数据在系统内部的表示方式和存取方法,在磁盘或磁带上的存储方式和存取方法,是面向计算机系统的

物理模型是具体实现是DBMS的任务,数据库设计人员要了解和选择物理醋,一般用户则不必考虑物理级的细节

层次数据模型的数据结构特点:一是:有且只有一个结点没有双亲结点,这个结点称为根结点

二是:根以外的其他结点有且只有一个双亲结点

优点是:1

层次数据结构比较简单清晰

2

层次数据库的查询效率高

3

层次数据模型提供了良好的完整性支持

缺点主要有:1

现实世界中很多联系是非层次性的,如结点之间具有多对多联系

2

一个结点具有多个双亲等,层次模型表示这类联系的方法很笨拙,只能通过引入冗余数据或创建非自然的数据结构来解决

对插入和删除 *** 作的限制比较多,因此应用程序的编写比较复杂

3

查询子女结点必须通过双亲结点

4

由于结构严密,层次命令趋于程序化

可见用层次模型对具有一对多的层次联系的部门描述非常自然,直观容易理解,这是层次数据库的突出优点

网状模型:特点:1

允许一个以上的结点无双亲2

一个结点可以有多于一个的双亲

网状数据模型的优点主要有:1

能够更为直接地描述现实世界,如一个结点可以有多个双亲

结点之间可以有多种上联第

2

具有良好的性能,存取效率较高

缺点主要有:1

结构比较复杂,而且随着应用环境的扩大,数据库的结构就变得越来越复杂,不利于最终用户掌握

2

网状模型的DDL,DML复杂,并且要嵌入某一种高级语言中,用户不容易掌握,不容易使用

关系数据模型具有下列优点:1

关系模型与非关系模型不同,它是建立在严格的数学概念的基础上的

2

关系模型的概念单一

3

关系模型的存取路径对用户透明,从而具有更高的数据独立性,更好的安全保密性,也简化了程序员的工作和数据库开发的建立的工作

主要的缺点是:由于存取路径房租明,查询效率往往不如非关系数据模型

因此为了提高性能,DBMS必须对用户的查询请求进行优化

因此增加了开发DBMS的难度,不过用户不必考虑这些系统内部的优化技术细节

6

三级体系结构,外模式,模式,内模式定义是什么?模式也称逻辑模式,是数据库中全体数据的逻辑结构和牲的描述,是所有用户的公共数据视图

外模式也称子模式或用户模式,它是数据库用户能够看见和使用的局部数据的逻辑结构和特征的

B树 即二叉搜索树: 1所有非叶子结点至多拥有两个儿子(Left和Right); 2所有结点存储一个关键字; 3非叶子结点的左指针指向小于其关键字的子树,右指针指向大于其关键字的子树; 如: B树的搜索,从根结点开始,如果查询的关键字与结点的关键字相等,那么就命中;否则,如果查询关键字比结点关键字小,就进入左儿子;如果比结点关键字大,就进入右儿子;如果左儿子或右儿子的指针为空,则报告找不到相应的关键字; 如果B树的所有非叶子结点的左右子树的结点数目均保持差不多(平衡),那么B树的搜索性能逼近二分查找;但它比连续内存空间的二分查找的优点是,改变B树结构(插入与删除结点)不需要移动大段的内存数据,甚至通常是常数开销; 如: 但B树在经过多次插入与删除后,有可能导致不同的结构: 右边也是一个B树,但它的搜索性能已经是线性的了;同样的关键字集合有可能导致不同的树结构索引;所以,使用B树还要考虑尽可能让B树保持左图的结构,和避免右图的结构,也就是所谓的“平衡”问题; 实际使用的B树都是在原B树的基础上加上平衡算法,即“平衡二叉树”;如何保持B树结点分布均匀的平衡算法是平衡二叉树的关键;平衡算法是一种在B树中插入和删除结点的策略; B-树 是一种多路搜索树(并不是二叉的): 1定义任意非叶子结点最多只有M个儿子;且M>2; 2根结点的儿子数为[2, M]; 3除根结点以外的非叶子结点的儿子数为[M/2, M]; 4每个结点存放至少M/2-1(取上整)和至多M-1个关键字;(至少2个关键字) 5非叶子结点的关键字个数=指向儿子的指针个数-1; 6非叶子结点的关键字:K[1], K[2], …, K[M-1];且K[i] < K[i+1]; 7非叶子结点的指针:P[1], P[2], …, P[M];其中P[1]指向关键字小于K[1]的子树,P[M]指向关键字大于K[M-1]的子树,其它P[i]指向关键字属于(K[i-1], K[i])的子树; 8所有叶子结点位于同一层; 如:(M=3) B-树的搜索,从根结点开始,对结点内的关键字(有序)序列进行二分查找,如果命中则结束,否则进入查询关键字所属范围的儿子结点;重复,直到所对应的儿子指针为空,或已经是叶子结点;B-树的特性: 1关键字集合分布在整颗树中; 2任何一个关键字出现且只出现在一个结点中; 3搜索有可能在非叶子结点结束; 4其搜索性能等价于在关键字全集内做一次二分查找; 5自动层次控制; 由于限制了除根结点以外的非叶子结点,至少含有M/2个儿子,确保了结点的至少利用率,其最底搜索性能为: 其中,M为设定的非叶子结点最多子树个数,N为关键字总数; 所以B-树的性能总是等价于二分查找(与M值无关),也就没有B树平衡的问题; 由于M/2的限制,在插入结点时,如果结点已满,需要将结点分裂为两个各占M/2的结点;删除结点时,需将两个不足M/2的兄弟结点合并; B+树 B+树是B-树的变体,也是一种多路搜索树: 1其定义基本与B-树同,除了: 2非叶子结点的子树指针与关键字个数相同; 3非叶子结点的子树指针P[i],指向关键字值属于[K[i], K[i+1])的子树(B-树是开区间); 5为所有叶子结点增加一个链指针; 6所有关键字都在叶子结点出现; 如:(M=3) B+的搜索与B-树也基本相同,区别是B+树只有达到叶子结点才命中(B-树可以在非叶子结点命中),其性能也等价于在关键字全集做一次二分查找; B+的特性: 1所有关键字都出现在叶子结点的链表中(稠密索引),且链表中的关键字恰好是有序的; 2不可能在非叶子结点命中; 3非叶子结点相当于是叶子结点的索引(稀疏索引),叶子结点相当于是存储(关键字)数据的数据层; 4更适合文件索引系统; B树 是B+树的变体,在B+树的非根和非叶子结点再增加指向兄弟的指针; B树定义了非叶子结点关键字个数至少为(2/3)M,即块的最低使用率为2/3(代替B+树的1/2); B+树的分裂:当一个结点满时,分配一个新的结点,并将原结点中1/2的数据复制到新结点,最后在父结点中增加新结点的指针;B+树的分裂只影响原结点和父结点,而不会影响兄弟结点,所以它不需要指向兄弟的指针; B树的分裂:当一个结点满时,如果它的下一个兄弟结点未满,那么将一部分数据移到兄弟结点中,再在原结点插入关键字,最后修改父结点中兄弟结点的关键字(因为兄弟结点的关键字范围改变了);如果兄弟也满了,则在原结点与兄弟结点之间增加新结点,并各复制1/3的数据到新结点,最后在父结点增加新结点的指针; 所以,B树分配新结点的概率比B+树要低,空间使用率更高; 小结 B树:二叉树,每个结点只存储一个关键字,等于则命中,小于走左结点,大于走右结点; B-树:多路搜索树,每个结点存储M/2到M个关键字,非叶子结点存储指向关键字范围的子结点; 所有关键字在整颗树中出现,且只出现一次,非叶子结点可以命中; B+树:在B-树基础上,为叶子结点增加链表指针,所有关键字都在叶子结点中出现,非叶子结点作为叶子结点的索引;B+树总是到叶子结点才命中; B树:在B+树基础上,为非叶子结点也增加链表指针,将结点的最低利用率从1/2提高到2/3 见:>

以上就是关于医学信息数据库的基本结构全部的内容,包括:医学信息数据库的基本结构、什么是数据库的概念结构、数据库体系结构按照哪三层结构进行组织等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/sjk/10149710.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-05
下一篇 2023-05-05

发表评论

登录后才能评论

评论列表(0条)

保存