空间数据库的组成部分

空间数据库的组成部分,第1张

空间数据库指的是地理信息系统在计算机物理存储介质上存储的与应用相关的地理空间数据的总和,一般是以一系列特定结构的文件的形式组织在存储介质之上的。《空间数据库》范围及重点 1 第一章:绪论 1) 空间数据库基本概念、组成部分、名称简写之间的联系与区别与联系; 答;利用当代的系统方法,在地理学、地图学原理的指导下,对地理空间进行科学的认识与抽象,将地理数据库化为计算机处理时所需的形式与结构,形成综合性的信息系统技术——空间数据库 或者SDBMS是海量SD的存储场所、提供SD处理与更新、交换与共享,实现空间分析与决策的综合系统。 组成:存储系统、管理系统、应用系统 是SDBS的简称 2) 目前空间数据库实现方案; 答:ORDBMS 3) GIS,RS与空间数据库之间的联系; 4) 常见的空间数据库产品 答:轻量级: MS的Access、FoxPro、 SUN的MySQL 中等:MS的SQL Server系列 重量级:Oracle的Oracle 不太熟悉的有: Sybase、Informix、DB2 、Ingress、 PostgreSQL(PG)等 5) 产生空间数据库的原因; 答:直接利用? SD特征 :空间特性 非结构化特征 空间关系特征 多尺度与多态性 海量数据特性 存在的问题:复杂图形功能:空间对象 复杂的空间关系 数据变长记录 6)空间数据库与普通关系数据库的主要区别。 答:关系数据库管理属性数据,空间数据采用文件库或图库形式;增加大二进制数据类型(BLOB),解决变长数据存储问题;将空间数据/属性数据全部存放在数据库中;但空间特性由程序处理 2 第二章:空间数据库模型 1) 如何理解空间数据库模型; 2) 空间数据及空间关系; „ (1) 空间数据类型 几何图形数据 影像数据 属性数据 地形数据 元数据:对空间数据进行推理、分析和总结得到的关于数据的数据, 数据来源、数据权属、数据产生的时间 数据精度、数据分辨率、元数据比例尺 地理空间参考基准、数据转换方法… (2) 空间关系 指地理空间实体之间相互作用的关系: 拓扑关系:形状、大小随投影改变。在拓扑变换下不变的拓扑变量,如相邻、包含、相交等,

反映空间连续变化的不变性 方位关系:地理空间上的排列顺序,如前后、上下、左右和东、南、西、北等方位 度量关系:距离远近等 3) 空间数据库如何建模; DB设计三步骤 ‹ Conceptual Data Model:与应用有关的可用信息组织、数据类型、联系及约束、不考虑细节、E-R模型 Logic Data Model 层次、网状、关系,都归为关系,SQL的关系代数(relational algebra, RA) Physical Data Model:解决应用在计算机中具体实现的各种细节,计算机存储、数据结构等 4) 模型之间如何转换? 5) 可行的空间数据库建模方案。 面向对象的空间数据库模型GeoDatabase 3 第三章:空间数据库存储与索引 1) 空间数据如何组织、存储的,采用什么技术或者方法; 为有效表达空间信息内容,空间数据必须按照一定的方式进行组织与存储:适合外存 *** 作的数据结构、记录和文件的多种组织方式 SDB空间数据组织:数据项、记录、文件、数据库 SDB空间数据存储:二级存储器、缓冲区管理器、空间聚类(clustering)、空间索引 2) 空间近似与空间聚类; 目的:降低响应大查询的寻道时间和等待时间,在二级存储中空间上相邻的/查询上有关联的空间对象在物理上存放在一起, 内部聚类(internal clustering):加快单个对象的访问,一个对象都存放在一个磁盘块(页面);如超出则存放在连续扇区,本地聚类(local clustering):加快多个对象访问。一组空间相邻对象存放在一个页面 空间聚类比传统聚类技术复杂。多维空间对象无天然的顺序 磁盘:一维存取,高维:将高维映射到一维, 一一对应,保持距离(distance preserving):一一对应,容易;距离不变,近似,映射技术、Z序(z-order)、Hilbert曲线 3) 空间数据库性能提升的关键问题是什么?如何提升; 数据库索引,基于树:ISAM、B树、B 树等,基于Hash:静态、可扩展、线性等 4) 空间索引技术是什么?为什么产生?有哪些常见的空间索引;各有何特点及适用范围? 依据空间对象的位置和形状或者空间对象之间的空间关系,按一定顺序排列的一种数据结构,介于空间 *** 作算法和空间对象之间,通过筛选,大量与特定空间 *** 作无关的空间对象被排除,提高效率,空间数据库关键的技术 空间索引产生的原因:空间数据的特点:空间定位、空间关系、多维、多尺度、海量、复杂,传统数据库索引处理的一维的字符、数字,对多维处理采用组合字段 1、基于二叉树的索引技术:二分索引树结构主要用于索引多维数据点;对复杂空间目标(线、面、体等)的索引却必须采用近似索引方法和空间映射技术 2、 基于B树的索引技术 ‹B树的变体如R树系列,外包矩形;对大型数据库具有出色表现;需要解决:减少区域重叠,提高搜索效率 3、基于哈希的网格技术

这是关系型数据库概念中提出的一个子概念。

关系数据库系统是支持关系模型的数据库系统。而关系模型由:关系数据结构、关系 *** 作集合和关系完整性约束组成。

关系数据结构:

在关系模型中,现实世界的实体以及实体间的各种联系均用关系来表示。在用户看来,关系模型中数据的逻辑结构是一种二维数据结构,在数据库中就表现为一张二维表。

数据结构就是计算机存储、组织数据的方式,关系就是实体间的某种联系,例如两个实体分别为学生与课程,在选课系统的环境下,他们之间的联系就是“选课”,我们为了想存储下每个学生都选了什么课,可以以学生实体与课程实体的联系建立起一个二维的逻辑结构,在这种逻辑结构中我们可以很轻松的检索两实体间的关系集,例如某一学生都选了什么课,或者是某一课程都有哪些学生选了,多维的关系数据结构可以以此类推,但很少见到实际应用,大多都是二维关系的组合应用。

关系数据结构的重点在于“实体”与“关系”的选择,只要记住“关系”是指的实体与实体之间的联系就可以了,作为关系数据结构中维度的定义,具体的(麻雀)或是抽象的(鸟)实体都可以,但行为(吃)或属性(小)是不行的。

地质图空间数据库的组成要素主要包括:对象类、要素类、关系类、综合要素类和要素数据集。组成地质图空间数据库要素数据集分为三大类:基本要素数据集、综合要素数据集和对象数据集。地质图要素数据集是共享空间参考系统的要素类的集合。在地质图数据模型中,由地质点、面、线要素实体类构成。一个要素数据集的空间参考指定了包括坐标系统、投影系统和高程系统的空间参照系、空间域和精度。具有拓扑关系,且具有相同几何类型和相同属性的要素的集合称为地质图要素类。构成地质图的点称为地质图点要素类,构成地质图的线称为地质图线要素类、构成地质图的面称为地质图面要素类。另外,一个地质图要素数据集还应包括属性域(domains),属性域是一个字段类型的合法值的规则,用于限制在表要素类,或子类型的任何具体的属性字段内允许的值。每个要素类或表有一个属性域的集合,这些属性域用于不同的属性和子类型,并且可以在地理数据库的要素类和表之间共享。

图5-2 地质图空间数据库实体关系

传统的地质图数据模型不能很好地解决上述问题,面向对象的技术和方法给我们带来了曙光。面向对象数据模型是以单个空间地质对象为数据组织和存储的基本单位,与拓扑关系数据模型相反,以独立完整、具有地质意义的对象为基本单位对地质空间进行表达,典型实例是ESRI公司的GeoDataBase模型。在具体组织和存储时,将对象的坐标数据和属性数据(如建立了部分拓扑,拓扑关系也放在表中保存)统一存放在关系数据库中。利用面向对象的思想对数字地质图数据进行重新组织与存储,使得数据的表达更接近于人们对客观世界的认识,其语义关系和内部关系更加合理,大大增强了高层次的地质空间分析能力。该模型使得数字地质图独立于任何给定的软件和硬件结构。

本文建库所采用的基本要素类包括:地质(线)界线、脉岩(点)、矿产地(点)、产状、火山口;综合要素数据集包括:蚀变带(面);对象数据集包括:沉积(火山)岩岩石地层单位、侵入岩岩石年代单位、变质岩地(岩)层单位、断层、面状水域与沼泽。

1数据库各要素类概念

采用以下要素对地质图空间数据库要素类、对象类和综合要素类描述与定义:

实体名称:实体数据的中文名称;

要素类名称:要素类的中文名称;

对象类名称:对象类的中文名称;

综合要素类名称:综合要素类的中文名称;

要素对象与综合要素类编码:数据项名称的标准化编码;

空间数据类型:指点线面类型;

数据类型:指数据存储的类型,一般包括字符型(C)、单精度数值(S)、双精度数值(D)、长整形(L)、整形等(I),对于特殊系统的数据类型,需要明确说明;

与其他实体的关系:表示该实体与其他实体的关系,如拓扑关系或依赖关系;

数据存储长度:存储于某一特定系统平台的字节数,为系统默认值;

数据显示长度:数据用于信息表达的长度,字符型数据说明字符个数,数值型数据说明小数点前后的位数,不确定长度的数据项需明确说明;

约束条件:确定数据项是否填写,按照以下三类规定,可选(O)、必选(M)、条件必选(C);若为必选(M)时,可填写是否为空(NOT NULL);

默认值/初始值:确定数据项在初始状态下的值;

值域范围:明确给出数据项的取值范围;

数据项描述:对需要进一步说明的数据项进行描述。对于特殊表达格式的数据项也需在此说明,如多数值表达的分隔符,特殊符号的表达描述等;

主关键字名称:用以标识记录的唯一性,并用于和其他实体进行关联的数据项的名称;

子关键字名称:和主关键字一起用以标识记录的唯一性,并用于和其他实体进行关联的数据项的名称;

索引键名称:用于按照一定规律排序的数据项的名称;

注释要素类编码:注释要素类数据项名称的标准化编码。

2组成地质图空间数据库要素数据集

包括三大类:基本要素数据集、综合要素数据集和对象数据集。地质图空间数据库包括要素、对象的分类,描述要素、对象的内容,要素、对象的关系等。

3基于地质数据库模型的地质图类图

图5-3是基于地质数据库模型的地质图类图,反映了地质图要素类与对象类之间的关系。

图5-3 地质数据库模型的地质图类图

4空间数据库各要素类字段定义

参照中国地质调查局地质调查技术标准 《数字地质图空间数据库》(DD2006-06)的建库标准,在ArcGIS 93 Catalog下,根据标准规定的各要素数据的数据格式建立各类要素集(Feature Classet)见表5-3,及数据表结构和填写规范,见表5-4至表5-11。

表5-3 基础数据库中各要素类一览表

表5-4 沉积(火山)岩图层表结构及填写规范

表5-5 侵入岩岩图层表结构及填写规范

表5-6 地质界线图层表结构及填写规范

表5-7 断层图层表结构及填写规范

续表

表5-8 蚀变图层表结构及填写规范

表5-9 火山机构图层表结构及填写规范

表5-10 矿点图层表结构及填写规范

续表

表5-11 岩墙图层表结构及填写规范

1、数据量庞大。

空间数据库面向的是地理学及其相关对象,而在客观世界中它们所涉及的往往都是地球表面信息、地质信息、大气信息等及其复杂的现象和信息,所以描述这些信息的数据容量很大,容量通常达到 GB级。

2、具有高可访问性 。

空间信息系统要求具有强大的信息检索和分析能力, 这是建立在空间数据库基础上的,需要高效访问大量数据。

3、空间数据模型复杂

空间数据库存储的不是单一性质的数据,而是涵盖了几乎所有与地理相关的数据类型,这些数据类型主要可以分为 3 类:

(1)属性数据:与通用数据库基本一致,主要用来描述地学现象的各种属性,一般包括数字、文本、日期类型。

(2)图形图像数据:与通用数据库不同,空间数据库系统中大量的数据借助于图形图像来描述。

(3)空间关系数据:存储拓扑关系的数据,通常与图形数据是合二为一的。

4、属性数据和空间数据联合管理。

5、空间实体的属性数据和空间数据可随时间而发生相应变化。

6、空间数据的数据项长度可变,包含一个或多个对象,需要嵌套记录。

7、一种地物类型对应一个属性数据表文件。多种地物类型共用一个属性数据表文件。

8、具有空间多尺度性和时间多尺度性。

9、应用范围广泛。

空间数据库的设计

数据库因不同的应用要求会有各种各样的组织形式。数据库的设计就是根据不同的应用目的和用户要求,在一个给定的应用环境中,确定最优的数据模型、处理模式、存贮结构、存取方法,建立能反映现实世界的地理实体间信息之间的联系,满足用户要求,又能被一定的DBMS接受,同时能实现系统目标并有效地存取、管理数据的数据库。简言之,数据库设计就是把现实世界中一定范围内存在着的应用数据抽象成一个数据库的具体结构的过程。

空间数据库的设计是指在现在数据库管理系统的基础上建立空间数据库的整个过程。主要包括需求分析、结构设计、和数据层设计三部分。

1、需求分析

需求分析是整个空间数据库设计与建立的基础,主要进行以下工作:

1)调查用户需求:

了解用户特点和要求,取得设计者与用户对需求的一致看法。

2)需求数据的收集和分析:

包括信息需求(信息内容、特征、需要存储的数据)、信息加工处理要求(如响应时间)、完整性与安全性要求等。

3)编制用户需求说明书:

包括需求分析的目标、任务、具体需求说明、系统功能与性能、运行环境等,是需求分析的最终成果。

需求分析是一项技术性很强的工作,应该由有经验的专业技术人员完成,同时用户的积极参与也是十分重要的。

在需求分析阶段完成数据源的选择和对各种数据集的评价

2、结构设计

指空间数据结构设计,结果是得到一个合理的空间数据模型,是空间数据库设计的关键。空间数据模型越能反映现实世界,在此基础上生成的应用系统就越能较好地满足用户对数据处理的要求。

空间数据库设计的实质是将地理空间实体以一定的组织形式在数据库系统中加以表达的过程,也就是地理信息系统中空间实体的模型化问题。

1)概念设计

概念设计是通过对错综复杂的现实世界的认识与抽象,最终形成空间数据库系统及其应用系统所需的模型。

具体是对需求分析阶段所收集的信息和数据进行分析、整理,确定地理实体、属性及它们之间的联系,将各用户的局部视图合并成一个总的全局视图,形成独立于计算机的反映用户观点的概念模式。概念模式与具体的DBMS无关,结构稳定,能较好地反映用户的信息需求。

表示概念模型最有力的工具是E-R模型,即实体-联系模型,包括实体、联系和属性三个基本成分。用它来描述现实地理世界,不必考虑信息的存储结构、存取路径及存取效率等与计算机有关的问题,比一般的数据模型更接近于现实地理世界,具有直观、自然、语义较丰富等特点,在地理数据库设计中得到了广泛应用。

2)逻辑设计

在概念设计的基础上,按照不同的转换规则将概念模型转换为具体DBMS支持的数据模型的过程,即导出具体DBMS可处理的地理数据库的逻辑结构(或外模式),包括确定数据项、记录及记录间的联系、安全性、完整性和一致性约束等。导出的逻辑结构是否与概念模式一致,能否满足用户要求,还要对其功能和性能进行评价,并予以优化。

从E—R模型向关系模型转换的主要过程为:

①确定各实体的主关键字;

②确定并写出实体内部属性之间的数据关系表达式,即某一数据项决定另外的数据项;

③把经过消冗处理的数据关系表达式中的实体作为相应的主关键字

④根据②、③形成新的关系。

⑤完成转换后,进行分析、评价和优化。

3)物理设计

物理设计是指有效地将空间数据库的逻辑结构在物理存储器上实现,确定数据在介质上的物理存储结构,其结果是导出地理数据库的存储模式(内模式)。主要内容包括确定记录存储格式,选择文件存储结构,决定存取路径,分配存储空间。

物理设计的好坏将对地理数据库的性能影响很大,一个好的物理存储结构必须满足两个条件:一是地理数据占有较小的存储空间;二是对数据库的 *** 作具有尽可能高的处理速度。在完成物理设计后,要进行性能分析和测试。

数据的物理表示分两类:数值数据和字符数据。数值数据可用十进制或二进制形式表示。通常二进制形式所占用的存贮空间较少。字符数据可以用字符串的方式表示,有时也可利用代码值的存贮代替字符串的存储。为了节约存贮空间,常常采用数据压缩技术。

物理设计在很大程度上与选用的数据库管理系统有关。设计中应根据需要,选用系统所提供的功能。

4)数据层设计

大多数GIS都将数据按逻辑类型分成不同的数据层进行组织。数据层是GIS中的一个重要概念。GIS的数据可以按照空间数据的逻辑关系或专业属性分为各种逻辑数据层或专业数据层,原理上类似于的叠置。例如,地形图数据可分为地貌、水系、道路、植被、控制点、居民地等诸层分别存贮。将各层叠加起来就合成了地形图的数据。在进行空间分析、数据处理、图形显示时,往往只需要若干相应图层的数据。

数据层的设计一般是按照数据的专业内容和类型进行的。数据的专业内容的类型通常是数据分层的主要依据,同时也要考虑数据之间的关系。如需考虑两类物体共享边界(道路与行政边界重合、河流与地块边界的重合)等,这些数据间的关系在数据分层设计时应体现出来。

不同类型的数据由于其应用功能相同,在分析和应用时往往会同时用到,因此在设计时应反映出这样的需求,即可将这些数据作为一层。例如,多边形的湖泊、水库,线状的河流、沟渠,点状的井、泉等,在GIS的运用中往往同时用到,因此,可作为一个数据层。

5)数据字典设计

数据字典用于描述数据库的整体结构、数据内容和定义等。 数据字典的内容包括: 1)数据库的总体组织结构、 数据库总体设计的框架 。  2)各数据层详细内容的定义及结构、 数据命名的定义 。  3)元数据(有关数据的数据,是对一个数据集的内容、质量条件及 *** 作过程等的描述) 。

以上就是关于空间数据库的组成部分全部的内容,包括:空间数据库的组成部分、空间数据模型与空间数据结构之间是怎样的关系、空间数据库结构定义等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/9280986.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-26
下一篇 2023-04-26

发表评论

登录后才能评论

评论列表(0条)

保存