数据库系统的三种模型是什么

数据库系统的三种模型是什么,第1张

数据模型主要有三种:层次模型、网状模型和关系模型。其中,层次模型和网状模型统称为非关系模型,由此构成的数据库居于非关系数据库产品,目前较少使用,关系模型构成关系数据库,是当前数据库主流产品。

关系模型是通过满足一定条件的二维表来表示数据及其数据间联系的一种模型。

层次模型

网状模型

关系模型

对象关系模型

对象模型

还有这些数据库模型:

数据联合模型

面向概念模型

实体-属性-值模型

多位数据库模型

半结构化模型

数据(data)是描述事物的符号记录。模型(Model)是现实世界的抽象。数据模型(Data Model)是数据特征的抽象,是数据库管理的教学形式框架。数据库系统中用以提供信息表示和 *** 作手段的形式构架。数据模型包括数据库数据的结构部分、数据库数据的 *** 作部分和数据库数据的约束条件

特点也就是优缺点

关系模型有如下优点

1. 数据结构简单

在关系模型中,数据模型是一些表格的框架,实体通过关系的属性(即表格的栏目)表示,实体之间的联系通过这些表格中的公共属性(可以不同属性名,但必须同域)表示。结构非常简单,即使非专业人员也能一看就明白。

2. 查询与处理方便

在关系模型中,数据的 *** 作较非关系模型方便,它的一次 *** 作不只是一个元组,而可以是一个元组集合。特别在高级语言的条件语句配合下,一次可 *** 作所有满足条件的记录。

3. 数据独立性很高

在关系模型中,用户对数据的 *** 作可以不涉及数据的物理存储位置,而只须给出数据所在的表、属性等有关数据自身的特性即可,具有较高的数据独立性。

4. 坚实的理论基础

与网状模型和层次模型不同,关系模型一开始便注重理论研究。在数据库领域专家的不懈努力下,关系系统的研究日趋完善,而且也促进了其它软件分支如软件工程的发展。

关系模型也存在的不足的地方:

1. 查询效率低

关系模型的数据库管理系统提供了较高的数据独立性和非过程化的查询功能,因此系统的负担很重,直接影响查询速度和查询效率。

2. 关系DBMS实现较困难

由于关系数据库管理系统的效率比较低,必须对关系模型的查询进行优化,这一工作相当复杂,实现难度比较大。

关系数据库模型支持了SQL语言的发展,并且拥有强大的理论基础为后盾(基于一阶的谓词逻辑),目前,SQL已经成为定义和 *** 纵关系数据库的标准语言。

关系数据模型的另一个好处在于它的简单性、适合联机事务处理(OLTP)、支持数据独立性。但是关系数据模型特别是RDBMS同样存在许多的不足之处。详细内容请参考下文:

一对“现实世界”实体的表达能力比较弱

规范化通常导致表与“现实世界”中的实体不对应,它将“现实世界”中的实体分割成几张表来显示,以物理表示法来反映实体结构,这样效率会比较差,常常要在查询处理中进行很多连接 *** 作。

二语义过载

关系模型表达数据和数据间关系的构造只有一种——表。例如,为了表达实体A和实体B之间的多对多(:)关系、我们需要创建三张表,两个分别用于表达实体A和B,第三张表用于表达实体间的关系。它没有一种机制来区分实体和关系,也无法区分在实体间存在的不同种类的关系。例如,一个1:关系可能是Has、Supervises、Manages等等。如果可以进行区分,也许我们就可以将语义构建到 *** 作中。所以,我们说关系模型语义过载了。

三不能很好的支持业务规则

很多商业化系统不能完全支持实体和参照完整性、域等业务规则,所以需要将它们内置到应用程序中。这样当然是危险的,而且容易导致做重复的工作。更糟糕的是,可能还会引起不一致现象。而且,在关系模型中不支持其他类型的业务规则,这又意味着它们需要被构建到DBMS或应用程序中。

四有限的 *** 作

关系模型只有一些固定的 *** 作集,例如面向集合和记录的 *** 作, *** 作是在SQL规格说明中提供的。但是,SQL目前不允许指定新的 *** 作。因此,在给许多“现实世界”对象的行为建模就有了太多的限制。例如,一个GIS应用程序典型的使用点、线、线组、多边形和一些处理距离、交叉点和包含关系的 *** 作。

五处理递归查询困难

数据的原子性意味着在关系模型中不允许出现重复的数据组,这样就导致了处理递归查询极为困难。递归查询就是那些有关表和自身直接或间接的关系的查询。为了解决这个问题,SQL可以嵌入在一个高级程序设计语言中,由高级程序设计语言来提供支持反复 *** 作的功能。而且,很多RDBMS提供了具有类似结构的报表书写程序。不管是哪种情况,都是应用程序而不是系统的内在功能提供了所需的功能。

六阻抗失配

直到最新版本的SQL标准,都缺少完全的计算功能。为了解决这个问题并且提供更多的灵活性,SQL标准提供嵌入式SQL来帮助开发更加复杂的数据库应用程序。但是,这引起了阻抗不匹配(impedance mismatch)的问题,因为我们将两种不同的程序设计模式混合在了一起。

1SQL是一种处理行数据的声明性语言,而诸如C语言这样的高级语言则是过程化的语言,一次只能处理一行数据。

2SQL和3GL使用不同的模型来表达数据。比如,SQL提供内置的数据类型Date(日期型)和Interval(时间间隔型),而在传统的编程语言中却没有这样的类型。因此,就需要应用程序在两种表示法之间进行转换。而这样做无论从程序设计的工作量还是运行时资源的使用来看都是低效的。而且,由于我们使用两种不同的系统,因此,不可能将类型检测作为一个整体自动进行。

注:SQL标准(SQL3)通过引入许多新的特征已经弥补了上文中讲述的一些不足之处。

一、航空物探数据库定位

数据库是信息系统的基础和核心,把大量的数据信息按一定的模型组织起来存储在数据库中,提供数据维护、数据检索等功能,使信息系统能方便、及时、准确地从数据库中获得所需的信息。因此,数据库结构设计是信息系统开发的重中之重。

经分析航空物探数据具有空间性、海量性、多源性和多尺度的特点,这说明航空物探数据具有典型的空间数据的特点,可以采用空间数据管理方式进行管理。

ESRI公司的Geodatabase(空间数据库)是采用标准关系数据库技术来表现地理信息的面向对象的高级GIS数据模型,是建立在DBMS之上的统一的、智能化的空间数据模型,是以一组相关联的表来表达地理要素之间关系、有效性规则和值域。对于多源、海量的航空物探数据,Geodatabase能在一个统一的模型框架下很好地解决多源数据一体化存储的问题,和采用标准关系数据库技术来表现海量航空物探数据的地理信息特性。Geoda-tabase引入了地理空间实体的行为、有效性规则和关系,在处理Geodatabase中对象时,对象的基本行为和必须满足的规则无需通过程序编码实现,只需根据需要扩展其有效性规则(Geodatabase面向对象的智能化特性),即可支持航空物探数据模型扩展的需要。

因此,航空物探数据库是空间数据库,在航空物探数据库建模过程中,以空间数据建模为主导,统领属性数据建模。

二、统一空间坐标框架

为了用数学语言描述地球,人们用规则的几何形体来替代地球表面,从地球自然表面、大地水准面、旋转椭球面直到用简单数学函数表达的参考椭球体,以便通过地图投影将三维曲面转化成二维平面。由于地球表面不同地区的地形起伏差异很大,采用单一椭球体势必会造成某地区的误差小而其他地区误差很大的结果。因此,在20世纪初不同国家或地区先后采用了逼近本国或本地区地球表面的椭球体,如中国的克拉索夫斯基椭球体,美国的海福特椭球体、英国的克拉克椭球体等。这又造成了目前世界各国的地理信息空间坐标框架不统一,空间数据信息难以共享被动局面。为此,在实现数字地球计划中,必须规范和统一世界上不同国家和地区的地球参考椭球体。

在小区域表达地球表面时,通常采用平面的方式,即投影坐标系统。如何科学地选择投影坐标,一般要根据具体的地学应用、地理区域和范围、比例尺条件等因素来确定,不同的国家有着不同的规定。

通过对航空物探数据的坐标系统进行分析可知,航空物探图件的坐标框架与国家对基本比例尺制图的规定相一致,即小比例尺编图采用Lambert双标准纬线等角圆锥投影;中比例尺采用Gauss6°带的分带投影;大比例尺采用Gauss3°带的分带投影(表2-1);对于低纬度的海上作业区通常采用Mecator等角圆柱投影。地球椭球体分别采用1954北京坐标系的Krassovsky椭球参数、WGS84椭球参数和未来的国家2000坐标系的椭球参数。

表2-1 航空物探地理坐标数据的投影方式

传统的航空物探数据是按测区管理的,根据测区的测量比例尺来确定相应的坐标框架;因此,勘探目标不同的测区测量比例尺是不一致的,地坐标框架也不同。航空物探数据库要将不同测区、不同比例尺、不同坐标框架的数据集中管理和可视表达,若没有统一的空间坐标框架,就不可能正确地表达全国航空物探数据。所以,面对如此复杂的多坐标框架的航空物探数据,如何确定科学合理的空间坐标框架,将全国的航空物探数据整合到统一的空间参考框架下,实现数据的统一存储和数据间无缝拼接,是航空物探数据库建设的关键所在,是组织和管理多维、多格式、大跨度、跨平台的航空物探数据和多目标数字制图的数学基础。

统一的空间坐标框架必须支持我国领土覆盖的海域和陆域航空物探数据的存储和表达。我国领土东西跨度达70°,南北达55°,显然采用任何投影坐标系都是不合适的。Gauss6°投影适合6°带内空间数据表达,若全国航物探数据采用6°分带表达,在高纬度地区会造成6°带间数据裂缝问题;Lambert投影可满足数据的无缝表达,但对大比例尺数据变形较大,无法满足数据制图的精度要求;Mecator投影也可满足数据的无缝表达,低纬度地区也能满足大比例尺数据制图的精度要求,但在我国中高纬度区存在着严重变形问题。所以,航空物探数据模型采用地理坐标(无投影,图2-1)格式存放,可根据实际应用的需要将航空物探数据变换到任何方式的投影坐标系统。

航空物探数据库模型采用Beijing_1954地理坐标系,相关参数如下:

角度单位:°(0017453292519943299rad)

零经线:格林尼治(0000000000000000000)

基准:D_Beijing_1954

椭球:Krasovsky_1940

长轴半径:6378245000m

短轴半径:6356863019m

建立统一坐标框架是空间数据库建设的一项基础性工作,采用Beijing_1954地理坐标系作为航空物探数据库统一空间坐标框架具有以下优点。

图2-1 统一空间坐标框架示意图

(一)无缝空间数据存储

统一空间坐标框架解决了复杂的航空物探数据的坐标系统、投影、比例尺等不统一的问题,实现同一性质的物探数据在同一个主题中进行管理。如全国的航磁异常数据可放在一个图层上进行管理。

(二)适合多尺度表达

按测区管理的多尺度、多框架的航空物探数据是处于一个相对坐标系统中,各个测区间相对位置关系会发生错位。采用统一的Beijing_1954地理坐标框架,恢复了各测区间正确的位置关系,实现不同尺度数据的集成和正确表达,易于多源异构空间数据的融合。

(三)大区域数据集成

我国海陆面积近1300×104km2,地域跨度较大。在进行小比例尺的航空物探编图时,需要选用与之相适应的投影坐标;在陆地和海域进行大比例尺制图时,同样需要选用合适投影系统。航空物探制图的实践也证明了这一点。1995年6月由中国、加拿大、美国、爱尔兰和俄罗斯等国科学家共同编制的1:1000万欧亚东北地区磁异常与大地构造图,采用横轴Mercator投影。中心编制的1:500万全国航磁图采用Lambert投影。2008年,由中国和吉尔吉斯斯坦科学家编制的1:100万中吉天山金属矿产成矿规律图,采用Lambert投影,将两个国家不同时期、不同尺度的数据进行了有效的集成,是地质、地球物理等综合应用的典范。

随着航空物探数据应用领域的不断扩展,陆地、海域,甚至于洲际和全球航空物探数据的整体表达都需对坐标投影提出要求。采用统一的地理坐标框架的航空物探数据非常容易变换到指定的投影坐标框架,满足多样化的制图要求。

三、要素类和对象类的划分

Geodatabase空间数据库模型结构(图2-2)分为空间数据库、要素数据集(Feature dataset)、要素类(Feature classes)、要素(Feature)4个层次。为了建立航空物探Geoda-tabase空间数据模型,我们依据Geodatabase模型关于要素类和对象类的划分原则,结合相关的国家标准和地球物理行业标准,制定了《航空物探数据要素类和对象类划分标准》,对航空物探数据进行数据分类。

图2-2 空间数据库模型结构

1)按照航空物探数据的空间特征,将其划分为5个要素数据集,即勘查项目概况要素数据集、基础数据要素数据集、异常要素数据集、解释要素数据集和评价要素数据集。

2)根据航空物探测量方法、数据处理过程以及推断解释方法和过程,进一步把航空物探数据划分为若干要素类和对象类,定义了要素类的主题特征和表达方式,确定子类和属性域;定义对象类的结构和联接字段,建立了关系类。

3)定义要素类的内容、字段名称和存储结构。在航空物探数据采集过程中,不同类型的数据采样率不同,坐标数据采样2次/s,重力场数据采样2次/s,磁场数据采样10次/s,这就造成了场值数据与坐标数据无法一一对应问题。若按场值数据采样率内插坐标数据,将导致数据量成倍增长;若按坐标数据采样率抽稀场值数据,将降低航空物探测量对地质体的分辨能力,影响测量效果。在综合分析航空物探数据应用基础上,提出了采用要素数据与属性数据分置的方式,将测线坐标数据与地球物理场数据分离,分别建立独立共享的航迹线数据要素类模型,磁场、重力场等数据对象类模型(图2-3),很好地解决了航空物探数据的存储问题。

图2-3 要素数据与属性数据分置示意图

采用要素数据与属性数据分置方式,不仅是基于航空物探数据属性数据的多源性、不同采样频率等特点的考虑,还考虑到数据的综合查询和检索的速度,特别是通过ArcSDE访问空间数据库的效率的问题。再者,对于大部分用户来说,需求是属性数据的综合应用,因此在数据库建模过程中,将属性数据采用对象类的方式进行管理,不但提高了空间数据的 *** 作能力,同时在ArcSDE的配置上采用直接访问数据库(对象类)方式,并且加快了数据查询和统计的速度。

四、数据库概念模型

用户需求是数据库建设的约束条件之一。航空物探数据的空间特性决定航空物探数据库必须是空间数据库,采用数据库管理数据,利用GIS技术提供可视化服务,这是各个层次用户的一致要求。因此,我们从现实世界出发,对航空物探数据的多源性、多尺度和不同采样等问题进行了描述,提出了解决方案。此方案是不依赖于任何具体的硬件环境和数据库管理系统(DBMS),建立了客观反映现实世界的航空物探数据库概念模型,把用户需要管理的信息统一到整体概念结构中,表达了用户需要。

在全面分析航空物探业务流程和数据流程,以及航空物探数据特性的基础上,按照《航空物探数据要素类和对象类划分标准》,以及空间实体点、线、面要素特征的基本原则,对航空物探数据库所涉及的实体进行归类,划分成12个主题。根据空间数据分主题表达的特点和航空物探空间数据坐标框架的定义,确定航空物探数据库空间数据概念模型,明确各个主题的用途、数据来源、表达方式、空间参考、比例尺和精度等内容,按照ArcGIS定义空间数据库的数据分层表达方式(图2-4),完成航空物探数据库概念模型设计(图2-5)。

图2-4 航空物探数据库空间数据分层模型

图2-5 航空物探数据库空间数据概念模型

数据库物理模型设计的目标是根据选定的Oracle数据库系统特点和航空物探数据管理与服务的业务处理需求,确定航空物探数据库最优的物理环境、存取方法和存储结构。即通过数据库物理设计,以便达到物理数据库结构的优化,使得在数据库上运行的各种事务响应时间少、存储空间利用率高、事务吞吐率大。

一、数据库布局

航空物探信息系统的维护数据(部门、岗位、人员、人员权限、数据入库检查规则及数据字典等)相对比较稳定。入库前数据需经过各种检查校对,确认数据正确后才能归档,存入航空物探资料数据库,所以存入资料库前的数据可能经常需要修改和删除,相对变化较大;而存入资料数据库中的数据一般不允许修改和删除,以免误 *** 作破坏资料库数据造成损失。

图2-12 航空物探数据库逻辑模型

图2-13 航空物探数据库布局与数据采集流程图

据此,我们采用图2-13所示的数据库数据采集流程,并将航空物探数据库分为资料采集数据库、资料数据库、系统维护数据库分别进行存储和管理,实现数据的统一管理和统一使用,便于数据入库和易于维护等。

航空物探资料数据库是航空物探所有数据最终存储的场所。资料采集数据库是数据归档存入资料数据库前的临时“集散地”,在此接收各项检查,在确认数据无误后归档到资料数据库,然后删除资料采集数据库中已归档的数据。此外,资料采集数据库中还保存数据入库、维护、检查日志及归档记录。

系统维护数据库,存储系统维护信息(如系统功能、数据库表清单等)、安全信息(如信息系统用户的角色、权限、授权的系统功能等),数据字典、入库数据检查规则等。将其与航空物探数据分开,有利于系统维护和管理。

二、数据库空间设置

数据库空间设置包括磁盘空间设置、应用系统表空间设置、撤销表空间、临时表空间、日志空间和索引空间设置。

(一)磁盘空间设置

磁盘空间设置的目标:磁盘性能不能阻碍实现数据库性能,数据库磁盘必须专用于数据库文件,否则非数据库将会影响到数据库性能,且磁盘空间必须满足恢复和性能的要求。

航空物探数据库服务器为IBM P620小型机,8块硬盘,每块硬盘36GB空间,每块物理磁盘建立一个文件系统。为了提高磁盘的反应时间和寻道时间,提高I/O的存取效率,除了一块硬盘用于UNIX *** 作系统外,其余7块磁盘分别存放资料采集数据库、系统维护数据库-日志文件,资料数据库及资料数据库的大字段数据、索引、回滚段和数据日志文件。

(二)应用系统表空间设置

信息系统数据采集过程对数据的事务 *** 作比较频繁,经常进行数据插入(新数据入库)、修改(入库数据有误)和删除 *** 作(数据重新导入或归档入库),因此航空物探资料采集数据库所在的表空间会很活跃。为了不影响其他I/O的竞争,同时也可以提高数据入库的 *** 作效率(50多年的历史数据需要集中入库),分配一个磁盘空间(36GB)为采集库的表空间。由于采集数据归档入资料库后被删除,同时进行数据入库的项目也不是很多,虽仍保留所有的采集日志数据,一个磁盘空间也足够使用。

航空物探资料数据库的二维表和Oracle大字段(BLOB)分别存放在不同的物理磁盘(每个磁盘36GB)上,对同时存在有表格数据和大字段数据的数据库表(如航迹线数据)时,可以提高磁盘I/O效率。随着数据入库的项目越来越多,需要增加相应的物理磁盘或磁盘阵列。

系统维护数据库相对稳定,占用磁盘空间约500 M左右。由于系统磁盘有限,把日志文件存放该磁盘中。

(三)撤销表和临时表空间的设置

在Oracle数据库中,撤销的目的是确保事务的回退和恢复。撤销参数有UNDO_MANAGEMENT、UNDO_TABLESPACE和UNDO_RETENTION。

UNDO_MANAGEMENT参数用于数据库中管理撤销数据的方式,航空物探数据库设置为自动模式(auto)。

UNDO_TABLESPACE参数用于指定数据库中保存撤销数据的撤销表空间名称,航空物探数据库撤销表空间名称为UNDO_ARGS_TBSPACE,空间大小设置为20GB,以确保在保留时间内进行恢复。

UNDO_RETENTION参数用于指定已经提交事务的撤销数据在能够覆盖之前应该保留多长时间,本数据库系统设置为60 min。

临时表空间是用以存储大量的排序,与撤销表空间存放在一个物理磁盘上,本数据库系统临时表空间设置为500 M。

(四)日志空间设置

日志的主要功能是记录对数据库已做过的全部 *** 作。在系统出现故障时,如果不能将修改数据永久地写入数据文件,则可利用日志得到该修改,所以不会丢失已有 *** 作结果。

日志文件主要是保护数据库以防止故障。为了防止日志文件本身的故障,航空物探数据库系统分别在一个独立磁盘和系统维护库磁盘中存放日志文件。若系统出现故障,在下次打开数据库时Oracle数据库系统自动用日志文件中的信息来恢复数据库文件。

根据航空物探数据库信息系统同时登录的用户数及使用的功能,将日志文件大小设置为10GB。

(五)索引表空间设置

为了提高航空物探信息系统的查询和统计速度,把所有索引空间与应用表空间完全分开,从而提高I/O存取效率。航空物探索引表空间大小设置为10GB。

聚集是表的一种存储方法,一般每个基本表是单独组织的,但对逻辑上经常在一起查询的表,在物理上也邻近存放,这样可减少数据的搜索时间,提高性能。

当几个关系(表)以聚集方式组织时,是通过公共属性的值为表聚集的依据。航空物探数据库系统是以项目标识(PROJ_ID)建立聚集的,所有涉及项目标识的数据库表直接引用项目标识聚集。航空物探聚集表空间与索引表空间相同。

三、数据库参数设置

在数据库创建前需要对如下数据库参数进行设置,航空物探参数文件名为Initoraargsora,各种参数设置如下:

航空物探信息系统建设

四、内存设置

航空物探数据库服务器物理内存为4GB,除部分用于系统开销外,其余全部用于数据库。

Oracle使用共享系统全局区(System Global Area,SGA)内存来管理内存和文件结构,包含DB_block_Buffers、DB_cache_size、Shared_pool_size、Log_Buffer参数。航空物探数据库系统的全局区内存参数设置如下。

DB_block_Buffers参数为SGA中存储区高速缓存的缓冲区数目,每个缓冲区的大小等于参数DB_block_size的大小,DB_block_Buffers=19200(约300 MB)。

Shared_pool_size参数为分配给共享SQL区的字节数,是SGA大小的主要影响者,Shared_pool_size=1228800000(12GB)。

DB_cache_size参数是SGA大小和数据库性能的最重要的决定因素。该值较高,可以提高系统的命中率,减少I/O,DB_cache_size=1024000000(1GB)。

Log_Buffer参数为重做日志高速缓存大小,主要进行插入、删除和修改回退 *** 作,Log_buffer=5120000(5MB)。

五、优化设置

由于航空物探信息系统的采集软件和应用软件是采用MSNET C#进行开发的,应用程序与数据库之间的连接有传统的ODBC和OLE DB两种方式。为了支持ODBC在OLE DB技术上建立了相应的OLE DB到ODBC的调用转换,而使用直接的OLE DB方式则不需转换,从而提高处理速度。

在建立数据库表时,参数Pctfree和Pctused设置不正确可能会导致数据出现行链接和行迁移现象,即同一行的数据被保存在不同的数据块中。在进行数据查询时,为了读出这些数据,磁头必须重新定位,这样势必会大大降低数据库的执行速度。因此,在创建表时应充分估计到将来可能出现的数据变化,正确地设置这两个参数,尽量减少数据库中出现的行链接和行迁移现象。

航空物探资料采集数据库表的插入、修改和删除的频率较高,Pctfree设置为20,Pctused设置为40;系统维护数据库表相对稳定,Pctfree设置为10,Pctused设置为15;资料数据库表除了增加数据外基本不进行修改和删除 *** 作,Pctfree设置为10,Pctused设置为5。

六、扩展性设置

多CPU和并行查询PQO(Parallel Query Option)方式的利用:CPU的快速发展使得Oracle越来越重视对多CPU的并行技术的应用,一个数据库的访问工作可以用多个CPU相互配合来完成。对于多CPU系统尽量采用并行查询选项方式进行数据库 *** 作。航空物探数据库服务器为2个CPU,在程序查询中采用了并行查询的方式。

在航空物探工作量统计、飞行小时统计、测量面积统计和岩石物性统计中,为了加快统计效率,在相应的查询语句中增加了并行查询语句。

随着航空物探高精度测量程度的不断提高,测量数据将越来越大。为了满足航空物探查询效率及发展,将航磁测量数据与校正后航磁测量数据按比例尺分1∶20 万以下、20万~50万、1∶50万以上分别存放3张不同的数据库表。

七、创建数据库

在完成数据库布局、空间设置、内存设置、数据库参数设置、扩展性设置和优化设置后,进行航空物探数据库物理模型设计,即航空物探数据库实体创建。由于航空物探空间数据库逻辑模型是采用ESRI提供的ArcGIS UML构建的Geodatabase模型,因此,使用ESRI公司提供的CaseTools将航空物探数据UML模型图转成空间数据库(Geodatabase)实体(图2-14)。

航空物探属性数据库表(二维表)是采用Power Designer数据库设计平台直接把数据库关系模型生成数据库脚本来创建的。

经过数据库的概念设计、逻辑设计和物理设计,最终生成航空物探数据库。

图2-14 航空物探数据库物理模型实现

八、空间数据的索引机制

对于海量的空间数据库而言,数据库的 *** 作效率是关系到数据库成败的关键问题。为了提高数据的访问、检索和显示速度,数据在加载到数据库时,要素类数据建立了空间索引,栅格数据构建了金字塔结构,对象类数据采用与数据库直接联接的访问机制。

(一)空间索引

为了提高要素类数据的查询性能,在建立航空物探空间数据库时,创建了空间索引机制。常用的空间索引有格网索引、R树索引、四叉树索引等。Geodatabase采用格网索引方式。所谓格网索引是将空间区域划分成适合大小的正方形格网,记录每一个格网内所包含的空间实体(对象)以及每一个实体的封装边界范围,即包围空间实体的左下角和右上角坐标。当用户进行空间查询时,首先计算出用户查询对象所在格网,然后通过格网编号,就可以快速检索到所需的空间实体。

确定适合的格网级数、单元大小是建立空间格网索引的关键。格网太大,在一个格网内有多个空间实体,查询检索的准确度降低。格网太小,则索引数据量成倍增长和冗余,检索的速度和效率较低。数据库的每一数据层采用不同大小、不同级数的空间索引格网单元,但每层最多级数不能超过三级。格网单元的大小不是一个确定性的值,需要根据对象的大小确定。空间索引格网的大小与检索准确度之间的关系如图2-15所示。

选择格网单元的大小遵循下列基本原则:

1)对于简单要素的数据层,尽可能选择单级索引格网。减少RDBMS搜索格网单元索引的级数,缩短空间索引搜索的过程,例如航迹线要素类。

图2-15 索引格网大小与检索准确度的关系

2)如果数据层中的要素封装边界大小变化比较大,应选择2或3级索引格网。Geodatabase最多提供三级格网单元。每一要素封装边界在适合的级内,减少了每一封装边界有多个格网的可能性。在空间索引搜索过程中,RDBMS则必须搜索所有3个格网单元级,这将消耗大量的时间。

3)若用户经常对图层执行相同的查询,最佳格网的大小应是平均查寻空间范围的15倍。

4)格网的大小不能小于要素封装边界的平均大小,为了减少每个格网单元有多个要素封装边界的可能性,格网单元的大小应取平均格网单元的3倍。最佳格网单元的大小可能受图层平均查询的影响。

空间域是按照要素数据集定义的,空间索引格网是按照要素类设置的。它们都是在创建Geodatabase数据库时设置,并一经设置,中间不许改变;所以一定要在充分分析数据的情况下确定它们的值。航空物探数据主要是简单要素类,空间跨度为70°。根据上述原则,航空物探数据选择单级索引格网,格网大小为20°。

(二)金字塔结构

金字塔结构的核心是将栅格数据逐级进行抽稀,形成多级分辨率的重采样数据,并将其分割成块,按一定的文件格式(金字塔文件格式)存储成磁盘文件;在以后进行图像显示处理时,只需将要显示的部分所覆盖的块从磁盘文件直接读进内存缓冲区显示即可。从金字塔的所有层中寻找与所要求显示的比例相近或匹配的一层,并将该层的从某一点起的一定范围的图像所覆盖的所有块加载到内存缓冲区,提取所需部分并形成图像。

金字塔算法(图2-16)是通过获取显示时所需要的一定分辨率的数据来提高显示速度。使用金字塔数据格式后,在显示全图时仅需要显示一个较低分辨率的数据,这样既能加快显示速度,又不会影响显示效果。放大图像,尽管显示图像分辨率提高,由于显示区域减小,所以显示速度不会下降。如果没有为栅格数据建立金字塔数据,则每次显示都会读取整个数据,然后进行重采样得到显示所需要的分辨率,明显地降低了显示速度。

图2-16 金字塔压缩示意图

金字塔数据重采样方式有:最近邻法、双线性内插和立方卷积。其中最近邻法适用于离散数据,而双线性内插法和立方卷积法适合于连续数据。

在ArcGIS Engine中提供了IRasterPyramid和IRasterPyramid2接口来实现金字塔数据的建立,而建立的数据保存在rrd格式的文件中。

(三)空间域定义

空间域是指数据的有效空间范围,即Geodatabase数据库的最大等效坐标的值域范围,其定义主要是指比例系数和Min X、Min Y的计算。

因为使用整数比浮点数有更高的压缩率,并且对整数进行二进制搜索比较快,所以多用户Geodatabase以4字节正整数存储坐标,其最大值为32位正整数所能表示的范围是214亿(2147483647),整数的范围称为空间域。在创建Geodatabase数据库时需要定义合适的比例系数。大的整数值将消耗大量的计算机物理内存,所以选定的比例系数最好不要大于必须的比例系数。空间域随坐标系的单位变化而变化。

比例系数和空间域之间成反比例关系,比例系数越大(存储单位越小),表达的空间域也越小。为了使目标数据都存储在系统中,需要谨慎地设置比例系数。将目标数据的宽度和高度较适中的数值乘以比例系数,如果结果小于214亿,则比例系数是合适的。

航空物探数据模型是为我国的航空物探行业数据建库设计的,它支持的空间数据的坐标范围为我国领土覆盖的海陆空间,最低纬度为赤道。根据概念设计的分析,航空物探数据模型采用的是地理坐标系,坐标系单位是度,基准是Beijing_1954,要求存储的坐标数据精度达到001 m。在赤道处,赤道圆周长为400756946 m,则每度弧长=400756946×100/360 cm=11132137389 cm,即1 cm对应8983000883E-8°。所以,航空物探数据模型的比例系数取为898E-8,即存储单位为898E-8°,可满足1 cm精度要求。

将空间域移动到目标数据范围之前,首先找到空间域在存储单位的中心位置,目的是在必要时向各个方向扩展。4字节正整数可表示的坐标范围:2147483647×898E-8=19284°。我国的领土范围是东经70°~140°,北纬0°~60°。所以,选取的比例系数是合适的。把空间域坐标系中心定为90°,然后,计算空间域的Min X、Min Y。

航空物探信息系统建设

航空物探信息系统建设

所以坐标的存储数据是:

航空物探信息系统建设

航空物探信息系统建设

以上就是关于数据库系统的三种模型是什么全部的内容,包括:数据库系统的三种模型是什么、数据库主要有哪几种数据模型、数据库简答题 解释数据模型的概念,为什么要将数据模型分成两个层次等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/sjk/9547915.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-29
下一篇 2023-04-29

发表评论

登录后才能评论

评论列表(0条)

保存