空间数据库与一般数据库相比有哪些特点?

空间数据库与一般数据库相比有哪些特点?,第1张

1、数据量庞大。

空间数据库面向的是地学及其相关对象,而在客观世界中它们所涉及的往往都是地球表面信息、地质信息、大气信息等及其复杂的现象和信息,所以描述这些信息的数据容量很大,容量通常达到 GB级。

2、具有高可访问性 。

空间信息系统要求具有强大的信息检索和分析能力, 这是建立在空间数据库基础上的,需要高效访问大量数据。

3、空间数据模型复杂

空间数据库存储的不是单一性质的数据,而是涵盖了几乎所有与地理相关的数据类型,这些数据类型主要可以分为 3 类:

(1)属性数据:与通用数据库基本一致,主要用来描述地学现象的各种属性,一般包括数字、文本、日期类型。

(2)图形图像数据:与通用数据库不同,空间数据库系统中大量的数据借助于图形图像来描述。

(3)空间关系数据:存储拓扑关系的数据,通常与图形数据是合二为一的。

4、属性数据和空间数据联合管理。

5、应用范围广泛。

一、范围

本标准定义了山东半岛城市群地质-生态环境空间数据库的数据结构框架、数据实体及实体之间的相互关系,定义了成果图件空间数据的要素集、要素类、要素分类代码及属性数据项,可用于山东半岛城市群项目数据的采集、存储、管理、共享及数据库建设。

二、规范性引用文件

下列标准所包含的条文,通过在本标准中引用而构成为本标准的条文。本标准出版时,所示版本均为有效。所有标准都会被修订,使用本标准的各方应探讨使用下列标准最新版本的可能性。

GB / T 1. 1—2000 标准化工作导则 第 1 部分: 标准的结构和编写规则

GB / T 13923—92 国土基础信息数据分类代码

GB / T 2260—1999 中华人民共和国行政区划代码

GB / T 2659 世界各国和地区名称代码

GB / T 9649—88 地质矿产术语分类代码

DZ / T 0160—95 1∶ 200000 地质图地理底图编绘规范及图式

DZ / T 0197—1997 数字化地质图图层及属性文件格式

GB 958—99 区域地质图图例 ( 1∶ 50000)

DZ / T 0179—1997 地质图用色标准及用色原则

DDB 9702 GIS 图层描述数据内容标准

GB 17108—1997 海洋功能区划技术导则

中国地质调查局 地质图空间数据库建设工作指南 ( 2. 0 版)

中国地质调查局 1∶ 20 万区域水文地质图空间数据库图层及属性文件格式工作指南

三、术语和定义

本标准涉及的主要术语如下:

1. 地理信息数据库 ( geodatabase)

采用标准关系数据库技术来管理、表现地理信息的空间数据库。

2. 数据包 ( data package)

逻辑相关数据实体的集合,本标准中将山东半岛城市群项目数据整体视作一个数据包。

3. 数据实体 ( data entity)

描述专业领域同一类型数据的数据元素的集合,如地质构造数据实体,概念上等同于UML 的类。数据实体可通过一个或多个相关的数据元素及相关的数据实体定义。

4. 数据集 ( dataset)

逻辑相关数据组成的数据集合,如一幅地图可视作一个数据集,数据集是一个逻辑上的整体。

5. 数据子集 ( subdataset)

按一定规则划分的数据集中逻辑相关数据的集合,本标准中的一个数据子集对应一个地图要素类,数据子集类别对应地图上的图层划分。

6. 空间数据 ( spatial data)

用来表示空间实体的位置、形状、大小和分布特征诸方面信息的数据。空间数据不仅具有实体本身的空间位置及形态信息,而且还有实体属性和空间关系 ( 如拓扑关系)信息。

7. 空间参照系 ( spatial reference)

对地理信息数据的空间范围和投影的描述。

8. 地图 ( map)

地理信息的图形描述,包括地理信息数据和地图元素,如标题、图例和比例尺等。本标准中将一幅地图视作一个数据集进行管理,并通过一组要素集 ( 要素类、关系类、属性表的集合) 、空间参照系、地图样式定义地图的数据内容及显示方式。

9. 图层 ( layer)

地图上特定区域范围内按一定规则划分的相似要素类的集合,如水系、城镇。图层为要素类的专题组合及表现,一个图层定义了它包含地理信息数据的地理位置和显示方法。

10. 要素 ( feature)

现实世界中的对象在地图图层中的表示,如地图中表示道路的一条线。

……

四、缩略语和符号

1. 缩略语

ARD 图外整饰要素 ( Elements Around Map)

BMAP 地理底图 ( Basemap)

BOU 境界、边界 ( Bourn)

CD 代码 ( Code)

COL 综合柱状图 ( Colomnar Chart)

DT 日期 ( Date)

ELE 地形高程 ( Elevation)

……

2. UML 类图符号

山东半岛城市群地区地质-生态环境与可持续发展研究

3. ER 图符号

山东半岛城市群地区地质-生态环境与可持续发展研究

五、基于 UML 的 Geodatabase 的空间数据模型

构建地质数据的空间数据模型是建立地质信息数据库的一项关键工作,是数据库建设的基础。Geodatabase 数据模型作为 ArcGIS 软件平台的一种通用数据形式,目前已被国内外众多地质空间数据库的建设所采用。数据建模也已经成为地质数据库建立的一项主要内容。

目前针对地质、水文、矿产、海洋等多个领域的专业 Geodatabase 数据模型都已存在,国内目前应用于区域地质 - 生态环境调查的综合地质 - 生态环境空间数据模型还比较少见。因此,本项目在分析国内外目前比较通用的各专业数据模型的基础上,提出了专门面向山东半岛城市群地质 - 生态环境空间数据库建设的 Geodatabase 数据模型。

在 Geodatabase 数据模型中,允许定义要素之间类型的关联,Geodatabase 对空间数据管理以关系数据库为基础,利用商用关系数据库成熟的数据处理能力对空间数据和非空间数据进行统一管理。Geodatabase 使用面向对象的方法,使得要素可以具有自己的行为和属性,并且要素类具有继承性、多态性和封装性。这样,以更加适合自然的行为和人的思维方式去组织数据,更精确地模拟真实世界。

1. Geodatabase 数据模型的结构体系

Geodatabase 数据模型作为一种新型的面向对象的数据模型,融入了面向对象的核心技术,如类 ( Class) 、对象 ( Object) 、封装 ( Encapsulation) 、继承 ( Inheritance) 和多态( Polymorphism) 等思想和技术。Geodatabase 数据模型的目的就是为了让用户能更容易、更自然地表示 GIS 数据特征和更容易地建立特征之间的各种关系。Geodatabase 空间数据库数据模型如表 12 -1 所示。

表 12 -1 Geodatabase 内部结构

续表

2. Geodatabase 数据库模型的特点

Geodatabase 有两种,即个人与多用户 Geodatabase。

1) 个人 Geodatabase 支持内置于 ArcGIS 系统并提供对本地数据的访问,适用于面向项目的 GIS,在 Microsoft Access 数据库平台上实现,提供生成和更新 Access 数据库的服务,可处理小型或适中的 Access 数据库。但个人 Geodatabase 的存储容量有不能超过 2GB的限制。

2) 多用户的 Geodatabase 是通过 ArcSDE ( ARC 空间数据库引擎) 实现的。ArcSDE可以生成和访问从小型到大型的 Geodatabase 并提供关系型数据的开放界面。

与标准的关系数据库相比,Geodatabase 简化了地理数据建模的工作,因为它包含有用于建模地理信息的通用模型。

此外,Geodatabase 还同时支持两个视图,即对象视图和关系视图。这样就综合了对象视图和关系视图两者的优点。对象视图在 Geodatabase 中占据主导地位,其目的是提供一个接近于逻辑数据模型的数据模型,因而更接近于现实。关系视图则用于一些 Geodata-base 数据的常规处理,它表示的是一些简单地理对象的特征。

3. 基于 UML 的 Geodatabase 数据模型的设计

( 1) Geodatabase 数据库设计的方法

在 ArcGIS 中,建立地理数据库可以有多种方法。借助 ArcCatalog,可以通过 3 种方式建立新的地理数据库。

第一种方法是建立一个新的地理数据库。

第二种方法是移植已经存在的数据到地理数据库中去。

第三种方式是用 CASE 工具来建立地理数据库。

( 2) 面向对象和 UML ( 统一建模语言)

面向对象是软件程序设计中的一种新思想,它能使程序设计更加贴近现实,并且花费更小的精力。面向对象方法学包含了对象 ( object) 、类 ( classification) 、继承 ( inherit-ance) 、聚集和消息 ( messages) 的概念。

UML ( Unified Modeling Language,统一建模语言) 是一种基于面向对象方法的建模语言,具有创建系统的静态结构和动态行为等多种结构模型的能力,是一种通用的建模语言。在 Geodatabase 的设计中,主要用到描述系统静态结构的类图。类图的节点表示系统中的类及其属性和 *** 作。类图的边表示类之间的联系,包括继承、关联、依赖、聚合等。

类的表示由 3 个部分方框组成,上面部分给出了类的名称中间部分给出了该类的单个对象的属性下面部分给出了一些可以应用到这些对象的 *** 作。类的表示如图 12 -5。

图 12 -5 类的表示

关联是对类的实例之间联系的命名,与关联有关的内容有关联元数 ( Degree) 、关联角色 ( Role) 和重复度 ( Multiplicity) 。

UML 中有 3 种类型的类: 抽象类 ( abstract class) 、可创建化类 ( creatable class) 和可实例化类 ( instantiable class) 。

UML 类图的符号见本节第四部分内容。

( 3) 面向对象的地理数据模型的设计方法

利用 CASE 工具进行 Geodatabase 数据模型设计的步骤具体为:

1) 在 CASE 工具中进行 UML 建模。

2) 将设计好的 UML 模型载入资料库 ( repositry) 。

3) 利用 GIS 软件提供的 CASE 接口,根据资料库中的 UML 模型生成空间数据库结构。至此,Geodatabase 空间数据库结构初具雏形。在 GIS 软件环境中,现在可以将新生成的数据或已有的数据进行格式转换后载入到设计好的 Geodatabase 空间数据库中,由空间数据库统一管理。利用 CASE 工具来建立 Geodatabase 地理数据库的工作流程见图12 - 6。

图 12 -6 利用 CASE 工具来建立 Geodatabase 地理数据库的工作流程

六、地质 - 生态环境 Geodatabase 数据模型的建立

( 一) 数据模型设计的依据

根据山东半岛城市群地质 - 生态环境调查评价研究工作的需要和山东半岛城市群地质 - 生态环境 GIS 数据库系统的整体设计要求,结合各地质 - 生态环境要素的成果图件和文本报告资料,利用 UML 设计工具 Microsoft Visio 完成了山东半岛城市群地质 - 生态环境Geodatabase 数据模型的设计 ( 图 12 - 7) 。

图 12 -7 山东半岛城市群地质 - 生态环境 Geodatabase 数据模型的设计依据

( 二) 山东半岛城市群地质 - 生态环境数据库的 UML 类图

1. 数据集管理

山东半岛城市群项目数据包中的数据以数据集为单元统一组织管理,数据集管理方式就是将一份文字报告或一幅成果图件视作逻辑上的整体,用 “数据集编号”唯一标识,通过数据集实体统一管理。同一数据集的不同实体,例如成果图中的图层,通过实体中的“数据集编号”元素关联。

2. 空间数据管理

山东半岛城市群项目数据包由文字报告及成果图件两大类数据组成,并以成果图件为主,成果图件是一空间数据实体,统一存储在面向对象的地理信息数据库中,以图幅为单元进行管理。

3. 数据包总体结构

本标准中山东半岛城市群项目数据包总体结构用 UML 模型来体现,山东半岛城市群项目数据包由 “成果报告”、“元数据”及 “存档文件”3 个数据实体 ( UML 类) 组成,通过 “数据集”实体统一组织管理。“成果报告”由它的继承类 “文字报告”及 “成果图件”定义,为研究成果数据包的主体数据。“元数据”及 “存档文件”为数据集的辅助数据,“元数据”存放文字报告或成果图件的元数据“存档文件”存放文字报告或成果图件的相关存档文件,供数据集数据的整体下载与利用。

一个 “数据集”实体对应一个项目的 “文字报告”或一幅 “成果图件”每一个数据集必须有一个而且只能有一个 “元数据”文件“存档文件”是 “数据集”的可选聚合实体。

“成果图件”是一空间数据实体,由特定的面向对象地理信息数据库 ( Geodatabase)统一存储、管理。一幅 “成果图件”数据内容由一组空间要素集 ( 基础地理要素集、地质要素集、地球物理要素集、地球化学要素集、辅助要素集) 组成,空间要素集数据类型包括矢量 ( Feature Dataset,简称要素集) 、栅格 ( Raster Dataset) 和 TIN ( TIN Dataset)3 种。

4. 数据集编号的编码规则

数据集编号由数据库管理方统一编码,必须保证编号在数据库中唯一,编号中的英文字母全部大写。

山东半岛城市群项目数据集按 “项目或图幅—提交单位—提交年份—成果序号”编码。数据集编号的字符串长度不得超过 22 位,以保证 “数据集编号 + 要素类名”的字符串总长度不超过 30 位。

5. 成果图件要素类命名规则

要素类名字符串总长度不得超过 8 位。

矢量要素类按 “要素集类型 + 要素类名 + 要素类型”命名,全部用大写英文字母表示。“要素集类型”用一位代码表示,如 “L”表示基础地理要素集。栅格数据集数据以“要素集类型 + 要素类型”命名,要素类型用代码 RAS 表示,如 “DRSRAS”表示遥感栅格数据。TIN 数据集数据以 “要素集类型 + 要素类型”命名,要素类型用代码 TIN 表示,如 “LELETIN”表示地面高程 TIN。

6. 成果图件要素分类编码规则

要素分类编码用以标识不同的要素类要素,保证地图要素存储、交换、显示的一致性。

( 1) 分类编码原则

1) 科学性、系统性

2) 相对稳定性

3) 不受地图比例尺的限制

4) 完整性和可扩展性

5) 适用性。

( 2) 分类编码方法

成果图件要素类中不同要素的分类编码采用中华人民共和国国家标准 《国土基础信息数据分类与代码》的编码结构,结构如下:

山东半岛城市群地区地质-生态环境与可持续发展研究

大类码、小类码、一级代码和二级代码分别用数字顺序排列。识别位由用户自行定义,以便于扩充。在本项目中编码分两类: ①基础地理要素编码②地质专业要素编码( 地质、地球物理、地球化学等) 。

( 三) 山东半岛城市群项目数据实体及实体关系

山东半岛城市群项目数据实体类及其代码见表 12 -2,实体类名代码按实体类的英文名缩略语编码,本标准中山东半岛城市群项目数据实体及实体间关系用 UML 及实体关系图 ( ERD) 来体现。

表 12 -2 山东半岛城市群项目数据实体类及其代码

1. 数据集实体 ( MGRD_Dataset)

山东半岛城市群项目数据包中的 “数据集”实体用来统一组织管理 “文字报告”、“成果图件”、“元数据”及 “存档文件”数据实体,“数据集”实体中的数据项包含数据集的归属项目、提交日期、提交单位、主题类别及地理范围等可用于数据集检索的信息。一个 “数据集”实体对应一个项目的 “文字报告”或一幅 “成果图件”,“数据集”实体与 “元数据”实体间为一一对应关系,与 “存档文件”实体间为一对多的对应关系。“数据集”实体的数据内容及其存储表通过 “数据子集”实体分类定义,主键 [数据集编号]可用于同一数据集中不同 “数据子集”的关联,也可用于数据集对应的 “元数据”及“存档文件”的关联。

2. 成果报告数据实体 ( MGRD SumTmaryReport)

研究成果报告数据实体包括项目的最终综合文字报告及相应的成果图件。

( 1) 文字报告数据实体 ( SR_WordReport)

文字报告数据实体包括 “文字报告”及图像格式的 “报告附图”数据实体,文字报告及附图均以二进制大对象存储。数据实体之间通过 [数据集编号] 关联。

( 2) 成果图件数据实体 ( SR_hemeMapSet)

“成果图件”数据实体是一空间数据实体,主要以矢量图形格式存储在地理信息数据库中,其中也包括栅格数据及 TIN 数据用于数据的空间分析。

1) 要素集: “成果图件” 数据实体以图幅为数据集单元进行管理图幅内容以分属不同空间要素集 ( 基础地理要素集、地质要素集、地球物理要素集、地球化学要素集、辅助要素集) 的要素类组合,同一个要素集内的要素类享有同一空间参照系,相互具有拓扑关系。

2) 要素类: 一个要素类的存储单元为关系数据库中的一个数据表,要素类图元类型有点、线、面、注记 4 种,一个要素类只能包含一种图元类型。本标准中基础地理要素集、地质要素集、地球物理要素集、地球化学要素类、辅助要素集的要素类用 UML 类图体现。

3) 图层: 图层为要素类的专题组合及表现,不同图层的组合即构成了可视化 “成果图件”。本项目通过对数据来源的分析,提出并建立了适合山东半岛城市群地区地质 - 生态环境调查与评价特点的空间数据库数据图层。考虑到空间数据的应用和相互转换,每一图层均应建立相应的内部属性表,属性表必须包含一些基本字段内容,根据具体任务的不同,需灵活扩充内部属性表字段内容。 “成果图件”数据实体的图层划分及其代码见表 12 -3。

4) 要素类属性: 要素类的要素特征由属性表定义,属性表每一行对应一个要素,每一列包含要素的一个特征信息。

表 12 -3 成果图件数据实体的图层划分及其代码

5) 要素类要素分类: 同一要素类中不同类型的要素用不同的代码标识,通过属性表中的 “编码” ( GEO_CODE) 数据项体现,以便地图中同一要素类要素的分类显示,并保证地图要素存储、交换、显示的一致性。在本项目中成果图件的基础地理要素分类代码采用中华人民共和国国家标准 《国土基础信息数据分类与代码》,并根据需要进行了扩充,地质专业要素分类代码全部由本标准定义,见表 12 -4 和表 12 -5。

表 12 -4 基础地理要素分类代码

表 12 -5 地质专业要素分类代码

图12 -8 山东半岛城市群项目数据包UML类图

图层编码中,第一位为图类代码,L 代表基础地理类图层D 代表基础地质类图层G 代表国土资源图层W 代表地壳稳定性图层S 代表水资源图层H 代表海岸带图层T 代表生态环境图层R 代表人类工程活动图层F 代表分析评价图层Y 代表预测与防治图层Z 代表辅助图层。第二位为比例尺代码,图件均采用 1∶ 50 万比例尺,代码为 B。第三位到第五位为图名的汉语拼音首字母缩写。第六位为图层数字编号。

( 四) 山东半岛城市群项目 UML 类图

1. 山东半岛城市群项目数据包 UML 类图

UML 类图见图 12 - 8。

2. 成果图件要素集 UML 类图

1) 基础地理要素集实体 UML 类图 ( FD_Geography) 。本项目将基础地理要素分为地理网格、居民地、境界、交通网、地貌地形、水系、海洋海岸带、行政区划、栅格数据等 9个抽象要素类,建立了 “各市基本情况”对象类,与表明各地区域的 “城市群”类相连接,将山东半岛城市群8 个地级市的地理位置数据与地区的基本资料数据有机地联系起来。

2) 地质要素集实体 UML 类图 ( FD_Geology) 。

3) 国土资源要素集实体 UML 类图 ( FD_LandResource) 。

4) 水资源要素集实体 UML 类图 ( FD_WaterResource) 。

5) 生态环境要素集实体 UML 类图 ( FD_Environment) 。

6) 辅助要素集实体 UML 类图 ( FD_Ancillary) 。

3. 山东半岛城市群项目数据实体关系图

1) 数据集实体 ER 图 ( MGRD_DataSet) 。

2) 研究成果报告数据实体 ER 图 ( MGRD_SummaryReport) ( 图 12 - 9) 。

图 12 -9 研究成果报告数据实体 ER 图 ( MGRD_SummaryReport)

七、山东半岛城市群项目数据包数据字典

( 一) 数据集实体 ( MGRD_DataSet)

山东半岛城市群地区地质-生态环境与可持续发展研究

( 二) 研究成果报告数据实体 ( MGRD_SummaryReport)

1. 文字报告数据实体 ( SR_WordReport)

山东半岛城市群地区地质-生态环境与可持续发展研究

2. 成果图件数据实体 ( SR_ThemeMapSet)

( 1) 基础地理要素集实体 ( FD_Geography)

山东半岛城市群地区地质-生态环境与可持续发展研究

( 2) 地质要素集实体 ( FD_Geology)

山东半岛城市群地区地质-生态环境与可持续发展研究

( 3) 水资源要素集实体 ( FD_HydroResource)

山东半岛城市群地区地质-生态环境与可持续发展研究

1.数据标准化

数据处理建库的生产过程需要经历数据检查、数据处理、坐标变换、数据转换等过程,这些过程不断进行迭代,即进行转换,转换后检查,检查如果有问题,进行处理,如果不能处理,将问题提交数据工程组进行修改,再转换、检查、处理,直到数据满足要求,然后再进行数据提交。

为了提高效率,在上述过程开始之前,可以先利用特定的数据检查工具进行数据检查,确认符合数据标准的数据才开始转换、处理;否则宜先对原始数据做必要的编辑整理。数据转换生产流程见图12-2。

图12-1 总体设计思路图

图12-2 数据转换流程

2.数据质量检查

数据作为一种战略资源与生产要素,成为现代社会正常运转的基础,成为决策的依据,通过对数据进行以下检查,来规范数据质量。

1)完整性:实体、实体属性和实体关系的存在和缺失;

2)逻辑一致性:对数据结构(数据结构可以是概念的、逻辑的或物理的)、属性及关系的逻辑规则的符合程度;

3)位置准确度:空间实体位置的准确度;

4)专题数据准确度:定量属性的准确度、定性属性的正确性、实体及其属性分类的正确性;

5)图面整饰规范性:符号、注记和图廓整饰的规范性。

3.Geo Database空间数据模型

Geodatabase是一种采用标准关系数据库技术来表现地理信息的数据模型,支持多种DBMS结构和多用户访问,且大小可伸缩。Geo Database按照成层次型的数据对象来组织地理数据,集合了面向对象数据库和关系数据库系统两者的优点,实现了严格意义上的地理空间数据库、连续空间要素的无缝存储、对象属性和行为智能化结合等,克服了GIS软件中传统数据存储模式存在的查询 *** 作难以优化、数据完整性的约束条件有可能遭到破坏、数据管理的安全性较差、不适合网络共享发展需要等缺点。

4.Arc GIS Engine开发技术

系统采用ArcGIS Engine组件开发GIS数据集成平台。ArcGIS Engine是Arc GIS系列中一个基于ArcObjects之上的,用于创建客户化GIS桌面应用程序的开发产品。ArcGIS Engine是一个创建定制的GIS桌面应用程序的开发产品。使用ArcGIS Engine可以创建独立界面版本(stand—alone)的应用程序,或者对现有的应用程序进行扩展,为GIS和非GIS用户提供专门的空间解决方案。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/9921560.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-03
下一篇 2023-05-03

发表评论

登录后才能评论

评论列表(0条)

保存