历史数据归档选择什么数据库

历史数据归档选择什么数据库,第1张

1地理数据库 (Geodatabase) 存档

2启用存档

3存档过程

4使用历史版本

5使用历史标记

6使用地理数据库历史查看器

7直接使用存档类

8架构更改和存档

9禁用存档

10存档情景

代码参考1链接

代码参考2链接

数据归档应用场景

很多用户在处理数据时都会要求记录 *** 作的过程,也就是记录历史数据。地理数据库归档允许数据随时间变化时对数据进行存储和分析。归档类和地理数据库历史查看器可用做解决此问题的工具,所以数据归档功能也常被称为历史归档。Esri公司从ArcGIS 9.2版本之后就增加了Geodatabase 数据模型的历史库功能。

在国土行业中,用户经常会要求按年、季度、月等时间类型来保留历史,以方便日后进行数据参考或数据分析。随着时间的推移而不断对宗地进行编辑时,可将其保存在归档类中。如果想要查看宗地在某时刻的情况,便可使用地理数据库历史查看器切换到相应的日期和时间。相反,如果想要查看某宗地随时间的变化情况,则可将宗地归档类添加到地图中,并依照其ID号选择相应的宗地。这会显示所选宗地随时间变化的每个制图表达。

1地理数据库 (Geodatabase) 存档

ArcGIS 中的存档 *** 作能够记录和访问对地理数据库中所有数据或数据子集所做的更改。地理数据库存档是一种记录、管理和分析数据更改的机制。

很多组织都需要保留对数据的更改以回答一些常见的问题,例如

某一时刻特定属性的值是多少?

特定要素或特定行是如何随时间变化的?

某一空间区域是如何随时间变化的?

地理数据库存档用于帮助各组织机构通过保存数据更改来回答这些类型的问题。地理数据库存档可保存从启用存档到禁用存档这段期间内所发生的全部更改,明确这一点是十分重要的。

地理数据库归档允许用户连接到历史版本。历史版本表示某一特定历史时刻的数据,它可提供地理数据库的只读信息。用户可通过现有历史标记或特定时刻连接到历史版本。历史标记是用户创建的一个特定时刻,例如,“分区 158 完成”是指 2012 年 7 月 11 日 2:13 PM。

ArcGIS 中提供的工具使用户可以轻松地研究对数据所做的更改。“历史查看器”工具使用户可快速导航到特定历史时刻以显示数据在该时刻是如何显示的。此外,向 ArcMap 中直接添加归档类可使用户执行查询以探究数据如何随时间变化;例如,查看在 2006 年 1 月 1 日到 2007 年 1 月 1 日之间对特定道路所做的编辑。

一、范围

本标准定义了山东半岛城市群地质-生态环境空间数据库的数据结构框架、数据实体及实体之间的相互关系,定义了成果图件空间数据的要素集、要素类、要素分类代码及属性数据项,可用于山东半岛城市群项目数据的采集、存储、管理、共享及数据库建设。

二、规范性引用文件

下列标准所包含的条文,通过在本标准中引用而构成为本标准的条文。本标准出版时,所示版本均为有效。所有标准都会被修订,使用本标准的各方应探讨使用下列标准最新版本的可能性。

GB / T 1. 1—2000 标准化工作导则 第 1 部分: 标准的结构和编写规则

GB / T 13923—92 国土基础信息数据分类代码

GB / T 2260—1999 中华人民共和国行政区划代码

GB / T 2659 世界各国和地区名称代码

GB / T 9649—88 地质矿产术语分类代码

DZ / T 0160—95 1∶ 200000 地质图地理底图编绘规范及图式

DZ / T 0197—1997 数字化地质图图层及属性文件格式

GB 958—99 区域地质图图例 ( 1∶ 50000)

DZ / T 0179—1997 地质图用色标准及用色原则

DDB 9702 GIS 图层描述数据内容标准

GB 17108—1997 海洋功能区划技术导则

中国地质调查局 地质图空间数据库建设工作指南 ( 2. 0 版)

中国地质调查局 1∶ 20 万区域水文地质图空间数据库图层及属性文件格式工作指南

三、术语和定义

本标准涉及的主要术语如下:

1. 地理信息数据库 ( geodatabase)

采用标准关系数据库技术来管理、表现地理信息的空间数据库。

2. 数据包 ( data package)

逻辑相关数据实体的集合,本标准中将山东半岛城市群项目数据整体视作一个数据包。

3. 数据实体 ( data entity)

描述专业领域同一类型数据的数据元素的集合,如地质构造数据实体,概念上等同于UML 的类。数据实体可通过一个或多个相关的数据元素及相关的数据实体定义。

4. 数据集 ( dataset)

逻辑相关数据组成的数据集合,如一幅地图可视作一个数据集,数据集是一个逻辑上的整体。

5. 数据子集 ( subdataset)

按一定规则划分的数据集中逻辑相关数据的集合,本标准中的一个数据子集对应一个地图要素类,数据子集类别对应地图上的图层划分。

6. 空间数据 ( spatial data)

用来表示空间实体的位置、形状、大小和分布特征诸方面信息的数据。空间数据不仅具有实体本身的空间位置及形态信息,而且还有实体属性和空间关系 ( 如拓扑关系)信息。

7. 空间参照系 ( spatial reference)

对地理信息数据的空间范围和投影的描述。

8. 地图 ( map)

地理信息的图形描述,包括地理信息数据和地图元素,如标题、图例和比例尺等。本标准中将一幅地图视作一个数据集进行管理,并通过一组要素集 ( 要素类、关系类、属性表的集合) 、空间参照系、地图样式定义地图的数据内容及显示方式。

9. 图层 ( layer)

地图上特定区域范围内按一定规则划分的相似要素类的集合,如水系、城镇。图层为要素类的专题组合及表现,一个图层定义了它包含地理信息数据的地理位置和显示方法。

10. 要素 ( feature)

现实世界中的对象在地图图层中的表示,如地图中表示道路的一条线。

……

四、缩略语和符号

1. 缩略语

ARD 图外整饰要素 ( Elements Around Map)

BMAP 地理底图 ( Basemap)

BOU 境界、边界 ( Bourn)

CD 代码 ( Code)

COL 综合柱状图 ( Colomnar Chart)

DT 日期 ( Date)

ELE 地形高程 ( Elevation)

……

2. UML 类图符号

山东半岛城市群地区地质-生态环境与可持续发展研究

3. ER 图符号

山东半岛城市群地区地质-生态环境与可持续发展研究

五、基于 UML 的 Geodatabase 的空间数据模型

构建地质数据的空间数据模型是建立地质信息数据库的一项关键工作,是数据库建设的基础。Geodatabase 数据模型作为 ArcGIS 软件平台的一种通用数据形式,目前已被国内外众多地质空间数据库的建设所采用。数据建模也已经成为地质数据库建立的一项主要内容。

目前针对地质、水文、矿产、海洋等多个领域的专业 Geodatabase 数据模型都已存在,国内目前应用于区域地质 - 生态环境调查的综合地质 - 生态环境空间数据模型还比较少见。因此,本项目在分析国内外目前比较通用的各专业数据模型的基础上,提出了专门面向山东半岛城市群地质 - 生态环境空间数据库建设的 Geodatabase 数据模型。

在 Geodatabase 数据模型中,允许定义要素之间类型的关联,Geodatabase 对空间数据管理以关系数据库为基础,利用商用关系数据库成熟的数据处理能力对空间数据和非空间数据进行统一管理。Geodatabase 使用面向对象的方法,使得要素可以具有自己的行为和属性,并且要素类具有继承性、多态性和封装性。这样,以更加适合自然的行为和人的思维方式去组织数据,更精确地模拟真实世界。

1. Geodatabase 数据模型的结构体系

Geodatabase 数据模型作为一种新型的面向对象的数据模型,融入了面向对象的核心技术,如类 ( Class) 、对象 ( Object) 、封装 ( Encapsulation) 、继承 ( Inheritance) 和多态( Polymorphism) 等思想和技术。Geodatabase 数据模型的目的就是为了让用户能更容易、更自然地表示 GIS 数据特征和更容易地建立特征之间的各种关系。Geodatabase 空间数据库数据模型如表 12 -1 所示。

表 12 -1 Geodatabase 内部结构

续表

2. Geodatabase 数据库模型的特点

Geodatabase 有两种,即个人与多用户 Geodatabase。

1) 个人 Geodatabase 支持内置于 ArcGIS 系统并提供对本地数据的访问,适用于面向项目的 GIS,在 Microsoft Access 数据库平台上实现,提供生成和更新 Access 数据库的服务,可处理小型或适中的 Access 数据库。但个人 Geodatabase 的存储容量有不能超过 2GB的限制。

2) 多用户的 Geodatabase 是通过 ArcSDE ( ARC 空间数据库引擎) 实现的。ArcSDE可以生成和访问从小型到大型的 Geodatabase 并提供关系型数据的开放界面。

与标准的关系数据库相比,Geodatabase 简化了地理数据建模的工作,因为它包含有用于建模地理信息的通用模型。

此外,Geodatabase 还同时支持两个视图,即对象视图和关系视图。这样就综合了对象视图和关系视图两者的优点。对象视图在 Geodatabase 中占据主导地位,其目的是提供一个接近于逻辑数据模型的数据模型,因而更接近于现实。关系视图则用于一些 Geodata-base 数据的常规处理,它表示的是一些简单地理对象的特征。

3. 基于 UML 的 Geodatabase 数据模型的设计

( 1) Geodatabase 数据库设计的方法

在 ArcGIS 中,建立地理数据库可以有多种方法。借助 ArcCatalog,可以通过 3 种方式建立新的地理数据库。

第一种方法是建立一个新的地理数据库。

第二种方法是移植已经存在的数据到地理数据库中去。

第三种方式是用 CASE 工具来建立地理数据库。

( 2) 面向对象和 UML ( 统一建模语言)

面向对象是软件程序设计中的一种新思想,它能使程序设计更加贴近现实,并且花费更小的精力。面向对象方法学包含了对象 ( object) 、类 ( classification) 、继承 ( inherit-ance) 、聚集和消息 ( messages) 的概念。

UML ( Unified Modeling Language,统一建模语言) 是一种基于面向对象方法的建模语言,具有创建系统的静态结构和动态行为等多种结构模型的能力,是一种通用的建模语言。在 Geodatabase 的设计中,主要用到描述系统静态结构的类图。类图的节点表示系统中的类及其属性和 *** 作。类图的边表示类之间的联系,包括继承、关联、依赖、聚合等。

类的表示由 3 个部分方框组成,上面部分给出了类的名称中间部分给出了该类的单个对象的属性下面部分给出了一些可以应用到这些对象的 *** 作。类的表示如图 12 -5。

图 12 -5 类的表示

关联是对类的实例之间联系的命名,与关联有关的内容有关联元数 ( Degree) 、关联角色 ( Role) 和重复度 ( Multiplicity) 。

UML 中有 3 种类型的类: 抽象类 ( abstract class) 、可创建化类 ( creatable class) 和可实例化类 ( instantiable class) 。

UML 类图的符号见本节第四部分内容。

( 3) 面向对象的地理数据模型的设计方法

利用 CASE 工具进行 Geodatabase 数据模型设计的步骤具体为:

1) 在 CASE 工具中进行 UML 建模。

2) 将设计好的 UML 模型载入资料库 ( repositry) 。

3) 利用 GIS 软件提供的 CASE 接口,根据资料库中的 UML 模型生成空间数据库结构。至此,Geodatabase 空间数据库结构初具雏形。在 GIS 软件环境中,现在可以将新生成的数据或已有的数据进行格式转换后载入到设计好的 Geodatabase 空间数据库中,由空间数据库统一管理。利用 CASE 工具来建立 Geodatabase 地理数据库的工作流程见图12 - 6。

图 12 -6 利用 CASE 工具来建立 Geodatabase 地理数据库的工作流程

六、地质 - 生态环境 Geodatabase 数据模型的建立

( 一) 数据模型设计的依据

根据山东半岛城市群地质 - 生态环境调查评价研究工作的需要和山东半岛城市群地质 - 生态环境 GIS 数据库系统的整体设计要求,结合各地质 - 生态环境要素的成果图件和文本报告资料,利用 UML 设计工具 Microsoft Visio 完成了山东半岛城市群地质 - 生态环境Geodatabase 数据模型的设计 ( 图 12 - 7) 。

图 12 -7 山东半岛城市群地质 - 生态环境 Geodatabase 数据模型的设计依据

( 二) 山东半岛城市群地质 - 生态环境数据库的 UML 类图

1. 数据集管理

山东半岛城市群项目数据包中的数据以数据集为单元统一组织管理,数据集管理方式就是将一份文字报告或一幅成果图件视作逻辑上的整体,用 “数据集编号”唯一标识,通过数据集实体统一管理。同一数据集的不同实体,例如成果图中的图层,通过实体中的“数据集编号”元素关联。

2. 空间数据管理

山东半岛城市群项目数据包由文字报告及成果图件两大类数据组成,并以成果图件为主,成果图件是一空间数据实体,统一存储在面向对象的地理信息数据库中,以图幅为单元进行管理。

3. 数据包总体结构

本标准中山东半岛城市群项目数据包总体结构用 UML 模型来体现,山东半岛城市群项目数据包由 “成果报告”、“元数据”及 “存档文件”3 个数据实体 ( UML 类) 组成,通过 “数据集”实体统一组织管理。“成果报告”由它的继承类 “文字报告”及 “成果图件”定义,为研究成果数据包的主体数据。“元数据”及 “存档文件”为数据集的辅助数据,“元数据”存放文字报告或成果图件的元数据“存档文件”存放文字报告或成果图件的相关存档文件,供数据集数据的整体下载与利用。

一个 “数据集”实体对应一个项目的 “文字报告”或一幅 “成果图件”每一个数据集必须有一个而且只能有一个 “元数据”文件“存档文件”是 “数据集”的可选聚合实体。

“成果图件”是一空间数据实体,由特定的面向对象地理信息数据库 ( Geodatabase)统一存储、管理。一幅 “成果图件”数据内容由一组空间要素集 ( 基础地理要素集、地质要素集、地球物理要素集、地球化学要素集、辅助要素集) 组成,空间要素集数据类型包括矢量 ( Feature Dataset,简称要素集) 、栅格 ( Raster Dataset) 和 TIN ( TIN Dataset)3 种。

4. 数据集编号的编码规则

数据集编号由数据库管理方统一编码,必须保证编号在数据库中唯一,编号中的英文字母全部大写。

山东半岛城市群项目数据集按 “项目或图幅—提交单位—提交年份—成果序号”编码。数据集编号的字符串长度不得超过 22 位,以保证 “数据集编号 + 要素类名”的字符串总长度不超过 30 位。

5. 成果图件要素类命名规则

要素类名字符串总长度不得超过 8 位。

矢量要素类按 “要素集类型 + 要素类名 + 要素类型”命名,全部用大写英文字母表示。“要素集类型”用一位代码表示,如 “L”表示基础地理要素集。栅格数据集数据以“要素集类型 + 要素类型”命名,要素类型用代码 RAS 表示,如 “DRSRAS”表示遥感栅格数据。TIN 数据集数据以 “要素集类型 + 要素类型”命名,要素类型用代码 TIN 表示,如 “LELETIN”表示地面高程 TIN。

6. 成果图件要素分类编码规则

要素分类编码用以标识不同的要素类要素,保证地图要素存储、交换、显示的一致性。

( 1) 分类编码原则

1) 科学性、系统性

2) 相对稳定性

3) 不受地图比例尺的限制

4) 完整性和可扩展性

5) 适用性。

( 2) 分类编码方法

成果图件要素类中不同要素的分类编码采用中华人民共和国国家标准 《国土基础信息数据分类与代码》的编码结构,结构如下:

山东半岛城市群地区地质-生态环境与可持续发展研究

大类码、小类码、一级代码和二级代码分别用数字顺序排列。识别位由用户自行定义,以便于扩充。在本项目中编码分两类: ①基础地理要素编码②地质专业要素编码( 地质、地球物理、地球化学等) 。

( 三) 山东半岛城市群项目数据实体及实体关系

山东半岛城市群项目数据实体类及其代码见表 12 -2,实体类名代码按实体类的英文名缩略语编码,本标准中山东半岛城市群项目数据实体及实体间关系用 UML 及实体关系图 ( ERD) 来体现。

表 12 -2 山东半岛城市群项目数据实体类及其代码

1. 数据集实体 ( MGRD_Dataset)

山东半岛城市群项目数据包中的 “数据集”实体用来统一组织管理 “文字报告”、“成果图件”、“元数据”及 “存档文件”数据实体,“数据集”实体中的数据项包含数据集的归属项目、提交日期、提交单位、主题类别及地理范围等可用于数据集检索的信息。一个 “数据集”实体对应一个项目的 “文字报告”或一幅 “成果图件”,“数据集”实体与 “元数据”实体间为一一对应关系,与 “存档文件”实体间为一对多的对应关系。“数据集”实体的数据内容及其存储表通过 “数据子集”实体分类定义,主键 [数据集编号]可用于同一数据集中不同 “数据子集”的关联,也可用于数据集对应的 “元数据”及“存档文件”的关联。

2. 成果报告数据实体 ( MGRD SumTmaryReport)

研究成果报告数据实体包括项目的最终综合文字报告及相应的成果图件。

( 1) 文字报告数据实体 ( SR_WordReport)

文字报告数据实体包括 “文字报告”及图像格式的 “报告附图”数据实体,文字报告及附图均以二进制大对象存储。数据实体之间通过 [数据集编号] 关联。

( 2) 成果图件数据实体 ( SR_hemeMapSet)

“成果图件”数据实体是一空间数据实体,主要以矢量图形格式存储在地理信息数据库中,其中也包括栅格数据及 TIN 数据用于数据的空间分析。

1) 要素集: “成果图件” 数据实体以图幅为数据集单元进行管理图幅内容以分属不同空间要素集 ( 基础地理要素集、地质要素集、地球物理要素集、地球化学要素集、辅助要素集) 的要素类组合,同一个要素集内的要素类享有同一空间参照系,相互具有拓扑关系。

2) 要素类: 一个要素类的存储单元为关系数据库中的一个数据表,要素类图元类型有点、线、面、注记 4 种,一个要素类只能包含一种图元类型。本标准中基础地理要素集、地质要素集、地球物理要素集、地球化学要素类、辅助要素集的要素类用 UML 类图体现。

3) 图层: 图层为要素类的专题组合及表现,不同图层的组合即构成了可视化 “成果图件”。本项目通过对数据来源的分析,提出并建立了适合山东半岛城市群地区地质 - 生态环境调查与评价特点的空间数据库数据图层。考虑到空间数据的应用和相互转换,每一图层均应建立相应的内部属性表,属性表必须包含一些基本字段内容,根据具体任务的不同,需灵活扩充内部属性表字段内容。 “成果图件”数据实体的图层划分及其代码见表 12 -3。

4) 要素类属性: 要素类的要素特征由属性表定义,属性表每一行对应一个要素,每一列包含要素的一个特征信息。

表 12 -3 成果图件数据实体的图层划分及其代码

5) 要素类要素分类: 同一要素类中不同类型的要素用不同的代码标识,通过属性表中的 “编码” ( GEO_CODE) 数据项体现,以便地图中同一要素类要素的分类显示,并保证地图要素存储、交换、显示的一致性。在本项目中成果图件的基础地理要素分类代码采用中华人民共和国国家标准 《国土基础信息数据分类与代码》,并根据需要进行了扩充,地质专业要素分类代码全部由本标准定义,见表 12 -4 和表 12 -5。

表 12 -4 基础地理要素分类代码

表 12 -5 地质专业要素分类代码

图12 -8 山东半岛城市群项目数据包UML类图

图层编码中,第一位为图类代码,L 代表基础地理类图层D 代表基础地质类图层G 代表国土资源图层W 代表地壳稳定性图层S 代表水资源图层H 代表海岸带图层T 代表生态环境图层R 代表人类工程活动图层F 代表分析评价图层Y 代表预测与防治图层Z 代表辅助图层。第二位为比例尺代码,图件均采用 1∶ 50 万比例尺,代码为 B。第三位到第五位为图名的汉语拼音首字母缩写。第六位为图层数字编号。

( 四) 山东半岛城市群项目 UML 类图

1. 山东半岛城市群项目数据包 UML 类图

UML 类图见图 12 - 8。

2. 成果图件要素集 UML 类图

1) 基础地理要素集实体 UML 类图 ( FD_Geography) 。本项目将基础地理要素分为地理网格、居民地、境界、交通网、地貌地形、水系、海洋海岸带、行政区划、栅格数据等 9个抽象要素类,建立了 “各市基本情况”对象类,与表明各地区域的 “城市群”类相连接,将山东半岛城市群8 个地级市的地理位置数据与地区的基本资料数据有机地联系起来。

2) 地质要素集实体 UML 类图 ( FD_Geology) 。

3) 国土资源要素集实体 UML 类图 ( FD_LandResource) 。

4) 水资源要素集实体 UML 类图 ( FD_WaterResource) 。

5) 生态环境要素集实体 UML 类图 ( FD_Environment) 。

6) 辅助要素集实体 UML 类图 ( FD_Ancillary) 。

3. 山东半岛城市群项目数据实体关系图

1) 数据集实体 ER 图 ( MGRD_DataSet) 。

2) 研究成果报告数据实体 ER 图 ( MGRD_SummaryReport) ( 图 12 - 9) 。

图 12 -9 研究成果报告数据实体 ER 图 ( MGRD_SummaryReport)

七、山东半岛城市群项目数据包数据字典

( 一) 数据集实体 ( MGRD_DataSet)

山东半岛城市群地区地质-生态环境与可持续发展研究

( 二) 研究成果报告数据实体 ( MGRD_SummaryReport)

1. 文字报告数据实体 ( SR_WordReport)

山东半岛城市群地区地质-生态环境与可持续发展研究

2. 成果图件数据实体 ( SR_ThemeMapSet)

( 1) 基础地理要素集实体 ( FD_Geography)

山东半岛城市群地区地质-生态环境与可持续发展研究

( 2) 地质要素集实体 ( FD_Geology)

山东半岛城市群地区地质-生态环境与可持续发展研究

( 3) 水资源要素集实体 ( FD_HydroResource)

山东半岛城市群地区地质-生态环境与可持续发展研究

ArcGIS是围绕着Geodatabase数据库构建的,它使用对象关系型数据库来存储空间数据。Geodatabase是一个存储数据集的容器,同时将空间数据和属性绑定起来。拓扑数据也能够存储在Geodatabase中并对特性进行建模,比如说在表示道路交叉时可以对道路之间的相关性进行设定。在使用Geodatabase时,很重要的一点就是要理解要素类(Feature Classes)就是就是一系列要素,它以点、线或多边形的形式呈现。在使用Shapefile格式时每个文件只能存储一类要素然而Geodatabase却能够在一个文件中存储多个要素或者是多种类型的要素。

在ArcGIS中Geodatabase可以以三种不同方式存储包括FGDB(File Geodatabase)、PGDB(Personal Geodatabase),和ArcSDE Geodatabase。FGDB在9.2版时被引进,它把信息储存在一个扩展名为gdb的文件夹中,文件夹内部的文件和Coverage差不多但不一样。和PGDB类似,FGDB也支持单一用户,但与PGDB不同的是,FGDB没有数据量大小的限制。默认情况下单一表的大小不能超过1TB,但这实际是可以被改变的。PGDB用Microsoft Access文件存储数据,将几何数据存储在二进制大对象字段中,OGR库能够处理这种文件类型并将它转换其它文件格式。一些需要数据库管理员完成的工作诸如管理用户及备份等可以通过ArcCatalog完成。基于Microsoft Access的PGDB仅能在Windows *** 作系统下运行而其有2GB数据量上线的限制。企业级的Geodatabase可以通过ArcSDE *** 作,它拥有可连接高端数据库管理系统(DBMS)的接口像是Oracle、Microsoft SQL Server、DB2和Infomix等。这些DBMS能够多方面的管理数据库,同时ArcGIS就用来进行空间数据的管理。企业级的Geodatabase还支持数据库复制、版本控制及事务管理等高级功能,更支持跨平台兼容,即可同时在Linux、Windows和Solaris等不同的 *** 作系统下使用。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/6643631.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-03-26
下一篇 2023-03-26

发表评论

登录后才能评论

评论列表(0条)

保存