数据库建设

数据库建设,第1张

(一)数据准备

1.数据收集

1∶25万遥感地质填图数据包含影像数据和矢量数据两种格式,影像数据主要包括:TM原始影像、SPOT原始影像、SAR原始影像、TM与SPOT融合影像、TM与SAR融合影像、信息增强分类处理后的整幅影像或影像子区;矢量数据主要包括:航磁等值线影像、1∶25万地形图、地质图、航磁解译地质图、遥感解译单元图、遥感解译地质图。现以新疆瓦石峡地区、内蒙古阿龙山地区为例,具体情况如下:

(1)瓦石峡地区

TM卫星影像

SAR卫星影像

航磁等值线(TIF)影像

航磁解译地质图

地质图

遥感解译影像单元图

遥感解译地质图

(2)阿龙山地区

TM卫星影像

SPOT卫星影像

航磁等值线(TIF)影像

地质图

航磁解译地质图

遥感解译地质图

2.数据预处理

1)影像数据处理,主要针对原始影像数据

(1)将TM原始影像、SPOT原始影像、SAR原始影像、航磁等值线(.JPG)数据格式转换为ERDAS的.IMG格式。

(2)对转换后的IMG文件进行投影转换。投影系采用6度分带的横轴墨卡托(Transverse Mercator)投影,投影参数为:

Units:Meters

Scale Factor:1.0

Longitude Of Center:123 00 00

Latitude Of Center:0 00 00

False Easting:500 KM

False Northing:0 KM

Xshift:0

Yshift:0

椭球(spheroid)体采用克拉索夫(Krasovsky)椭球,参数为:

SemiMajor:6378245.0000 Meters

SemiMinor:6356863.0188 Meters

坐标系采用大地坐标,度量单位为米,这样可以在GIS系统中方便的量算特征的长度和面积。

(3)图像坐标纠正

参照地形图选择同名点,对影像数据进行坐标精校正。同名点的选择不少于12个。

2)矢量数据处理

工作主要针对地质图、航磁解译地质图、遥感解译单元图、遥感解译地质图。

(1)数据分层

根据图面特征信息内容和制图要求,每幅矢量图按特征类型划分为点、线、面(区)三个图层。划分的依据是遥感地质解译图件的信息不完全等同于其他地质调查图件,它表现的内容主要是:从影像图中判读出的地层、岩石影像单元及构造界线,但各种地质特征的单位、时代、分类、度量、结构、方向等的描述不是十分具体,因此在属性定义上比较一致,对一个图件不需要产生基于同一特征类型的专题图层,因此按矢量特征类型划分较为合理、简便。

(2)图件扫描矢量化

将地质、影像单元等图件扫描成 TIF影像文件,按照分层要求,将每个图件数字化为点、线、面三个图层文件。处理的图件和产生的矢量图层文件见表3-1至3-7。

表3-1 矢量图层表

表3-2 遥感影像单元图线特征编码结构表

表3-3 遥感影像单元图性特征编码表

表3-4 遥感影像单元图点特征编码结构表

表3-5 遥感影像单元图点特征编码表

表3-6 遥感影像单元图矢量文件属性字段定义表

表3-7 遥感影像单元图矢量文件属性字段使用说明表

数字化后的矢量文件投影变换为6度分带的横轴墨卡托投影,坐标采用地理坐标,转换成ARC/INFO的交换格式E00文件,以便于使用。

(3)数据编辑

数字化后的E00文件在ARC/INFO中转换为Coverage格式。建立拓扑关系,生成属性表,检查特征的正确性。编辑工作包括:

a.面:多边形的闭合,多边形的拼合等。

b.线:冗余线段的删除,平滑曲线等。

c.点:悬挂点、伪节点的删除等。

特征的裁剪,使用图廓对每个图层进行切割,删除超出工作区范围的特征。

(4)投影转换和坐标校正

a.投影转换:采用横轴墨卡托投影,投影参数与影像数据完全一致。

b.坐标校正:由于图纸和扫描过程中的变形,数字化的矢量文件坐标会与实际坐标产生一定的误差,必须进行校正。本课题中使用的图纸纸张质量较差,保存时间长,又经过复制,所以误差产生因素更为复杂,误差比较大。由于这些都是解译图件,表现的内容与影像数据或地形数据基本上是不相关的,因此寻找同名点非常困难。鉴于上述种种原因,只能采用一次多项式,不少于4个坐标参数的校正方法,但校正后的文件不能准确的匹配每个特征。这也是传统手工绘图的缺陷之一,如采用计算机辅助解译、制图则会大大提高数据精度。

(5)地质特征编码

a.线特征:编码采用三位数字码组成。

1∶25万遥感地质填图方法和技术

b.点特征:编码采用三位数字码组成。

1∶25万遥感地质填图方法和技术

c.面特征:由于影像单元图的面特征描述有其特殊之处,有时遵照地层、岩石的分类方法国家标准,但绝大部分是按照影像颜色、纹理等划分和称谓,因此进行分类编码十分困难,有待进一步研究解决。

以上编码方法是在每种特征类型组合最大值和预留一定的扩充余地的基础上编制的,编码方案参照国标:GB958—89区域地质图图例(1∶5万)

(6)属性定义

说明:由于地质代号的组成方式极为复杂,使用了上下角标、希腊字符、拉丁字母等,而这些字符和格式在纯文本的属性字段中是不能完全或准确表达的,因此在录入时对地质代号进行了一些简化。

例如:Pt2xh简化为Pt2xh

简化为An1—3

(二)建立数据库

GIS空间数据库有两种存储形式:一是基于文件索引的传统空间数据库管理体系;二是采用商用关系数据库的解决方案,二者各有千秋。第一种结构是对应用的集成,而数据是松散的,虽不利于数据的集中管理,但对不同系统平台之间共享数据提供了很大方便,特别是数据较少的小型应用系统。这种结构的另外一个可取之处是方案简单,工作量小,不需要数据库方面的专业知识。第二种结构既是应用的集成,也是数据的集成,并且提供所有的RDBMS的数据和安全管理优势,但它需要专用的空间数据引擎,对其他软件使用数据是一个极大的限制,必须进行数据的导入导出和格式转换,并且要求使用者对RDBMS有一定的 *** 作和管理经验。

由于本集成系统采用的是ARC/INFO和ERDAS软件,它们之间只能达到文件方式的数据共享,虽然ARC/INFO 8提供了GeoDataBase这种关系数据库管理模式,实现真正的空间数据集中管理和RDBMS所有的数据管理能力,但为了满足两个软件之间数据的交互处理,本系统采用文件索引形式的数据库。在数据完备的基础上,建库工作需以下两个步骤:

(1)首先创建基于项目的不同格式、不同类型的目录树工作区,把所有数据文件分类保存在这个工作区中,工作区框架以瓦石峡幅数据为例(图3-5)。

(2)然后在 ARC/INFO 的 ARCMAP中新建一个 MAP DOCUMENT(以下简称为文档),添加所有数据文件到文档中。文档中每个数据文件都被称为一个 LAYER(以下简称为层),每个矢量层可以有它自己的环境,文档可以保存环境的变化。使用者只需打开这个文档即可调用项目所有的数据文件,并且恢复到上一次工作时的状态。

图3-5 数据分层结构图

在MAP DOCUMENT这种集成的数据环境下,使用者可以采用ARC/INFO 8的ARCEDITOR、ARCMAP参照影像图层进行矢量化的解译工作,对已形成的图件直接进行图形和属性编辑,进行辅助解译的空间分析,对各种图件进行叠加比较,使用文字标签或属性字段标注特征,按照分类符号化特征,制作专题图,打印输出图件报表等,实现一系列与遥感解译有关的功能和 *** 作。

由于ARC/INFO提供的地质图式图例和符号不能满足我国的地质成图要求,因此制图软件采用地质行业较为通用的MAPGIS。通过ARCTOOLS工具将最终的解译成果矢量地质图转换为ARC/INFO的标准交换格式E00,提交给MAPGIS形成绘图文件,出版印刷。具体的实施方案和技术流程见“成果图件制作方法研究”一节。

数据库建立过程包括六个主要步骤:

1.需求分析:了解用户的数据需求、处理需求、安全和完整性需求。

2.概念设计:通过数据抽象,设计系统的概念模型,一般为e-r模型。

3.逻辑结构设计:设计系统的模式和外部模式,特别是关系模型的基本表和视图。

4.物理结构设计:设计数据的存储结构和访问方法,如索引的设计。

5.系统实现:组织数据存储,编写应用程序,试运行。

6.运维:系统投入运行,进行长期维护。

扩展资料:

数据库设计技巧:

1.原始文档与实体之间的关系

它可以是一对一、一对多、多对多。一般来说,它们是一对一的关系:也就是说,原始文档只对应于一个实体,而且只对应于一个实体。在特殊情况下,它们可能是一对多或多对一的,其中一个原始文档对应多个实体,或者多个原始文档对应一个实体。

这里的实体可以理解为基本表。在明确了这些对应关系之后,这对于输入接口的设计是非常有益的。

2.主键和外键

通常,实体不能同时没有主键和外键。在e-r关系图中,叶中的实体可以定义主键,也可以不定义主键(因为它没有后代),但是它必须有外键(因为它有父键)。

主键和外键的设计在全局数据库的设计中起着重要的作用。当全球数据库的设计完成后,一位美国的数据库设计专家说:“钥匙,钥匙无处不在,只有钥匙”,这是他的数据库设计经验,也是他高度抽象的信息系统核心思想(数据模型)的体现。

因为:主键是实体的高度抽象,主键和外键对,表示实体之间的连接。

3.基本表的属性

基表不同于中间表和临时表,因为它有以下四个特点:

原子性。基表中的字段没有分解。

原始性。基表中的记录是原始数据(底层数据)的记录。

先验性。所有输出数据都可以从基表和代码表中的数据派生出来。

稳定。表的基本结构比较稳定,表中的记录保存时间较长。

一旦理解了基本表的性质,就可以在设计数据库时将它们与中间表和临时表区分开。

在遥感图像处理系统空间数据库的建立过程中,由于我们的大部分资料来源于现有的地图,因而以地图的数据处理,采用扫描矢量化的数字化手段进行数据录入,各种地图处理,数据入库工作流程可分为预处理、图形扫描数字化、图层数据建立拓扑关系、建属性数据库、图层矢量数据与属性数据联接、投影转换、图幅拼接、图面整饰、数据入库九个阶段。如图7-9所示。

图7-9 数据采集工作流程图

(1)图形预处理

资源信息是多源和多尺度的。毫无疑问,对这些资料的初步整理是数字化工作进程的重要一环。

本系统将采用统一的坐标系统,坐标系为1980西安坐标系,高程系为1985国家高程基准。所有的图形数据均应该转换到此坐标系。

(2)图形扫描数字化

在地图数据采集过程中,由于地图原图质量、内容、比例尺和扫描过程中的种种因素,根据纸介质地图的图形要素和彩色特征提取的分层图仍会带有各种噪声以及不需要的其他一些信息,为了获得正确的、干净的数据,在数字化之前,要进行二值化、去脏、光滑、断线修补、细化处理等预处理步骤。

(3)图层数据建立拓扑关系与图形编辑

矢量化后的各图层,利用ArcGIS软件提供的功能建立拓扑关系,在建拓扑关系时会发现图形数据错误,要进行编辑、修改,再重新建立拓扑关系,这一过程可能做多次,直到数据正确为止。

(4)建属性数据库

按已采集的属性数据表,和标准规定格式,利用通用的数据库管理软件建立分层数据库,文字型数据要按标准代码录入。

(5)图层矢量数据与属性数据联接

按图元编码(用户ID)将矢量数据与属性数据联接。对于已建立联接的各类空间数据和属性数据,通过ArcGIS 系统对它们做进一步的编辑和修改,确保数据库的准确性和完整性。在ArcGIS 系统中,图形数据被分成“点”、“线”、“面”三种几何要素,它们都有各自相关的属性,在进行拓扑处理后,这三种要素间便拥有了相关的空间拓扑结构,这种空间数据关系与相应的属性数据是一种动态联结关系,这也是在ArcGIS系统中能够进行空间分析的关键所在。属性数据的编辑可通过ArcGIS系统的数据库管理系统进行数据结构定义(如数据项名称、类型、长度等)、数据编辑(如插入、删除、拷贝等)、数据查询检索等等,形成可供使用的属性数据库。

(6)投影转换

同一工作区可能利用不同比例、不同投影的图件,要对不同来源、不同时间分辨率和空间分辨率的点、线、面数据进行计算,在拼接图层之前必须对它们进行投影转换,使最终形成的图层均投影到一个坐标系统。

(7)图幅接边

图幅接边的目的是要保持图面数据连续性。工作区有多幅图构成,按上述步骤每幅图分层建立起图层之后,要对各相邻图幅分层进行拼接,图幅的接边精度要满足相应比例尺的国家精度要求。各图层中线图元或面图元拼接后其图元编号要进行改变,在右边图幅中的图元拼接后用左边图幅内的图元编号,下边图幅的图元改用上边图幅的图元编号。其属性数据也要合并为一个,属性数据结构不相同的图元(线或面)不能进行图幅拼接。对于一些图面标注的内容也要做相应的调整。到现在为止,已完成了图形库的建立工作。拼接完成后,仍按图幅分开储存与管理。

(8)数据入库

前面数据处理的目的都是为了使图形进入GIS数据库系统中,以作为其他应用系统的数据基础。图形数据将采用空间数据管理方式、利用系统软件将所有图形及属性统一存放于Oracle之中。

(9)图件输出与图面整饰

在每一图幅数字化完成后,或工作区各图幅分层拼接之后,要对图面标注内容逐一添加到图面上。按有关图例符号标准和用色标准对相应点、线、面图元的线型、符号、颜色进行设置定义。再就图名、图例、比例尺及其图面内容整饰后,输出图件成果。

(10)数据质量控制

检查内容包括数据完整性、逻辑一致性、位置精度、属性精度、接边精度、现势性等是否符合国家标准及有关技术规定。专题图形数据库建设质量控制的方案如下:

建立数据采集标准规范,详细阐述不同要素的采集要求,作为数据采集的根本基准,统一采集认识。

进行数据采集人员培训,熟练使用采集软硬件,掌握采集规范,采集过程中填写详细的图例簿,统一图例簿格式,记录每幅图数据生产过程的基本情况,特别是作业时遇到的问题及处理意见,质量情况等。

数据质量控制采用分级分层管理方式,首先,数据生产 *** 作人员在数据采集过程中严格遵守数据采集规范标准,采集后进行数据的第一次检查;其次,数据库集成人员进行第二次数据质量检查;最后,系统总工随机抽样检查。

检查方式多种多样,这里主要采用以下3种:屏幕视觉检查,打印出图检查,查错软件检查。


欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/sjk/10870117.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-11
下一篇 2023-05-11

发表评论

登录后才能评论

评论列表(0条)

保存