空间数据库的空间数据库的设计_sql

数据库因不同的应用要求会有各种各样的组织形式。数据库的设计就是根据不同的应用目的和用户要求，在一个给定的应用环境中，确定最优的数据模型、处理模式、存贮结构、存取方法，建立能反映现实世界的地理实体间信息之间的联系，满足用户要求，又能被一定的DBMS接受，同时能实现系统目标并有效地存取、管理数据的数据库。简言之，数据库设计就是把现实世界中一定范围内存在着的应用数据抽象成一个数据库的具体结构的过程。

空间数据库的设计是指在现在数据库管理系统的基础上建立空间数据库的整个过程。主要包括需求分析、结构设计、和数据层设计三部分。

1、需求分析

需求分析是整个空间数据库设计与建立的基础，主要进行以下工作：

1）调查用户需求：

了解用户特点和要求，取得设计者与用户对需求的一致看法。

2）需求数据的收集和分析：

包括信息需求(信息内容、特征、需要存储的数据)、信息加工处理要求(如响应时间)、完整性与安全性要求等。

3）编制用户需求说明书：

包括需求分析的目标、任务、具体需求说明、系统功能与性能、运行环境等，是需求分析的最终成果。

需求分析是一项技术性很强的工作，应该由有经验的专业技术人员完成，同时用户的积极参与也是十分重要的。

在需求分析阶段完成数据源的选择和对各种数据集的评价

2、结构设计

指空间数据结构设计，结果是得到一个合理的空间数据模型，是空间数据库设计的关键。空间数据模型越能反映现实世界，在此基础上生成的应用系统就越能较好地满足用户对数据处理的要求。

空间数据库设计的实质是将地理空间实体以一定的组织形式在数据库系统中加以表达的过程，也就是地理信息系统中空间实体的模型化问题。

1）概念设计

概念设计是通过对错综复杂的现实世界的认识与抽象，最终形成空间数据库系统及其应用系统所需的模型。

具体是对需求分析阶段所收集的信息和数据进行分析、整理，确定地理实体、属性及它们之间的联系，将各用户的局部视图合并成一个总的全局视图，形成独立于计算机的反映用户观点的概念模式。概念模式与具体的DBMS无关，结构稳定，能较好地反映用户的信息需求。

表示概念模型最有力的工具是E-R模型，即实体-联系模型，包括实体、联系和属性三个基本成分。用它来描述现实地理世界，不必考虑信息的存储结构、存取路径及存取效率等与计算机有关的问题，比一般的数据模型更接近于现实地理世界，具有直观、自然、语义较丰富等特点，在地理数据库设计中得到了广泛应用。

2）逻辑设计

在概念设计的基础上，按照不同的转换规则将概念模型转换为具体DBMS支持的数据模型的过程，即导出具体DBMS可处理的地理数据库的逻辑结构(或外模式)，包括确定数据项、记录及记录间的联系、安全性、完整性和一致性约束等。导出的逻辑结构是否与概念模式一致，能否满足用户要求，还要对其功能和性能进行评价，并予以优化。

从E—R模型向关系模型转换的主要过程为：

①确定各实体的主关键字；

②确定并写出实体内部属性之间的数据关系表达式，即某一数据项决定另外的数据项；

③把经过消冗处理的数据关系表达式中的实体作为相应的主关键字

④根据②、③形成新的关系。

⑤完成转换后，进行分析、评价和优化。

3)物理设计

物理设计是指有效地将空间数据库的逻辑结构在物理存储器上实现，确定数据在介质上的物理存储结构，其结果是导出地理数据库的存储模式(内模式)。主要内容包括确定记录存储格式，选择文件存储结构，决定存取路径，分配存储空间。

物理设计的好坏将对地理数据库的性能影响很大，一个好的物理存储结构必须满足两个条件：一是地理数据占有较小的存储空间；二是对数据库的 *** 作具有尽可能高的处理速度。在完成物理设计后，要进行性能分析和测试。

数据的物理表示分两类：数值数据和字符数据。数值数据可用十进制或二进制形式表示。通常二进制形式所占用的存贮空间较少。字符数据可以用字符串的方式表示，有时也可利用代码值的存贮代替字符串的存储。为了节约存贮空间，常常采用数据压缩技术。

物理设计在很大程度上与选用的数据库管理系统有关。设计中应根据需要，选用系统所提供的功能。

4)数据层设计

大多数GIS都将数据按逻辑类型分成不同的数据层进行组织。数据层是GIS中的一个重要概念。GIS的数据可以按照空间数据的逻辑关系或专业属性分为各种逻辑数据层或专业数据层，原理上类似于图片的叠置。例如，地形图数据可分为地貌、水系、道路、植被、控制点、居民地等诸层分别存贮。将各层叠加起来就合成了地形图的数据。在进行空间分析、数据处理、图形显示时，往往只需要若干相应图层的数据。

数据层的设计一般是按照数据的专业内容和类型进行的。数据的专业内容的类型通常是数据分层的主要依据，同时也要考虑数据之间的关系。如需考虑两类物体共享边界(道路与行政边界重合、河流与地块边界的重合)等，这些数据间的关系在数据分层设计时应体现出来。

不同类型的数据由于其应用功能相同，在分析和应用时往往会同时用到，因此在设计时应反映出这样的需求，即可将这些数据作为一层。例如，多边形的湖泊、水库，线状的河流、沟渠，点状的井、泉等，在GIS的运用中往往同时用到，因此，可作为一个数据层。

5)数据字典设计

数据字典用于描述数据库的整体结构、数据内容和定义等。　数据字典的内容包括：　 1）数据库的总体组织结构、数据库总体设计的框架。　 2）各数据层详细内容的定义及结构、数据命名的定义。　 3）元数据（有关数据的数据，是对一个数据集的内容、质量条件及 *** 作过程等的描述）。

数据库设计的基本步骤

按照规范设计的方法，考虑数据库及其应用系统开发全过程，将数据库设计分为以下6个阶段

1.需求分析

2.概念结构设计

3.逻辑结构设计

4.物理结构设计

5.数据库实施

6.数据库的运行和维护

数据库设计通常分为6个阶段1分析用户的需求，包括数据、功能和性能需求；2概念结构设计：主要采用E-R模型进行设计，包括画E-R图；3逻辑结构设计：通过将转换成表，实现从E-R模型到关系模型的转换；4：主要是为所设计的数据库选择合适的和存取路径；5数据库的实施：包括编程、测试和试运行；6数据库运行与维护：系统的运行与数据库的日常维护。）,主要讨论其中的第3个阶段,即逻辑设计。

在数据库设计过程中，需求分析和概念设计可以独立于任何数据库管理系统进行，逻辑设计和物理设计与选用的DAMS密切相关。

1.需求分析阶段（常用自顶向下）

进行数据库设计首先必须准确了解和分析用户需求（包括数据与处理）。需求分析是整个设计过程的基础，也是最困难，最耗时的一步。需求分析是否做得充分和准确，决定了在其上构建数据库大厦的速度与质量。需求分析做的不好，会导致整个数据库设计返工重做。

需求分析的任务，是通过详细调查现实世界要处理的对象，充分了解原系统工作概况，明确用户的各种需求，然后在此基础上确定新的系统功能，新系统还得充分考虑今后可能的扩充与改变，不仅仅能够按当前应用需求来设计。

调查的重点是，数据与处理。达到信息要求，处理要求，安全性和完整性要求。

分析方法常用SA(Structured Analysis) 结构化分析方法，SA方法从最上层的系统组织结构入手，采用自顶向下，逐层分解的方式分析系统。

数据流图表达了数据和处理过程的关系，在SA方法中，处理过程的处理逻辑常常借助判定表或判定树来描述。在处理功能逐步分解的同事，系统中的数据也逐级分解，形成若干层次的数据流图。系统中的数据则借助数据字典（data dictionary，DD）来描述。数据字典是系统中各类数据描述的集合，数据字典通常包括数据项，数据结构，数据流，数据存储，和处理过程5个阶段。

2.概念结构设计阶段（常用自底向上）

概念结构设计是整个数据库设计的关键，它通过对用户需求进行综合，归纳与抽象，形成了一个独立于具体DBMS的概念模型。

设计概念结构通常有四类方法：

自顶向下。即首先定义全局概念结构的框架，再逐步细化。

自底向上。即首先定义各局部应用的概念结构，然后再将他们集成起来，得到全局概念结构。

逐步扩张。首先定义最重要的核心概念结构，然后向外扩张，以滚雪球的方式逐步生成其他的概念结构，直至总体概念结构。

混合策略。即自顶向下和自底向上相结合。

3.逻辑结构设计阶段（E-R图）

逻辑结构设计是将概念结构转换为某个DBMS所支持的数据模型，并将进行优化。

在这阶段，E-R图显得异常重要。大家要学会各个实体定义的属性来画出总体的E-R图。

各分E-R图之间的冲突主要有三类：属性冲突，命名冲突，和结构冲突。

E-R图向关系模型的转换，要解决的问题是如何将实体性和实体间的联系转换为关系模式，如何确定这些关系模式的属性和码。

4.物理设计阶段

物理设计是为逻辑数据结构模型选取一个最适合应用环境的物理结构（包括存储结构和存取方法）。

首先要对运行的事务详细分析，获得选择物理数据库设计所需要的参数，其次，要充分了解所用的RDBMS的内部特征，特别是系统提供的存取方法和存储结构。

常用的存取方法有三类：1.索引方法，目前主要是B+树索引方法。2.聚簇方法（Clustering）方法。3.是HASH方法。

5.数据库实施阶段

数据库实施阶段，设计人员运营DBMS提供的数据库语言（如sql）及其宿主语言，根据逻辑设计和物理设计的结果建立数据库，编制和调试应用程序，组织数据入库，并进行试运行。

6.数据库运行和维护阶段

数据库应用系统经过试运行后，即可投入正式运行，在数据库系统运行过程中必须不断地对其进行评价，调整，修改。

数据库设计5步骤

Five Steps to design the Database

1.确定entities及relationships

a) 明确宏观行为。数据库是用来做什么的？比如，管理雇员的信息。

b) 确定entities。对于一系列的行为，确定所管理信息所涉及到的主题范围。这将变成table。比如，雇用员工，指定具体部门，确定技能等级。

c) 确定relationships。分析行为，确定tables之间有何种关系。比如，部门与雇员之间存在一种关系。给这种关系命名。

d) 细化行为。从宏观行为开始，现在仔细检查这些行为，看有哪些行为能转为微观行为。比如，管理雇员的信息可细化为：

· 增加新员工

· 修改存在员工信息

· 删除调走的员工

e) 确定业务规则。分析业务规则，确定你要采取哪种。比如，可能有这样一种规则，一个部门有且只能有一个部门领导。这些规则将被设计到数据库的结构中。

====================================================================

范例：

ACME是一个小公司，在5个地方都设有办事处。当前，有75名员工。公司准备快速扩大规模，划分了9个部门，每个部门都有其领导。

为有助于寻求新的员工，人事部门规划了68种技能，为将来人事管理作好准备。员工被招进时，每一种技能的专业等级都被确定。

定义宏观行为

一些ACME公司的宏观行为包括：

● 招聘员工

● 解雇员工

● 管理员工个人信息

● 管理公司所需的技能信息

● 管理哪位员工有哪些技能

● 管理部门信息

● 管理办事处信息

确定entities及relationships

我们可以确定要存放信息的主题领域(表)及其关系，并创建一个基于宏观行为及描述的图表。

我们用方框来代表table，用菱形代表relationship。我们可以确定哪些relationship是一对多，一对一，及多对多。

这是一个E-R草图，以后会细化。

细化宏观行为

以下微观行为基于上面宏观行为而形成：

● 增加或删除一个员工

● 增加或删除一个办事处

● 列出一个部门中的所有员工

● 增加一项技能

● 增加一个员工的一项技能

● 确定一个员工的技能

● 确定一个员工每项技能的等级

● 确定所有拥有相同等级的某项技能的员工

● 修改员工的技能等级

这些微观行为可用来确定需要哪些table或relationship。

确定业务规则

业务规则常用于确定一对多，一对一，及多对多关系。

空间数据库的空间数据库的设计

发表评论

评论列表（0条）