系统数据库和模型库设计_sql

（一）系统数据库类型

数据库是整个农用地分等信息系统的基础，是系统开发设计要考虑的重中之重。在数据形式上，系统数据库包括两大块：一是空间数据库，二是属性数据库。目前的空间数据技术已从以MapInfo为代表的混合型数据库（空间数据库＋关系型数据库）发展到以ArcInfo的Coverage为代表的拓展型数据库。鉴于农用地分等属性数据量庞大，为减少数据冗余，提高数据检索的速度，本研究采用空间数据和属性数据分开管理的模式，依据关键字段进行绑定，进行科学索引，从而实现空间数据和属性动态链接和高效整合。

1.空间数据库

江苏省农用地分等信息系统空间数据库内容包括以下方面：

（1）土地利用现状图层：全省13个省辖市以1996年土地利用现状图为基础，经变更调绘形成以2000年为基准年的土地利用现状图，以现行的土地分类标准按八大类分类进行信息提取并分层存储，系统分别存储为耕地、林地、水域、未利用地、建设用地等图层。

（2）全省土壤类型图层：以土属为分类单位，比例尺为1:20万。

（3)1996年和2000年全省行政区划图层：在行政区划中精确到乡镇级别，分别提取存储了市名图层、县（区）名图层、乡（镇）名图层、全省行政界线图层、市级行政界线图层、县（区）级行政界线图层、乡（镇）级行政界线图层。

（4）评价单元图层：通过GIS空间叠加功能，利用土地利用现状图、行政区划图和土壤类型图叠加产生的评价单元图层，建立分等评价单元数据库。

2.属性数据库

江苏省农用地分等信息系统属性数据库内容包括以下方面：

（1）土壤属性数据：以全国第二次土壤普查为基础，结合全省土壤监测样点数据，建立土壤质量状况数据库，最小单位为土种，包括pH值、有机质含量、表层土壤质地、耕层厚度、障碍层深度、水土侵蚀程度、盐渍化程度数据。

（2）农田水利环境数据：建立了1996～2000年间各乡镇农田水利环境基础数据库，包括灌溉保证率、排水条件数据。

（3）土地利用现状数据：建立了全省13个省辖市的以1996年土地利用现状图为基础，经变更调绘形成的以2000年为基准年的土地利用现状数据库，区分耕地中的详细用地类型差异，标示水田、旱地、荒草地等纳入本次评价范围的用地内容。

（4）全省地形地貌数据库。

（5）农业区划数据：输入了江苏省农业区划数据，把江苏全省划分为6大区划，以乡镇为最小级别，建立全省乡镇的区划归属数据库。

（6）农业耕作制度数据：建立了全省各市、县、乡镇的农业耕作制度数据库，包括指定作物水稻和小麦的播种空间分布状况数据库。

（7）光温生产潜力数据：建立了全省各市、县指定作物水稻和小麦的光温生产潜力和气候生产潜力数据库。

（8）农业投入－产出数据：全省13个省辖市以乡镇为单位，建立了1996～2000年农业生产投入－产出数据库。

（9）作物产量数据：全省13个省辖市以乡镇为单位，建立了1996～2000年的指定作物水稻和小麦的产量数据库。

（10）土地利用详查分类面积数据：全省13个省辖市以乡镇为单位，建立了2000年土地利用详查分类面积数据库。

从数据格式上分，数据库又可分为：①图件数据库：指空间数据以及绑定在空间数据上的相关属性数据，本次江苏省农用地分等建立了以分等单元为记录的属性数据库，并通过关键字段与空间数据关联；②分类统计数据库：包括全省13个省辖市以乡镇为单位的1996～2000年指定作物产量统计数据和全省13个省辖市以乡镇为单位的2000年土地利用详查分类面积统计数据。

（二）系统数据库管理模式

为减少数据存储冗余，同时提高索引速度，江苏省农用地分等信息系统数据文件采用普遍的目录树形式进行管理，按省－市－县行政体系分别存储相关数据。全省建立13个省辖市分目录，分目录下按照各自所含的县（区）建立子目录。根据目前行政管理体系现状，基础资料大多来源于县级行政单位，因此采用县（区）为基本行政单位较为合理，在保证资料来源的同时，也利于资料的分类归档存储。其相对应的空间图件数据也按精度要求分割到县级行政单位，既能减少系统调用数据的吞吐量，同时也满足了系统的精度需求。空间数据、属性数据、文本数据按照各自所属的行政级别归类存储，同时设立数据文件管理器进行目录文件的索引管理，见图3-86。

图3-86 江苏省农用地分等信息系统数据文件管理模式图

（三）系统数据库结构

数据库的结构设计决定了数据之间的调用及接口关系，清晰的逻辑调用关系和统一的数据接口格式有利于数据的组织、管理、调用。

1.空间数据库

江苏省农用地分等信息系统空间数据库以矢量图件的形式存在，以分图层的方式管理，包括了全省行政界线、土壤类型、按八大类分别提取的土地利用现状、分等单元等图层。其中，分等单元图层作为农用地分等的基础，考虑到图层本身信息量大，可能影响到系统运行效率，因此所在图层的属性表中只保留了ID字段，通过ID字段与外部属性库绑定，实现分等单元与外部属性库一一对应关系。ID字段是本图层的特征代码，表征了单元的唯一性，能体现出单元的图上位置和行政归属。《农用地分等定级规程》（国土资源大调查专用）和《中华人民共和国行政区划代码》（GB/T 2260-1999）为本研究分等单元代码的编码依据；本研究有1996年和2000年两套行政区划工作底图，为此分等单元特征代码共设14位，依次为江苏省代码（2位）－市代码（2位）－2000年县或区代码（2位）－2000年乡镇代码（2位）－1996年县或区代码（2位）－1996年乡镇代码（2位）－分等单元号（2位）。其中，省、市、县（区）的行政代码按国家统一代码，乡镇级代码在县（区）范围内根据划分分等单元的需要依次编码；分等单元编号的原则是不破乡镇界，即单元号是在同一乡镇内部自行编码。示例：32011501210101，指1996年江苏（32）南京（01）市江宁县（21）由于2000年行政调整变更为南京（01）的江宁区（15）。按行政体系分级编码的优点是有利于空间查询和国土资源管理部门根据工作需求按行政级别分类汇总统计数据。

2.属性数据库

江苏省农用地分等信息系统采用关系型数据库来存储数据，优点是结构清晰明了，数据的更新维护方便，通过索引能优化数据库，建立快速的查询浏览（表3-26～表3-30）。

表3-26 行政代码数据结构表

表3-27 土壤属性数据结构表

表3-28 农田水利设施数据结构表

表3.29 指定农作物投入－产出数据结构表

表3-30 农业耕作制度及农业区划表

（四）系统模型库

系统以《农用地分等定级规程》（国土资源大调查专用）中的相关技术方法和计算模型为基础，在模型库中预先内置了分等计算模型。模型库是动态，它允许专家根据情况动态调整计算模型形式及其参数。系统主要模型的数学计算公式如下：

（1）农用地自然质量分值（Clij）计算公式见式（3-11）。

（2）样点土地利用系数计算公式：

中国耕地质量等级调查与评定（江苏卷）

式中：

Klj´——样点的第j种指定作物土地利用系数；

Yj——样点的第j种指定作物实际单产；

Yj,max——第j种指定作物最大标准粮单产。

（3）等值区土地利用系数计算公式：

中国耕地质量等级调查与评定（江苏卷）

式中：

Klj——等值区内第j种指定作物土地利用系数；

Klj´——参与计算的同一等值区内合格样点第j种指定作物土地利用系数；

n——排除异常数据后参与计算的样点的个数。

（4）样点土地经济系数计算公式：

中国耕地质量等级调查与评定（江苏卷）

式中：

Kcj′——样点的第j种指定作物土地经济系数；

Yj——样点第j种指定作物实际单产；

Cj——样点第j种指定作物实际成本；

Aj——第j种指定作物最高“产量－成本”指数。

（5）等值区土地经济系数计算公式：

中国耕地质量等级调查与评定（江苏卷）

式中：

Kcj——等值区内土地经济系数；

Kcj´——参与计算的同一等值区内合格样点第j种指定作物土地经济系数；

n——排除异常数据后参与计算的样点的个数。

（6）农用地自然质量等指数（Ri）计算公式见式（3-12）和式（3-13）。

（7）农用地利用等指数（Yi）计算公式见式（3-14）和式（3-15）。

（8）农用地经济等指数（Gi）计算公式见式（3-16）和式（3-17）。

数据库设计的基本步骤

按照规范设计的方法，考虑数据库及其应用系统开发全过程，将数据库设计分为以下6个阶段

1.需求分析

2.概念结构设计

3.逻辑结构设计

4.物理结构设计

5.数据库实施

6.数据库的运行和维护

数据库设计通常分为6个阶段1分析用户的需求，包括数据、功能和性能需求；2概念结构设计：主要采用E-R模型进行设计，包括画E-R图；3逻辑结构设计：通过将转换成表，实现从E-R模型到关系模型的转换；4：主要是为所设计的数据库选择合适的和存取路径；5数据库的实施：包括编程、测试和试运行；6数据库运行与维护：系统的运行与数据库的日常维护。）,主要讨论其中的第3个阶段,即逻辑设计。

在数据库设计过程中，需求分析和概念设计可以独立于任何数据库管理系统进行，逻辑设计和物理设计与选用的DAMS密切相关。

1.需求分析阶段（常用自顶向下）

进行数据库设计首先必须准确了解和分析用户需求（包括数据与处理）。需求分析是整个设计过程的基础，也是最困难，最耗时的一步。需求分析是否做得充分和准确，决定了在其上构建数据库大厦的速度与质量。需求分析做的不好，会导致整个数据库设计返工重做。

需求分析的任务，是通过详细调查现实世界要处理的对象，充分了解原系统工作概况，明确用户的各种需求，然后在此基础上确定新的系统功能，新系统还得充分考虑今后可能的扩充与改变，不仅仅能够按当前应用需求来设计。

调查的重点是，数据与处理。达到信息要求，处理要求，安全性和完整性要求。

分析方法常用SA(Structured Analysis) 结构化分析方法，SA方法从最上层的系统组织结构入手，采用自顶向下，逐层分解的方式分析系统。

数据流图表达了数据和处理过程的关系，在SA方法中，处理过程的处理逻辑常常借助判定表或判定树来描述。在处理功能逐步分解的同事，系统中的数据也逐级分解，形成若干层次的数据流图。系统中的数据则借助数据字典（data dictionary，DD）来描述。数据字典是系统中各类数据描述的集合，数据字典通常包括数据项，数据结构，数据流，数据存储，和处理过程5个阶段。

2.概念结构设计阶段（常用自底向上）

概念结构设计是整个数据库设计的关键，它通过对用户需求进行综合，归纳与抽象，形成了一个独立于具体DBMS的概念模型。

设计概念结构通常有四类方法：

自顶向下。即首先定义全局概念结构的框架，再逐步细化。

自底向上。即首先定义各局部应用的概念结构，然后再将他们集成起来，得到全局概念结构。

逐步扩张。首先定义最重要的核心概念结构，然后向外扩张，以滚雪球的方式逐步生成其他的概念结构，直至总体概念结构。

混合策略。即自顶向下和自底向上相结合。

3.逻辑结构设计阶段（E-R图）

逻辑结构设计是将概念结构转换为某个DBMS所支持的数据模型，并将进行优化。

在这阶段，E-R图显得异常重要。大家要学会各个实体定义的属性来画出总体的E-R图。

各分E-R图之间的冲突主要有三类：属性冲突，命名冲突，和结构冲突。

E-R图向关系模型的转换，要解决的问题是如何将实体性和实体间的联系转换为关系模式，如何确定这些关系模式的属性和码。

4.物理设计阶段

物理设计是为逻辑数据结构模型选取一个最适合应用环境的物理结构（包括存储结构和存取方法）。

首先要对运行的事务详细分析，获得选择物理数据库设计所需要的参数，其次，要充分了解所用的RDBMS的内部特征，特别是系统提供的存取方法和存储结构。

常用的存取方法有三类：1.索引方法，目前主要是B+树索引方法。2.聚簇方法（Clustering）方法。3.是HASH方法。

5.数据库实施阶段

数据库实施阶段，设计人员运营DBMS提供的数据库语言（如sql）及其宿主语言，根据逻辑设计和物理设计的结果建立数据库，编制和调试应用程序，组织数据入库，并进行试运行。

6.数据库运行和维护阶段

数据库应用系统经过试运行后，即可投入正式运行，在数据库系统运行过程中必须不断地对其进行评价，调整，修改。

数据库设计5步骤

Five Steps to design the Database

1.确定entities及relationships

a) 明确宏观行为。数据库是用来做什么的？比如，管理雇员的信息。

b) 确定entities。对于一系列的行为，确定所管理信息所涉及到的主题范围。这将变成table。比如，雇用员工，指定具体部门，确定技能等级。

c) 确定relationships。分析行为，确定tables之间有何种关系。比如，部门与雇员之间存在一种关系。给这种关系命名。

d) 细化行为。从宏观行为开始，现在仔细检查这些行为，看有哪些行为能转为微观行为。比如，管理雇员的信息可细化为：

· 增加新员工

· 修改存在员工信息

· 删除调走的员工

e) 确定业务规则。分析业务规则，确定你要采取哪种。比如，可能有这样一种规则，一个部门有且只能有一个部门领导。这些规则将被设计到数据库的结构中。

====================================================================

范例：

ACME是一个小公司，在5个地方都设有办事处。当前，有75名员工。公司准备快速扩大规模，划分了9个部门，每个部门都有其领导。

为有助于寻求新的员工，人事部门规划了68种技能，为将来人事管理作好准备。员工被招进时，每一种技能的专业等级都被确定。

定义宏观行为

一些ACME公司的宏观行为包括：

● 招聘员工

● 解雇员工

● 管理员工个人信息

● 管理公司所需的技能信息

● 管理哪位员工有哪些技能

● 管理部门信息

● 管理办事处信息

确定entities及relationships

我们可以确定要存放信息的主题领域(表)及其关系，并创建一个基于宏观行为及描述的图表。

我们用方框来代表table，用菱形代表relationship。我们可以确定哪些relationship是一对多，一对一，及多对多。

这是一个E-R草图，以后会细化。

细化宏观行为

以下微观行为基于上面宏观行为而形成：

● 增加或删除一个员工

● 增加或删除一个办事处

● 列出一个部门中的所有员工

● 增加一项技能

● 增加一个员工的一项技能

● 确定一个员工的技能

● 确定一个员工每项技能的等级

● 确定所有拥有相同等级的某项技能的员工

● 修改员工的技能等级

这些微观行为可用来确定需要哪些table或relationship。

确定业务规则

业务规则常用于确定一对多，一对一，及多对多关系。

系统数据库和模型库设计

发表评论

评论列表（0条）