数据库如何设计

数据库如何设计,第1张

数据库设计的基本步骤

按照规范设计的方法,考虑数据库及其应用系统开发全过程,将数据库设计分为以下6个阶段

1需求分析

2概念结构设计

3逻辑结构设计

4物理结构设计

5数据库实施

6数据库的运行和维护

数据库设计通常分为6个阶段1分析用户的需求,包括数据、功能和性能需求;2概念结构设计:主要采用E-R模型进行设计,包括画E-R图;3逻辑结构设计:通过将转换成表,实现从E-R模型到关系模型的转换;4:主要是为所设计的数据库选择合适的和存取路径;5数据库的实施:包括编程、测试和试运行;6数据库运行与维护:系统的运行与数据库的日常维护。),主要讨论其中的第3个阶段,即逻辑设计。 

在数据库设计过程中,需求分析和概念设计可以独立于任何数据库管理系统进行,逻辑设计和物理设计与选用的DAMS密切相关。

1需求分析阶段(常用自顶向下)

进行数据库设计首先必须准确了解和分析用户需求(包括数据与处理)。需求分析是整个设计过程的基础,也是最困难,最耗时的一步。需求分析是否做得充分和准确,决定了在其上构建数据库大厦的速度与质量。需求分析做的不好,会导致整个数据库设计返工重做。

需求分析的任务,是通过详细调查现实世界要处理的对象,充分了解原系统工作概况,明确用户的各种需求,然后在此基础上确定新的系统功能,新系统还得充分考虑今后可能的扩充与改变,不仅仅能够按当前应用需求来设计。

调查的重点是,数据与处理。达到信息要求,处理要求,安全性和完整性要求。

分析方法常用SA(Structured  Analysis) 结构化分析方法,SA方法从最上层的系统组织结构入手,采用自顶向下,逐层分解的方式分析系统。

数据流图表达了数据和处理过程的关系,在SA方法中,处理过程的处理逻辑常常借助判定表或判定树来描述。在处理功能逐步分解的同事,系统中的数据也逐级分解,形成若干层次的数据流图。系统中的数据则借助数据字典(data dictionary,DD)来描述。数据字典是系统中各类数据描述的集合,数据字典通常包括数据项,数据结构,数据流,数据存储,和处理过程5个阶段。

2概念结构设计阶段(常用自底向上)

概念结构设计是整个数据库设计的关键,它通过对用户需求进行综合,归纳与抽象,形成了一个独立于具体DBMS的概念模型。

设计概念结构通常有四类方法:

自顶向下。即首先定义全局概念结构的框架,再逐步细化。

自底向上。即首先定义各局部应用的概念结构,然后再将他们集成起来,得到全局概念结构。

逐步扩张。首先定义最重要的核心概念结构,然后向外扩张,以滚雪球的方式逐步生成其他的概念结构,直至总体概念结构。

混合策略。即自顶向下和自底向上相结合。

3逻辑结构设计阶段(E-R图)

逻辑结构设计是将概念结构转换为某个DBMS所支持的数据模型,并将进行优化。

在这阶段,E-R图显得异常重要。大家要学会各个实体定义的属性来画出总体的E-R图。

各分E-R图之间的冲突主要有三类:属性冲突,命名冲突,和结构冲突。

E-R图向关系模型的转换,要解决的问题是如何将实体性和实体间的联系转换为关系模式,如何确定这些关系模式的属性和码。

4物理设计阶段

物理设计是为逻辑数据结构模型选取一个最适合应用环境的物理结构(包括存储结构和存取方法)。

首先要对运行的事务详细分析,获得选择物理数据库设计所需要的参数,其次,要充分了解所用的RDBMS的内部特征,特别是系统提供的存取方法和存储结构。

常用的存取方法有三类:1索引方法,目前主要是B+树索引方法。2聚簇方法(Clustering)方法。3是HASH方法。

5数据库实施阶段

数据库实施阶段,设计人员运营DBMS提供的数据库语言(如sql)及其宿主语言,根据逻辑设计和物理设计的结果建立数据库,编制和调试应用程序,组织数据入库,并进行试运行。

6数据库运行和维护阶段

数据库应用系统经过试运行后,即可投入正式运行,在数据库系统运行过程中必须不断地对其进行评价,调整,修改。

数据库设计5步骤

Five Steps to design the Database

1确定entities及relationships

a)    明确宏观行为。数据库是用来做什么的?比如,管理雇员的信息。

b)    确定entities。对于一系列的行为,确定所管理信息所涉及到的主题范围。这将变成table。比如,雇用员工,指定具体部门,确定技能等级。

c)    确定relationships。分析行为,确定tables之间有何种关系。比如,部门与雇员之间存在一种关系。给这种关系命名。

d)    细化行为。从宏观行为开始,现在仔细检查这些行为,看有哪些行为能转为微观行为。比如,管理雇员的信息可细化为:

·         增加新员工

·         修改存在员工信息

·         删除调走的员工

e)    确定业务规则。分析业务规则,确定你要采取哪种。比如,可能有这样一种规则,一个部门有且只能有一个部门领导。这些规则将被设计到数据库的结构中。

====================================================================

范例:

ACME是一个小公司,在5个地方都设有办事处。当前,有75名员工。公司准备快速扩大规模,划分了9个部门,每个部门都有其领导。

为有助于寻求新的员工,人事部门规划了68种技能,为将来人事管理作好准备。员工被招进时,每一种技能的专业等级都被确定。

定义宏观行为

一些ACME公司的宏观行为包括:

● 招聘员工

● 解雇员工

● 管理员工个人信息

● 管理公司所需的技能信息

● 管理哪位员工有哪些技能

● 管理部门信息

● 管理办事处信息

确定entities及relationships

我们可以确定要存放信息的主题领域(表)及其关系,并创建一个基于宏观行为及描述的图表。

我们用方框来代表table,用菱形代表relationship。我们可以确定哪些relationship是一对多,一对一,及多对多。

这是一个E-R草图,以后会细化。

细化宏观行为

以下微观行为基于上面宏观行为而形成:

● 增加或删除一个员工

● 增加或删除一个办事处

● 列出一个部门中的所有员工

● 增加一项技能

● 增加一个员工的一项技能

● 确定一个员工的技能

● 确定一个员工每项技能的等级

● 确定所有拥有相同等级的某项技能的员工

● 修改员工的技能等级

这些微观行为可用来确定需要哪些table或relationship。

确定业务规则

业务规则常用于确定一对多,一对一,及多对多关系。

相关的业务规则可能有:

● 现在有5个办事处;最多允许扩展到10个。

● 员工可以改变部门或办事处

● 每个部门有一个部门领导

● 每个办事处至多有3个电话号码

● 每个电话号码有一个或多个扩展

● 员工被招进时,每一种技能的专业等级都被确定。

● 每位员工拥有3到20个技能

● 某位员工可能被安排在一个办事处,也可能不安排办事处。

2确定所需数据

要确定所需数据:

a)    确定支持数据

b)    列出所要跟踪的所有数据。描述table(主题)的数据回答这些问题:谁,什么,哪里,何时,以及为什么

c)    为每个table建立数据

d)    列出每个table目前看起来合适的可用数据

e)    为每个relationship设置数据

f)    如果有,为每个relationship列出适用的数据

确定支持数据

你所确定的支持数据将会成为table中的字段名。比如,下列数据将适用于表Employee,表Skill,表Expert In。

Employee

   

Skill

   

Expert In

   

ID

   

ID

   

Level

   

Last Name

   

Name

   

Date acquired

   

First Name

   

Description

      

Department

         

Office

         

Address

         

如果将这些数据画成图表,就像:

 

需要注意: 

● 在确定支持数据时,请一定要参考你之前所确定的宏观行为,以清楚如何利用这些数据。 

● 比如,如果你知道你需要所有员工的按姓氏排序的列表,确保你将支持数据分解为名字与姓氏,这比简单地提供一个名字会更好。 

● 你所选择的名称最好保持一致性。这将更易于维护数据库,也更易于阅读所输出的报表。 

● 比如,如果你在某些地方用了一个缩写名称Emp_status,你就不应该在另外一个地方使用全名(Empolyee_ID)。相反,这些名称应当是Emp_status及Emp_id。 

● 数据是否与正确的table相对应无关紧要,你可以根据自己的喜好来定。在下节中,你会通过测试对此作出判断。

3标准化数据

标准化是你用以消除数据冗余及确保数据与正确的table或relationship相关联的一系列测试。共有5个测试。本节中,我们将讨论经常使用的3个。

关于标准化测试的更多信息,请参考有关数据库设计的书籍。

标准化格式

标准化格式是标准化数据的常用测试方式。你的数据通过第一遍测试后,就被认为是达到第一标准化格式;通过第二遍测试,达到第二标准化格式;通过第三遍测试,达到第三标准化格式。

如何标准格式:

1. 列出数据

2. 为每个表确定至少一个键。每个表必须有一个主键。

3. 确定relationships的键。relationships的键是连接两个表的键。

4. 检查支持数据列表中的计算数据。计算数据通常不保存在数据库中。

5. 将数据放在第一遍的标准化格式中:

6. 从tables及relationships除去重复的数据。

7. 以你所除去数据创建一个或更多的tables及relationships。

8. 将数据放在第二遍的标准化格式中:

9. 用多于一个以上的键确定tables及relationships。

10. 除去只依赖于键一部分的数据。

11. 以你所除去数据创建一个或更多的tables及relationships。

12. 将数据放在第三遍的标准化格式中:

13. 除去那些依赖于tables或relationships中其他数据,并且不是键的数据。

14. 以你所除去数据创建一个或更多的tables及relationships。

数据与键

在你开始标准化(测试数据)前,简单地列出数据,并为每张表确定一个唯一的主键。这个键可以由一个字段或几个字段(连锁键)组成。

主键是一张表中唯一区分各行的一组字段。Employee表的主键是Employee ID字段。Works In relationship中的主键包括Office Code及Employee ID字段。给数据库中每一relationship给出一个键,从其所连接的每一个table中抽取其键产生。

RelationShip

   

Key

   

Office

   

Office code

      

Office address

      

Phone number

   

Works in

   

Office code

      

Employee ID

   

Department

   

Department ID

      

Department name

   

Heads

   

Department ID

      

Employee ID

   

Assoc with

   

Department ID

      

EmployeeID

   

Skill

   

Skill ID

      

Skill name

      

Skill description

   

Expert In

   

Skill ID

      

Employee ID

      

Skill level

      

Date acquired

   

Employee

   

Employee ID

      

Last Name

      

First Name

      

Social security number

      

Employee street

      

Employee city

      

Employee state

      

Employee phone

      

Date of birth

   

将数据放在第一遍的标准化格式中

● 除去重复的组

● 要测试第一遍标准化格式,除去重复的组,并将它们放进他们各自的一张表中。

● 在下面的例子中,Phone Number可以重复。(一个工作人员可以有多于一个的电话号码。)将重复的组除去,创建一个名为Telephone的新表。在Telephone与Office创建一个名为Associated With的relationship。

将数据放在第二遍的标准化格式中

● 除去那些不依赖于整个键的数据。

● 只看那些有一个以上键的tables及relationships。要测试第二遍标准化格式,除去那些不依赖于整个键的任何数据(组成键的所有字段)。

● 在此例中,原Employee表有一个由两个字段组成的键。一些数据不依赖于整个键;例如,department name只依赖于其中一个键(Department ID)。因此,Department ID,其他Employee数据并不依赖于它,应移至一个名为Department的新表中,并为Employee及Department建立一个名为Assigned To的relationship。

将数据放在第三遍的标准化格式中

● 除去那些不直接依赖于键的数据。

● 要测试第三遍标准化格式,除去那些不是直接依赖于键,而是依赖于其他数据的数据。

● 在此例中,原Employee表有依赖于其键(Employee ID)的数据。然而,office location及office phone依赖于其他字段,即Office Code。它们不直接依赖于Employee ID键。将这组数据,包括Office Code,移至一个名为Office的新表中,并为Employee及Office建立一个名为Works In的relationship。

4考量关系

当你完成标准化进程后,你的设计已经差不多完成了。你所需要做的,就是考量关系。

考量带有数据的关系

你的一些relationship可能集含有数据。这经常发生在多对多的关系中。

遇到这种情况,将relationship转化为一个table。relationship的键依旧成为table中的键。

考量没有数据的关系

要实现没有数据的关系,你需要定义外部键。外部键是含有另外一个表中主键的一个或多个字段。外部键使你能同时连接多表数据。

有一些基本原则能帮助你决定将这些键放在哪里:

一对多 在一对多关系中,“一”中的主键放在“多”中。此例中,外部键放在Employee表中。

一对一 在一对一关系中,外部键可以放进任一表中。如果必须要放在某一边,而不能放在另一边,应该放在必须的一边。此例中,外部键(Head ID)在Department表中,因为这是必需的。

多对多 在多对多关系中,用两个外部键来创建一个新表。已存的旧表通过这个新表来发生联系。

5检验设计

在你完成设计之前,你需要确保它满足你的需要。检查你在一开始时所定义的行为,确认你可以获取行为所需要的所有数据:

● 你能找到一个路径来等到你所需要的所有信息吗?

● 设计是否满足了你的需要?

● 所有需要的数据都可用吗?

如果你对以上的问题都回答是,你已经差不多完成设计了。

最终设计

最终设计看起来就像这样:

设计数据库的表属性

数据库设计需要确定有什么表,每张表有什么字段。此节讨论如何指定各字段的属性。

对于每一字段,你必须决定字段名,数据类型及大小,是否允许NULL值,以及你是否希望数据库限制字段中所允许的值。

选择字段名

字段名可以是字母、数字或符号的任意组合。然而,如果字段名包括了字母、数字或下划线、或并不以字母打头,或者它是个关键字(详见关键字表),那么当使用字段名称时,必须用双引号括起来。

为字段选择数据类型

SQL Anywhere支持的数据类型包括:

整数(int, integer, smallint)

小数(decimal, numeric)

浮点数(float, double)

字符型(char, varchar, long varchar)

二进制数据类型(binary, long binary)

日期/时间类型(date, time, timestamp)

用户自定义类型

关于数据类型的内容,请参见“SQL Anywhere数据类型”一节。字段的数据类型影响字段的最大尺寸。例如,如果你指定SMALLINT,此字段可以容纳32,767的整数。INTEGER可以容纳2,147,483,647的整数。对CHAR来讲,字段的最大值必须指定。

长二进制的数据类型可用来在数据库中保存例如图像(如位图)或者文字编辑文档。这些类型的信息通常被称为二进制大型对象,或者BLOBS。

关于每一数据类型的完整描述,见“SQL Anywhere数据类型”。

(一)数据资料收集整理工作步骤

农用地分等工作中数据资料收集整理与调查工作是整个农用地分等工作的关键环节,其质量关系到分等成果的准确性。其基本步骤如下:

(1)农用地分等项目技术组到国土资源局、农业局、统计局、水利局、交通局、环保局、气象局等相关部门收集有关资料,主要包括土壤普查、国土资源调查、农业区划、土地利用总体规划等资料,气象、水文、地质以及国民经济统计等基础资料,环境保护资料、农田水利资料、国民经济、农业统计资料以及土壤图、地形图、土地利用现状图等基础图件。

(2)由各镇国土资源所负责将镇级国土资源所、农技站和各村委会调查表格下发至相关单位,并要求各单位按照调查表格的内容准备材料。在农用地分等技术组和当地国土资源所、农办工作人员的具体指导下,集中各行政村和相关单位的干部或技术人员,结合各镇的实际情况,现场进行调查与收集资料工作。内容包括农用地投入、产出样点资料,农田水利基础设施状况及区位交通状况等资料。

(3)资料整理,即对收集的资料进行核实、分析与整理。

(二)数据资料整理

数据资料整理主要是对收集的资料进行核实、分析与整理。

1资料核实

严格核实资料数据,要求数据来源可靠,计量单位统一,剔除明显不符合实际的数值和特殊的极值。

2资料整理

(1)对资料进行分类整理,重点是图件、数据资料整理。

(2)对不能满足分等工作要求的资料应做好记录,以便进行外业补充调查。

(3)四周与邻县接边的分等单元要整理出来,填写专门的表格,以备接边检核和存档。

(4)对缺乏土壤资料的补充调查点,应注意收集土壤普查土种志资料(有其生产性能的描述)或补充土壤剖面,以便准确诊断分等因素。

(5)外业调查原始记录的文字、表格、图件、剖面照片及其说明、环境照片及其说明,必须整理成册,列入基础资料汇编,存入档案。

(三)分等主要工作过程及数据库建设

1分等主要工作过程

分等工作包括工作准备、资料收集整理、外业调查、数据处理、成果自检、成果整理及报告撰写、省级预检等工作过程。分等工作的基本工作流程如图2-1所示。

2分等数据库处理

农用地分等数据库处理主要包括以下7个方面的工作:

(1)整理分析外业调查资料与数据:对收集的分等资料和数据,进行全面的整理、核实、检查、分析,以保证各个分等因素因子数据的准确性。

(2)建立分等数据库:利用GIS工具,将土地利用现状、土壤类型、土壤有机质含量、土壤pH值、行政区划、土地变更调查等成果图件中未数字化的图件进行扫描、矢量化,建立分等空间数据库;应用地理信息系统工具软件进行分等因素因子的属性数据的录入和检验,建立分等数据库。

(3)将农用地分等单元图与土壤分布图、土壤有机质图进行叠加套合,再根据土壤普查报告和农业区划报告等有关资料对农用地分等因素进行判读,提取各分等单元的土层厚度、土体构型、有机质含量、pH值等土壤属性,经归纳、检核后建立分等单元属性数据库。

(4)在对调查资料中投入产出数据进行系统整理的基础上,进行样点内不同指定作物的土地利用系数、土地经济系数计算,等值区划分,等值区土地利用系数、土地经济系数计算并与农用地分等属性库连接。

图2-1 广东省农用地分等工作流程图

(5)计算样点及各村的平均土地利用系数及土地经济系数,划分等值区。计算各分等单元内的自然质量等指数、利用等指数、经济等指数。

(6)进行农用地等别划分:采用等间距法,以200分为区间划分农用地分等单元的自然质量等、利用等和经济等,初步确定农用地等别。

(7)确定标准样地:按照《农用地分等规程》和《广东省农用地分等定级与估价技术方案和工作方案》中的有关规定,选择各镇自然质量等指数、利用等指数和经济等指数最高的农用地分等单元,确定县域内农用地的省级和县级标准样地。

3分等数据库的建立

1)建立分等数据库的目的和意义

(1)目的。协调、统一、规范农用地分等定级与估价成果的数据组织、数据内容与数据格式,为省级农用地分等定级估价工作奠定基础。

(2)意义:

①农用地分等定级估价工作是一项内容新、技术性强、技术要求高、涉及部门多的工作,由于农用地分等定级与估价工作涉及的基础资料繁多,必须制定统一的技术细则才能建立起完备的数据管理系统。

②由于参与此项工作的技术单位众多,为了协调统一省级农用地分等定级与估价成果数据,避免数据汇总、统计、数据共享和数据互 *** 作可能出现的问题,须建立统一的数据格式和标准。

③农用地分等定级与估价的成果数据及其管理系统是农用地分等定级估价工作的核心成果,作为国土资源管理的基础数据,将在土地征收、农用地流转、土地利用规划等工作中发挥重要的作用。

2)建立分等数据库的技术依据

建立分等数据库的技术依据包括以下几个方面:

(1)《农用地分等规程》(TD/T1004-2003)。

(2)《农用地分等数据库标准》(征求意见稿)。

(3)《广东省农用地分等定级与估价技术方案和工作方案》。

(4)国土资源部土地整理中心《农用地分等定级与估价项目技术简报》。

(5)广东省农用地分等定级与估价项目工作技术简报。

(6)广东省农用地分等定级估价工作相关文件。

3)分等数据库的内容

数据库成果包括图形数据库、表格数据库和数据库软件系统,对于通用软件或国家要求格式的数据库,仅要求提交数据内容;对于图形数据库的内容,应包含提交的所有成果图件的数据;对于表格数据库或属性数据库,应与图形数据相关联,对于不需要图形对应的表格可以仅提交电子表格。

4)数据库要求

(1)样点调查图必须包含样点编号、单元编号、村名和各项调查因素字段。

(2)分等单元电子图的属性必须包含单元编号、地类代码、指标区名称、面积、分等因素原始属性。

(3)农用地自然质量等别图属性必须包括单元编号、各单元的自然质量等别的诊断因素及其指标。

(4)农用地利用等别图属性必须包括各利用等别单元编号、实际调查产量、二级区最高产量、利用系数。

(5)农用地等别图属性必须包括单元编号、投入、产量、经济系数。

(6)农用地标准样地分布图与样地属性表相对应。

(7)综合数据库应包括单元图形库和与单元相连接的分等单元综合数据表。

5)数据格式

(1)属性数据格式。属性数据格式要求数据字段包含字段名称、字段代码、字段类型、字段长度和小数位数,具体如表2-1所示。

表2-1 属性数据格式要求表

(2)电子成果格式。本项目电子图件采用E00格式,电子表格采用DBF、Excel两种格式,文字报告采用Word格式。

(四)分等成果图件编制

1农用地分等成果图件

农用地分等成果图件包括工作底图、中间成果图和最终成果图。最终成果图应直观反映农用地质量的优劣,反映不同质量农用地的分布、面积等状况。

(1)工作底图。农用地分等工作底图采用2003年土地利用现状调查图。

(2)中间成果图。中间成果图有分等单元图、指标区图、土地利用系数等值区图和土地经济系数等值区图。

(3)最终成果图。最终成果图包括农用地自然质量等别图、农用地利用等别图、农用地经济等别图、标准样地分布图。

2农用地分等成果图编绘要求

(1)比例尺。农用地分等成果图件的比例尺应为1∶1万~1∶10万,应与土地利用现状调查的精度一致。

(2)工作底图。农用地分等工作要以土地利用现状图为工作底图。

(3)上图要素。各图件应突出反映主题内容,并包括图名、图廓、图例、比例尺、坐标系统、方位坐标、县级和乡级行政界线、重要的线状地物或明显地物点、编图单位、编图时间、邻区名称和界线等要素,各等别图还应包括面积汇总表。

(4)等别图斑。编制最终成果图时应将等别相同的相邻分等单元进行归并,形成等别图斑,图斑面积不小于6平方毫米。

(5)图件内容标注。用图示、注记等标注分等成果,具体要求如下:①用阿拉伯数字分别表示各等别(1等、2等、3等……);②用实线表示各等别界线;③各地根据需要编绘彩色等别图,等别图以冷色调为主,等别色差明显,图面色调和谐。

以上就是关于数据库如何设计全部的内容,包括:数据库如何设计、数据资料收集整理、等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/9338697.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-27
下一篇 2023-04-27

发表评论

登录后才能评论

评论列表(0条)

保存