数据库的概念
什么是数据库呢当人们从不同的角度来描述这一概念时就有不同的定义(当然是描述性的)。例如,称数据库是一个"记录保存系统"(该定义强调了数据库是若干记录的集合)。又如称数据库是"人们为解决特定的任务,以一定的组织方式存储在一起的相关的数据的集合"(该定义侧重于数据的组织)。更有甚者称数据库是"一个数据仓库"。当然,这种说法虽然形象,但并不严谨。严格地说,数据库是"按照数据结构来组织、存储和管理数据的仓库"。在经济管理的日常工作中,常常需要把某些相关的数据放进这样"仓库",并根据管理的需要进行相应的处理。例如,企业或事业单位的人事部门常常要把本单位职工的基本情况(职工号、姓名、年龄、性别、籍贯、工资、简历等)存放在表2063中,这张表就可以看成是一个数据库。有了这个"数据仓库"我们就可以根据需要随时查询某职工的基本情况,也可以查询工资在某个范围内的职工人数等等。这些工作如果都能在计算机上自动进行,那我们的人事管理就可以达到极高的水平。此外,在财务管理、仓库管理、生产管理中也需要建立众多的这种"数据库",使其可以利用计算机实现财务、仓库、生产的自动化管理。
JMartin给数据库下了一个比较完整的定义:数据库是存储在一起的相关数据的集合,这些数据是结构化的,无有害的或不必要的冗余,并为多种应用服务;数据的存储独立于使用它的程序;对数据库插入新数据,修改和检索原有数据均能按一种公用的和可控制的方式进行。当某个系统中存在结构上完全分开的若干个数据库时,则该系统包含一个"数据库集合"。
数据库的优点
使用数据库可以带来许多好处:如减少了数据的冗余度,从而大大地节省了数据的存储空间;实现数据资源的充分共享等等。此外,数据库技术还为用户提供了非常简便的使用手段使用户易于编写有关数据库应用程序。特别是近年来推出的微型计算机关系数据库管理系统dBASELL, *** 作直观,使用灵活,编程方便,环境适应广泛(一般的十六位机,如IBM/PC/XT,国产长城0520等均可运行种软件),数据处理能力极强。数据库在我国正得到愈来愈广泛的应用,必将成为经济管理的有力工具。
数据库是通过数据库管理系统(DBMS-DATA BASE MANAGEMENT SYSTEM)软件来实现数据的存储、管理与使用的dBASELL就是一种数据库管理系统软件。
数据库结构与数据库种类
数据库通常分为层次式数据库、网络式数据库和关系式数据库三种。而不同的数据库是按不同的数据结构来联系和组织的。
1数据结构模型
(1)数据结构
所谓数据结构是指数据的组织形式或数据之间的联系。如果用D表示数据,用R表示数据对象之间存在的关系集合,则将DS=(D,R)称为数据结构。例如,设有一个电话号码簿,它记录了n个人的名字和相应的电话号码。为了方便地查找某人的电话号码,将人名和号码按字典顺序排列,并在名字的后面跟随着对应的电话号码。这样,若要查找某人的电话号码(假定他的名字的第一个字母是Y),那么只须查找以Y开头的那些名字就可以了。该例中,数据的集合D就是人名和电话号码,它们之间的联系R就是按字典顺序的排列,其相应的数据结构就是DS=(D,R),即一个数组。
(2)数据结构种类
数据结构又分为数据的逻辑结构和数据的物理结构。数据的逻辑结构是从逻辑的角度(即数据间的联系和组织方式)来观察数据,分析数据,与数据的存储位置无关。数据的物理结构是指数据在计算机中存放的结构,即数据的逻辑结构在计算机中的实现形式,所以物理结构也被称为存储结构。本节只研究数据的逻辑结构,并将反映和实现数据联系的方法称为数据模型。
目前,比较流行的数据模型有三种,即按图论理论建立的层次结构模型和网状结构模型以及按关系理论建立的关系结构模型。
2层次、网状和关系数据库系统
(1)层次结构模型
层次结构模型实质上是一种有根结点的定向有序树(在数学中"树"被定义为一个无回的连通图)。例如图2064是一个高等学校的组织结构图。这个组织结构图像一棵树,校部就是树根(称为根结点),各系、专业、教师、学生等为枝点(称为结点),树根与枝点之间的联系称为边,树根与边之比为1:N,即树根只有一个,树枝有N个。这种数据结构模型的一般结构见图2065所示。
图2064 高等学校的组织结构图 图2065 层次结构模型
图2065中,Ri(i=1,2,…6)代表记录(即数据的集合),其中R1就是根结点(如果Ri看成是一个家族,则R1就是祖先,它是R2、R3、R4的双亲,而R2、R3、R4互为兄弟),R5、R6也是兄弟,且其双亲为R3。R2、R4、R5、R6又被称为叶结点(即无子女的结点)。这样,Ri(i=1,2,…6)就组成了以R1为树根的一棵树,这就是一个层次数据结构模型。
按照层次模型建立的数据库系统称为层次模型数据库系统。IMS(Information Manage-mentSystem)是其典型代表。
(2)网状结构模型
在图2066中,给出了某医院医生、病房和病人之间的联系。即每个医生负责治疗三个病人,每个病房可住一到四个病人。如果将医生看成是一个数据集合,病人和病房分别是另外两个数据集合,那么医生、病人和病房的比例关系就是M:N:P(即M个医生,N个病人,P间病房)。这种数据结构就是网状数据结构,它的一般结构模型如图2067所示。在图中,记录Ri(i=1,2,8)满足以下条件:
①可以有一个以上的结点无双亲(如R1、R2、R3)。
②至少有一个结点有多于一个以上的双亲。在"医生、病人、病房"例中,"医生集合有若干个结点(M个医生结点)无"双亲",而"病房"集合有P个结点(即病房),并有一个以上的"双亲"(即病人)。
图2066 医生、病房和病人之间的关系
图2067 网状结构模型
按照网状数据结构建立的数据库系统称为网状数据库系统,其典型代表是DBTG(Data Base Task Group)。用数学方法可将网状数据结构转化为层次数据结构。
(3)关系结构模型
关系式数据结构把一些复杂的数据结构归结为简单的二元关系(即二维表格形式)。例如某单位的职工关系就是一个二元关系(见表2068)。这个四行六列的表格的每一列称为一个字段(即属性),字段名相当于标题栏中的标题(属性名称);表的每一行是包含了六个属性(工号、姓名、年龄、性别、职务、工资)的一个六元组,即一个人的记录。这个表格清晰地反映出该单位职工的基本情况。
表2068 职工基本情况
通常一个m行、n列的二维表格的结构如表2069所示。
表中每一行表示一个记录值,每一列表示一个属性(即字段或数据项)。该表一共有m个记录。每个记录包含n个属性。
作为一个关系的二维表,必须满足以下条件:
(1)表中每一列必须是基本数据项(即不可再分解)。
(2)表中每一列必须具有相同的数据类型(例如字符型或数值型)。
(3)表中每一列的名字必须是唯一的。
(4)表中不应有内容完全相同的行。
(5)行的顺序与列的顺序不影响表格中所表示的信息的含义。
由关系数据结构组成的数据库系统被称为关系数据库系统。
在关系数据库中,对数据的 *** 作几乎全部建立在一个或多个关系表格上,通过对这些关系表格的分类、合并、连接或选取等运算来实现数据的管理。dBASEII就是这类数据库管理系统的典型代表。对于一个实际的应用问题(如人事管理问题),有时需要多个关系才能实现。用dBASEII建立起来的一个关系称为一个数据库(或称数据库文件),而把对应多个关系建立起来的多个数据库称为数据库系统。dBASEII的另一个重要功能是通过建立命令文件来实现对数据库的使用和管理,对于一个数据库系统相应的命令序列文件,称为该数据库的应用系统。因此,可以概括地说,一个关系称为一个数据库,若干个数据库可以构成一个数据库系统。数据库系统可以派生出各种不同类型的辅助文件和建立它的应用系统。
数据库的要求与特性
为了使各种类型的数据库系统能够充分发挥它们的优越性,必须对数据库管理系统的使用提出一些明确的要求。
1建立数据库文件的要求
(1)尽量减少数据的重复,使数据具有最小的冗余度。计算机早期应用中的文件管理系统,由于数据文件是用户各自建立的,几个用户即使有许多相同的数据也得放在各自的文件中,因而造成存储的数据大量重复,浪费存储空间。数据库技术正是为了克服这一缺点而出现的,所以在组织数据的存储时应避免出现冗余。
(2)提高数据的利用率,使众多用户都能共享数据资源。
(3)注意保持数据的完整性。这对某些需要历史数据来进行预测、决策的部门(如统计局、银行等)特别重要。
(4)注意同一数据描述方法的一致性,使数据 *** 作不致发生混乱。如一个人的学历在人事档案中是大学毕业,而在科技档案中却是大学程度,这样就容易造成混乱。
(5)对于某些需要保密的数据,必须增设保密措施。
(6)数据的查找率高,根据需要数据应能被及时维护。
2数据库文件的特征
无论使用哪一种数据库管理系统,由它们所建立的数据库文件都可以看成是具有相同性质的记录的集合,因而这些数据库文件都有相同的特性:
(1)文件的记录格式相同,长度相等。
(2)不同的行是不同的记录,因而具有不同的内容。
(3)不同的列表示不同的字段名,同一列中的数据的性质(属性)相同。
(4)每一行各列的内容是不能分割的,但行的顺序和列的顺序不影响文件内容的表达。
3文件的分类
对文件引用最多的是主文件和事物文件。其他的文件分类还包括表文件、备份文件、档案的输出文件等。下面将讲述这些文件。
(1)主文件。主文件是某特定应用领域的永久性的数据资源。主文件包含那些被定期存取以提供信息和经常更新以反映最新状态的记录。典型的主文件有库存文件、职工主文件和收帐主文件等。
(2)事务文件。事务文件包含着作为一个信息系统的数据活动(事务)的那些记录。这些事务被分批以构成事务文件。例如,从每周工资卡上录制下来的数分批存放在一个事务文件上,然后对照工资清单文件进行处理以便打印出工资支票和工资记录簿。
(3)表文件。表文件是一些表格。之所以单独建立表文件而不把表设计在程序中是为了便于修改。例如,一个公用事业公司的税率表或国内税务局的税率就可以存储在表中文件。
(4)备用文件。备用文件是现有生产性文件的一个复制品。一旦生产性文件受到破坏,利用备用文件就可以重新建立生产性文件。
(5)档案文件。档案文件不是提供当前处理使用的,而是保存起来作为历史参照的。例如,国内税务局(IRS)可能要求检查某个人最近15年的历史。实际上,档案文件恰恰是在给定时间内工作的一个"快照"。
(6)输出文件。输出文件包含将要打印在打印机上的、显在屏幕上的或者绘制在绘图仪上的那些信息的数值映象。输出文件可以是"假脱机的"(存储在辅存设备上),当输出设备可
用时才进行实际的输出。
在空间数据库的逻辑设计中,往往将不同类,不同级的地理要素进行分层存放,每一层存放一种专题或一类信息。按照用户一定的需求或标准把某些地理要素组合在一起成为图层,它表示地理特征以及描述这些特征的属性的逻辑意义上的集合。在同一层信息中,数据一般具有相同的几何特征和相同的属性特征。
对空间数据进行分层管理,能提高数据的管理效率,便于数据的二次开发与综合利用,实现资源共享。同时,它也是满足多用户不同需要的有效手段,各用户可以根据自己的需要,将不同内容的图层进行分离、组合和叠加,形成自己需要的专题图。
空间数据分层可以按专题、时间、垂直高度等方式来划分。按专题分层就是每层对应一个专题,包含一种或几种不同的信息。专题分层就是根据一定的目的和分类指标对地理要素进行分类,按类设层,每类作为一个图层,对每一个图层赋予一个图层名。分类可以从性质、用途、形状、尺度、色彩等5个方面的因素考虑。按时间序列分层则可以从不同时间或时期进行划分,时间分层便于对数据的动态管理,特别是对历史数据的管理。按垂直高度划分是以地面不同高层来分层,这种分层从二维转化为三维,便于分析空间数据的垂向变化,从立体角度去认识事物的构成。
空间数据分层要考虑如下一些问题:
(1)数据具有同样的特性,也可以说是具有相同的属性信息。
(2)按要素类型分层,性质相同或相近的要素应放在同一层。
(3)即使是同一类型的数据,有时其属性特征也不相同,所以应该分层存储《
(4)分层时要考虑数据与数据之间的关系,如哪些数据有公共边,哪些数据之间有隶属关系等。很多数据之间都具有共同或重叠的部分,即多重属性的问题,这些因素都将影响层的设置。
(5)分层时要考虑数据与功能的关系,如哪些数据经常在一起使用,哪些功能是起主导作用的功能。考虑功能之间的关系,不同类型的数据由于其应用功能相同,在分析和应用时往往会同时用到,因此在设计时应反映这样的需求,可以将此类数据设计为同一专题层。例如,水系包括多边形水体(湖泊、水库等)、线状水体(河流、小溪等)和点状水体(井、泉等)。由于多边形的湖泊、水库,线状的河流、小溪和点状的井、泉等在功能上有着不可分割、相互依赖的关系,在设计上可将这3种类型的数据组成同一个专题数据层
(6)分层时应考虑更新的问题。数据库中各类数据的更新可能使用各种不同的数据源,更新一般以层为单位进行处理,在分层中应考虑将变更频繁的数据分离出来,使用不同数据源更新的数据也应分层进行存储,以便更新。
(7)比例尺的一致性。
(8)同一层数据会有同样的使用目的和方式。
(9)不同部门的数据通常应该放人不同的层,这样便于维护。
(10)数据库中需要不同级别安全处理的数据也应该单独存储。
(11)分层印应顾及数据量的大小,各层数据的数据量最好比较均衡。
(12)尽量减少冗余数据。
我也是学GIS的,就自己的理解说一下吧。
GIS重点在空间信息的处理,优势在空间分析。
举例来说吧,现在导航已经逐渐走进我们的生活了,那么导航时位置的获取是GPS,但是真正的导航,在地图上显示你的位置,地图的组织,到目的地最短路径的计算和显示,都是GIS在做。打个比方就是,GPS是眼睛,那么GIS就是大脑,它指挥你处理你获取的信息并作出指示,向哪里走,怎么到目的地。
因而,你可以简单的理解GIS为综合分析和处理空间数据的技术。通常,地图是GIS的表现形式,但是GIS深层是空间信息的处理,所以你从GIS地图上可以获取地理空间信息的直观的印象,更可以通过GIS获取大量的其它信息,如地物与周边地物的关系(主要是拓扑关系,相邻,包含,相离),地物的某一属性的影响范围,如公路对周边多大范围有噪音污染(缓冲区分析)等。GIS让你可以所见即所得,获取地图上的大量信息。而且,由于GIS将属性信息和空间信息相结合,你可以更加直观的理解这些信息。比如,全国人口分布,你可以从一张表上看到各个省份的人口数目,但是那样不容易直观感受,但是用GIS,你可以从地图上分块获取各个省份的人口数目和相对多少,找了张图,不是很好,因为GIS可以在地图上拉出很多柱状,表明人口数,这样,你是不是不仅可以获取人口数,也可以直观看到分布,以及各省人口数呢?呵呵,GIS是很强大的。
再举个例子吧。有一块地,地面不平,坡度不一,土壤有酸碱度,灌溉有条件,土壤含水量等等多种属性,你如何决定土地作何用?如果种地种什么合适?一块地,请一个专家也许花几天也可以出来,但是如果是大量的土地呢?这时,GIS的优势就显示出来了,它可以轻松通过GIS算法处理出来,而且更加科学高效。
相信说了这么多,你应该有些直观感受了。再说说GIS的用途吧。简单的说一下吧。像国土规划,这么大的数据量,还有众多的属性信息,如房屋权属,用途,何时建立,属于哪个行政单位等等,出了GIS,还有谁这么厉害呢?CAD在图形方面可以,属性不行的。制图就不说了,看来你是用过的。交通方面,就说这个最短路径就行,你到某地如何走用时最少或者最近?GIS来帮你!旅游方面类似,如何最短的路径游玩最多的地方?GIS可以帮你。公共安全方面,消防站建在哪里可以覆盖最大面积,同时不与其它的消防站覆盖面相重合?同时到各个地方路径比较短?GIS可以做。。。。。。等等,GIS用途很广的,你关注一下,会发现很多地方都用到了GIS。
至于WebGIS,简单理解是因为地理数据的分布存储以及应用,还有网络化的原因。像Google地图和百度地图不就是吗?
呵呵,说了这么多了,希望对你有帮助。相信GIS会越来越广泛的应用于我们身边,使我们的生活更加方便。
以上都是自己的理解和体会,有不对的地方还请大家指出,谢了!
数据库因不同的应用要求会有各种各样的组织形式。数据库的设计就是根据不同的应用目的和用户要求,在一个给定的应用环境中,确定最优的数据模型、处理模式、存贮结构、存取方法,建立能反映现实世界的地理实体间信息之间的联系,满足用户要求,又能被一定的DBMS接受,同时能实现系统目标并有效地存取、管理数据的数据库。简言之,数据库设计就是把现实世界中一定范围内存在着的应用数据抽象成一个数据库的具体结构的过程。
空间数据库的设计是指在现在数据库管理系统的基础上建立空间数据库的整个过程。主要包括需求分析、结构设计、和数据层设计三部分。
1、需求分析
需求分析是整个空间数据库设计与建立的基础,主要进行以下工作:
1)调查用户需求:
了解用户特点和要求,取得设计者与用户对需求的一致看法。
2)需求数据的收集和分析:
包括信息需求(信息内容、特征、需要存储的数据)、信息加工处理要求(如响应时间)、完整性与安全性要求等。
3)编制用户需求说明书:
包括需求分析的目标、任务、具体需求说明、系统功能与性能、运行环境等,是需求分析的最终成果。
需求分析是一项技术性很强的工作,应该由有经验的专业技术人员完成,同时用户的积极参与也是十分重要的。
在需求分析阶段完成数据源的选择和对各种数据集的评价
2、结构设计
指空间数据结构设计,结果是得到一个合理的空间数据模型,是空间数据库设计的关键。空间数据模型越能反映现实世界,在此基础上生成的应用系统就越能较好地满足用户对数据处理的要求。
空间数据库设计的实质是将地理空间实体以一定的组织形式在数据库系统中加以表达的过程,也就是地理信息系统中空间实体的模型化问题。
1)概念设计
概念设计是通过对错综复杂的现实世界的认识与抽象,最终形成空间数据库系统及其应用系统所需的模型。
具体是对需求分析阶段所收集的信息和数据进行分析、整理,确定地理实体、属性及它们之间的联系,将各用户的局部视图合并成一个总的全局视图,形成独立于计算机的反映用户观点的概念模式。概念模式与具体的DBMS无关,结构稳定,能较好地反映用户的信息需求。
表示概念模型最有力的工具是E-R模型,即实体-联系模型,包括实体、联系和属性三个基本成分。用它来描述现实地理世界,不必考虑信息的存储结构、存取路径及存取效率等与计算机有关的问题,比一般的数据模型更接近于现实地理世界,具有直观、自然、语义较丰富等特点,在地理数据库设计中得到了广泛应用。
2)逻辑设计
在概念设计的基础上,按照不同的转换规则将概念模型转换为具体DBMS支持的数据模型的过程,即导出具体DBMS可处理的地理数据库的逻辑结构(或外模式),包括确定数据项、记录及记录间的联系、安全性、完整性和一致性约束等。导出的逻辑结构是否与概念模式一致,能否满足用户要求,还要对其功能和性能进行评价,并予以优化。
从E—R模型向关系模型转换的主要过程为:
①确定各实体的主关键字;
②确定并写出实体内部属性之间的数据关系表达式,即某一数据项决定另外的数据项;
③把经过消冗处理的数据关系表达式中的实体作为相应的主关键字
④根据②、③形成新的关系。
⑤完成转换后,进行分析、评价和优化。
3)物理设计
物理设计是指有效地将空间数据库的逻辑结构在物理存储器上实现,确定数据在介质上的物理存储结构,其结果是导出地理数据库的存储模式(内模式)。主要内容包括确定记录存储格式,选择文件存储结构,决定存取路径,分配存储空间。
物理设计的好坏将对地理数据库的性能影响很大,一个好的物理存储结构必须满足两个条件:一是地理数据占有较小的存储空间;二是对数据库的 *** 作具有尽可能高的处理速度。在完成物理设计后,要进行性能分析和测试。
数据的物理表示分两类:数值数据和字符数据。数值数据可用十进制或二进制形式表示。通常二进制形式所占用的存贮空间较少。字符数据可以用字符串的方式表示,有时也可利用代码值的存贮代替字符串的存储。为了节约存贮空间,常常采用数据压缩技术。
物理设计在很大程度上与选用的数据库管理系统有关。设计中应根据需要,选用系统所提供的功能。
4)数据层设计
大多数GIS都将数据按逻辑类型分成不同的数据层进行组织。数据层是GIS中的一个重要概念。GIS的数据可以按照空间数据的逻辑关系或专业属性分为各种逻辑数据层或专业数据层,原理上类似于的叠置。例如,地形图数据可分为地貌、水系、道路、植被、控制点、居民地等诸层分别存贮。将各层叠加起来就合成了地形图的数据。在进行空间分析、数据处理、图形显示时,往往只需要若干相应图层的数据。
数据层的设计一般是按照数据的专业内容和类型进行的。数据的专业内容的类型通常是数据分层的主要依据,同时也要考虑数据之间的关系。如需考虑两类物体共享边界(道路与行政边界重合、河流与地块边界的重合)等,这些数据间的关系在数据分层设计时应体现出来。
不同类型的数据由于其应用功能相同,在分析和应用时往往会同时用到,因此在设计时应反映出这样的需求,即可将这些数据作为一层。例如,多边形的湖泊、水库,线状的河流、沟渠,点状的井、泉等,在GIS的运用中往往同时用到,因此,可作为一个数据层。
5)数据字典设计
数据字典用于描述数据库的整体结构、数据内容和定义等。 数据字典的内容包括: 1)数据库的总体组织结构、 数据库总体设计的框架 。 2)各数据层详细内容的定义及结构、 数据命名的定义 。 3)元数据(有关数据的数据,是对一个数据集的内容、质量条件及 *** 作过程等的描述) 。
意义:GIS基础软件技术是地理信息领域软件技术的制高点,是整个产业链条的关键。发展GIS基础软件对我国地理信息产业发展和保证国家地理信息安全至关重要。
方法:大数据与GIS的结合正在改变传统地理研究与分析方法,也在悄然改变GIS的服务形态。IT新技术的融入,不断丰富和提升地理智慧的内核。而爆发式增长的市场需求,又为GIS技术的创新和应用发展提供了新的动力。
扩展资料
超图集团正式对外发布了基于大数据架构的GIS基础软件产品SuperMap GIS 9D,其在大数据GIS技术、新一代三维GIS技术、云端一体化GIS技术、跨平台GIS技术四大方面取得了全新进展和突破,
满足大数据应用、新型智慧城市和新型测绘等应用需求,解决了海量时空数据分布式管理、高性能、高可信分布式计算的新难题,以及传统GIS复杂图示制图与空间分析的老问题,开创了GIS与大数据等技术融合发展和创新应用的新格局。
此次会议围绕大数据领域的探索实践、GIS与空间大数据融合、大数据时代的地理信息应用转型升级、新一代三维GIS技术创新与应用、中国GIS的国际化探索等话题,测绘地信主管部门,阿里、腾讯等互联网企业,
超图等GIS基础软件企业,相关科研机构,众多海内外GIS用户单位的相关专家在主题大会环节呈现了数十场精彩报告,共同探讨大数据时代的GIS技术创新发展与应用落地。
参考资料来源:中国经济网——2017地理信息软件技术大会在京举办
以上就是关于数据库的概念及用途全部的内容,包括:数据库的概念及用途、数据库中空间数据是如何进行分幅分层的、Gis到底有哪些应用等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)