数据库概念模型

数据库概念模型,第1张

一、航空物探数据库定位

数据库是信息系统的基础和核心,把大量的数据信息按一定的模型组织起来存储在数据库中,提供数据维护、数据检索等功能,使信息系统能方便、及时、准确地从数据库中获得所需的信息。因此,数据库结构设计是信息系统开发的重中之重。

经分析航空物探数据具有空间性、海量性、多源性和多尺度的特点,这说明航空物探数据具有典型的空间数据的特点,可以采用空间数据管理方式进行管理。

ESRI公司的Geodatabase(空间数据库)是采用标准关系数据库技术来表现地理信息的面向对象的高级GIS数据模型,是建立在DBMS之上的统一的、智能化的空间数据模型,是以一组相关联的表来表达地理要素之间关系、有效性规则和值域。对于多源、海量的航空物探数据,Geodatabase能在一个统一的模型框架下很好地解决多源数据一体化存储的问题,和采用标准关系数据库技术来表现海量航空物探数据的地理信息特性。Geoda-tabase引入了地理空间实体的行为、有效性规则和关系,在处理Geodatabase中对象时,对象的基本行为和必须满足的规则无需通过程序编码实现,只需根据需要扩展其有效性规则(Geodatabase面向对象的智能化特性),即可支持航空物探数据模型扩展的需要。

因此,航空物探数据库是空间数据库,在航空物探数据库建模过程中,以空间数据建模为主导,统领属性数据建模。

二、统一空间坐标框架

为了用数学语言描述地球,人们用规则的几何形体来替代地球表面,从地球自然表面、大地水准面、旋转椭球面直到用简单数学函数表达的参考椭球体,以便通过地图投影将三维曲面转化成二维平面。由于地球表面不同地区的地形起伏差异很大,采用单一椭球体势必会造成某地区的误差小而其他地区误差很大的结果。因此,在20世纪初不同国家或地区先后采用了逼近本国或本地区地球表面的椭球体,如中国的克拉索夫斯基椭球体,美国的海福特椭球体、英国的克拉克椭球体等。这又造成了目前世界各国的地理信息空间坐标框架不统一,空间数据信息难以共享被动局面。为此,在实现数字地球计划中,必须规范和统一世界上不同国家和地区的地球参考椭球体。

在小区域表达地球表面时,通常采用平面的方式,即投影坐标系统。如何科学地选择投影坐标,一般要根据具体的地学应用、地理区域和范围、比例尺条件等因素来确定,不同的国家有着不同的规定。

通过对航空物探数据的坐标系统进行分析可知,航空物探图件的坐标框架与国家对基本比例尺制图的规定相一致,即小比例尺编图采用Lambert双标准纬线等角圆锥投影;中比例尺采用Gauss6°带的分带投影;大比例尺采用Gauss3°带的分带投影(表2-1);对于低纬度的海上作业区通常采用Mecator等角圆柱投影。地球椭球体分别采用1954北京坐标系的Krassovsky椭球参数、WGS84椭球参数和未来的国家2000坐标系的椭球参数。

表2-1 航空物探地理坐标数据的投影方式

传统的航空物探数据是按测区管理的,根据测区的测量比例尺来确定相应的坐标框架;因此,勘探目标不同的测区测量比例尺是不一致的,地坐标框架也不同。航空物探数据库要将不同测区、不同比例尺、不同坐标框架的数据集中管理和可视表达,若没有统一的空间坐标框架,就不可能正确地表达全国航空物探数据。所以,面对如此复杂的多坐标框架的航空物探数据,如何确定科学合理的空间坐标框架,将全国的航空物探数据整合到统一的空间参考框架下,实现数据的统一存储和数据间无缝拼接,是航空物探数据库建设的关键所在,是组织和管理多维、多格式、大跨度、跨平台的航空物探数据和多目标数字制图的数学基础。

统一的空间坐标框架必须支持我国领土覆盖的海域和陆域航空物探数据的存储和表达。我国领土东西跨度达70°,南北达55°,显然采用任何投影坐标系都是不合适的。Gauss6°投影适合6°带内空间数据表达,若全国航物探数据采用6°分带表达,在高纬度地区会造成6°带间数据裂缝问题;Lambert投影可满足数据的无缝表达,但对大比例尺数据变形较大,无法满足数据制图的精度要求;Mecator投影也可满足数据的无缝表达,低纬度地区也能满足大比例尺数据制图的精度要求,但在我国中高纬度区存在着严重变形问题。所以,航空物探数据模型采用地理坐标(无投影,图2-1)格式存放,可根据实际应用的需要将航空物探数据变换到任何方式的投影坐标系统。

航空物探数据库模型采用Beijing_1954地理坐标系,相关参数如下:

角度单位:°(0017453292519943299rad)

零经线:格林尼治(0000000000000000000)

基准:D_Beijing_1954

椭球:Krasovsky_1940

长轴半径:6378245000m

短轴半径:6356863019m

建立统一坐标框架是空间数据库建设的一项基础性工作,采用Beijing_1954地理坐标系作为航空物探数据库统一空间坐标框架具有以下优点。

图2-1 统一空间坐标框架示意图

(一)无缝空间数据存储

统一空间坐标框架解决了复杂的航空物探数据的坐标系统、投影、比例尺等不统一的问题,实现同一性质的物探数据在同一个主题中进行管理。如全国的航磁异常数据可放在一个图层上进行管理。

(二)适合多尺度表达

按测区管理的多尺度、多框架的航空物探数据是处于一个相对坐标系统中,各个测区间相对位置关系会发生错位。采用统一的Beijing_1954地理坐标框架,恢复了各测区间正确的位置关系,实现不同尺度数据的集成和正确表达,易于多源异构空间数据的融合。

(三)大区域数据集成

我国海陆面积近1300×104km2,地域跨度较大。在进行小比例尺的航空物探编图时,需要选用与之相适应的投影坐标;在陆地和海域进行大比例尺制图时,同样需要选用合适投影系统。航空物探制图的实践也证明了这一点。1995年6月由中国、加拿大、美国、爱尔兰和俄罗斯等国科学家共同编制的1:1000万欧亚东北地区磁异常与大地构造图,采用横轴Mercator投影。中心编制的1:500万全国航磁图采用Lambert投影。2008年,由中国和吉尔吉斯斯坦科学家编制的1:100万中吉天山金属矿产成矿规律图,采用Lambert投影,将两个国家不同时期、不同尺度的数据进行了有效的集成,是地质、地球物理等综合应用的典范。

随着航空物探数据应用领域的不断扩展,陆地、海域,甚至于洲际和全球航空物探数据的整体表达都需对坐标投影提出要求。采用统一的地理坐标框架的航空物探数据非常容易变换到指定的投影坐标框架,满足多样化的制图要求。

三、要素类和对象类的划分

Geodatabase空间数据库模型结构(图2-2)分为空间数据库、要素数据集(Feature dataset)、要素类(Feature classes)、要素(Feature)4个层次。为了建立航空物探Geoda-tabase空间数据模型,我们依据Geodatabase模型关于要素类和对象类的划分原则,结合相关的国家标准和地球物理行业标准,制定了《航空物探数据要素类和对象类划分标准》,对航空物探数据进行数据分类。

图2-2 空间数据库模型结构

1)按照航空物探数据的空间特征,将其划分为5个要素数据集,即勘查项目概况要素数据集、基础数据要素数据集、异常要素数据集、解释要素数据集和评价要素数据集。

2)根据航空物探测量方法、数据处理过程以及推断解释方法和过程,进一步把航空物探数据划分为若干要素类和对象类,定义了要素类的主题特征和表达方式,确定子类和属性域;定义对象类的结构和联接字段,建立了关系类。

3)定义要素类的内容、字段名称和存储结构。在航空物探数据采集过程中,不同类型的数据采样率不同,坐标数据采样2次/s,重力场数据采样2次/s,磁场数据采样10次/s,这就造成了场值数据与坐标数据无法一一对应问题。若按场值数据采样率内插坐标数据,将导致数据量成倍增长;若按坐标数据采样率抽稀场值数据,将降低航空物探测量对地质体的分辨能力,影响测量效果。在综合分析航空物探数据应用基础上,提出了采用要素数据与属性数据分置的方式,将测线坐标数据与地球物理场数据分离,分别建立独立共享的航迹线数据要素类模型,磁场、重力场等数据对象类模型(图2-3),很好地解决了航空物探数据的存储问题。

图2-3 要素数据与属性数据分置示意图

采用要素数据与属性数据分置方式,不仅是基于航空物探数据属性数据的多源性、不同采样频率等特点的考虑,还考虑到数据的综合查询和检索的速度,特别是通过ArcSDE访问空间数据库的效率的问题。再者,对于大部分用户来说,需求是属性数据的综合应用,因此在数据库建模过程中,将属性数据采用对象类的方式进行管理,不但提高了空间数据的 *** 作能力,同时在ArcSDE的配置上采用直接访问数据库(对象类)方式,并且加快了数据查询和统计的速度。

四、数据库概念模型

用户需求是数据库建设的约束条件之一。航空物探数据的空间特性决定航空物探数据库必须是空间数据库,采用数据库管理数据,利用GIS技术提供可视化服务,这是各个层次用户的一致要求。因此,我们从现实世界出发,对航空物探数据的多源性、多尺度和不同采样等问题进行了描述,提出了解决方案。此方案是不依赖于任何具体的硬件环境和数据库管理系统(DBMS),建立了客观反映现实世界的航空物探数据库概念模型,把用户需要管理的信息统一到整体概念结构中,表达了用户需要。

在全面分析航空物探业务流程和数据流程,以及航空物探数据特性的基础上,按照《航空物探数据要素类和对象类划分标准》,以及空间实体点、线、面要素特征的基本原则,对航空物探数据库所涉及的实体进行归类,划分成12个主题。根据空间数据分主题表达的特点和航空物探空间数据坐标框架的定义,确定航空物探数据库空间数据概念模型,明确各个主题的用途、数据来源、表达方式、空间参考、比例尺和精度等内容,按照ArcGIS定义空间数据库的数据分层表达方式(图2-4),完成航空物探数据库概念模型设计(图2-5)。

图2-4 航空物探数据库空间数据分层模型

图2-5 航空物探数据库空间数据概念模型

当前常见的三种数据库数据模型是:层次模型、网状模型、关系模型。

相关知识点介绍

数据库模型描述了在数据库中结构化和 *** 纵数据的方法,模型的结构部分规定了数据如何被描述(例如树、表等)。模型的 *** 纵部分规定了数据的添加、删除、显示、维护、打印、查找、选择、排序和更新等 *** 作。

数据库模型的分类

1、概念模型

2、层次模型

3、网状模型

4、关系模型

5、面向对象模型

一般意义上的模型的表现形式可以分为物理模型、数学模型、结构模型和仿真模型。

纬度数据库所描述的关系模式就是关系的描写关系模式,首先描绘与关系对应的两个维度的表结构,这些关系中都包含着一些属性,这些属性都来自于固定的领域,以及与域之间的映象关系。 

关系是n个域的笛卡儿积的子集,组成关系的元组必须是笛卡儿积中使n目谓词为真的元组,所有有可能的关系必须满足非常完整并且基础的约束条件,而关系模式也要把这个约束条件描述出来。

在这其中关系模式和关系的区别就在于关系模式,主要就是描述一些数据结构的语句意思,而关系是一个数据的集合,是关系的值,是关系模式的一个关系实例。

数据库维度的基本概念:

1、多维数据集。多维数据集是联机分析处理(OLAP)中的主要对象,是一项可对数据仓库中的数据进行快速访问的技术。多维数据集是一个数据集合,通常从数据仓库的子集构造,并组织和汇总成一个由一组维度和度量值定义的多维结构。

2、xx(dimension)是多维数据集的结构性特性。它们是事实数据表中用来描述数据的分类的有组织层次结构(级别)。这些分类和级别描述了一些相似的成员集合,用户将基于这些成员集合进行分析。

3、度量值。在多维数据集中,度量值是一组值,这些值基于多维数据集的事实数据表中的一列,而且通常为数字。此外,度量值是所分析的多维数据集的中心值。

即,度量值是最终用户浏览多维数据集时重点查看的数字数据。您所选择的度量值取决于最终用户所请求的信息类型。一些常见的度量值有sales、cost、expenditures和productioncount等。

4、元数据。不同OLAP组件中的数据和应用程序的结构模型。元数据描述OLTP数据库中的表、数据仓库和数据集市中的多维数据集这类对象,还记录哪些应用程序引用不同的记录块。

5、级别。级别是维度层次结构的一个元素。级别描述了数据的层次结构,从数据的最高(汇总程度最大)级别直到最低(最详细)级别。

6、数据挖掘。数据挖掘使您得以定义包含分组和预测规则的模型,以便应用于关系数据库或多维OLAP数据集中的数据。之后,这些预测模型便可用于自动执行复杂的数据分析,以找出帮助识别新机会并选择有获胜把握的机会的趋势。

7、多维OLAP(MOLAP)。MOLAP存储模式使得分区的聚合和其源数据的复本以多维结构存储在分析服务器计算机上。根据分区聚合的百分比和设计,MOLAP存储模式为达到最快查询响应时间提供了潜在可能性。总而言之,MOLAP更加适合于频繁使用的多维数据集中的分区和对快速查询响应的需要。

8、关系OLAP(ROLAP)。ROLAP存储模式使得分区的聚合存储在关系数据库的表(在分区数据源中指定)中。但是,可为分区数据使用ROLAP存储模式,而不在关系数据库中创建聚合。

9、数据钻取。最终用户从常规多维数据集、虚拟多维数据集或连接多维数据集中选择单个单元,并从该单元的源数据中检索结果集以获得更详细的信息,这个 *** 作过程就是数据钻取。

10、数据挖掘模型。数据挖掘使您得以定义包含分组和预测规则的模型,以便应用于关系数据库或多维OLAP数据集中的数据。之后,这些预测模型便可用于自动执行复杂的数据分析,以找出帮助识别新机会并选择有获胜把握的机会的趋势。

一 Oracle OLAP 组件 说明

有关Oracle 的所有组件的说明,参考:

Oracle8i/9i/10g/11g 组件(Components) 说明

联机分析处理OLAP(On-Line Analytical Processing), 也称DSS决策支持系统。OLAP是数据仓库系统的主要应用,支持复杂的分析 *** 作,侧重决策支持,并且提供直观易懂的查询结果。

OLAP是Oracle数据库企业版的一个多维分析引擎,采用oracle数据库来存储OLAP数据和元数据。

在OLAP中,语句的执行量不是考核标准,因为一条语句的执行时间可能会非常长,读取的数据也非常多。所以,在这样的系统中,考核的标准往往是磁盘子系统的吞吐量(带宽),如能达到多少MB/s的流量。

更多内容参考:

OracleOLAP 与 OLTP 介绍

在添加OLAP 组件的情况下,如果我们做32到64位的DB迁移,都会需要重建OLAP 组件,否则就会导致大量的无效对象的存在。 而这个重建工作又需要近40分钟,所以是个很耗时间的过程。

Oracle OLAP是Oracle企业版的一个可选件,由于将OLAP引擎完全集成进了Oracle数据库,所以,所有数据和元数据都是从Oracle数据库内部进行存储和管理的,以提供高度可伸缩性、强健的管理环境及工业级可用性和安全性。

11 OLAP 组件

可以使用如下SQL 查看OLAP组件的状态和版本信息:

SQL> column comp_name format a35

SQL> col version for a15

SQL> set wrap off

--Oracle11g:

SQL> select comp_name, version, statusfrom dba_registry where comp_name like '%OLAP%';

COMP_NAME VERSION STATUS

-------------------------------------------------- ----------------------

OLAP Analytic Workspace 112030 INVALID

Oracle OLAP API 112030 VALID

OLAP Catalog 112030 VALID

--Oracle 10g:

SYS@ wangou > select comp_name, version,status from dba_registry where comp_name like '%OLAP%';

COMP_NAME VERSION STATUS

-------------------------------------------------- ----------------------

OLAP Analytic Workspace 102050 VALID

Oracle OLAP API 102050 VALID

OLAP Catalog 102050 VALID

Oracle OLAP主要包括以下组件:

(1)OLAP Analytic Engine

Oracle的OLAP分析引擎是一个基于多维模型的MOLAP引擎,运行在Oracle内核中,因此拥有良好的性能。

(2)Analytic Workspace

分析工作区中实际存储多维模型的数据。一个Analytic Workspace存储为一个关系表,分析工作区中的不同对象存储为表中的一行(LOB格式)。分析工作区甚至可以存储在分区表中,以提供更好的并发性能。

(3)OLAP DML

OLAP DML是Analytic Workspace的原始 *** 作语言,包括关于Analytic Workspace的数据定义语言(DDL)和数据 *** 作语言(DML)。对于Analytic Workspace的所有 *** 作方式,比如GUI工具,java和SQL等方式,最终都要转化为Oracle DML语言。

(4)SQL Interface to OLAP

提供使用SQL *** 作AnalyticWorkspace的接口,该接口使用PL/SQL实现。

(5)Analytic Workspace Java API

提供使用Java *** 作AnalyticWorkspace的接口。在GUI工具Analytic Workspace Manager中使用的就是该接口。

(6)OLAP API

Oracle OLAP的一个Java编程接口,支持OracleBI Bean。

12 Oracle OLAP的两个客户端工具:

(1)Analytic Workspace Manager

这是Oracle提供的一个 *** 作AnalyticWorkspace的一个图形工具。使用该工具可以快速的完成诸如定义数据的逻辑多维模型、创建多维数据到关系数据的映射、装载和聚合数据等任务。

(2)OLAP Worksheet

OLAP Worksheet提供了 *** 作Analytic Workspace的一个交互式环境。有点类似于Oracle数据库的SQLPLUS工具。

13 Active Catalog View(活动目录视图)

Active CatalogView,活动目录视图,是Oracle为OLAP用户提供的一系列动态视图,用于提供分析工作区(Analytic Workspace)中的对象信息。Analytic workspace是用户session和Oracle OLAP引擎交互所必须的接口,也是dimension,cube的对象的容器。

在Oracle OLAP中,Analytic workspace的概念有点类似与数据库中的schema,也是一组相关对象的集合。但是Analytic workspace会使用一个名为aw$name的table来实际的存储analyticworkspace中的对象 (dimension,cube,level,attribute等)。有时候,我们可能需要将一个analytic workspace从一个系统迁移到另外一个系统,也可能需要将一个analytic workspace的内容迁移到另外一个analytic workspace中,利用Analytic Workspace Manager可以在图形界面下完成该任务,首先将一个aw导出为EIF文件,然后将EIF导入到另外一个aw即可。

OLAP 多维模型中的一些主要对象,如dimension(维度),measure(度量),cube(数据立方体),hierarchy(层 次),level(层),attribute(属性)等,都有对应的活动目录视图,根据视图的名字基本可以判断该视图中的内容,Oracle10g所有的 活动目录视图都以ALL_OLAP2_AW开头:

(1) ALL_OLAP2_AWS

(2) ALL_OLAP2_AW_ATTRIBUTES

(3) ALL_OLAP2_AW_CATALOGS

(4) ALL_OLAP2_AW_CATALOG_MEASURES

(5) ALL_OLAP2_AW_CUBES

(6) ALL_OLAP2_AW_CUBE_AGG_LVL

(7) ALL_OLAP2_AW_CUBE_AGG_MEAS

(8) ALL_OLAP2_AW_AGG_OP

(9) ALL_OLAP2_AW_CUBE_AGG_SPECS

(10) ALL_OLAP2_AW_CUBE_DIM_USES

(11) ALL_OLAP2_AW_CUBE_MEASURES

(12) ALL_OLAP2_AW_DIMENSIONS

(13) ALL_OLAP2_AW_DIM_HIER_LVL_ORD

(14) ALL_OLAP2_AW_DIM_LEVELS

(15) ALL_OLAP2_AW_PHYS_OBJ

(16) ALL_OLAP2_AW_PHYS_OBJ_PROP

除了活动目录视图,Oracle也提供了几个动态性能视图,用于展示OLAP对象的一些统计信息,这些DynamicPerformance View都以V$AW开头:

(1) v$aw_aggregate_op

(2) v$aw_allocate_op

(3) v$aw_calc

(4) v$aw_longops

(5) v$aw_olap

(6) v$aw_session_info

以上理论知识转自ningoo的blog:

>

数据仓库系统的三个工具层数据仓库系统通常采用3层的体系结构,底层为数据仓库服务器,中间层为OLAP服务器,顶层为前端工具。具体如下:

1、数据源和数据的存储与管理部分可以统称为数据仓库服务器。

(1)数据源:是数据仓库系统的基础,是整个系统的数据源泉。通常包括企业内部信息和外部信息。内部信息包括存放于RDBMS中的各种业务处理数据和各类文档数据。外部信息包括各类法律法规、市场信息和竞争对手的信息,等等。

(2)数据的存储与管理:是整个数据仓库系统的核心。数据仓库的真正关键是数据的存储和管理。数据仓库的组织管理方式决定了它有别于传统数据库,同时也决定了其对外部数据的表现形式。要决定采用什么产品和技术来建立数据仓库的核心,则需要从数据仓库的技术特点着手分析。针对现有各业务系统的数据,进行抽取、清理,并有效集成,按照主题进行组织。数据仓库按照数据的覆盖范围可以分为企业级数据仓库和部门级数据仓库(通常称为数据集市)。

2、OLAP服务器:对分析需要的数据进行有效集成,按多维模型予以组织,以便进行多角度、多层次的分析,并发现趋势。其具体实现可以分为:ROLAP、MOLAP和HOLAP。ROLAP基本数据和聚合数据均存放在RDBMS之中;MOLAP基本数据和聚合数据均存放于多维数据库中;HOLAP基本数据存放于RDBMS之中,聚合数据存放于多维数据库中。

3、前端工具:主要包括各种报表工具、查询工具、数据分析工具、数据挖掘工具,以及各种基于数据仓库或数据集市的应用开发工具。其中数据分析工具主要针对OLAP服务器,报表工具、数据挖掘工具主要针对数据仓库。

数据模型主要有三种:层次模型、网状模型和层次模型、网状模型和关系模型。

三种模型的特点如下:

1、层次模型 :满足以下二个条件的基本层次联系的集合:

有且只有一个结点没有双亲结点。除根结点外的其他结点有且只有一个双亲结点。2、网状模型 :满足以下二个条件的基本层次联系的集合:

允许一个以上的结点没有双亲结点。一个结点可以有多个双亲结点。3、关系模型

关系模型用表的集合来表示数据和数据间的联系。每个表有多个列,每列有唯一的列名在关系模型中,无论是从客观事物中抽象出的实体,还是实体之间的联系,都用单一的结构类型“关系”来表示。

以上就是关于数据库概念模型全部的内容,包括:数据库概念模型、数据库模型分为哪三类、维度数据库采用什么来描述数据或关系等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/9670177.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-30
下一篇 2023-04-30

发表评论

登录后才能评论

评论列表(0条)

保存