mysql
数据库是什么数据模型
MySQL是一种开放源代码的关系型数据库管理系统(RDBMS),MySQL数据库系统使用最常用的数据库管理语言--结构化查询语言(SQL)进行数据库管理。
1、数据采集
了解数据采集的意义在于真正了解数据的原始面貌,包括数据产生的时间、条件、格式、内容、长度、限制条件等。
2、数据存储
无论数据存储于云端还是本地,数据的存储不只是我们看到的数据库那么简单。
3、数据提取
数据提取是将数据取出的过程,数据提取的核心环节是从哪取、何时取、如何取。
4、数据挖掘
数据挖掘是面对海量数据时进行数据价值提炼的关键。
5、数据分析
数据分析相对于数据挖掘更多的是偏向业务应用和解读,当数据挖掘算法得出结论后,如何解释算法在结果、可信度、显著程度等方面对于业务的实际意义,如何将挖掘结果反馈到业务 *** 作过程中便于业务理解和实施是关键。
6、数据展现
数据展现即数据可视化的部分,数据分析师如何把数据观点展示给业务的过程。数据展现除遵循各公司统一规范原则外,具体形式还要根据实际需求和场景而定。
7、数据应用
数据应用是数据具有落地价值的直接体现,这个过程需要数据分析师具备数据沟通能力、业务推动能力和项目工作能力。
数据库是信息系统的基础和核心,把大量的数据信息按一定的模型组织起来存储在数据库中,提供数据维护、数据检索等功能,使信息系统能方便、及时、准确地从数据库中获得所需的信息。因此,数据库结构设计是信息系统开发的重中之重。
经分析航空物探数据具有空间性、海量性、多源性和多尺度的特点,这说明航空物探数据具有典型的空间数据的特点,可以采用空间数据管理方式进行管理。
ESRI公司的Geodatabase(空间数据库)是采用标准关系数据库技术来表现地理信息的面向对象的高级GIS数据模型,是建立在DBMS之上的统一的、智能化的空间数据模型,是以一组相关联的表来表达地理要素之间关系、有效性规则和值域。对于多源、海量的航空物探数据,Geodatabase能在一个统一的模型框架下很好地解决多源数据一体化存储的问题,和采用标准关系数据库技术来表现海量航空物探数据的地理信息特性。Geoda-tabase引入了地理空间实体的行为、有效性规则和关系,在处理Geodatabase中对象时,对象的基本行为和必须满足的规则无需通过程序编码实现,只需根据需要扩展其有效性规则(Geodatabase面向对象的智能化特性),即可支持航空物探数据模型扩展的需要。
因此,航空物探数据库是空间数据库,在航空物探数据库建模过程中,以空间数据建模为主导,统领属性数据建模。
二、统一空间坐标框架
为了用数学语言描述地球,人们用规则的几何形体来替代地球表面,从地球自然表面、大地水准面、旋转椭球面直到用简单数学函数表达的参考椭球体,以便通过地图投影将三维曲面转化成二维平面。由于地球表面不同地区的地形起伏差异很大,采用单一椭球体势必会造成某地区的误差小而其他地区误差很大的结果。因此,在20世纪初不同国家或地区先后采用了逼近本国或本地区地球表面的椭球体,如中国的克拉索夫斯基椭球体,美国的海福特椭球体、英国的克拉克椭球体等。这又造成了目前世界各国的地理信息空间坐标框架不统一,空间数据信息难以共享被动局面。为此,在实现数字地球计划中,必须规范和统一世界上不同国家和地区的地球参考椭球体。
在小区域表达地球表面时,通常采用平面的方式,即投影坐标系统。如何科学地选择投影坐标,一般要根据具体的地学应用、地理区域和范围、比例尺条件等因素来确定,不同的国家有着不同的规定。
通过对航空物探数据的坐标系统进行分析可知,航空物探图件的坐标框架与国家对基本比例尺制图的规定相一致,即小比例尺编图采用Lambert双标准纬线等角圆锥投影;中比例尺采用Gauss6°带的分带投影;大比例尺采用Gauss3°带的分带投影(表2-1);对于低纬度的海上作业区通常采用Mecator等角圆柱投影。地球椭球体分别采用1954北京坐标系的Krassovsky椭球参数、WGS84椭球参数和未来的国家2000坐标系的椭球参数。
表2-1 航空物探地理坐标数据的投影方式
传统的航空物探数据是按测区管理的,根据测区的测量比例尺来确定相应的坐标框架;因此,勘探目标不同的测区测量比例尺是不一致的,地坐标框架也不同。航空物探数据库要将不同测区、不同比例尺、不同坐标框架的数据集中管理和可视表达,若没有统一的空间坐标框架,就不可能正确地表达全国航空物探数据。所以,面对如此复杂的多坐标框架的航空物探数据,如何确定科学合理的空间坐标框架,将全国的航空物探数据整合到统一的空间参考框架下,实现数据的统一存储和数据间无缝拼接,是航空物探数据库建设的关键所在,是组织和管理多维、多格式、大跨度、跨平台的航空物探数据和多目标数字制图的数学基础。
统一的空间坐标框架必须支持我国领土覆盖的海域和陆域航空物探数据的存储和表达。我国领土东西跨度达70°,南北达55°,显然采用任何投影坐标系都是不合适的。Gauss6°投影适合6°带内空间数据表达,若全国航物探数据采用6°分带表达,在高纬度地区会造成6°带间数据裂缝问题;Lambert投影可满足数据的无缝表达,但对大比例尺数据变形较大,无法满足数据制图的精度要求;Mecator投影也可满足数据的无缝表达,低纬度地区也能满足大比例尺数据制图的精度要求,但在我国中高纬度区存在着严重变形问题。所以,航空物探数据模型采用地理坐标(无投影,图2-1)格式存放,可根据实际应用的需要将航空物探数据变换到任何方式的投影坐标系统。
航空物探数据库模型采用Beijing_1954地理坐标系,相关参数如下:
角度单位:°(0017453292519943299rad)
零经线:格林尼治(0000000000000000000)
基准:D_Beijing_1954
椭球:Krasovsky_1940
长轴半径:6378245000m
短轴半径:6356863019m
建立统一坐标框架是空间数据库建设的一项基础性工作,采用Beijing_1954地理坐标系作为航空物探数据库统一空间坐标框架具有以下优点。
图2-1 统一空间坐标框架示意图
(一)无缝空间数据存储
统一空间坐标框架解决了复杂的航空物探数据的坐标系统、投影、比例尺等不统一的问题,实现同一性质的物探数据在同一个主题中进行管理。如全国的航磁异常数据可放在一个图层上进行管理。
(二)适合多尺度表达
按测区管理的多尺度、多框架的航空物探数据是处于一个相对坐标系统中,各个测区间相对位置关系会发生错位。采用统一的Beijing_1954地理坐标框架,恢复了各测区间正确的位置关系,实现不同尺度数据的集成和正确表达,易于多源异构空间数据的融合。
(三)大区域数据集成
我国海陆面积近1300×104km2,地域跨度较大。在进行小比例尺的航空物探编图时,需要选用与之相适应的投影坐标;在陆地和海域进行大比例尺制图时,同样需要选用合适投影系统。航空物探制图的实践也证明了这一点。1995年6月由中国、加拿大、美国、爱尔兰和俄罗斯等国科学家共同编制的1:1000万欧亚东北地区磁异常与大地构造图,采用横轴Mercator投影。中心编制的1:500万全国航磁图采用Lambert投影。2008年,由中国和吉尔吉斯斯坦科学家编制的1:100万中吉天山金属矿产成矿规律图,采用Lambert投影,将两个国家不同时期、不同尺度的数据进行了有效的集成,是地质、地球物理等综合应用的典范。
随着航空物探数据应用领域的不断扩展,陆地、海域,甚至于洲际和全球航空物探数据的整体表达都需对坐标投影提出要求。采用统一的地理坐标框架的航空物探数据非常容易变换到指定的投影坐标框架,满足多样化的制图要求。
三、要素类和对象类的划分
Geodatabase空间数据库模型结构(图2-2)分为空间数据库、要素数据集(Feature dataset)、要素类(Feature classes)、要素(Feature)4个层次。为了建立航空物探Geoda-tabase空间数据模型,我们依据Geodatabase模型关于要素类和对象类的划分原则,结合相关的国家标准和地球物理行业标准,制定了《航空物探数据要素类和对象类划分标准》,对航空物探数据进行数据分类。
图2-2 空间数据库模型结构
1)按照航空物探数据的空间特征,将其划分为5个要素数据集,即勘查项目概况要素数据集、基础数据要素数据集、异常要素数据集、解释要素数据集和评价要素数据集。
2)根据航空物探测量方法、数据处理过程以及推断解释方法和过程,进一步把航空物探数据划分为若干要素类和对象类,定义了要素类的主题特征和表达方式,确定子类和属性域;定义对象类的结构和联接字段,建立了关系类。
3)定义要素类的内容、字段名称和存储结构。在航空物探数据采集过程中,不同类型的数据采样率不同,坐标数据采样2次/s,重力场数据采样2次/s,磁场数据采样10次/s,这就造成了场值数据与坐标数据无法一一对应问题。若按场值数据采样率内插坐标数据,将导致数据量成倍增长;若按坐标数据采样率抽稀场值数据,将降低航空物探测量对地质体的分辨能力,影响测量效果。在综合分析航空物探数据应用基础上,提出了采用要素数据与属性数据分置的方式,将测线坐标数据与地球物理场数据分离,分别建立独立共享的航迹线数据要素类模型,磁场、重力场等数据对象类模型(图2-3),很好地解决了航空物探数据的存储问题。
图2-3 要素数据与属性数据分置示意图
采用要素数据与属性数据分置方式,不仅是基于航空物探数据属性数据的多源性、不同采样频率等特点的考虑,还考虑到数据的综合查询和检索的速度,特别是通过ArcSDE访问空间数据库的效率的问题。再者,对于大部分用户来说,需求是属性数据的综合应用,因此在数据库建模过程中,将属性数据采用对象类的方式进行管理,不但提高了空间数据的 *** 作能力,同时在ArcSDE的配置上采用直接访问数据库(对象类)方式,并且加快了数据查询和统计的速度。
四、数据库概念模型
用户需求是数据库建设的约束条件之一。航空物探数据的空间特性决定航空物探数据库必须是空间数据库,采用数据库管理数据,利用GIS技术提供可视化服务,这是各个层次用户的一致要求。因此,我们从现实世界出发,对航空物探数据的多源性、多尺度和不同采样等问题进行了描述,提出了解决方案。此方案是不依赖于任何具体的硬件环境和数据库管理系统(DBMS),建立了客观反映现实世界的航空物探数据库概念模型,把用户需要管理的信息统一到整体概念结构中,表达了用户需要。
在全面分析航空物探业务流程和数据流程,以及航空物探数据特性的基础上,按照《航空物探数据要素类和对象类划分标准》,以及空间实体点、线、面要素特征的基本原则,对航空物探数据库所涉及的实体进行归类,划分成12个主题。根据空间数据分主题表达的特点和航空物探空间数据坐标框架的定义,确定航空物探数据库空间数据概念模型,明确各个主题的用途、数据来源、表达方式、空间参考、比例尺和精度等内容,按照ArcGIS定义空间数据库的数据分层表达方式(图2-4),完成航空物探数据库概念模型设计(图2-5)。
图2-4 航空物探数据库空间数据分层模型
图2-5 航空物探数据库空间数据概念模型
数据库的概念模型是面向对象数据库系统是为了满足新的数据库应用需要而产生的新一代数据库系统。面向对象是一种认识方法学,也是一种新的程序设计方法学。
数据库概念模型实际上是现实世界到机器世界的一个中间层次。数据库概念模型用于信息世界的建模,是现实世界到信息世界的第一层抽象,是数据库设计人员进行数据库设计的有力工具,也是数据库设计人员和用户之间进行交流的语言。
扩展资料:
建立数据概念模型,就是从数据的观点出发,观察系统中数据的采集、传输、处理、存储、输出等,经过分析、总结之后建立起来的一个逻辑模型,它主要是用于描述系统中数据的各种状态。这个模型不关心具体的实现方式(例如如何存储)和细节,而是主要关心数据在系统中的各个处理阶段的状态。 实际上,数据流图也是一种数据概念模型。
参考资料来源:百度百科-数据库概念模型
参考资料来源:百度百科-面向对象数据库系统
用树形结构表示实体之间联系的模型叫层次模型。层次模型是最早用于商品数据库管理系统的数据模型。其典型代表是于1969问世、由IBM公司开发的数据库管理系统IMS(Information Management System)。
1231 层次模型的结构
层次模型的表示方法是:树的结点表示实体集(记录的型),结点之间的连线表示相连两实体集之间的关系,这种关系只能是“1一M”的。通常把表示1的实体集放在上方,称为父结点,表示M的实体集放在下方,称为子结点。层次模型的结构特点是:
(1) 有且仅有一个根结点。
(2) 根结点以外的其它结点有且仅有一个父结点。
因而层次模型只能表示“1一M”关系,而不能直接表示“M—M”关系。
在层次模型中,一个结点称为一个记录型,用来描述实体集。每个记录型可以有一个或多个记录值,上层一个记录值对应下层一个或多个记录值,而下层每个记录值只能对应上层一个记录值。例如,系记录型有:计算机系、电信系等记录值。而计算机系的下层记录值有软件、结构、应用等研究室和数据结构、 *** 作系统、数据库等课程,软件研究室下层又有员工和项目记录值,
关于层次模型中实体集之间多对多的联系的处理,解决的方法是引入冗余结点。例如,学生和课程之间的多对多的联系,引入学生和课程的冗余结点 转换为两棵树:一棵树的根是学生,子结点是课程,它表现了一个学生可以选多门课程;一棵树的根是课程,子结点是学生,它反映了一门课程可以被多个学生选。
1232层次模型的数据 *** 作
层次模型的数据 *** 作特点是必须从根结点入手,按层次顺序访问。首先介绍层次顺序中的两个概念。
(1) 记录类型码 对层次模型中的记录型树,按照从上到下,从左到右的顺序给每个记录类一个编号,称为记录类型码,以表示记录类在树中的位置。
(2) 顺序域 为了确定同一记录类下的各个记录值的位置,指定记录中某字段的值作为记录值的排序的依据,该字段称为顺序域。
(3) 层次顺序和路径 有了记录类型码和顺序域,就可以对所有的记录值进行排序,首先按类型码排序,同一类型码下的各个记录值再按顺序域排序。这种从上到下、从左到右的排列顺序就是层次顺序。从根结点开始到目标结点之间所有直系祖先的类型码和顺序域组成该结点的层次路径。如图119所示,D(Department)、S(Section)、C(Course)、F(Faculty)和P(Project)分别表示系、研究室、课程、员工和项目。D02的层次顺序: D02S01F01F02S02F03F04S03F05F06F07023056C01C02C03。
GU DEPT(DEPT#=’D02’)
SECTION(SEC#=’S03’)
FACULTY(FAC#=’F06’)
层次模型中的更新 *** 作之前,一般都先执行一个查询,再执行相应 *** 作。所以层次模型数据 *** 作的特点是通过层次路径定位记录,一次仅能访问一条记录。
1234 层次模型的物理存储
层次模型的物理存储有两种实现方法:
(1) 顺序法
按照层次顺序把所有的记录邻接存放,即通过物理空间的位置相邻来实现层次顺序。
(2) 指针法
各个记录存放时不是按层次顺序,而是用指针按层次顺序把它们链接起来。
1235 层次模型的约束
层次模型的限制是:
(1) 层次模型的树是有序树(层次顺序)。对任一结点的所有子树都规定了先后次序,这一限制隐含了对数据库存取路径的控制。
(2) 树中父子结点之间只存在一种联系,因此,对树中的任一结点,只有一条自根结点到达它的路径。
(3) 不能直接表示多对多的联系。
(4) 树结点中任何记录的属性只能是不可再分的简单数据类型。
模型是数据库中稳定用得最多的数据形式,模式是常用的数据形式。模型少,模式多。
联系:模型、模式都是对具体值数量关系的抽象分析和理论概括。
区别:模型、模式比具体值抽象得多。
以上就是关于mysql 数据库是什么数据模型全部的内容,包括:mysql 数据库是什么数据模型、数据分析项目包含哪些流程、数据库概念模型等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)