根据标准参考数据计划,NIST的各实验室正在将他们的数据库产品不断加入到在线访问的数据库行列,建立了一系列的科学数值数据库。通过更新现有的数据库及开发新数据库,NIST不断地丰富它的评价数值数据集,为社会提供可靠的、经过评价的数值数据。社会各界的工程师和科学家依靠 NIST的标准参考数据对许多关键技术进行决策。
NIST的标准参考数据库系列包括50多个数据库,其中大部分是建在微机上的多用途数据包,根据学科可分为以下几类:分析化学(包括谱学),原子和分子物理,生物技术,化学与晶体结构,化学动力学,工业流体与化工,材料性能,热力学与热化学,以及NIST的其它数据库。
分析化学类包括质谱库、红外谱、光电子能谱等数据库;原子与分子物理类包括光谱性能、c-射线衰减系数及交叉截面、原子光谱等数据库;生物技术类包括生物大分子结晶库等数据库;化学与晶体结构类有电子衍射等数据库;化学动力学类包括化学动力学、溶液动力学等数据库;工业流体与化工类有物质的热力学性能数据库;材料性能类包括结构陶瓷、腐蚀性能、摩擦材料、高温超导等数据库;表面数据类包括表面结构、d性电子散射交叉截面等数据库;热化学类包括化学热力学、有机化合物热力学性能估算、JANAF热化学表等数据库。
NIST提供科学数值数据服务的方式主要有:①将数据与分析仪器连在一起出售,如质谱库中有近10万个化合物数据,附在质谱仪中出售的有常用的几万个化合物;②以PC数据包方式出售;③联机数据服务;④作为其它大的软件包的一部分;⑤直接装入用户的计算机。
具体的在线科学数据库名单如下:
儿童人体测量数据库(AnthroKids - Anthropometric Data of Children),
铂/氖阴极管灯泡的光谱图(Atlas of the Spectrum of a Platinum/Neon Hollow-Cathode Lamp in the Region 1130-4330 Å),
用于电子结构计算的原子参考数据库(Atomic Reference Data for Electronic Structure Calculations),
原子光谱数据库(Atomic Spectra Database,ASD),
原子谱线加宽目录数据库(Atomic Spectral Line Broadening Bibliographic Database),
原子跃迁概率数据库(Atomic Transition Probability Bibliographic Database),
原子重量及同位素成分数据库(Atomic Weights and Isotopic Compositions),
光子总交叉截面(衰减系数)测量目录(Bibliography of Photon Total Cross Section (Attenuation Coefficient) Measurements),
生物高分子结晶数据库(Biological Macromolecule Crystallization Database),
陶瓷互联网手册(Ceramics WebBook),
化学动力学数据库(CKMech,Chemical Kinetic Mechanisms),
化学互联网手册(Chemistry WebBook),
单分子反应计算数据库(ChemRate: A Calculational Database for Unimolecular Reaction),
视觉协同测试床(CIS2 Visual Interoperability Testbed),
化学动力学机理(CKMech,Chemical Kinetic Mechanisms),
计算化学比较和基准数据库(Computational Chemistry Comparison and Benchmark Database),
计算机辨认工具测试项目网站(Computer Forensics Tool Testing (CFTT) Project Web Site),
二阶光谱数据库(Diatomic Spectral Database),
运算法则和数据结构字典(Dictionary of Algorithms and Data Structures),
电子与等离子体加工用气体相互作用数据 (Electron Interactions with Plasma Processing Gases),
元素数据索引(Elemental Data Index),
工程统计学手册(Engineering Statistics Handbook),
火灾研究信息服务(Fire Research Information Services ,FRIS),
基本物理常数(Fundamental Physical Constants),
中性原子的基本水平和电离能量(Ground Levels and Ionization Energies for the Neutral Atoms),
数学软件指南(Guide to Available Mathematical Software),
NIST计量结果不确定性的评估与表达指南(Guidelines for Evaluating and Expressing the Uncertainty of NIST Measurement Results),
基础原子光谱数据手册(Handbook of Basic Atomic Spectroscopic Data),
绝缘体和建筑材料的热传递性质(Heat Transmission Properties of Insulating and Building Materials),
高温超导材料数据库(High Temperature Superconducting Materials Database),
HIV蛋白酶数据库(HIV Protease Database),
人线粒体蛋白数据库(Human Mitochondrial Protein Database),
烃类光谱数据库(Hydrocarbon Spectral Database),
二氧化碳同位素测定的交互规则(Interactive Algorithm for Isotopic CO2 Measurements),
国际比较数据库(International Comparisions Database),
ITS-90热电偶数据库(ITS-90 Thermocouple Database),
自动数据分析工具(MassSpectator Automated Data Analysis Tool),
矩阵市场数据库(Matrix Market Database),
相位图和计算热动力学―焊接系统(Phase Diagrams and Computational Thermodynamics - Solder Systems),
多轮烃结构索引(Polycyclic Aromatic Hydrocarbon Structure Index),
聚合物方法数据库(Polymer MALDI MS Methods Database),
高级材料的性质数据总结(Property Data Summaries for Advanced Materials),
断裂韧度性质数据总结(Property Data Summaries for Fracture Toughness),
氧化玻璃的性质数据总结(Property Data Summaries for Oxide Glasses),
蛋白质数据银行(Protein Data Bank (PDB) ( in collaboration with RCSB )
放射性核半衰期计量(Radionuclide Half-Life Measurements),
用于观测星际分子微波跃迁的雷达技术扫描频率(Recommended Rest Frequencies for Observed Interstellar Molecular Microwave Transitions - 1991 Revision),
加强渗透性数值数据库(Database on Reinforcement Permeability Values),
短暂前后重复的DNA数据库(Short Tandem Repeat DNA Internet Database),
无铅焊料的焊接特性数据库(Database for Solder Properties with Emphasis on New Lead-free Solders),
可溶性数据库(IUPAC-NIST Solubility Database),
溶解动力学数据库(NDRL/NIST Solution Kinetics Database on the Web),
坎德拉X-射线天文台光谱数据库(Spectral Data for the Chandra X-ray Observatory),
统计参考数据库(Statistical Reference Datasets),
电子、质子和氦离子的静止能与行程表(Stopping-Power and Range Tables for Electrons,Protons,and Helium Ions),
NIST结构陶瓷学数据库(NIST Structural Ceramics Database),
合成聚合物质谱项目(Synthetic Polymer Mass Spectrometry Project),
X-射线质量衰减系数和能量吸收系数表(Tables of X-Ray Mass Attenuation Coefficients and Mass Energy - Absorption Coefficients),
酶催化反应的热力学数据库(Thermodynamics of Enzyme-Catalyzed Reactions Database),
半导体器件加工用的气体的热物理特性数据库(Database of the Thermophysical Properties of Gases Used in the Semiconductor Industry),
三原子光谱数据库(Triatomic Spectral Database),
Vibrational branching ratios and asymmetry parameters in the photoionization of CO2 in the region between 650 Å and 840 Å
可见物粘合剂数据集(NIST Visible Cement Dataset),
Wavenumber Calibration Tables from Heterodyne Frequency Measurements
用于剂量测定的X-射线衰减与吸收表(X-Ray Attenuation and Absorption for Materials of Dosimetric Interest),
X-射线波型系数、衰减与散射表(X-Ray Form Factor,Attenuation and Scattering Tables),
X-射线电光子分光光谱数据库(NIST X-ray Photoelectron Spectroscopy Database),
X-射线跃迁能量数据库(X-Ray Transition Energies Database),
光子交叉截面数据库(XCOM: Photon Cross Sections Database)。
数据库设计的基本步骤
按照规范设计的方法,考虑数据库及其应用系统开发全过程,将数据库设计分为以下6个阶段
1需求分析
2概念结构设计
3逻辑结构设计
4物理结构设计
5数据库实施
6数据库的运行和维护
数据库设计通常分为6个阶段1分析用户的需求,包括数据、功能和性能需求;2概念结构设计:主要采用E-R模型进行设计,包括画E-R图;3逻辑结构设计:通过将转换成表,实现从E-R模型到关系模型的转换;4:主要是为所设计的数据库选择合适的和存取路径;5数据库的实施:包括编程、测试和试运行;6数据库运行与维护:系统的运行与数据库的日常维护。),主要讨论其中的第3个阶段,即逻辑设计。
在数据库设计过程中,需求分析和概念设计可以独立于任何数据库管理系统进行,逻辑设计和物理设计与选用的DAMS密切相关。
1需求分析阶段(常用自顶向下)
进行数据库设计首先必须准确了解和分析用户需求(包括数据与处理)。需求分析是整个设计过程的基础,也是最困难,最耗时的一步。需求分析是否做得充分和准确,决定了在其上构建数据库大厦的速度与质量。需求分析做的不好,会导致整个数据库设计返工重做。
需求分析的任务,是通过详细调查现实世界要处理的对象,充分了解原系统工作概况,明确用户的各种需求,然后在此基础上确定新的系统功能,新系统还得充分考虑今后可能的扩充与改变,不仅仅能够按当前应用需求来设计。
调查的重点是,数据与处理。达到信息要求,处理要求,安全性和完整性要求。
分析方法常用SA(Structured Analysis) 结构化分析方法,SA方法从最上层的系统组织结构入手,采用自顶向下,逐层分解的方式分析系统。
数据流图表达了数据和处理过程的关系,在SA方法中,处理过程的处理逻辑常常借助判定表或判定树来描述。在处理功能逐步分解的同事,系统中的数据也逐级分解,形成若干层次的数据流图。系统中的数据则借助数据字典(data dictionary,DD)来描述。数据字典是系统中各类数据描述的集合,数据字典通常包括数据项,数据结构,数据流,数据存储,和处理过程5个阶段。
2概念结构设计阶段(常用自底向上)
概念结构设计是整个数据库设计的关键,它通过对用户需求进行综合,归纳与抽象,形成了一个独立于具体DBMS的概念模型。
设计概念结构通常有四类方法:
自顶向下。即首先定义全局概念结构的框架,再逐步细化。
自底向上。即首先定义各局部应用的概念结构,然后再将他们集成起来,得到全局概念结构。
逐步扩张。首先定义最重要的核心概念结构,然后向外扩张,以滚雪球的方式逐步生成其他的概念结构,直至总体概念结构。
混合策略。即自顶向下和自底向上相结合。
3逻辑结构设计阶段(E-R图)
逻辑结构设计是将概念结构转换为某个DBMS所支持的数据模型,并将进行优化。
在这阶段,E-R图显得异常重要。大家要学会各个实体定义的属性来画出总体的E-R图。
各分E-R图之间的冲突主要有三类:属性冲突,命名冲突,和结构冲突。
E-R图向关系模型的转换,要解决的问题是如何将实体性和实体间的联系转换为关系模式,如何确定这些关系模式的属性和码。
4物理设计阶段
物理设计是为逻辑数据结构模型选取一个最适合应用环境的物理结构(包括存储结构和存取方法)。
首先要对运行的事务详细分析,获得选择物理数据库设计所需要的参数,其次,要充分了解所用的RDBMS的内部特征,特别是系统提供的存取方法和存储结构。
常用的存取方法有三类:1索引方法,目前主要是B+树索引方法。2聚簇方法(Clustering)方法。3是HASH方法。
5数据库实施阶段
数据库实施阶段,设计人员运营DBMS提供的数据库语言(如sql)及其宿主语言,根据逻辑设计和物理设计的结果建立数据库,编制和调试应用程序,组织数据入库,并进行试运行。
6数据库运行和维护阶段
数据库应用系统经过试运行后,即可投入正式运行,在数据库系统运行过程中必须不断地对其进行评价,调整,修改。
数据库设计5步骤
Five Steps to design the Database
1确定entities及relationships
a) 明确宏观行为。数据库是用来做什么的?比如,管理雇员的信息。
b) 确定entities。对于一系列的行为,确定所管理信息所涉及到的主题范围。这将变成table。比如,雇用员工,指定具体部门,确定技能等级。
c) 确定relationships。分析行为,确定tables之间有何种关系。比如,部门与雇员之间存在一种关系。给这种关系命名。
d) 细化行为。从宏观行为开始,现在仔细检查这些行为,看有哪些行为能转为微观行为。比如,管理雇员的信息可细化为:
· 增加新员工
· 修改存在员工信息
· 删除调走的员工
e) 确定业务规则。分析业务规则,确定你要采取哪种。比如,可能有这样一种规则,一个部门有且只能有一个部门领导。这些规则将被设计到数据库的结构中。
====================================================================
范例:
ACME是一个小公司,在5个地方都设有办事处。当前,有75名员工。公司准备快速扩大规模,划分了9个部门,每个部门都有其领导。
为有助于寻求新的员工,人事部门规划了68种技能,为将来人事管理作好准备。员工被招进时,每一种技能的专业等级都被确定。
定义宏观行为
一些ACME公司的宏观行为包括:
● 招聘员工
● 解雇员工
● 管理员工个人信息
● 管理公司所需的技能信息
● 管理哪位员工有哪些技能
● 管理部门信息
● 管理办事处信息
确定entities及relationships
我们可以确定要存放信息的主题领域(表)及其关系,并创建一个基于宏观行为及描述的图表。
我们用方框来代表table,用菱形代表relationship。我们可以确定哪些relationship是一对多,一对一,及多对多。
这是一个E-R草图,以后会细化。
细化宏观行为
以下微观行为基于上面宏观行为而形成:
● 增加或删除一个员工
● 增加或删除一个办事处
● 列出一个部门中的所有员工
● 增加一项技能
● 增加一个员工的一项技能
● 确定一个员工的技能
● 确定一个员工每项技能的等级
● 确定所有拥有相同等级的某项技能的员工
● 修改员工的技能等级
这些微观行为可用来确定需要哪些table或relationship。
确定业务规则
业务规则常用于确定一对多,一对一,及多对多关系。
相关的业务规则可能有:
● 现在有5个办事处;最多允许扩展到10个。
● 员工可以改变部门或办事处
● 每个部门有一个部门领导
● 每个办事处至多有3个电话号码
● 每个电话号码有一个或多个扩展
● 员工被招进时,每一种技能的专业等级都被确定。
● 每位员工拥有3到20个技能
● 某位员工可能被安排在一个办事处,也可能不安排办事处。
2确定所需数据
要确定所需数据:
a) 确定支持数据
b) 列出所要跟踪的所有数据。描述table(主题)的数据回答这些问题:谁,什么,哪里,何时,以及为什么
c) 为每个table建立数据
d) 列出每个table目前看起来合适的可用数据
e) 为每个relationship设置数据
f) 如果有,为每个relationship列出适用的数据
确定支持数据
你所确定的支持数据将会成为table中的字段名。比如,下列数据将适用于表Employee,表Skill,表Expert In。
Employee
Skill
Expert In
ID
ID
Level
Last Name
Name
Date acquired
First Name
Description
Department
Office
Address
如果将这些数据画成图表,就像:
需要注意:
● 在确定支持数据时,请一定要参考你之前所确定的宏观行为,以清楚如何利用这些数据。
● 比如,如果你知道你需要所有员工的按姓氏排序的列表,确保你将支持数据分解为名字与姓氏,这比简单地提供一个名字会更好。
● 你所选择的名称最好保持一致性。这将更易于维护数据库,也更易于阅读所输出的报表。
● 比如,如果你在某些地方用了一个缩写名称Emp_status,你就不应该在另外一个地方使用全名(Empolyee_ID)。相反,这些名称应当是Emp_status及Emp_id。
● 数据是否与正确的table相对应无关紧要,你可以根据自己的喜好来定。在下节中,你会通过测试对此作出判断。
3标准化数据
标准化是你用以消除数据冗余及确保数据与正确的table或relationship相关联的一系列测试。共有5个测试。本节中,我们将讨论经常使用的3个。
关于标准化测试的更多信息,请参考有关数据库设计的书籍。
标准化格式
标准化格式是标准化数据的常用测试方式。你的数据通过第一遍测试后,就被认为是达到第一标准化格式;通过第二遍测试,达到第二标准化格式;通过第三遍测试,达到第三标准化格式。
如何标准格式:
1. 列出数据
2. 为每个表确定至少一个键。每个表必须有一个主键。
3. 确定relationships的键。relationships的键是连接两个表的键。
4. 检查支持数据列表中的计算数据。计算数据通常不保存在数据库中。
5. 将数据放在第一遍的标准化格式中:
6. 从tables及relationships除去重复的数据。
7. 以你所除去数据创建一个或更多的tables及relationships。
8. 将数据放在第二遍的标准化格式中:
9. 用多于一个以上的键确定tables及relationships。
10. 除去只依赖于键一部分的数据。
11. 以你所除去数据创建一个或更多的tables及relationships。
12. 将数据放在第三遍的标准化格式中:
13. 除去那些依赖于tables或relationships中其他数据,并且不是键的数据。
14. 以你所除去数据创建一个或更多的tables及relationships。
数据与键
在你开始标准化(测试数据)前,简单地列出数据,并为每张表确定一个唯一的主键。这个键可以由一个字段或几个字段(连锁键)组成。
主键是一张表中唯一区分各行的一组字段。Employee表的主键是Employee ID字段。Works In relationship中的主键包括Office Code及Employee ID字段。给数据库中每一relationship给出一个键,从其所连接的每一个table中抽取其键产生。
RelationShip
Key
Office
Office code
Office address
Phone number
Works in
Office code
Employee ID
Department
Department ID
Department name
Heads
Department ID
Employee ID
Assoc with
Department ID
EmployeeID
Skill
Skill ID
Skill name
Skill description
Expert In
Skill ID
Employee ID
Skill level
Date acquired
Employee
Employee ID
Last Name
First Name
Social security number
Employee street
Employee city
Employee state
Employee phone
Date of birth
将数据放在第一遍的标准化格式中
● 除去重复的组
● 要测试第一遍标准化格式,除去重复的组,并将它们放进他们各自的一张表中。
● 在下面的例子中,Phone Number可以重复。(一个工作人员可以有多于一个的电话号码。)将重复的组除去,创建一个名为Telephone的新表。在Telephone与Office创建一个名为Associated With的relationship。
将数据放在第二遍的标准化格式中
● 除去那些不依赖于整个键的数据。
● 只看那些有一个以上键的tables及relationships。要测试第二遍标准化格式,除去那些不依赖于整个键的任何数据(组成键的所有字段)。
● 在此例中,原Employee表有一个由两个字段组成的键。一些数据不依赖于整个键;例如,department name只依赖于其中一个键(Department ID)。因此,Department ID,其他Employee数据并不依赖于它,应移至一个名为Department的新表中,并为Employee及Department建立一个名为Assigned To的relationship。
将数据放在第三遍的标准化格式中
● 除去那些不直接依赖于键的数据。
● 要测试第三遍标准化格式,除去那些不是直接依赖于键,而是依赖于其他数据的数据。
● 在此例中,原Employee表有依赖于其键(Employee ID)的数据。然而,office location及office phone依赖于其他字段,即Office Code。它们不直接依赖于Employee ID键。将这组数据,包括Office Code,移至一个名为Office的新表中,并为Employee及Office建立一个名为Works In的relationship。
4考量关系
当你完成标准化进程后,你的设计已经差不多完成了。你所需要做的,就是考量关系。
考量带有数据的关系
你的一些relationship可能集含有数据。这经常发生在多对多的关系中。
遇到这种情况,将relationship转化为一个table。relationship的键依旧成为table中的键。
考量没有数据的关系
要实现没有数据的关系,你需要定义外部键。外部键是含有另外一个表中主键的一个或多个字段。外部键使你能同时连接多表数据。
有一些基本原则能帮助你决定将这些键放在哪里:
一对多 在一对多关系中,“一”中的主键放在“多”中。此例中,外部键放在Employee表中。
一对一 在一对一关系中,外部键可以放进任一表中。如果必须要放在某一边,而不能放在另一边,应该放在必须的一边。此例中,外部键(Head ID)在Department表中,因为这是必需的。
多对多 在多对多关系中,用两个外部键来创建一个新表。已存的旧表通过这个新表来发生联系。
5检验设计
在你完成设计之前,你需要确保它满足你的需要。检查你在一开始时所定义的行为,确认你可以获取行为所需要的所有数据:
● 你能找到一个路径来等到你所需要的所有信息吗?
● 设计是否满足了你的需要?
● 所有需要的数据都可用吗?
如果你对以上的问题都回答是,你已经差不多完成设计了。
最终设计
最终设计看起来就像这样:
设计数据库的表属性
数据库设计需要确定有什么表,每张表有什么字段。此节讨论如何指定各字段的属性。
对于每一字段,你必须决定字段名,数据类型及大小,是否允许NULL值,以及你是否希望数据库限制字段中所允许的值。
选择字段名
字段名可以是字母、数字或符号的任意组合。然而,如果字段名包括了字母、数字或下划线、或并不以字母打头,或者它是个关键字(详见关键字表),那么当使用字段名称时,必须用双引号括起来。
为字段选择数据类型
SQL Anywhere支持的数据类型包括:
整数(int, integer, smallint)
小数(decimal, numeric)
浮点数(float, double)
字符型(char, varchar, long varchar)
二进制数据类型(binary, long binary)
日期/时间类型(date, time, timestamp)
用户自定义类型
关于数据类型的内容,请参见“SQL Anywhere数据类型”一节。字段的数据类型影响字段的最大尺寸。例如,如果你指定SMALLINT,此字段可以容纳32,767的整数。INTEGER可以容纳2,147,483,647的整数。对CHAR来讲,字段的最大值必须指定。
长二进制的数据类型可用来在数据库中保存例如图像(如位图)或者文字编辑文档。这些类型的信息通常被称为二进制大型对象,或者BLOBS。
关于每一数据类型的完整描述,见“SQL Anywhere数据类型”。
新一轮油气资源评价数据库是建立在国家层面上的数据库,数据库设计首先立足于国家能源政策和战略制定的宏观要求,还要结合油气资源评价的工作特征和各个评价项目及资源的具体情况。使用当前最流行和最成熟的数据库技术进行数据库的总体结构设计。
数据库的设计以《石油工业数据库设计规范》为指导标准,以《石油勘探开发数据》为设计基础,借鉴前人的优秀设计理念和思路,参考国内外优秀的资源评价数据库和油气资源数据库的设计技术优势,结合本轮资源评价的具体特点,按照面向对象的设计和面向过程的设计相结合的设计方法,进行数据库的数据划分设计。
油气资源评价数据库要满足新一轮全国油气资源评价工作的常规油气资源评价、煤层气资源评价、油砂资源评价、油页岩资源评价四个油气资源评价的数据需求。进行数据库具体数据内容设计。
并且,数据库的设计要为油气资源评价的快速、动态评价和远程评价工作的需求保留足够数据扩展接口,数据库具有良好开放性、兼容性和可扩充性。
(一)数据划分
数据库内存放的数据将支持资源评价的整个过程。为了能更好地管理库中数据,需要对整个过程中将用到的数据进行分类管理。具体分类方式如下(图4-11):
图4-11 数据分类示意图
1按照应用类型划分
按照数据在资源评价过程中的应用类型划分,可以划分为基础数据、参数数据和评价结果数据。
基础数据是指从勘探生产活动及认识中直接获取的原始数据,这些数据一般没有经过复杂的处理和计算过程。如分析化验数据、钻井地质数据、盆地基础数据等。这些数据是整个评价工作的基础。
参数数据是指在评价过程中各种评价方法和软件直接使用的参数数据。
评价结果数据是指资源评价中产生的各种评价结果数据,如资源量结果数据、地质评价结果数据等。
2按照评价对象划分
本次评价共分为大区、评价单元、计算单元三个层次,在研究中又使用了盆地、一级构造单元,在评价对象总体考虑中按照评价对象将数据划分为大区、评价单元、计算单元等类型。
3按照获取方式划分
按照获取方式可以将数据分为直接获取、研究获取、间接获取几类。
4按照存储类型划分
按照存储类型可以将数据划分为结构化数据和非结构化数据。
结构化数据是指能够用现有的关系数据库系统直接管理的数据,进一步又可以分为定量数据和定性数据两类。
非结构化数据是指不能用现有的关系数据库系统直接管理和 *** 作的数据,它必须借助于另外的工具管理和 *** 作。如图件数据、文档数据等。
库中数据类型的划分共分六个层次逐次划分,包括:数据存储类型→资源类型→评价对象→应用→获取方式→数据特征。
对于结构化存储的数据在应用层分为三类:基础数据、中间数据和结果数据,基础数据中包含用于类比的基础数据、用于统计分析的基础数据和直接用于公式运算的基础数据;结构化存储的数据在获取方式上可以继续划分,其中,用于公式运算的数据可以细化为专家直接录入、由地质类比获取、通过生产过程获取、通过地质研究过程获取及其他方式。中间数据可以从以下方式获取:标准、统计、类比、参数的关联。结果数据的获取有两种方式:公式运算结果和通过钻井、地质、综合研究等提交的文字报告。
对于非结构化存储的数据在应用层分为两类:图形数据和文档数据。
图形数据在获取方式上可以继续划分成四种方式:通过工程测量数据获取(如地理图件、井位坐标数据等)、通过地质研究过程获取(如沉积相图、构造区划图等)、由综合研究获取(如综合评价图等)、其他方式。
图形数据在表现方式上又可以进一步分为有坐标意义的图形(如构造单元划分图、地理图、井位图等)、数值图(如产烃率曲线图、酐洛根热降解图等)和无坐标含义图(如剖面图)等。
文档数据是指评价过程中产生的各种报告、项目运行记录等。
(二)数据库结构
从业务需求上,根据数据用途、数据类型和数据来源,可将本次的油气资源评价数据库分为三级:基础库、参数库、成果库(图4-12)。其结构如下:
图4-12 数据库结构示意图
1基础库
基础库是油气资源评价工作的最基础的原始数据,有实测数据(物探数据、测井数据、钻井数据、开发数据等)、实验数据和经验数据等。
确定基础数据实际上是一项涉及油田勘探、开发等领域的多学科的复杂工作,是油气资源评价工作的研究过程和研究成果在数据库中的具体表现方式。在设计数据库的过程中,需要与参数研究专家经过多次反复,才能最终确定基础数据库,确保基础数据库能满足目前所有评价工作中计算的需要。
2参数库
参数库用于存储油气资源评价工作所用到的参数数据,评价软件,直接从参数库中提取参数数据,用于计算。参数数据由基础数据汇总而来,也可以由专家根据经验直接得到。
本次评价中所涉及的参数大致可以分为以下几类:①直接应用的参数;②通过标准或类比借用的参数;③通过研究过程或复杂的预处理得到的参数。
3成果库
成果库用于存储资源评价结果,包括各种计算结果、各种文档、电子表格、、图册等数据。
数据库的体系结构采用分布式多层数据库结构,包括三个组成部分:应用服务层、应用逻辑层和数据服务层。
数据库体系结构如图4-13所示。
图4-13 体系结构结构图
(1)应用服务层:应用服务层包含复杂的事务处理逻辑,应用服务层主要由中间件组件构成。中间件是位于上层应用和下层服务之间的一个软件层,提供更简单、可靠和增值服务。并且能够实现跨库检索的关键技术。它能够使应用软件相对独立于计算机硬件和 *** 作系统平台,把分散的数据库系统有机地组合在一起,为应用软件系统的集成提供技术基础,中间件具有标准程序接口和协议,可以实现不同硬件和 *** 作系统平台上的数据共享和应用互 *** 作。而在具体实现上,中间件是一个用API定义的分布式软件管理框架,具有潜在的通信能力和良好的可扩展性能。中间件包含系统功能处理逻辑,位于应用服务器端。它的任务是接受用户的请求,以特定的方式向应用服务器提出数据处理申请,通过执行相应的扩展应用程序与应用服务层进行连接,当得到应用服务器返回的处理结果后提交给应用服务器,再由应用服务器传送回客户端。根据国内各大石油公司具体的需求开发相应的地质、油藏、生产等应用软件功能程序模块和各种算法模块。
(2)应用逻辑层:逻辑数据层是扩展数据服务层逻辑处理层,针对当前的底层数据库的数据结构,根据具体的需求,应用各种数据库技术,包括临时表、视图、存储过程、游标、复制和快照等技术手段从底层数据库中提取相关的数据,构建面向具体应用的逻辑数据库或者形成一个虚拟的数据库平台。逻辑数据层包含底层数据库的部分或全部数据处理逻辑,并处理来自应用服务层的数据请求和访问,将处理结果返回给逻辑数据层。
形成一个虚拟的数据库平台我们可以应用数据库系统中的多个技术来实现。如果系统中的一个节点中的场地或分片数据能够满足当前虚拟数据库,可以在应用服务层中使用大量的查询,生成一个以数据集结果为主的虚拟数据库平台,并且由数据集附带部分数据库的管理应用策略。或者对节点上的数据库进行复制方法进行虚拟数据库的建立。对与需要对多个节点上的数据库进行综合筛选,则要对各个节点上的数据库进行复制,合并各个复制形成一个应用逻辑层,从而建立一个虚拟数据平台。
(3)数据服务层:即数据库服务器层,其中包含系统的数据处理逻辑,位于不同的 *** 作系统平台上,不同数据库平台(异构数据库),具体完成数据的存储、数据的完整性约束。也可以直接处理来自应用服务层的数据请求和访问,将处理结果返回给逻辑数据层或根据逻辑数据层通过提交的请求,返回数据信息和数据处理逻辑方法。
(三)数据建设标准
1评价数据标准
系统数据库中的数据格式、大小、类型遵从国家及行业标准,参考的标准如表4-23。
表4-23 数据库设计参考标准
续表
系统中数据的格式及单位参考《常规油气资源评价实施方案》、《煤层气资源评价实施方案》、《油砂资源评价实施方案》、《油页岩资源评价实施方案》及数据字典。
2图形图件标准
对于地质研究来说,地质类图件是比较重要的。各种地质评价图形遵循以下标准(表4-24)。
表4-24 系统图形遵循的相关标准
系统对图形的要求为必须为带有地理坐标意义的、满足上述标准体系要求的矢量图形,且采用统一的地理底图。图形格式采用:MapGIS图形交换格式、GeoInfo图形格式、ArcInfo图形交换格式、MapInfo图形交换格式和GeoMap图形交换格式。
图件的比例尺要求:
全国性图件:1∶400万或1:600万
大区图件:1:200万
盆地图件:1:40万或1:50万
评价单元图件:1:10万或1:20万
图件的内容要求符合《常规油气资源评价实施方案》、《煤层气资源评价实施方案》、《油砂资源评价实施方案》和《油页岩资源评价实施方案》的规定。
(四)数据内容
数据库中存储的数据包括常规油气相关数据、煤层气相关数据、油砂相关数据和油页岩相关数据;还有可采系数研究涉及的数据,包括研究所需基础数据和研究成果数据;以及趋势预测相关数据。
储层综合评价工作贯穿在勘探开发的全过程,从打第一口探井发现油田一直到油气田开发结束。油气田开发工作要经过实践、认识、再实践的多次反复。实施各种开发措施,用多种开发手段加深对油藏的认识。在逐步加深认识油藏的基础上,进一步调整开发措施。这样,在油气田开发过程中,每个阶段具有的资料基础不同,开发任务也不同,因而储层评价的重点也不同。
原石油工业部1988年制定的 《油气田开发管理纲要》 根据我国绝大多数油田实行注水保持压力开发的特点,把油气田开发分为3个阶段,即油气藏评价阶段、设计实施阶段及管理调整阶段。考虑实际工作中的常规步骤和资料条件,这里把设计实施阶段又分为开发设计阶段和方案实施阶段加以叙述。
1 油气藏评价阶段
油气田发现工业油气流之后,即进入油气藏评价阶段。评价阶段的主要任务是,提高勘探程度,提交探明储量,进行开发的可行性研究。
评价阶段的资料来自少量探井、评价井及地震详查 (或细测)。因此要充分利用每口评价井的测井、录井、测试技术,搞好录井、取心、钻杆测试、垂直地震剖面测量、试井、地层重复测试、试油等工作,多方面获取地质资料,做到少井多信息。
开展可行性研究的主要内容是:
(1) 计算评价区的探明地质储量和预测可采储量。
(2) 提出规划性的开发部署。
(3) 对开发方式和采油工程设施提出建议。
(4) 估算可能达到的生产规模,并作经济效益评价。
上述内容的评价基础是油藏早期评价,建立一个初步的油藏地质模型。对储层评价来说,即建立储层的概念模型。
评价阶段建立储层概念模型主要依靠储层沉积相分析,利用少数井孔一维剖面上的地质信息,结合地震相解释和砂组连续性追踪,对储层三维空间分布和内部参数变化作出基本预测,保证开发可行性研究的正确结论,重点内容有:
(1) 明确主力储层,初步取得岩性、物性、含油性和微观孔隙结构参数。
(2) 确定储层沉积亚相,预测储层有利相带的分布。
(3) 建立反映主力储层层内非均质性的剖面模型。
(4) 预测主力储层的砂体几何形态和侧向连续性,建立反映平面物性变化的平面模型。
由于资料不足,评价阶段建立的储层概念模型对部分关键性地质因素不可能给出肯定的概念,这时应充分估计其可能变化的范围。用于油气藏模拟时,应进行必要的敏感性分析。
2 开发设计阶段
油气田经过开发可行性研究,被确认具有开发价值后,即要进行开发前期工程准备,进入开发设计阶段。油气田开发前期工程准备主要是补充必要的资料,开展各种室内实验以及试采或现场先导试验,进一步提高对油气藏的认识程度,保证开发方案设计的进行。
在钻井方面,仍然是少量稀井网的评价井,但一般已增补部分开发资料井;对开辟先导试验区的大型油气田则有一个小面积的密井网钻井区,供储层典型解剖;在地震方面,至少已完成地震细测,部分油气田可能完成三维地震测量工作,供各种特殊处理以辅助评价储层。
本阶段的任务是编制油田开发方案。要进行油藏工程、钻井工程、采油工程、地面建设工程的总体设计,对开发方式、开发层系、井网和注采系统、合理采油速度、稳产年限等重大开发战略问题进行决策,所优选的总体设计要达到最好的经济技术指标。因此,储层评价必须保证这些重大开发战略决策的正确性。
本阶段开发储层评价的重点内容是:
(1) 开展储层微相分析,确定微相类型。
(2) 进行 “四性” 关系研究,确定各种测井解释方法和解释模型,划分储层和非储层界限,对储层进行分类分级,建立测井相标准。
(3) 明确各类储层在剖面上和平面上的分布规律和储量分布状况。
(4) 对储层进行油气层单元划分,确定详细对比原则和方法。
(5) 预测各类储层微相砂体的几何形态和规模,预测微相砂体间连通程度,评估各油气层单元 (小层或单层) 流体流动单元连续性。特别需要强调的是不仅应评估含油区,而且还应评估含水区的连续性,以便估计水体能量。
(6) 对各种岩类 (或微相) 储层作出微观孔隙结构评价,特别是各种伤害源和保护措施的评估。
(7) 以小层和单层为单元,综合物性、渗流特性、连续性、微观孔隙结构及储量丰度,逐级作出储层评价。
(8) 建立各类储层的概念模型,供模拟计算用。
3 方案实施阶段
根据开发方案设计,油田钻成第一期开发井网 (或基础井网) 后,即进入方案实施阶段,通常也称编制射孔方案阶段。实施阶段的任务是确定完井射孔投产原则,要对开发层系划分、注采井别选择作出实施决策,确定每口井的井别、射孔完成井段,交付实施投产。根据实施方案,进一步预测开发动态,修正开发指标,并编制初期配产配注方案。
本阶段认识储层的资料基础是开发井网,已完全具备条件对本开发区储层作出详细的静态模型。
储层评价重点内容是:
(1) 完成全开发区详细的油气层单元划分与对比。
(2) 建立分井分层的储层参数数据库。
(3) 编制小层 (或重点单层) 的微相图,在微相图控制下编制小层或单层的各种参数平面图。
(4) 编制油气层剖面图和栅状图。
(5) 建立储层静态模型。
4 管理调整阶段
油气田投入开发以后,即进入管理调整阶段。这一阶段的任务是搞好油气田开发,即经常进行开发分析,掌握油水运动状况、储量动用状况及剩余油分布状况;实行各种增产增注措施,调整好注采关系,包括日常的局部调整和阶段性的系统调整直至加密井网。油藏工程师要用油藏模拟定期进行开采动态历史拟合,了解剩余油分布状况,预测未来阶段的开发趋势,拟定采取的开发措施,开展各种先导试验,以及各种三次采油方法的先导试验。
此阶段认识储层的基础资料,除前述静态资料以外,将积累大量动态资料,尤为重要的有分层测试资料和检查井取心资料。每一口加密钻井都是当时的一口阶段检查井,一定要掌握水淹层测井信息,取好投产时产出流体和压力数据。静 (态资料) 动 (态资料)结合,反复再认识储层是这一阶段储层评价的特点。
本阶段储层评价的重点内容是:
(1) 综合所有静、动态资料,逐步把储层静态模型向预测模型发展。对各类微相砂体的方向性、连续性及储层物性参数的变化,逐步精细到数十米甚至数米级的规模;对无控制井点的地区能作出一定精度的预测,为精细模拟和分析剩余油分布提供基础。
(2) 揭露和不断总结各类微相砂体水驱油全过程的运动规律,包括注入水平面运动规律、层内水淹厚度、驱油效率演变过程及各类砂体层间干扰特点。通过开采动态分析,完善各类砂体储层的概念模型。
(3) 密切监测储层在开采过程中可能发生的变化,如矿物的溶蚀和沉淀、岩石结构的变化、物性变化以及润湿性等渗流特征的变化。
以上就是关于美国国家标准与技术研究院的数据库全部的内容,包括:美国国家标准与技术研究院的数据库、数据库如何设计、数据库结构等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)