关于档案数据库建设问题的探讨

关于档案数据库建设问题的探讨,第1张

余虹剑

(中国地质调查局南京地质调查中心)

摘要 数字化各种档案的目的是要向社会提供信息服务,这种服务需要一个由档案网络体系、网站、数据库、信息服务系统、档案资源等组成的良好的服务平台做支撑。档案数据库建设就是为数字化了的档案提供服务的资源平台。

关键词 著录 数据库 规范 管理

1 标准化、规范化数据著录

档案数据库属于文献数据库,是档案自动化的重要内容。档案数据库是以系统的方法编排的,并可通过电子方式单独访问的档案数据的集合。[1]档案数据库建设的成功与否,在很大程度上取决于数据库的质量。库中的数据条目必须标准、规范,达到有序、有效,库管理本身是科学合理的,这样的数据库 *** 作性一般较强、使用面也较广。科学实用的档案数据库在建库时,一般都会按照相应的技术标准、管理标准和工作标准,最终形成一个自身的标准,形成规范的档案数字化利用平台。作为一个数字档案馆,应先建立馆藏档案的目录数据库,也是著录数据库,包括全宗级、案卷级、文件级目录,并应注意它们之间的关系。另外,根据本单位的馆藏特色开展档案全文数据库建设。档案全文数据库涵盖面较广,一般含有文本型、图形图像型和多媒体型。目录数据库与全文数据库要实现结构化,促发式。档案目录数据库是档案数据库的基本,它能提供便捷的查询路径,阅览者可根据需要,通过一次输入就能提取阅览者希望查询的结果。提供类似查询前必须建立基础信息数据,这些数据包括档案题名、责任者、来源、页码、分类号、主题词、摘要等,少数包含档案全文。[2]这项工作对著录的内容特征如关键词、题名、项目负责人等著录不详细、标准不统一、索引的档案内容深度广度不够,在检索时就会有误差,出现检索不准确、不全面的现象,在一定程度上会影响档案利用率。可以说,著录标引是否标准规范是影响数据库管理的关键因素之一,这项工作大体上决定着数据结构的合理性,这项工作能完成好是检索系统查全、查准的前提。除档案目录数据库外,档案全文数据库、多媒体档案数据库、Web数据库的建设也必须遵守档案著录、标引等标准的原则要求。

2 建立数据库

现阶段根据有关部门的工作需要和计划,按照内容不同,我们建立的数据库分为成果数据库和科技档案数据库,分别针对地质大调查形成的资料和单位各项目形成的资料、收集来的各项各类资料录入数据条目。该数据库更新到目前已收集的所有合格项目的资料和数据,针对这个数据库还建立了目录级数据库共分两级:第一级是项目大类共552条。第二级是各个项目详细内容条目,截至拟稿更新到第一级第240条记录的具体内容共5836条记录。还有一大半有待继续更新录入。

3 保障数据安全是档案信息数据库的根本

档案数据生成即必须长期甚至永久保存。该怎么保证经过数字化后的档案的原始性,防范这些数字内容不被篡改等,都是建设档案数据库时在安全方面应解决的问题。数据库的参数设定、数据存储方式和位置、数据传输途径、使用等各个环节和整个过程都涉及档案数据库的安全。为防止数据丢失、损毁,避免保密信息流失等事故,又要保障海量信息数据的安全、完整,使日积月累产生和收集来的档案数据能在日后长期得到利用,必须把更新档案数据库安全体系、合乎实际工作需求的管理制度作为数据库建设的关键环节。制定既利于工作又能监管数据出入的防范措施,加强数据运行中的监控和管理,使数据库从建设到利用各环节都万无一失。档案数据库建设时,经常使用技术手段实现权限控制,日常的数据备份必不可少。广义上,权限控制应设置读写控制、数据加密等方面,从实际工作需求出发,一般根据用户类别、部门允许访问范围内(包括阅览、下载等)的目录和档案数据对访问和使用设置可访问层度、控制和监督。防写控制是使信息保真的手段,使得用户只能读取信息,而不能修改、复制,以防止信息被篡改。加密技术可以确保控制档案内容的非公开性。为保证权限控制的有效性,要在系统中配置使用记录系统,全程跟踪、自动记录使用情况,进行定期检测与维护,还要随着高新技术的发展,引进新的安防技术。

4 档案信息化建设需要切实加强集中统一的管理体制

档案信息化建设的管理体制是从管理制度上保证业务技术的规范、标准和硬软件选用的统一性,使各层次、各专业办公都纳入统一的档案信息自动化系统管理当中,实现集中统一的管理。使其不能各行其是自建系统,从而减少信息分割和资源浪费现象的发生。档案信息化系统的管理体制,要在较强的管理和先进的技术条件下,实行高度集中管理和方便使用相结合的模式。

5 结束语

本文阐述的只限于在档案资料数据库建设中遇到的极有限的实际工作问题。档案数据库建设是一项长期、持久的工作,作为档案管理部门在进行数据库建设时,要有规划地形成数据库产品,一般需要做用户需求分析、本馆状况分析、效益分析等。科学选题,合理规划,循序渐进,杜绝短期行为的发生,形成良性循环,档案数据库建设才能有持久发展的动力。

参考文献

[1]孙淑梅档案管理与计算机[M]北京:档案出版社,1987

[2]洪漪编档案信息组织与检索[M]武汉:武汉大学出版社,1998

王斌 张立海 李杰 梁银平 杨贵生 刘向东

(国土资源实物地质资料中心)

摘要 钻孔图表数据库建设是全国钻孔数据库建设的三大内容之一,是最真实的原始地质钻孔资料信息库,旨在利用计算机和信息技术将地质钻孔的工程布置图、勘探线剖面图、钻孔柱状图、样品分析结果表以及钻孔基础属性等信息,著录建成全国统一的数据库管理系统,并向社会提供服务利用。结合实际工作,本文介绍了钻孔图表数据库建设的工作内容、方法和流程等,希望能为各省(区、市)钻孔图表数据库建设工作提供一定的技术指导。

关键词 钻孔 数据库 资料 方法

0 引言

为充分了解全国地质钻孔基本信息情况,2011年国土资源部印发了《关于开展钻孔基本信息清查工作的通知》。经统计,除油气、海洋和放射性矿产行业外,全国保管有地质钻孔资料的地勘单位1103个,有钻探工作量的项目35580个,钻孔总数958102个,总进尺约218×108m。为充分利用已有地质钻孔资料,降低地质工作风险,减少重复工作,2013年国土资源部印发了《关于开展全国重要地质钻孔数据库建设工作的通知》,在全国组织开展了钻孔数据库建设工作。全国钻孔数据库建设分为图表数据库、属性数据库和岩心图像数据库建设3个阶段。其中,2013~2015年度重点开展钻孔图表数据库建设工作。本文就钻孔图表数据库建设的工作内容和方法介绍如下:

1 目标任务

按照统一的标准和要求,将应汇交、已归档保管且信息完整的区域地质、矿产地质、水文地质、工程地质、环境地质、灾害地质等地质工作形成的地质钻孔工程布置图、勘探线剖面图、钻孔柱状图、样品分析结果表(以下简称“三图一表”)以及钻孔基础属性信息等资料,通过收集、整理、数字化、整合著录等工作,建成全国统一的数据库,并向社会公众提供服务利用。

2 工作内容和方法

21 收集整理地质钻孔资料

以项目为单元,通过查找有钻探工作量的项目的原始地质钻孔资料,收集和整理历史性和新汇交的地质钻孔“三图一表”以及保管单位、项目和钻孔的基本属性信息。同时,各单位应按照数据库中各数据表著录项的内容和要求,以表格形式做好钻孔资料保管单位、项目和钻孔信息的资料收集记录卡片,以便于后续数据著录和质量检查。

22 数字化地质钻孔资料

221 图件数字化质量要求

按照《SZ1999001—2000 图文地质资料扫描数字化规范》要求,利用数字化扫描或数据类型转换方式,生成格式或PDF格式的“三图一表”。其分辨率要求图纸300dpi、文字200dpi(至少在原图和扫描图1:1情况下,以图件中的各字符看清楚为准)。当栅格文件的清晰度不佳时,应根据实际情况调整分辨率和其他相关参数,如门限参数、对比度、亮度等。

对于纸质“三图一表”的扫描,应与原件的对角线误差和边长误差均不得超过±01%,倾斜度<1%。同时,应保证扫描后彩色栅格文件的色彩要有较好的还原度,灰度栅格文件要有层次感。各扫描图件应以文件形式进行单独存储。各扫描图件在钻孔数据库中的编号规则为:组织机构代码+资料档号+图件编号+顺序号。

222 地质钻孔资料的数字化方法

(1)纸质地质钻孔资料的数字化

对于纸质地质钻孔“三图一表”,按照图件数字化质量要求,扫描生成JPEG等格式或PDF格式电子文件。对于一次扫描不能完成的比较大的单个图件,可分割几次进行扫描。经多次扫描形成的多个栅格图件文件,可以拼接;也可以不拼接,保留其原始性。其中,在扫描之前,应对纸质图件进行修整、分类和组织编排等工作。

(2)电子类地质钻孔资料的数字化

对于2013年1月1日以前汇交的电子类地质钻孔资料,各省级地质资料馆可利用商业软件或汇交人开发的专业软件中的功能,将地质钻孔“三图一表”进行数据类型转换,生成JPEG等格式或PDF格式电子文件。对于无法转换的,应查找纸质原始地质钻孔资料,按照纸质地质钻孔资料的扫描方法进行数字化。

对于2013年1月1日以后新汇交的电子类地质钻孔资料,汇交人应利用商业软件或自己开发的专业软件将地质钻孔“三图一表”进行数据类型转换,或者扫描数字化,生成JPEG等格式或PDF格式电子文件,并以单独文件形式进行存储后进行汇交。

23 著录重要地质钻孔图表数据库

利用地质钻孔数据采集系统(以下简称“采集系统”),将地质钻孔信息著录到钻孔图表数据库有两种方法,一是在Excel表中进行录入,然后导入到采集系统中;二是直接利用采集系统,依次录入保管单位、项目和钻孔基本信息。系统界面如图1所示。

对于2011年已建立的地质钻孔基本信息清查数据库,经经纬度坐标转换后,可直接导入到采集系统,无须重复录入。导入完成后,只需在采集系统的项目信息表中补充工程布置图及其数量、勘探线剖面图及其数量、样品分析结果表及其数量、密级等7个属性项内容;钻孔基础信息表中补充勘探线号、孔口高程、钻孔柱状图及其数量等4个属性项内容。

图1 地质钻孔数据采集系统主界面

24 检查地质钻孔数据

地质钻孔数据质量检查分为自查、互查和抽查3个阶段。具体要求如下:一是著录人应按照著录一条自查一条的原则,对照《地质钻孔资料信息记录卡》及时开展,并做好工作日志(表1)和数据质量自查记录(表2),数据自查率为100%;二是各单位项目组应以录入钻孔数量或者时间为单位,及时开展互检工作,重点对属性项内容的准确性、完整性和规范性,以及“三图一表”录入数量和质量等进行检查,并做好数据质量互查记录(表2),数据互检率为100%;三是各省级技术支撑单位应对各地勘单位提交的钻孔图表数据库中各数据表中的必填项、有逻辑关系的字段(如项目结束时间与终孔日期等)、需要利用其进行检索查询和统计分析的字段(如保管单位、行业部门等)等进行100%检查,并至少对数据库中15%的钻孔对照原始地质资料和《地质钻孔资料信息记录卡》,进行钻孔数据的完整性、准确性、规范性,以及“三图一表”数量和质量等抽查工作,要求错误率低于03%;四是国土资源实物地质资料中心(以下简称“实物中心”)负责对31个省(区、市)提交的数据库中15%的钻孔进行数据质量抽查工作。

表1 地质钻孔数据采集工作日志表

表2 地质钻孔数据采集质量检查记录表

25 提交成果

利用采集系统中的“数据完整上报”、“数据默认备份”或“数据导出备份”等功能,生成7z格式的压缩文件进行上报。钻孔图表数据库上报不得采用互联网方式,应选用移动硬盘或光盘向上级部门进行成果提交。

3 工作职责和流程

全国钻孔数据库建设是一项十分复杂的系统工作,需要在政府部门和各单位的共同努力下才能顺利完成。国土资源部、中国地质调查局和各省(区、市)国土资源主管部门负责组织、督导下属各单位开展钻孔数据库建设工作。其他各单位工作职责和流程如下:

31 实物中心工作职责和流程

实物中心负责全国钻孔数据库建设的技术支撑、业务指导和咨询服务工作,工作流程如图2所示。

图2 实物中心工作流程图

32 各省级技术支撑单位工作职责和流程

各省级技术支撑单位负责本省(区、市)钻孔数据库建设的技术支撑、业务指导和咨询服务工作,工作流程如图3所示。

图3 各省(区、市)技术支撑单位工作流程图

33 各地勘单位工作职责和流程

各地勘单位负责完成需要由本单位补充扫描的地质钻孔“三图一表”的建库工作,并负责建立本单位钻孔图表数据库。其工作流程如图4所示。

图4 各地勘单位工作流程图

4 其他问题

1)对于冶金行业历史性的地质钻孔资料中没有钻孔柱状图的,可以扫描《原始地质钻孔编录信息表》替代钻孔柱状图进行录入。

2)对于“孔口高程”在原始地质资料中无法找到的,可根据具有等高线的平面地形地质图、工程布置图或实际材料图等相关资料,测量估算出高程值,并在备注中注明。

3)对于钻孔坐标为地方坐标的,应统一转换为经纬度坐标进行填报。同时,地方坐标的原始数据也应填报。地方坐标转换为经纬度坐标的方法为:①具有钻孔坐标所对应国家坐标的矿区原点坐标的,则可利用简单公式得到:X=X0+α,Y=Y0+b。②没有钻孔坐标所对应国家坐标的矿区原点坐标的,可查找其平面地形地质图、工程布置图等相关资料或其他地形地质图,通过比照的方法,直接读取相应钻孔的坐标(地形图等图件上的坐标为国家坐标的)或通过选取公共点的方式建立地方坐标和国家坐标之间的关系,测量估算出该点的坐标,然后将其转换为经纬度坐标,并在备注中注明为估算坐标。③没有钻孔坐标所对应国家坐标的矿区原点坐标的,也没有平面地形地质图,则应查找项目设计、该矿区开展过的其他工作资料、钻孔位置的文字描述等,如有此类资料,则参照方法①、②进行处理。经查找无以上资料的,可利用该矿区中心点的经纬度坐标作为此项目所有钻孔的坐标,并在备注中注明。

1评价数据标准

系统数据库中的数据格式、大小、类型遵从国家及行业标准,参考的具体标准如表3-1所示。

表3-1 数据库设计参考标准

进入本系统的数据格式及量纲参考《常规油气资源评价实施方案》、《煤层气资源评价实施方案》、《油砂资源评价实施方案》和《油页岩资源评价实施方案》,以及《数据字典》。

2图形图件数据标准

各种地质评价图形遵循以下标准,如表3-2所示。

表3-2 系统图形遵循的相关标准

进入本系统(数据库)的图形必须为带有地理坐标意义的、满足上述标准体系要求的矢量图形,且采用统一的地理底图。具体兼容下列图形格式:

(1)MapGIS图形交换格式;

(2)GeoInfo图形格式;

(3)Arclnfo图形交换格式;

(4)Maplnfo图形交换格式;

(5)GeoMap图形交换格式。

汇交图件的比例尺要求:

全国性图件:1∶400万或1:600万

大区图件:1∶200万

盆地图件:1∶40万或1∶50万

评价单元图件:1∶10万或1:20万

具体图件以《常规油气资源评价实施方案》、《煤层气资源评价实施方案》、《油砂资源评价实施方案》和《油页岩资源评价实施方案》的规定为准。

3数据库基本要求及主要指标

数据库要满足新一轮全国油气资源评价的数据管理及评价需求,有效管理在1TB之内的数据,在该容量下 *** 作性能不发生明显的衰减,具有强大网络支持及安全管理功能,能够同时为20个以上的用户提供服务。

在全面收集了研究区的地、物、化、遥以及所产出的矿床地质特征资料的基础上,完成研究区系统和详细的工作区研究程度图,详细地勾勒了全区总的已经开展的工作状况。

完成中国地质调查局的关于数据库和图库建设的任务,完成了西南三江中段矿产地质数据库,该地质数据库由地质图数据库、矿产地数据库、地理底图数据库、物探数据库(包括重力数据库和航磁数据库)、化探数据库、遥感构造解译数据库六大子库构成。数据库建设的主要进展包括:①完成研究区457个矿床(点)资料收集(四川272个、西藏185个);②完成了研究区1:25万图幅-数据点区域化探数据(共2364个数据点)及藏东和川西地区1:20万区域化探数据36个分幅的数据库收集和建设,并利用多种方法进行必要的数据处理和元素分布背景分析,取得满意的效果;③建立了西南三江中段重力数据库和重力场数据库;④完成 Landsat TM 图像处理,图像波段组合采用 TM543(RGB)进行假彩色合成,同时进行必要的和详细的线、环构造解译;⑤以MapGIS为基础平台,采用VB为开发工具实现二次开发,初步完成了一个针对本区各个子库的管理系统,主要完成各个子库的统一管理及浏览功能;⑥完成三江中段矿产地质数据库成果文件的详细分类。

黑龙江省农用地等别调查与评定工作是国土资源部“新一轮国土资源大调查”试点项目,工作开展较早,由于资金、资料等原因,当时在等别调查与评定工作中没有采用地理信息系统等软件。按照国土资源部预检组提出的提高分等成果电子化程度的要求,黑龙江省国土资源厅成立了以土地利用处处长吴迪为组长、省土地勘测利用技术中心主任李永清为副组长的领导小组,积极协调相关处室收集资料,下发文件要求各级国土资源管理部门配合,在经费十分困难的情况下,积极开展分等数据库建设。

黑龙江省于 2006 年 3 月份开始进行农用地分等成果电子化工作,历时 8 个月,矢量化图形412 幅,建库共录入属性数据 7848 条,形成多幅图件成果,包括分等因素指标区图、分等单元自然质量分值图、土地利用系数等值区图、土地经济系数等值区图、自然质量等别图、利用等别图、经济等别图、标准样地分布图。

为了使大量的农用地等别调查与评定的各项数据得以完善地保存和应用,黑龙江省按照统一的要求和格式,利用计算机技术建立了电子表格数据库,内容包括分等单元原始属性数据表、分等基本参数表、“指定作物-分等因素-自然质量分”记分规则表、分等的基本参数表、土地利用系数表、土地经济系数表、样点产量-投入调查表、指定作物分等计算结果表、分等面积统计表、标准样地属性数据表等。并将以上各种数据统一存入软盘,以便于保存和应用查找。黑龙江省在农用地分等中,已建立了省、市、县三级电子表格数据库,表格统一采用Excel 格式。

在农用地分等数据库中建立图层,绘出标准样地点,形成标准样地空间属性,录入标准样地特性条件,形成标准样地的数据属性,检核、合并数据库文件,建立标准样地数据库。

在数据库建设过程中,根据《农用地分等数据库标准》(国土资源部土地整理中心发布,2005 年 6 月)、《农用地分等定级规程》(国土资源大调查专用),确定了以黑龙江省省级土地利用现状图为底图,参照县(市)级土地利用现状数据库中的耕地、宜农未利用土地范围以及各县(市)农用地自然质量等别图、利用等别图、经济等别图,叠加生成省级分等单元,赋予其属性,建立省级单元与县(市)级单元的追溯关系的建库技术路线。目前,黑龙江省省级数据库建设及其他成果电子化已经完成,省级成果 100% 电子化。同时,望奎县、新林区、呼中区等部分县(区)建立了县(市)级农用地分等数据库。

以上就是关于关于档案数据库建设问题的探讨全部的内容,包括:关于档案数据库建设问题的探讨、重要地质钻孔图表数据库建设工作内容和方法、数据建设标准等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/9286707.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-26
下一篇 2023-04-26

发表评论

登录后才能评论

评论列表(0条)

保存