余虹剑
(中国地质调查局南京地质调查中心)
摘要 数字化各种档案的目的是要向社会提供信息服务,这种服务需要一个由档案网络体系、网站、数据库、信息服务系统、档案资源等组成的良好的服务平台做支撑。档案数据库建设就是为数字化了的档案提供服务的资源平台。
关键词 著录 数据库 规范 管理
1 标准化、规范化数据著录
档案数据库属于文献数据库,是档案自动化的重要内容。档案数据库是以系统的方法编排的,并可通过电子方式单独访问的档案数据的集合。[1]档案数据库建设的成功与否,在很大程度上取决于数据库的质量。库中的数据条目必须标准、规范,达到有序、有效,库管理本身是科学合理的,这样的数据库 *** 作性一般较强、使用面也较广。科学实用的档案数据库在建库时,一般都会按照相应的技术标准、管理标准和工作标准,最终形成一个自身的标准,形成规范的档案数字化利用平台。作为一个数字档案馆,应先建立馆藏档案的目录数据库,也是著录数据库,包括全宗级、案卷级、文件级目录,并应注意它们之间的关系。另外,根据本单位的馆藏特色开展档案全文数据库建设。档案全文数据库涵盖面较广,一般含有文本型、图形图像型和多媒体型。目录数据库与全文数据库要实现结构化,促发式。档案目录数据库是档案数据库的基本,它能提供便捷的查询路径,阅览者可根据需要,通过一次输入就能提取阅览者希望查询的结果。提供类似查询前必须建立基础信息数据,这些数据包括档案题名、责任者、来源、页码、分类号、主题词、摘要等,少数包含档案全文。[2]这项工作对著录的内容特征如关键词、题名、项目负责人等著录不详细、标准不统一、索引的档案内容深度广度不够,在检索时就会有误差,出现检索不准确、不全面的现象,在一定程度上会影响档案利用率。可以说,著录标引是否标准规范是影响数据库管理的关键因素之一,这项工作大体上决定着数据结构的合理性,这项工作能完成好是检索系统查全、查准的前提。除档案目录数据库外,档案全文数据库、多媒体档案数据库、Web数据库的建设也必须遵守档案著录、标引等标准的原则要求。
2 建立数据库
现阶段根据有关部门的工作需要和计划,按照内容不同,我们建立的数据库分为成果数据库和科技档案数据库,分别针对地质大调查形成的资料和单位各项目形成的资料、收集来的各项各类资料录入数据条目。该数据库更新到目前已收集的所有合格项目的资料和数据,针对这个数据库还建立了目录级数据库共分两级:第一级是项目大类共552条。第二级是各个项目详细内容条目,截至拟稿更新到第一级第240条记录的具体内容共5836条记录。还有一大半有待继续更新录入。
3 保障数据安全是档案信息数据库的根本
档案数据生成即必须长期甚至永久保存。该怎么保证经过数字化后的档案的原始性,防范这些数字内容不被篡改等,都是建设档案数据库时在安全方面应解决的问题。数据库的参数设定、数据存储方式和位置、数据传输途径、使用等各个环节和整个过程都涉及档案数据库的安全。为防止数据丢失、损毁,避免保密信息流失等事故,又要保障海量信息数据的安全、完整,使日积月累产生和收集来的档案数据能在日后长期得到利用,必须把更新档案数据库安全体系、合乎实际工作需求的管理制度作为数据库建设的关键环节。制定既利于工作又能监管数据出入的防范措施,加强数据运行中的监控和管理,使数据库从建设到利用各环节都万无一失。档案数据库建设时,经常使用技术手段实现权限控制,日常的数据备份必不可少。广义上,权限控制应设置读写控制、数据加密等方面,从实际工作需求出发,一般根据用户类别、部门允许访问范围内(包括阅览、下载等)的目录和档案数据对访问和使用设置可访问层度、控制和监督。防写控制是使信息保真的手段,使得用户只能读取信息,而不能修改、复制,以防止信息被篡改。加密技术可以确保控制档案内容的非公开性。为保证权限控制的有效性,要在系统中配置使用记录系统,全程跟踪、自动记录使用情况,进行定期检测与维护,还要随着高新技术的发展,引进新的安防技术。
4 档案信息化建设需要切实加强集中统一的管理体制
档案信息化建设的管理体制是从管理制度上保证业务技术的规范、标准和硬软件选用的统一性,使各层次、各专业办公都纳入统一的档案信息自动化系统管理当中,实现集中统一的管理。使其不能各行其是自建系统,从而减少信息分割和资源浪费现象的发生。档案信息化系统的管理体制,要在较强的管理和先进的技术条件下,实行高度集中管理和方便使用相结合的模式。
5 结束语
本文阐述的只限于在档案资料数据库建设中遇到的极有限的实际工作问题。档案数据库建设是一项长期、持久的工作,作为档案管理部门在进行数据库建设时,要有规划地形成数据库产品,一般需要做用户需求分析、本馆状况分析、效益分析等。科学选题,合理规划,循序渐进,杜绝短期行为的发生,形成良性循环,档案数据库建设才能有持久发展的动力。
参考文献
[1]孙淑梅档案管理与计算机[M]北京:档案出版社,1987
[2]洪漪编档案信息组织与检索[M]武汉:武汉大学出版社,1998
农用地分等数据成果丰富,按照农用地分等的流程可分为自然质量分、自然质量等指数、自然质量等别、土地利用系数、土地经济系数、利用等指数、利用等别、经济等指数和经济等别;按照农用地分等数据的性质可分为空间数据、属性数据、文本数据。为使农用地分等成果能够方便、直观地展现国家级、省级、县级、乡级各级农用地的质量与数量特征,实现对农用地分等数据的查询、分析、融合、分发等功能,必须建立一套统一、规范化的数据管理体系。这套体系能够从农用地分等的基础资料、中间成果和农用地分等成果(图、文、表)等海量数据中提取信息,供汇总平衡、调整、分析,为各级政府部门制定相关政策提供技术支持,是土地信息化的坚实基础,对各级农用地的数据(包括属性数据和矢量数据)进行更新、查询、检索和集成,建设农用地分等数据库。
农用地分等数据库的建设是实现土地资源数量、质量、产能与生态环境并重管理及国土信息化工程建设的基础保障,是实现国土资源现代化管理、社会化服务的必要前提,也是各级政府和国土资源管理部门切实保护基本农田、实施耕地占补按等级折算的重要手段。广西壮族自治区农用地分等自治区级与县级农用地分等成果主要包括文字成果、图件成果、数据成果和电子成果。
1文字成果
文字成果主要包括自治区级与县级农用地分等技术报告(包含县级农用地分等基础资料汇编等)。农用地分等技术报告主要包括4个方面的内容:一是分等对象所在区域的自然、经济和社会概况;二是分等技术方法,包括分等参数的确定,分等因素指标区、分等单元、土地利用系数等值区与土地经济系数等值区的划分方法,分等因素及其分值和权重的确定方法,等别划分方法,分等成果检验与调整方法,计算机技术在分等中的应用以及其他需要说明的技术问题等;三是分等成果及其分布特点和规律、地域组合特点、差异原因、农用地利用中存在的主要问题等;四是分等成果的应用分析。
2图件成果
图件成果具体包括分等单元图、农用地自然质量等别分布图、农用地利用等别分布图、农用地经济等别分布图、标准样地分布图。
3数据成果
数据成果包括广西壮族自治区的农用地分等单元原始属性数据表、样点投入产出调查数据表、农用地分等基本参数表、各指标区“指定作物-分等因素-自然质量分”记分规则表、农用地分等各指标区分等因素体系及其权重表、土地利用系数与土地经济系数汇总表、土地利用系数等值区间表、土地经济系数等值区间表、自治区级农用地分等单元指定作物计算结果表、自治区级农用地分等单元多作物综合计算结果表、农用地分等结果各乡(镇)面积汇总表、农用地分等结果各地类面积汇总表、自治区级农用地分等单元综合数据表、农用地标准样地属性数据表等,部分表格见附录。
4电子成果
广西壮族自治区农用地分等电子成果用光盘或硬盘保存,提交的农用地分等成果包括文字、图件和数据等成果的电子版本。
(二)农用地分等数据库建设的依据与内容
1农用地分等数据库建设的依据
农用地分等数据库建设首先要依据分等数据的特点:一是信息量巨大;二是数据与信息种类多种多样,按数据的特征分为属性数据和矢量数据,按数据的来源和性质分为农用地自然属性和社会经济属性,这些数据涉及土地学、农业学、地理学、测绘学、信息学和经济学等众多学科;三是成果具有复杂多层次的特征。其次,依据《农用地分等数据库标准》,农用地分等成果数据的内涵、特点及其应用需求,设计农用地分等数据库建设方案,按照《农用地分等规程》对农用地分等的各个环节及其成果数据进行整合加工标准化处理,把农用地分等成果的矢量数据和属性数据,通过关联式数据系统储存、管理、整合在一起,建立统一、规范的农用地分等数据库。
2农用地分等数据库建设的内容
农用地分等数据库建设的内容主要包括农用地分等数据的分类编码、农用地分等数据的图形要素分层、农用地分等数据的属性数据结构、分等单元扩展属性结构、外部表格信息和农用地分等数据文件命名6个方面的内容。
农用地分等数据的分类编码包括基础地理信息分类与编码、土地利用信息分类与编码和分等基础信息分类与编码。
农用地分等数据的属性数据结构内容复杂,主要包括基础地理、土地利用类图层属性表、注记属性表结构、县级分等基础层属性表结构、县级分等结果层属性表结构、自治区级分等基础层属性表结构、自治区级分等结果层属性表结构等内容。
分等单元扩展属性结构包括指定作物分等计算结果表结构和县级综合等别计算表结构。
外部表格信息包括指定作物参数表结构、“指定作物-分等因素-分值”说明表结构、“指定作物-分等因素-权重”说明表结构、标准样地属性特征基准分值表结构、“县级-自治区级”农用地分等单元对应表结构、县级文档结果和自治区级文档结果。
农用地分等数据文件命名规则包括以行政区为基础的数据文件命名规则和文档数据文件命名规则等内容。
(三)数据库系统的设计思想和目标
广西壮族自治区农用地分等数据管理信息系统的设计思想是以地理信息系统(GIS)为平台,在计算机软硬件支持下,把各种地理信息按照空间分布,以一定的格式输入、存储、检索、更新、显示、制图和综合分析的计算机技术系统。利用该系统,通过对农用地诸多因素(自然因素和社会经济因素)的综合分析,找出农用地变化的特点与规律,从而迅速地获取满足应用需要的信息,并能以地图、图形或数据的形式表示处理的结果。
1系统的设计思想和目标
广西壮族自治区农用地分等数据管理信息系统的设计是在充分研究和总结土地利用管理的实际工作需求和吸收目前计算机技术在土地管理中的应用经验的基础上,结合国土资源部新一轮国土资源大调查中《县级土地利用数据库标准》和《县(市)级土地利用数据库建设技术规范(征求意见稿)》而制定的。系统的设计综合了以下几方面的技术:①数字制图技术;②计算机的自动查询、检索分类、计算统计技术;③空间查询和分析技术;④空间信息的存储管理技术;⑤计算机网络技术。配套统一以上技术,将地理信息系统(GIS)技术应用到系统的设计中,形成系统基本的设计思想,即按照农用地分等数据的规范和标准,建立起农用地分等数据管理的技术路线和工艺流程,按照GIS的要求严格控制入库数据的精度;提供方便、快捷的实用工具,提高数据库的利用率和满足国土资源管理部门的工作需求;利用地理信息系统中的空间分析功能,完成对数据库的动态更新,维持数据库的现势性。
广西壮族自治区农用地分等数据管理信息系统设计的基本目标是满足国土资源管理部门对农用地分等数据的管理需求,提高土地管理的效率和质量,并且充分利用计算机技术来减轻土地管理工作的劳动强度,最终实现土地管理的信息化,构建“数字国土”工程的基础设施。
2数据入库
数据入库前要检查采集数据的质量,检查合格的数据方可入库。数据检查主要包括矢量数据几何精度和拓扑检查、属性数据完整性和正确性检查、图形和属性数据一致性检查、接边精度和完整性检查等。数据入库主要包括矢量数据、DEM数据、DOM数据、元数据等数据的入库。最后进行系统测试(图3-17)。
图3-17 入库工作流程图
数据入库前要对采集数据进行全面质量检查,并对错误进行改正,数据的检查与更正是数据建库中至关重要的一步。
(1)按照《县级土地利用数据库标准》、《农用地分等规程》等相关标准确定检查项,包括矢量数据几何精度和拓扑检查、属性数据完整性和正确性检查、图形和属性数据一致性检查、接
边完整性检查等。
(2)基于上述检查项,定制检查内容,配置相应的参数。
(3)按照定制的内容,系统自动实现批量检查,也可以采用人机交互方式对重点内容进行检查,对发现的错误及时修正。
(4)自动生成或手工编写检查报告,检查与更正工作结束(图3-18)。
图3-18 数据检查流程图
1)矢量数据入库
(1)数据检查。数据入库前,对矢量数据质量进行全面检查,并记录检查结果,对质量不合格的数据应予以返工,质量检查合格的数据方可入库。
(2)参数输入及其数据组织入库。依据参数设置的要求,向数据库管理系统中输入各种建库参数,对不同数据层的数据建立索引等,各要素数据可分层入库,也可批量入库。
(3)多尺度空间数据连接设置。对于多尺度空间数据库应设置连接参数,便于不同比例尺数据的显示。
2)元数据入库
利用数据库管理软件,采用人工和自动相结合的方法对各要素元数据内容进行检查和处理,导入各种元数据。
3)属性入库
利用Excel软件输入分等评价单元质量分值表,形成分等评价单元自然属性电子表格文件;再将各评价单元的土地利用系数和土地经济系数进行汇总,划分各等值区;然后,汇总到分等评价单元自然属性表中,计算农用地分等单元的自然质量等指数、利用等指数和经济等指数;利用相关软件将整个Excel总表转换到数据库中,存为DBASE格式文件;最后,根据关键属性字段挂接,使图、表合一,形成统一的空间数据库。
4)系统运行情况
数据入库完成后,对系统进行全面的测试;并对测试出现的问题进行全面分析和处理。
具体测试内容及要求为系统运行无死机现象;系统能对数据库中数据层进行组合查询,且数据结构正确;系统能够对数据进行汇总统计并输出相关表格成果;系统能按要求输出相关图件,等等。
(四)系统设计总体框架图
广西壮族自治区农用地分等评价数据管理系统横向包括农用地调查评价基础业务工作,纵向涵盖国家、省、市、县四级国土资源管理部门,其总体框架如图3-19和图3-20。
图3-19 总体框架横向结构图
图3-20 总体框架纵向结构图
(五)数据库系统功能的实现
依据农用地分等成果和土地利用管理的需求,该系统应具有以下基本功能:
1系统建库
系统建库是指把农用地分等成果及其涉及的信息用计算机存储起来,它具有两个方面的含义:一是全面进行数字化建库,采用MapGIS的数据结构和几何特征的描述术语,输入农用地分等数据;还可在已有的图形数据库的基础上进行建库,可利用MapGIS平台提供的数据转换和属性管理工具把图形和属性转换到系统中来;二是变更数据,根据农用地分等进展情况,及时更新农用地分等数据信息系统。
2数据查询和检索
数据查询和检索模块是系统的主要功能模块。该系统提供了强大的地图浏览、图层控制、空间索引、查询统计、空间分析和报表输出等功能,为实现统筹数量、质量与生态并重管理,建设资源节约型社会提供了良好的手段;同时,也满足公众参与管理农用地分等数据的功能,加大土地科学普及工作,树立全社会关注农用地资源安全、耕地保护与国家粮食安全的意识;通过模糊查询、条件查询、空间查找等具体功能可以快速查询村、国家级基本农田、地类图斑等重要对象的空间位置和属性信息;能对县(市、区)各级数据进行实时动态的统计汇总,并可用专题图的形式对不同区域的农用地分等数据按不同的指标进行对比分析,可以输出各种图形和报表;可以根据不同的业务需要,设计不同的数据应用分析模型,例如征地分析模型、土地开发整理前后质量评价模型、土地利用变化模型等。通过系统,按这些模型进行处理,输出分析结果,从而有效地促进国土资源管理工作的信息化、科学化、专业化,提高办事效率,避免决策失误。
3成果输出
依据农用地分等制图规范和土地利用管理需求,输出农用地分等图形和数据成果;还可以按行政区域及任意区域裁剪图件等。
4系统维护
该系统是按照国家的有关规程和标准进行设计的,可根据土地管理实际情况做进一步的编码和更新,满足国土资源管理工作的实际需要。
651 数据库建设技术方法及工作流程
6511 技术方法
基于遥感影像土地利用数据建库,是以武汉中地公司开发的 MapGIS 土地利用数据库软件为工作平台,以县级行政辖区为单元,将已有的乡级及以上行政界线(采用全国第一次土地详查所确定的行政界线)叠加在以县为单位镶嵌的 1∶1 万正射影像图上,以正射影像图为本底图,参考已有的土地利用数据库或土地利用详查数据,结合遥感影像解译资料,采用人机交互的方式,目视解译采集地类图斑边界、线状地物,提取工作区土地利用分类信息。分别建立确定图斑、不确定图斑、样本图斑层,并制作外业调查工作底图,对不确定图斑、样本图斑以及抽取一定比例的确定图斑到外业进行实地验证,通过外业后处理,最终建立基于遥感影像信息的土地利用数据库。
6512 工作流程
工作流程如图 6-19 所示。
图 6-19 基于遥感影像信息土地利用数据库建设工作流程图
652 数据采集
以县级行政辖区为单元,将土地利用数据库中乡级及以上行政界线套叠在正射影像图上,结合样本影像信息并参考已有的土地利用数据库和土地利用详查资料,采用目视解译方法提取土地利用现状信息。
(1)多元数据复合分析。
1)与已有土地利用数据库复合。利用已建成的土地利用数据库与正射影像数据叠加,参考数据库地类属性数据,根据遥感数据的光谱和空间特征,通过人机交互采集土地利用现状信息。如图 6-20 所示。
图 6-20 遥感影像与土地利用数据叠加示意图
2)与土地利用现状图复合分析。对于未建成土地利用数据库的,将收集到的土地利用现状图扫描、纠正、投影变换后与正射影像套合,辅助提取土地利用现状信息。如图 6-21 所示。
图 6-21 土地利用现状图与遥感影像图复合示意图
(2)数据采集方法及要求。
1)使用MapGIS软件进行分层矢量化,为了保证数字化精度,我们要求显示窗口放大比例在100倍以上,采用半自动、交互式分层矢量采集,这样才能保证与影像同名地物不偏移。
2)将原土地现状数据库行政界线套合在DOM影像上,根据行政界线与影像套合情况,采用修正的方法进行局部调整,即影像上以线状地物为界的原行政界线明显偏离的,以影像上线状地物为准作局部修正,影像上没有线状地物作参考的直接采用原行政界线。
3)被乡级以上行政界线、地类界线、线状地物等分割而成的封闭地块为一个图斑。上图图斑的最小面积为:耕地和农村居民点最小上图面积为3mm2×3mm2(实地为900m2),其他地类为3mm2×5mm2(实地为1500m2)。
4)地类图斑边界的采集,可采取先易后难、先平原区后山区的方法,即先采集易于判读的居民地边界,然后依次采集纹理清晰的铁路、公路、河流、沟渠等,最后采集难以区分的地类边界。
5)线状地物:对于实际宽度小于30m的铁路、公路、河流等,沿影像轮廓中心线按图示用相应单线勾绘,大于等于30m的按图斑处理,当线状地物宽度变化大于20%时,分段标记。宽度量测除其本身宽度外还包含其两侧不以排灌为主的路沟及行道树。
6)河流:河流宽度为常水位线水面宽度。常水位线以原土地利用数据库数据或正射影像为准,如土地数据库所标位置偏移较大时可做适当移动,河流宽度不再实地调查。
7)公路林带:公路两侧种植的实际宽度大于等于30m的林带,按实际宽度标绘。公路宽度小于30m,而单侧林带宽度大于30m的,公路按线状地物标识,而林带则按实际宽度标绘。
(3)数据分层。按照《基于遥感影像土地利用数据库标准》的图层划分和命名规则将矢量数据分别建立县级政区、地类图斑、线状地物、行政界线、地面控制点、地类界线、注记、样本图斑线、不一致图斑线等数据层。
(4)属性结构的建立及属性输入。按照《基于遥感影像土地利用数据库标准》对分层数据分别建立属性结构,逐层输入属性内容。
(5)建立数据字典。数据字典设计是数据库设计的一项重要内容。新建工程前首先要建立系统的数据字典文件。依据《基于遥感影像土地利用数据库标准》定义的相关属性字段名、值域以及数据描述等建立基于遥感影像土地利用数据库运行所必需的数据字典。主要包括地类编码、行政区和权属单位等数据字典。
1)设置数据字典参数。按照国标《中华人民共和国行政区划代码》,省级行政区、省辖市级行政区、县级行政区的行政代码长度均为2位,乡级及行政村级政区代码均为3位。在“土地利用数据库管理系统”中,依次设置各级行政区划代码位数。如图6-22所示。
图 6-22 新建数据字典
2)编辑数据字典。根据技术要求中规定的基于遥感影像的土地利用分类,修改、增添或减少数据字典中的地类码。如图6-23所示。
图 6-23 编辑数据字典
(6)建立接图表。接图表文件记录了每个图幅的图名、图号、经度、纬度等信息,是标准图幅输出的依据。本项目接图表是根据大地坐标建立索引(图6-24)。
图 6-24 建立接图表
(7)数据入库。经过入库前数据检查,准备好完全拓扑无错误和图数一致的数据,并且建立好数据字典和接图表后,可建立工程文件,进行数据入库管理。
以县级行政辖区为单位,对采编的行政辖区、行政界线、地类图斑、线状地物、地类界线、注记、影像、DEM 等文件进行数据整理入库,建立土地利用信息管理数据库。
(8)数据预处理。数据预处理是进行表格汇总打印输出的前提,是为汇总输出和空间分析进行数据准备。实质上是扣除线状地物的面积、利用耕地系数计算耕地面积以及每个图斑净面积的计算。如图 6-25 所示。
(9)数据汇总。汇总输出各类面积汇总表。建立基于遥感影像土地利用数据管理系统。
图 6-25 数据预处理
不难。
1+x不动产数据采集与建库通过率高达975%,是建筑工程技术专业表明劳动者具有从事某一职业所必备的学识和技能的证明。
1+X证书全称:学历证书+若干职业技能等级证书,教育部等部门联合印发《关于在院校实施“学历证书+若干职业技能等级证书”制度试点方案》。
部署启动“学历证书+若干职业技能等级证书”(简称1+X证书)制度试点工作。方案提出,探索建设职业教育国家“学分银行”。
以上就是关于关于档案数据库建设问题的探讨全部的内容,包括:关于档案数据库建设问题的探讨、分等数据库的建设、土地利用数据建库等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)