一、引言数据库对于企业信息化的重要性是不言而喻的。数据库存储着现代企业最重要的数据,包括生产、经营、管理等各类数据,这些数据作为企业的核心信息,通过各类信息系统,为用户提供及时准确的信息,帮助用户分析,为用户提供决策依据。为提高企业的工作效率,提升企业形象,具有传统模式无法比拟的优势。其中构建合理高效的数据库,是数据库建设关键之一。如何构建合理高效的数据库是企业信息化过程要解决的问题。下面就数据库的构建谈谈自己的一些经验,希望能对大家有所帮助。
二、设计数据库之前
数据库并不是凭空想象出来的,而是根据业务部门的需要设计符合业务需求的数据库。因此在形成数据库之前需要充分了解业务需求。1充分理解业务需求。需求分析是整个设计过程的基础,是最困难、最耗费时间的一步。在这期间通过与业务部门交流,了解用户的想法以及工作流程,通过双方多次交流,会形成初步的数据模型,当然这时的数据模型不会是最终的模型,还需要和用户进行交流,并且在以后的信息系统开发过程中还会反复修改。2重视输入输出。在定义数据库表和字段需求(输入)时,首先应了解数据产生源和数据流程,也就是必需要知道每个数据在那儿产生,数据在那儿表现,以什么样的形式表现等等,然后根据用户提供的报表或者设计出的报表、查询和视图(输出)以决定为了支持这些输出哪些是必要的表和字段。3创建数据字典和ER图表。ER图表和数据字典可以让任何了解数据库的人都明确如何从数据库中获得数据。ER图对表明表之间关系很有用,而数据字典则说明了每个字段的用途以及任何可能存在的别名。对SQL表达式的文档化来说这是完全必要的。需要注意的是,在需求分析调研过程中,并不是一帆风顺的,因为业务人员对于业务的理解不同,以及对于信息知识的缺乏,会影响需求分析的质量,为了提高质量,各方要用更多的时间交流与相互理解,业务部门需要精通业务的人员自始至终全力配合,而开发人员则尽量使用用户理解的业务术语交流,这样会避免出现理解不同而产生的歧义。三、设计合理的表结构
通常合理的表结构会减少数据冗余,提高数据库的性能。设计合理的表结构要遵循以下两点。1标准化和规范化数据的标准化有助于消除数据库中的数据冗余。标准化有好几种形式,但3NF(第三范式)通常被认为在性能、扩展性和数据完整性方面达到了最好平衡。简单来说,遵守3NF标准的数据库的表设计原则是:某个表只包括其本身基本的属性,当不是它们本身所具有的属性时需进行分解。表之间的关系通过外键相连接。它具有以下特点:有一组表专门存放通过键连接起来的关联数据。例如:某个存放单井信息及其有关油井生产日报信息的3NF数据库就有两个表:单井基础信息和油井日报信息。日报信息不包含单井的任何信息,但表内会存放一个键值,该键指向单井基础信息里包含该油井信息的那一行。不过也有例外,有时为了效率的缘故,对表不进行标准化也是必要的。2考虑各种变化在设计数据库的时候考虑到哪些数据字段将来可能会发生变更。使数据库更具扩展性,从而减少将来数据变更所带来的损失。例如,日期类型字段,有时我们会考虑使用字符类型代替日期类型,因为在处理日期字段上容易产生数据错误,所以我们就使用字符类型。这样的例子还很多,在做前期设计时都要考虑的。表结构的设计不是一次就能成功的,在信息系统开发过程中会存在数据读取、录入或统计困难,为了解决这些问题会修改表结构,或增加一些字段,或修改一些字段的属性。这个过程不断重复,因此不要想一次能成功。建议使用专门设计工具来做这些工作,笔者经常使用:SYBASE,当然还有其它的工具:ORACLEDesigner2000,ROSE等工具。这样会使你的工作事半功倍。四、选择合理的索引
索引是从数据库中获取数据的最高效方式之一。95%的数据库性能问题都可以采用索引技术得到解决。1逻辑主键使用唯一的成组索引,对系统键(作为存储过程)采用唯一的非成组索引,对任何外键列采用非成组索引。考虑数据库的空间有多大,表如何进行访问,还有这些访问是否主要用作读写。2大多数数据库都索引自动创建的主键字段,但是可别忘了索引外键,它们也是经常使用的键,比如运行查询显示主表和所有关联表的某条记录就用得上。3不要索引大型字段(有很多字符),这样作会让索引占用太多的存储空间。如MEMO(备注)、TEXT(文本)等字段。4不要索引常用的小型表不要为小型数据表设置任何键,假如它们经常有插入和删除 *** 作就更别这样作了。对这些插入和删除 *** 作的索引维护可能比扫描表空间消耗更多的时间。如代码表,或系统参数表。五、保证数据完整性
数据的完整性非常重要,这关系到数据的准确性,不准确的数据是毫无价值的,因此保证数据的完整性非常重要。1完整性实现机制:实体完整性:主键参照完整性:父表中删除数据:级联删除;受限删除;置空值父表中插入数据:受限插入;递归插入父表中更新数据:级联更新;受限更新;置空值DBMS对参照完整性可以有两种方法实现:外键实现机制(约束规则)和触发器实现机制用户定义完整性:NOTNULL;CHECK;触发器以上完整性机制需要熟悉和掌握,它对于数据的完整性非常重要。2用约束而非业务规则强制数据完整性采用数据库系统实现数据的完整性。这不但包括通过标准化实现的完整性而且还包括数据的功能性。在写数据的时候还可以增加触发器来保证数据的正确性。不要依赖于业务层保证数据完整性;它不能保证表之间(外键)的完整性所以不能强加于其他完整性规则之上。3强制指示完整性在有害数据进入数据库之前将其剔除。激活数据库系统的指示完整性特性。这样可以保持数据的清洁而能迫使开发人员投入更多的时间处理错误条件。4使用查找控制数据完整性控制数据完整性的最佳方式就是限制用户的录入。只要有可能都应该提供给用户一个清晰的价值列表供其选择。这样将减少键入代码的错误和误解同时提供数据的一致性。某些公共数据特别适合查找:性别代码、单位代码等。5采用视图视图是一个虚拟表,其内容由SQL语句定义,视图不仅可以简化用户对数据的理解,也可以简化他们的 *** 作。那些被经常使用的查询可以被定义为视图,从而使得用户不必为以后的 *** 作每次指定全部的条件。另外通过视图用户只能查询和修改他们所能见到的数据。数据库中的其它数据则既看不见也取不到。数据库授权命令可以使每个用户对数据库的检索限制到特定的数据库对象上,增强数据的安全性。六、结束语
数据库的高效运行不仅需要技术上的支持,也需要硬件平台和网络的支持以及数据库管理员的有效管理,本文只是从技术的角度说明如何提高数据库的效率,但在实际应用过程中其它方面的支持也是不可缺少的,尤其是数据库管理,数据库建设是“三分技术,七分管理,十二分基础数据”,因此对于数据库管理一定要重视,在管理到位的情况下技术才能发挥应有的作用。
余虹剑
(中国地质调查局南京地质调查中心)
摘要 数字化各种档案的目的是要向社会提供信息服务,这种服务需要一个由档案网络体系、网站、数据库、信息服务系统、档案资源等组成的良好的服务平台做支撑。档案数据库建设就是为数字化了的档案提供服务的资源平台。
关键词 著录 数据库 规范 管理
1 标准化、规范化数据著录
档案数据库属于文献数据库,是档案自动化的重要内容。档案数据库是以系统的方法编排的,并可通过电子方式单独访问的档案数据的集合。[1]档案数据库建设的成功与否,在很大程度上取决于数据库的质量。库中的数据条目必须标准、规范,达到有序、有效,库管理本身是科学合理的,这样的数据库 *** 作性一般较强、使用面也较广。科学实用的档案数据库在建库时,一般都会按照相应的技术标准、管理标准和工作标准,最终形成一个自身的标准,形成规范的档案数字化利用平台。作为一个数字档案馆,应先建立馆藏档案的目录数据库,也是著录数据库,包括全宗级、案卷级、文件级目录,并应注意它们之间的关系。另外,根据本单位的馆藏特色开展档案全文数据库建设。档案全文数据库涵盖面较广,一般含有文本型、图形图像型和多媒体型。目录数据库与全文数据库要实现结构化,促发式。档案目录数据库是档案数据库的基本,它能提供便捷的查询路径,阅览者可根据需要,通过一次输入就能提取阅览者希望查询的结果。提供类似查询前必须建立基础信息数据,这些数据包括档案题名、责任者、来源、页码、分类号、主题词、摘要等,少数包含档案全文。[2]这项工作对著录的内容特征如关键词、题名、项目负责人等著录不详细、标准不统一、索引的档案内容深度广度不够,在检索时就会有误差,出现检索不准确、不全面的现象,在一定程度上会影响档案利用率。可以说,著录标引是否标准规范是影响数据库管理的关键因素之一,这项工作大体上决定着数据结构的合理性,这项工作能完成好是检索系统查全、查准的前提。除档案目录数据库外,档案全文数据库、多媒体档案数据库、Web数据库的建设也必须遵守档案著录、标引等标准的原则要求。
2 建立数据库
现阶段根据有关部门的工作需要和计划,按照内容不同,我们建立的数据库分为成果数据库和科技档案数据库,分别针对地质大调查形成的资料和单位各项目形成的资料、收集来的各项各类资料录入数据条目。该数据库更新到目前已收集的所有合格项目的资料和数据,针对这个数据库还建立了目录级数据库共分两级:第一级是项目大类共552条。第二级是各个项目详细内容条目,截至拟稿更新到第一级第240条记录的具体内容共5836条记录。还有一大半有待继续更新录入。
3 保障数据安全是档案信息数据库的根本
档案数据生成即必须长期甚至永久保存。该怎么保证经过数字化后的档案的原始性,防范这些数字内容不被篡改等,都是建设档案数据库时在安全方面应解决的问题。数据库的参数设定、数据存储方式和位置、数据传输途径、使用等各个环节和整个过程都涉及档案数据库的安全。为防止数据丢失、损毁,避免保密信息流失等事故,又要保障海量信息数据的安全、完整,使日积月累产生和收集来的档案数据能在日后长期得到利用,必须把更新档案数据库安全体系、合乎实际工作需求的管理制度作为数据库建设的关键环节。制定既利于工作又能监管数据出入的防范措施,加强数据运行中的监控和管理,使数据库从建设到利用各环节都万无一失。档案数据库建设时,经常使用技术手段实现权限控制,日常的数据备份必不可少。广义上,权限控制应设置读写控制、数据加密等方面,从实际工作需求出发,一般根据用户类别、部门允许访问范围内(包括阅览、下载等)的目录和档案数据对访问和使用设置可访问层度、控制和监督。防写控制是使信息保真的手段,使得用户只能读取信息,而不能修改、复制,以防止信息被篡改。加密技术可以确保控制档案内容的非公开性。为保证权限控制的有效性,要在系统中配置使用记录系统,全程跟踪、自动记录使用情况,进行定期检测与维护,还要随着高新技术的发展,引进新的安防技术。
4 档案信息化建设需要切实加强集中统一的管理体制
档案信息化建设的管理体制是从管理制度上保证业务技术的规范、标准和硬软件选用的统一性,使各层次、各专业办公都纳入统一的档案信息自动化系统管理当中,实现集中统一的管理。使其不能各行其是自建系统,从而减少信息分割和资源浪费现象的发生。档案信息化系统的管理体制,要在较强的管理和先进的技术条件下,实行高度集中管理和方便使用相结合的模式。
5 结束语
本文阐述的只限于在档案资料数据库建设中遇到的极有限的实际工作问题。档案数据库建设是一项长期、持久的工作,作为档案管理部门在进行数据库建设时,要有规划地形成数据库产品,一般需要做用户需求分析、本馆状况分析、效益分析等。科学选题,合理规划,循序渐进,杜绝短期行为的发生,形成良性循环,档案数据库建设才能有持久发展的动力。
参考文献
[1]孙淑梅档案管理与计算机[M]北京:档案出版社,1987
[2]洪漪编档案信息组织与检索[M]武汉:武汉大学出版社,1998
1基础地理数据库建库原则
(1)满足专题研究的特殊需求。河南省1:500000~1∶100000数字地理底图的制作,是根据《河南省国土资源遥感综合调查与信息化工程总体设计书》的要求,应用地理信息系统技术,为其提供数字式基础地理控制信息。基础地理控制信息用于专题信息的定位,正确表现其与周围地理环境的关系的分布规律,综合地反映自然地理形态和社会经济概况。同时,通过非空间数据(属性数据)录入,实现空间数据与非空间数据的对应联结。
(2)以国家基础地理信息中心“数字地图数据库”为基础,根据项目的需要,根据现时资料进行了部分内容的补充、修编。
2地理要素选取标准
(1)水系
图上所有双线河及河心岛,单线河5级以上基本全部选取。河网密度大的在保证体现其河系基本形态的原则下,进行了删减,选取图上面积大于10 mm2的湖泊和水库。
(2)行政区划
选取县级以上行政界线。
(3)居民地
县级以上政府所在地全部选取。地级以上政府所在地按真型居民地范围选取。镇级居民地按经差30′、纬差20′范围内3~5个居民地的标准选取。在部分人口稀疏区选取了部分村级居民地。
(4)交通
铁路及高等级公路全部选取,并按高速公路、国道、省道进行分类;其他公路按照与居民地相连通的原则选取。根据现势资料对近年来新建高速公路进行补充。由于数据及比例尺的不同,故补充信息的精度低于1∶250000比例尺的精度。
(5)地貌
地形等高线高差平原地区为50 m、100 m;低山区为300 m、500 m;中山区为1000 m、1500 m、2000 m。主要山峰及高程,按经差30′、纬差20′范围内选取3个山峰或高程点的标准。
3地理要素分类代码
1∶500000数字地理底图要素分类代码采用中华人民共和国国家标准《国土基础信息数据分类与代码》(GB/T13923-92)。国土基础信息数据分为九个大类,并依次细分为小类,一级和二级。分类代码由六位数字码组成,其结构如下:
遥感·河南省国土资源综合调查与评价
大类码、小类码、一级代码和二级代码分别用数字顺序排列。识别位由用户自行定义,以便于扩充。在1∶500000数字地理底图数据库中没有用到识别位,故用前五位数字表示要素分类代码。
(1)1:500000数字地理底图数据所用到的大类码意义
2=水系;3=居民地;4=交通;6=境界;7=地形。
(2)行政区划代码
1∶500000数字地理底图数据库中县级以上行政区划代码采用中华人民共和国国家标准《中华人民共和国行政区划代码》(GB/T2260-1995)。属性表中数据项为“行政区划代码”。县级以上行政区划代码结构如下:
a采用六位数字代码。按层次分别表示我国各省(自治区、直辖市)、地区(市、州、盟)、县(区、市、旗)的名称。
b行政区划代码从左至右的含义。第一、二位表示省(自治区、直辖市);第三、四位表示省辖市(市、州、盟及国家直辖市所属市辖区和县的总码)其中01~20、51~70表示省辖市;21~50表示地区(州、盟);第五、六位表示县(市辖区、地辖市、省直辖县级市、镇),其中01~18表示市辖区或地辖市,21~80表示县(镇),81~99表示省直辖县级市。
4投影、坐标系、高程系
数字地理底图数据库采用高斯-克吕格(等角横切圆柱)投影,中央经线为113°30 ′00″,坐标系采用1954年北京坐标系,高程系采用1956年黄海高程系。
5地理要素分层
河南省基础地理数字地图图层文件分类详见表531。
表531 河南省基础地理数字地图图层文件分类表
6河南省基础地理数据层描述
(1)基本信息图层名(L2HN01J)
数据描述 表532描述30′×20 ′的经纬网线及其经纬度值。
表532 基本信息属性表
数据项代码及其描述95202=经线;95203=纬线。
(2)水系信息图层名
a水系信息图层名(L2HN02S)
数据描述以多边形表示的水系要素,如河流、湖泊、水库、水塘等。
数据项代码及其描述 22012=常年双线河;22010=运河;23000=湖泊;24010=水库;24150=水塘;25050=水中岛。
河流、湖泊、水库属性见表533。
表533 河流、湖泊、水库属性表
b水系信息图层名(★2HN022H、L2HN02CH)
数据描述 以线表示的水系要素,包括河流、湖泊、水库、运河等。
数据项代码及其描述21011=常年单线河;21012=常年双线河岸线;21021=常年时令河;22010=运河岸线;23000=湖泊岸线;24010=水库岸线;24150=池塘岸线。
河流、海岸线属性见表534。
表534 河流、海岸线属性表
(3)交通信息图层名
a交通信息图层名(L2HN03T)
数据描述 表535描述主要铁路和铁路线起止点城市名。
数据项代码及其描述 41000=铁路;41010=电气化铁路;41011=复线铁路;41012=单线铁路;41013=建筑中铁路;41030=窄轨铁路。
铁路图层属性见表535。
表535 铁路图层属性表
b交通信息图层名(L2HN03G、L2HN03GD、L2HN03SD)
数据描述 表536描述高速公路、国道、省道及起止点城市名称等。
数据项代码及其描述42010=高速公路;42011=建筑中高速公路;41020=一级公路(国道);42070=主要公路(省道);42080=一般公路;42110=大路;42130=小路。
公路图层属性见表536。
表536 公路图层属性表
(4)居民地图层名
a居民地图层名(L2HN04X)
数据描述 表537描述乡镇级以上居民地及其行政区划代码名称等。
数据项代码及其描述31020=省政府驻地;31030=地级市政府驻地;31060=县政府驻地;31080=镇政府驻地;31090=乡政府驻地。
镇级以上居民地属性见表537。
表537 镇级以上居民地属性表
b居民地图层名(L2HN04D)
数据描述 表538描述地级以上真型居民地及其类别和名称。
地区级居民属性见表538。
表538 地区级居民地属性表
(5)政区图层名
a政区图层名(L2HN05X、L2HN05D、L2HN05X)
数据描述 表539描述省级行政界、地级行政界、县级行政界、地区界等。
表539 境界属性表
b政区图层名(L2HN05DQ、L2HN05XD)
数据描述 表5310描述地级行政区、县级行政区。
表5310 行政区属性表
(6)地貌图层名
a地貌图层名(L2HN06D)
数据描述 表5311描述等高线及其高程值。
数据项代码及其描述 71000=等高线。
表5311 地形等高线属性表
b地貌图层名(L2HN06G)
数据描述 表5312描述主要山峰的名称及高程值,主要高程点的高程值。
数据项代码及其描述 72000=山峰。
表5312 山峰高程点属性表
7工作流程
工作流程包括预处理、图形数字化、图形编辑、拓扑关系建立、属性输入、投影变换、输出图形等步骤,各步骤间均经过检查修改等过程。其工艺流程见图531。
图531 河南省基础地理数字地图制作工艺流程图
以上就是关于如何设计一个客户信息数据库全部的内容,包括:如何设计一个客户信息数据库、关于档案数据库建设问题的探讨、 基础地理数据库建设等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)