摘 要:网络数据库是重要的电子资源,有着独特的优势与良好的发展前景。文章从8个方面分析了国外网络数据库的当前特点,并对其未来发展趋势进行了探讨。
关键词:网络数据库 电子资源 特点 发展趋势
On Special Features and Development Trends of Web Databases
ABTRACT As one of important electronic resources, network databases have distinctive advantages and bright prospects. In this paper, the author analyzes the present characteristics of network databases and discuss its development trends. 9 refs.
KEY WORDS Network databases. Electronic resources
近年来,随着互联网的扩展和升级,网络数据库有了迅猛的发展。及时了解、探讨国外网络数据库的特点与发展趋势有助于图书馆对电子资源的评估、引进及其开发利用;同时亦可为国内网络数据库开发商提供有益的启示。
1. 网络数据库的特点
网络数据库是重要的电子资源,与印刷型文献及光盘、磁盘等电子出版物相比,网络版数据库有着独特的优势,正日益受到图书馆及其用户的青睐。
1.1 数据量大、增长迅速、更新速度快
在国外,数据库生产已形成规模,走向产业化和商业化,这就使得网络数据库的整体发展呈现出以下两个特点。一是数据库规模大、数据量多,增长迅速。如号称世界上最大学术电子出版物供应商的Elsevier Science,通过ScienceDirtect可在线提供多个数据库产品服务,包括一个综合性的学术期刊全文数据库、多个专题数据库、12种参考工具书及15个书目数据库,可检索、浏览的信息资源包括1500多种全文学术期刊、 5900万条文摘记录、2百万篇学术期刊论文。ISI的Web of Knowledge 信息平台上目前可提供服务的数据库有:ISI三大引文索引数据库、期刊目次库、多个专业文献信息及事实数据库、会议录及专利信息数据库;现有数据容量为:核心期刊8600多种、学术会议录论文记录2百多万条,专利信息2千多万条、化学反应60多万个、化合物1百多万个;其数据的年增长量为:12000多个学术会议的22万多条会议录论文记录,收入的期刊数量则以2.3%的速度递增。
二是数据更新速度快、周期短,如SCI、ISTP、BA、EI等著名文摘索引的印刷版、光盘版一般为每季度或每月更新,而相应的网络版数据库通常是每周更新;电子期刊数据库的更新通常早于其相应的印刷版,为每周或每日更新;而电子报纸的更新速度则可以以小时、分秒计算。
1.2 品种齐全,内容丰富
网络数据库品种繁多,内容丰富。从文献的加工程度看,既有目录、索引、文摘等二次文献数据库,如ISI的三大引文索引、Biosis Preview、EI Village等,又有期刊论文、会议论文等一次文献数据库,如 Elsevier Science的全文期刊数据库、IEEE/IEE Electronic Library等。从文献类型看,既有电子期刊、电子报纸、电子图书, 如Science、Nature Publishing Group、Springer-Link、netLibrary等,又有学位论文、会议录、专利、标准等数据库,如ProQuest的 Digital Dissertations、ISI Proceedings、IEEE/IEE Electronic Library、Derwent Innovations Index等。从学科范围看,既有单学科的,又有多学科综合性的,如RSC(化学)、IOPP(物理学)、Lexis.com (法律、法学)、ABI、Business Source Premier(商业与经济管理)、Elsevier Science 全文电子期刊数据库(综合性)、Springer-Link(人文社会科学、自然科学与医学)。从数据库的开发与供应看,既有书刊代理商,如,EBSCO、 Blackwell,又有出版商,如Elsevier Science、Springer、John Wiley 、World Scientific等著名出版商,还有研究所、学协会等,如ISI、Royas Society of Chemistry 及Institue of Physics等。
1.3 使用便捷、无时空限制
网络数据库借助于互联网出版发行,除极少数外,绝大多数是连续作业,24小时不停机,通过互联网为世界各地授权终端用户提供服务,且同一数据库可同时为多人取用。这就为人们检索、利用数据库提供了极大的便利,只要网路畅通,用户足不出户,即可查找、获取、利用所需信息资源,无须受信息资源储存的地理位置及图书馆开放时间的影响与限制,可克服图书馆传统服务受时空限制的缺陷。
网络数据库的用户界面友好,易于理解、便于使用。首先,网络数据库的用户界面设计通常直观清晰、图文并茂,如不同的文献类型用不同的图形符号标示,生动直观;其次数据库往往设有专门的功能帮助键,且帮助信息详略适当、清晰、便于查阅;第三,对信息资源的查找利用具有选择与限定的自由,如,可在不同的数据库或文档、不同检索方式之间自由切换与选择,可对文献类型、出版时间、出版形式、可检字段等进行限定与选择,用户只需点击鼠标,即可完成选择与链接 *** 作。这是其他形式的出版物所无法比拟的。
1. 4 数据标准、规范、多元
网络数据库的生产标准、规范,如采用超文本、多媒体等先进成熟的信息处理技术,遵循Z39.50等通用的标准、协议与规范,使用Internet Explorer、Netscape等通用、标准浏览器,以及PDF格式文档标准阅读器Acrobat Reader等,既便于用户的 *** 作使用,又便于数据的交换与系统的扩展整合,同时也为数据库的稳定、畅通使用提供了保证。
数据档案格式多元,可包含更多传统纸本媒体无法提供的文档格式。目前,网络数据库数据文档常用的格式有PDF、ASCII(TEXT)及HTML,可满足不同的需要。此外,Word、PostScript格式文档亦常有所见,例如在计算机科学领域,有时可发现许多电子期刊全文内还附上了计算机执行档供使用者取用执行。
图书馆及其网络终端用户只须熟悉常见、通用计算机解读软件的使用,无需特别加以培训,即可充分利用网络数据库检索、浏览、打印、下载所需信息资源。
1.5 数据库的检索功能强
网络数据库的检索功能往往较为强大,这就使得网络数据库在信息检索的检全率、检准率以及检索的灵活性、方便性等方面较之其他形式的出版物更突出、更具优势。其主要表现在以下几个方面:
(1)检索模块灵活、多样
除提供基本或简易检索模块,供初学者及一般用户使用外。还可提供各种形式的高级检索模块,以方便用户进行限定字段检索,或使用逻辑算符(AND 、OR和 NOT)、括号、位置算符、截词符和词根符等构造检索式,进行组配检索,使得检索更为灵活,更为准确。
(2)检索途径(入口)多
除提供关键词、 题名、 著者、刊名及字顺等多种检索途径外,类似INSPEC、Web of Scince等检索途径(入口)多而广的数据库将越来越多,前者的字段检索(Search Fields)提供有40个字段列表,每个字段都可作为检索入口,后者则提供有分子式等特殊多样的检索入口。
(3)扩、缩检手段灵活、多变
除使用逻辑算符(AND 、OR和 NOT)、括号、位置算符、截词符和词根符等符号进行扩、缩检外;还可对不同的数据库、文档、可检字段(包括关键词(Keyword)、题名(Title)、著者(Author Name)、文摘(Abstract)、全文(Full Text)及所有字段(All Fields)、出版年代、文献类型(包括图书、期刊、报纸、文章等)等进行选择与限定。
1.6 检索结果的显示与输出灵活、多样
(1)检索结果的显示方式灵活、多样
主要表现在三个方面:一是每屏显示的记录数的限定;二是排序方式的多样化,可按相关度、出版时间、文献标题、著者、来源、语言、出版国等多种方式升序或降序排列。如INSPEC数据库检索结果的排序方式即多达10种;三是显示格式的多样化,可提供题录(Citation)、 题录+文摘(Citation+Abstract)、 全记录(Complete Field)或选择字段(Select Field)等多种格式显示。
(2)检索结果的输出方式多元化
不仅可提供存盘、 打印方式下载数据,且可利用E-mial发送检索结果,或将检索结果直接输出到文献信息管理软件,如ProCite 、Reference Manager、EndNote等中,亦或直接在网上订购文献全文。
1.7 数据库系统具有扩展整合功能
对用户来说,理想的状态是:透过一个数据库即可迅速查到所需信息并加以取用,系统扩展整合功能可帮助用户实现其理想。系统扩展整合功能是指数据库开发商借助互联网,利用超文本技术,在不同的信息资源之间进行链接,将原本相互独立、但互为联系的信息资源与服务整合在一块,使之形成为一个互动的有机整体,用户只需透过同一界面,即可迅速查到并获取自己所需要的信息。目前,数据库供应商提供的系统整合功能主要有以下几种:
(1)与图书馆馆藏的链接与整合
目前数据库供应商提供的链接方式有两种:一是数据转入或人工直接输入;二是单向式或双向式直接与OPAC链接,直接链接更为方便、经济、有效。数据库与图书馆馆藏的整合通常可通过数据的上载和下载实现。数据上载,即将图书馆的纸本馆藏记录上载到数据库中,对数据库中只有文摘,没有全文而本馆有纸本馆藏的期刊给予馆藏标示与链接,为读者提供最经济、快捷获取原文资料的信息。数据下载,即将数据库所收录的全部期刊的 MARC 数据下载到图书馆的OPAC中,予以揭示。数据库与图书馆纸本馆藏链接整合,既便于读者在图书馆的各种馆藏资源中串联,弥补单一馆藏资源的不足,从而迅速、有效地检索、获取所需文献信息,又便于图书馆充分、有效地揭示、开发与利用其纸本与电子馆藏。目前,可提供馆藏链接与整合功能的数据库供应商有不少,但整合方式则有所区别。如 SWETSNet 提供LINK-IN/OUT功能;OCLC的 SiteSearch 提供 Web界面,经由Z39.50协议达成整合;EBSCO的EBSCOhost 提供双向式链接。
(2)与其他数据库的链接与整合
由于收录的文献范围、侧重点的不同,数据库之间往往既交叉重复,又详略不等。若能在彼此间进行链接,即可帮助用户获取更为详细、更为丰富的相关信息,有利于科研创新与发现。ISI为扩展系统整合功能而特别建立的ISI Links即可满足这种要求。ISI Links通过在不同的数据库之间进行链接,将各种不同来源的数据库加以整合,使得用户只需透过同一的界面进行检索,即可迅速高效地找到自己所需的信息。目前,ISI Web of Knowledge平台可在ISI Web of Scienc、ISI Proceedings、CCC、JCR、BIOSIS Previews、ISI Chemistry、Derwent Innovation Index、NCBI GenBank及INSPEC等数据库之间进行双向链接。如透过ISI Chemistry所进行的文献调研可以经由Web of Science获得更多的相关文献的资料,而在Web of Science中所找到的文献又可透过ISI Chemistry 获得更为详细的反应信息。
(3)与原始文献的链接
即系统利用超文本链接功能,为用户直接提供其在数据库,尤其是书目、索引、文摘数据库中查到的相关文献的原始文献链接。在书目索引文摘等二次文献数据库与全文数据库之间建立链接,可帮助用户迅速、直接访问、获取所需原始文献信息,克服二次文献数据库的固有缺陷,增强数据库的全文提供能力,同时,亦可提高全文数据库的利用率,于读者、于图书馆而言均是十分有利的。目前,数据库供应商提供原始文献链接的方式主要有两种,一是链接到出版商的电子期刊全文,二是链接到相应的全文数据库。例如,ISI已与Academic Press、Americn Institute of Physics 、Elseriver 等16个机构建立了友好的合作关系,可链接到的数百家出版商的数千种全文电子期刊。CSA (Cambridge Scientific Abstracts)数据库的做法与此相似。EBSCO则通过EBSCOhost Electronic Journals Service (EJS),在 PsycINFO、 Socilogical Abstracts、 ERIC、 MEDLINE、 Econlit、CINAHL 、HealthSTAR 、Life Sciences(CSA)等索引文摘数据库中直接提供出版商以及Academic Search Elite、BioMedical FullTEXT Collection等全文数据库中相关电子期刊的全文链接,EBSCOhost EJS可链接的期刊现有8000种,可链接的全文期刊论文达340万篇。目前,可提供该种整合功能与服务的数据库还有OCLC 的ECO、SWETS等,但前提是图书馆必须订购这些全文数据库或相应电子期刊的纸本形式。
(4)与Internet 信息资源的链接
Internet中包含着丰富的信息资源,网络数据库利用网络便利,可提供相关的Internet信息资源检索与链接,读者只需输入一个检索式即可同时检索数据库及Internet 中的相关信息。该种链接不仅可补充、扩展数据库资源,且可为用户快捷、有效地利用Internet信息资源提供方便。如ISI 的专家对3700多个经过严格评估的学科站点的学术文献进行标引,通过Current Contents eSearch,用户可在检索期刊文献的同时,检索、浏览14万篇全文Web文献。值得一提的是,ISI的互联网文献的链接是基于每一篇以网页形式出现的学术文献具体内容的检索与标引,更细微、更深入。目前,可提供Internet信息资源检索与链接服务功能的数据库有CAS(Cambridge Scientific Abstracts)的Internet Databases Service (IDS)、EBSCO 的EBSCO Host、OCLC 的FirstSearch、、SliverPlatter 的SliverLinker等。
1.8 可提供相关电子信息服务
数据库产品与服务紧密结合,这是网络数据库的又一显著特征。目前,数据库开发商提供的相关电子信息服务主要有:
(1) 文献传递服务,当用户从二次文献数据库中查到所需信息并希望得到文献全文时,可通过电子方式在线订购所需要的文献全文。原文订购若选择电子文献传递方式,一般在24小时内即可获得所需文献,方便、快捷,可弥补书目索引文摘等二次文献数据库不能提供全文的不足。
(2) 定题服务,与传统的定题服务提供相似,基于网络数据库的定题服务允许图书馆及其用户根据需要开展多种形式的SDI服务。目前,数据库供应商提供的SDI服务主要有两种。一是指定参考用书(reserved list)服务,即系统提供图书馆依主题方式整理出类似所谓的指定参考用书(reserved list)功能选项,从而达成专门的SDI服务。
二是个性化文献报导服务,即由用户创建自己的检索策略,系统定期将符合条件的检索结果传递给用户。例如,Uncover的最新文献报导服务(Uncover reveal) 由用户选择自己感兴趣的关键词或期刊(最多可选50种)建立用户需求文档,系统每周一次,自动地将相关文献及用户所选期刊的最新一期目次信息发送到用户的Email信箱,用户只需定期查看自己的Email信箱,即可及时了解最新研究动态。而ISI的个性化信息代理服务( Discovery Agent, 又称个性化定题快讯服务),则是ISI基于其现刊题录数据库 Current Contents高质量的信息资源而建立的。利用Discovery Agent ,用户可根据需要,按主题、编著者、期刊名、地址/机构等项目自行制定、管理和编辑自己的检索策略,并不断检测检索结果以获得最合适的检索策略,随后系统便会每周将基于该检索策略的检索结果通过Internet Web 传送给用户,其传递方式主要有两种:即Email和 Web发布加上Email通知,需要时可通过电子方式订购由ISI Document Solution所提供的全文。个性化文献报导服务直接面向网络终端用户,个性化特色鲜明,与全文传递服务配合使用,可实现用户自行 *** 作、完成由建立检索策略、查看检索结果到订购原始文献的文献检索与获取全过程的良好结合与循环,从而帮助用户方便、及时地了解、追踪、获取自己真正需要的最新信息(包括题录、文摘信息及原始文献),减少信息查询负担,提高工作效率。
近年来,国外网络网络数据库发展迅速,已形成一定的规模,但仍存在一些问题与不足,主要是:网络是必要条件,一旦断网或无网,数据库即无法使用;数据库内容存在交叉重复,如ABI与BSP、ARL与ASP;高水平学术电子期刊的品种与数量有限;数据库的开放程度有限,给数据库之间的整合带来困难;数据库的购买模式过于单一,不够灵活等。
2. 网络数据库的发展趋势
网络数据库作为一种主要的电子资源,其独特的优势在网络环境下日益突显。随着计算机、通信网络与信息技术的不断发展,未来几年网络数据库将继续呈现出良好的发展势头,成为图书馆发展电子馆藏、开展电子信息服务的重要资源与基础。
2.1 学术电子期刊迅速增长
在发展初期,由于数据库品种与数量有限,选择范围小,图书馆及其用户对数据库的要求不可能也无法要求太高、太多。但是,随着图书馆电子资源建设与电子信息服务的深入发展,图书馆及其用户对电子资源的需求将不断增加,要求亦将越来越高,将更加注重数据库的内容。书目索引文摘等二次文献数据库及普通期刊全文数据库将不再能满足图书馆,尤其是学术图书馆及其用户的需求,人们迫切需要高品质的学术电子期刊。未来几年,高品质的学术电子期刊是最具发展前途的,将迅速增长。据了解,越来越多的著名学术出版商、研究机构以及专业学协会,例如Springer-Verlag、John Wiley、World Scientific、Science、Nature Publishing Group等著名出版商以及英国皇家化学学会(RSC)、英国物理学会(IOP),美国计算机学会(ACM)等正在或拟在近期将其纸本期刊电子化,或者直接创办新的电子期刊。国外有专家预测,未来5年之内,在万维网上将可看到所有重要的自然科学、工程技术与医学学术期刊。届时,学术图书馆的电子期刊与纸本期刊的结构比例将发生变化。
2.2 电子图书迅速蔓延
继电子期刊后,电子图书潜在的巨大市场将引发出版社、数据库开发商及其代理商新一轮的竞争与合作,其结果必然是电子图书的迅猛发展。OCLC的netLibrary已获得10余家大学及其他出版社电子图书的发行权,现有电子图书4万种,2003年计划在此基础上新增2万种电子图书。Springer现有电子图书1300余种,并已成功将The Series Lecture Notes in Computer(LNCS)、 Lecture Notes in Mathematics、 Lecture Notes in Physics等20套丛书中的1000余种书电子化,这些丛书及其他图书的电子化工作将持续进行。John Wiley继2000年提供参考书在线服务后, 2001年11月又推出了在线图书Online Books, Online Books现有电子图书(手册、专著等)180多种,内容涉及化学、生命科学与医学、电子工程/通信等多个学科领域,预计2002年底可达300种。 ProQuest 的Safari Tech Books Online则将电子图书的重点放在IT领域,号称可提供50%以上已出版的IT图书,且通常情况下,新电子图书的提供将先于其印刷版。此外,Safari Tech Books Online 还具有较强的扩展与整合功能。难怪国外有专家预测,未来几年将是互联网上电子图书迅速蔓延的时期。从上述实例,我们不难预测,未来几年,电子图书将成为电子资源新的增长点。电子图书不仅在数量、品种和范围上有大的增长,且在结构、功能上有所发展,此外,电子图书的购买模式将更为灵活、多样。
2.3 文献全文取用即时方便
为了满足图书馆及其用户快速方便地获取所需原始文献的需要,实现信息检索、原文获取的一体化,数据库开发商与集成商日益重视数据库原始文献的提供,以强化数据库原文取用的即时性与方便性。其实现途径主要有以下几种:
(1)不断开发新的电子期刊全文数据库。未来几年电子期刊,尤其是高品质的学术期刊将迅速增加。此外,学术期刊过刊数据库回溯建设将进一步丰富全文电子期刊的品种与数量。例如,Elsevier Science已于2001年1月启动过刊数据库项目(Backfiles Program), 计划用3年时间,即到2003年底,完成其所收入的1500余种期刊中1995年以前出版的约300-350万篇期刊论文的回溯建库。届时,透过ScienceDirect可检索、浏览的期刊论文全文将多达800万篇、约4千万页。
(2)增加现有数据库中全文期刊的品种与数量,如Bell &Howell 公司(原UMI公司)的学术期刊图书馆( Proquest Research Library)1999年收录的报刊总数为2308种,其中,全文刊为1472种,2000年报刊总数达2345种,全文刊则增至1533种,2002年全文刊增至1700多种。 EBSCO的学术全文数据库(Academic Search Elite),1999年收录期刊3215种,其中,全文期刊996种,2002年其升级版Academic Search Premier收录的期刊达4425种,其中,全文期刊增至3467种。Elsevier Science的ScienceDirect 期刊数据库2000年收录期刊1100多种,2002年初增加到1200多种, 2002年5月成功收购IDEAL,将包括Academic Press、Mosby、Churchill Livingstone, W.B. Saunders等出版商在内的335种全文期刊纳入其系统,使其期刊总数增至1500多种,成为目前世界上最大的全文期刊数据库。
(3)提供原始文献链接,方式主要有四种。一是链接到出版商的电子期刊全文,例如,ISI近期将与Cambridege University Press、OCLC、Project Muse 等机构建立友好的合作关系,届时ISI的合作伙伴将近20个,可进行全文电子期刊链接的出版商将多达2300家,ISI的最终目标是力争与其收录的8000多种期刊种的所有电子版全文进行链接。二是链接到相应的全文数据库;三是链接到互联网上的文献全文;四是链接到图书馆的纸本馆藏期刊。
(4)直接在网上订购文献全文。
剩下的通过邮件发给你
PDF文件格式可以将文字、字型、格式、颜色及独立于设备和分辨率的图形图像等封装在一个文件中。而你的意思是将PDF文件以数据库形式存放,需要时以数据库来调用么。计算机多以二进制保存传输数据,PDF文件本身是一组二进制流,在封装的文件中将不同的信息分开归类,数据库则与之等同的设定一系列的项目来存放这些数据。SQL数据库是三级模式的数据库,分为关系模式,储存模式和子模式。
你用百度搜一下SQL,其中有一段SQL语言组成,可能对问题有帮助。
实际上,PDF转换到数据库,应该说很难,我也只了解很少的一部分,可以多查些资料,更为准确些。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)