计 算 机 检 索 系 统 的 构 成
计算机检索系统由计算机硬件、软件、数据库和通讯网络构成。
一、计算机硬件
计算机硬件是系统采用的各种硬设备的总称,主要包括具有一定性能的主计算机、外围设备以及与数据处理或数据传送有关的其他设备。
二、软件
软件由系统维护软件与检索软件构成。系统维护软件,如数据库管理程序、词表管理程序等,其作用是保障检索系统的高效运转。检索软件是用户与系统的界面,用户通过检索软件进行检索,检索软件功能的强弱直接影响着检索效果。检索软件可以分为指令式、菜单式和智能接口等。
三、数据库
根据ISO/DIS 5127标准,数据定义为:“至少由一种文档组成,并能满足某一特定目的或某一特定数据处理系统需要的一种数据集合。”通俗地说,数据库就是在计算机存储设备上按一定方式存储的相互关联的数据集合。
按国际上通用的分类方法,数据库可以划分为以下类型:
1 参考数据库
参考数据库(Reference databases)是指引用户到另一信息源以获得原文或其他细节的一类数据库。它包括书目数据库(Bibliographic databases)和指南数据库(Referral database或Directory database)两种。
书目数据库是指存储某个领域的二次文献(如文摘、题录、目录等书目数据)的一类数据库,有时又称为二次文献数据库,或简称为文献数据库。如中国机械工程文摘数据库,属于此类型数据库。
指南数据库也称指示性数据库,是指存储关于某些机构、人物、出版物、项目、程序、活动等对象的简要描述,指引用户从其他有关信息源获取更详细的信息的一类数据库。如产品目录、机构名录、研发项目、基金项目等数据库均属于此类型。
2 源数据库
源数据库(Source databases)是指能直接提供原始资料或具体数据的数据库,用户不必再查阅其他信息源。它可以分为:
(1)数值数据库这是一种专门提供以数值方式表示的数据的源数据库,如统计数据库、财务数据库等。
(2)文本-数值数据库这是一种能同时提供文本信息和数值数据的源数据库,如企业信息数据库、产品数据库等。
(3)全文数据库这是一种存储文献全文或其中主要部分的源数据库,如法律法规全文库、期刊全文库等。
(4)术语数据库这是一种专门存储名词术语信息、词语信息以及术语工作和语言规范工作成果的源数据库,如名词术语信息库、各种电子化辞书等。
(5)图像数据库这是一种用来存储各种图像或图形信息及有关文字说明资料的源数据库,主要应用于建筑、设计、广告、产品、或照片等资料类型的计算机存储与检索。
除上述几种类型的数据库外,还有能同时存储多种不同类型数据的数据库,即混合型数据库。另外,按其载体不同又可分成磁媒体数据库、光盘数据库和多媒体数据库等。
四、通讯网络
由于现代通信技术的发展,公共数据传输技术为信息的传递提供了保障,信息检索逐渐发展成为网络检索,通过数据传输网将各个计算机连接起来。每个计算机成为网络中的一个节点,每个节点可含一个或多个数据库,网络上的每个节点和其终端只要有授权均可对网络中的数据库进行访问,实现资源共享。随着空间技术的发展,信息检索已进入了信息传递-卫星通讯-计算机技术三位一体的新阶段。
收录学位论文的数据库有:中国知网博士学位论文全文数据库、中国知网硕士学位论文全文数据库、万方中国学位论文全文数据库等。
1、中国知网博士学位论文全文数据库。
该数据库是国内内容最全、质量最高、出版周期最短、数据最规范、最实用的博士学位论文全文数据库。内容覆盖基础科学、工程技术、农业、医学、哲学、人文、社会科学等各个领域。目前,收录1984年以来全国426家培养单位的博士学位论文290565篇。
2、中国知网硕士学位论文全文数据库。
该数据库重点收录985、211高校、中国科学院、社会科学院等重点院校高校的优秀硕士论文、重要特色学科如通信、军事学、中医药等专业的优秀硕士论文。出版内容覆盖基础科学、工程技术、农业、哲学、医学、哲学、人文、社会科学等各个领域。目前,收录来自699家培养单位的优秀硕士学位论文2671056篇。
3、万方中国学位论文全文数据库
该数据库收录的学位论文始于1980年,年增30万篇,并逐年回溯,与国内900余所高校、科研院所合作,占研究生学位授予单位85%以上,涵盖理、工、农、医、人文社科、交通运输、航空航天、环境科学等各学科。
4、华艺台湾学术文献数据库。
华艺为台湾最大的学术数据库公司,华艺-台湾学术文献数据库包含《台湾科学期刊数据库》及《台湾科学学位论文数据库》。《台湾科学学位论文全文数据库》为全台最大科学学位论文库,收录31所重点大学约50000篇全文(台湾大学为独家收录)。支持简繁体中文检索,PDF直接下载。是了解台湾学术研究资源最重要的电子全文数据库。
5、CADAL数字图书馆
收录内容:CADAL数字图书馆是全文型数据库,收录了CADAL共建单位的学位论文全文16万余篇,包括1900多篇民国学位论文和16万5千多篇当代学位论文。当代论文全文更新至2006年。检索功能:提供名称检索、作者检索、馆藏单位检索。提供学位论文按出版时间浏览。
6、ProQuest学位论文全文数据库
收录内容:ProQuest学位论文全文数据库是国外学位论文中国集团全文检索平台。收录了1743年至今的来自欧美、加拿大等60多个国家4000多所高校的优秀博士、硕士论文,涵盖文、理、工、农、医等高质量的学术研究领域。
该数据库的论文是由国内高校或机构图书馆经合作购买而形成的论文全文数据库。目前,中国集团全文检索平台可以共享访问的全文论文已超过80万篇。
检索功能:提供标题检索、摘要检索、作者检索、导师检索、学校检索、学科检索等检索功能。提供主题分类浏览和学校分类浏览导航功能。
7、ProQuest博硕士论文文摘索引数据库PQDT
收录内容:ProQuest博硕士论文文摘索引数据库是文摘型数据库。它收录主要来自欧美国家4000多所高校的500多万篇学位论文,是目前世界上最大和最广泛使用的学位论文数据库。该数据库每周更新,平均每年新增约20万篇条目,多数论文可以预览前24页原文。如只需检索学位论文,请选择数据库首页上方“学位论文”栏目。
国内五大论文数据库如下:
一、中国知网提供的《中国学术期刊(光盘版)》
也称中国期刊全文数据库由清华同方股份有限公司出版。
收录1994年以来国内6 600种期刊,包括了学术期刊于非学术期刊,涵盖理工、农业、医药卫生、文史哲、政治军事与法律、教育与社会科学综合、电子技术与信息科学、经济与管理。
收录的学术期刊同时作为“中国学术期刊综合评价数据库统计源期刊”。
但是收录的期刊不很全面,一些重要期刊未能收录。
二、中国生物医学文献数据库(CBMDISC)
数据库是中国医学科学院信息研究所开发研制,收录了自1978年以来1 600余种中国生物医学期刊。
范围涉及基础医学、临床医学、预防医学、药学、中医学及中药学等生物医学的各个领域。
三、中文生物医学期刊数据库(CMCC)
由中国人民解放军医学图书馆数据库研究部研制开发。
收录了1994年以来国内正式出版发行的生物医学期刊和一些自办发行的生物医学刊物1 000余种的文献题录和文摘。
涉及的主要学科领域有:基础医学、临床医学、预防医学、药学、医学生物学、中医学、中药学、医院管理及医学信息等生物医学的各个领域。
并具有成果查新功能医学全在线
四、万方数据资源系统(China Info)
由中国科技信息研究所,万方数据股份有限公司研制。
该数据库收录的期刊学科范围广,包括了学术期刊于非学术期刊,提供约2 000种的电子期刊的全文检索。
被收录的学术期刊都获得了“中国核心期刊(遴选)数据库来源期刊”的收录证书。
个别期刊甚至将“遴选”改成“精选”,或者干脆去掉。
很多作者因此误以为这就是核心期刊。
五、维普数据库
也称中文科技期刊数据库,维普科技期刊数据库,由中国科学技术信息研究所重庆分所出版。
收录了1989年以来我国自然科学、工程技术、农业科学、医药卫生、经济管理、教育科学和图书情报等学科9 000余种期刊,包括了学术与非学术期刊。
收录期刊数量很大,但不足之处是部分国家新闻出版总署公布的非法期刊也被收录了。
一般的,学术期刊都能进入至少1个国内期刊数据库。
期刊据数据库不是期刊的评价体系,对科研处的期刊性质评价也就缺乏足够的意义,故不宜作为期刊性质评价的依据。
另外还有:
1、万方数据
万方数据提供中国大陆科技期刊检索,是万方数据股份有限公司建立的专业学术知识服务网站。
隶属于万方数据资源系统,对外服务数据由万方数据资源系统统一部署提供。
2、全国报刊索引
收录全国包括港台地区的期刊8000种左右,月报道量在18万条以上,年报道量在44万条左右,书本式用户有3500多家,现又出版光盘数据库。
反映了中国政治、经济、军事、科学、文化、文学艺术、历史地理、科技等方面的发展情况,提供了国内外最新学术进展信息。
该索引是我国收录报刊种类最多,内容涉及范围最广,持续出版时间最长,与新文献保持同步发展的权威性检索刊物,也是查找建国以来报刊论文资料最重要的检索工具。
正文采用分类编排,先后采用过《中国人民大学图书分类法》和自编的《报刊资料分类表》,1980年起,仿《中国图书馆图书分类法》分21类编排,1992年全面改用《中国图书资料分类法》(第三版)编排,2000年开始用《中国图书馆分类法》(第四版)标引,计算机编排。
在著录上,《全国报刊索引》从1991年起采用国家标准——《检索期刊条目著录规则》进行著录,包括题名、著译者姓名、报刊名、版本、卷期标识、起止页码、附注等项。
同时,“哲社版”采用电脑编排,增加了“著者索引”、“题中人名分析索引”、“引用报刊一览表”,方便了读者的使用。
3、超星数字图书馆
为目前世界最大的中文在线数字图书馆,提供大量的电子图书资源提供阅读,其中包括文学、经济、计算机等五十余大类,数十万册电子图书,300万篇论文,全文总量4亿余页,数据总量30000GB,大量免费电子图书,并且每天仍在不断的增加与更新。
覆盖范围:涉及哲学、宗教、社科总论、经典理论、民族学、经济学、自然科学总论、计算机等各个学科门类。
本馆已订购67万余册。
收录年限:1977年至今。
4、维普资讯
维普资讯是科学技术部西南信息中心下属的一家大型的专业化数据公司,是中文期刊数据库建设事业的奠基人,公司全称重庆维普资讯有限公司。
目前已经成为中国最大的综合文献数据库。
从1989年开始,一直致力于对海量的报刊数据进行科学严谨的研究、分析,采集、加工等深层次开发和推广应用。
5、中宏数据库
中宏数据库由国家发改委所属的中国宏观经济学会、中宏基金、中国宏观经济信息网、中宏经济研究中心联合研创。
是由18类大库、74类中库组成,涵盖了九十年代以来宏观经济、区域经济、产业经济、金融保险、投资消费、世界经济、政策法规、统计数字、研究报告等方面的详尽内容,是目前国内门类最全,分类最细,容量最大的经济类数据库。
发展现状
在数据库的发展历史上,数据库先后经历了层次数据库、网状数据库和关系数据库等各个阶段的发展,数据库技术在各个方面的快速的发展。特别是关系型数据库已经成为目前数据库产品中最重要的一员,80年代以来,几乎所有的数据库厂商新出的数据库产品都支持关系型数据库,
即使一些非关系数据库产品也几乎都有支持关系数据库的接口。这主要是传统的关系型数据库可以比较好的解决管理和存储关系型数据的问题。随着云计算的发展和大数据时代的到来,关系型数据库越来越无法满足需要,
这主要是由于越来越多的半关系型和非关系型数据需要用数据库进行存储管理,以此同时,分布式技术等新技术的出现也对数据库的技术提出了新的要求,于是越来越多的非关系型数据库就开始出现,这类数据库与传统的关系型数据库在设计和数据结构有了很大的不同,
它们更强调数据库数据的高并发读写和存储大数据,这类数据库一般被称为NoSQL(Not only SQL)数据库。而传统的关系型数据库在一些传统领域依然保持了强大的生命力。
百度百科——数据库
以上就是关于计算机检索系统的构成是什么全部的内容,包括:计算机检索系统的构成是什么、收录学位论文的数据库有哪些、国内五大论文数据库等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)