什么是情报检索系统?

什么是情报检索系统?,第1张

什么是情报检索系统?

[拼音]:qingbao jiansuo xitong

[外文]:information retrieval systems

对情报资料进行收集、编辑、管理和检索的系统。现代情报检索系统是由电子计算机、通信网络和终端设备等组成的自动化系统,可进行情报资料的收集、标引、分析、组织、存储、检索和传播等工作。计算机情报检索可分为数据检索、文献检索、图谱检索、事件检索等类型。计算机情报检索的服务方式又可分为三类:

(1)定题情报服务。它是针对相对固定的用户提出的要求,定期对新到文档进行检索,及时向用户提供所需信息。

(2)回溯情报检索。它是根据用户的要求,对过去某段时间内积累收藏的全部文献,进行主题检索,一般采用脱机批处理方式。

(3)联机情报检索。它采用人机对话的方式,用户在计算机终端上经过通信线路直接与计算机对话,能在短时间内获得检索结果。

简史

早期的情报检索系统采用纯手工方式,使用卡片、索引和目录。直到现在相当一部分图书馆和情报服务中心仍沿用这种方式。40年代曾出现机械 *** 作的检索系统,但未推广。50年代出现了利用穿孔卡片的计算机数据处理系统,它在情报检索方式的革新中起过一定作用。60年代计算机情报检索开始得到推广。当时采用脱机处理和面向磁带的方式,现在有些情报服务中心还沿用这种方式。这一时期还开始研究联机检索方式。1964年美国麻省理工学院研制成功第一个实验性的联机检索系统,它不仅能用标题中的关键词来检索,还可用引文索引和书目结合的原理进行检索。1965年美国航空航天局(NASA)开始研究第一个大规模的联机检索系统RECON,于1969年投入使用。它采用了美国洛克希德公司开发的DIALOG联机检索软件。1971年美国国家医学院图书馆的联机检索系统 MEDLINE投入使用。它采用美国系统发展公司开发的 ORBIT联机检索软件。70年代卫星通信网络TYMNET的建成对发展联机情报检索系统产生重大影响。TYMNET是蒂姆谢尔公司经营的分时数据通信网络,它遍布美国全国并延伸到加拿大和欧洲,通过这个网络连接了许多重要的文献库,它以租用方式为用户提供选接远地数据库的检索服务。这一时期出现的联机文献服务中心,实际上是文献服务零售商。他们通过协议得到若干种文献数据库,连接到自己的计算机系统上,然后向用户提供文献检索服务。例如,系统发展公司经营的ORBIT系统和洛克希德公司经营的DIALOG系统提供了广泛的重要文献数据库的检索服务,包括化学文摘、工程索引、国家技术情报、科学引文索引以及教育情报中心和国家农业图书馆的文献数据库。1977年联机服务的用户已达3000户,年检索次数超过1百万次,累积使用机时达几十万小时。表中是主要联机情报检索系统的概况。




联机情报检索

联机情报检索系统由带有文献数据库的电子计算机、通信网络与终端组成。用户能使用终端直接与他希望查询的文献数据库交换信息。终端一般配备电话机、键盘、显示器和打印机等设备。终端与计算机之间传递信息可通过普通通信线路或通过电话线路或通信卫星来进行。利用通信卫星可以把不同地区和国家的文献数据库连接起来,实现情报资料的共享。联机情报检索的关键技术包括文献数据库、联机情报检索软件、文献传输技术和文献输入输出设备等。

文献数据库

现代联机情报检索系统已发展到拥有数百个文献数据库(见表),每库收录文献数目从数千篇到数百万篇,收录范围包括自然科学、社会科学和人文科学,并有建立跨学科文献数据库和私人文献数据库的倾向。从内容来看,包括简单的题录、文献摘要(即二次文献),直到文献全文(即一次文献)。建立和应用文献数据库包括5个环节:

(1)收集,包括查找合适文献、提取有用数据和鉴定数据的有效性和正确性等三个步骤。

(2)标引,指用代码或某种压缩形式标定选择文献数据的必要信息。代码包括数字代码和图形代码。可用数字化仪或电子扫描的方法输入图形,建立图形数据库。通过标引不仅使信息代码化,而且对数据进行了压缩。

(3)登录,是在计算机里组织和转换信息的过程。一般采用随机存取的方式。文献数据库由文档组成,每个文档包括名称、内容(属性)、建档日期和发表时间。

(4)检索,指用主题词或其他记录项目从文献数据库中找出需要的数据。检索分两个阶段:先用标引所抽出的主题词表示问题,再找出内容与问题的主题词相符合的数据或文献。联机检索使用控制语言,其特点是速度快并能对问题表示的正确性和文档能否正确回答作出一定判断。

(5)传播,即将信息传递给用户。把联机检索系统与缩微胶片系统结合起来,能将照片和文献全文的缩微胶片发送给用户。图形数据库的检索结果还可以通过图形工作站发送。

情报检索软件

联机情报检索软件是通用性很强的模块结构软件,它还具有检查程序,能自动检查和排除故障。现有应用最广的检索软件是DIALOG和ORBIT。在ORBIT软件中用“PROG”和“USER”分别表示系统向用户发送的信息和用户向系统发送的信息。它向用户提供的检索逻辑式有主题词与布尔算符的组合、前面出现过的检索阶段号与主题词和布尔算符的组合、阶段号与布尔算符的组合等多种灵活方式。

文献传输技术

在联机检索系统中,终端用户借助于公用数据网络与系统连接。公用数据网络有三种形式:

(1)租用专线网。它能同时传送数字信息和模拟信息,使用传统的电话线路,能同时传递20对电话,速度为2400位/秒。

(2)数字交换网。它只能传输数字信息,费用便宜。

(3)分组交换网。它也只传输数字信息,把信息分成很多小信息包,每包约为1000位并在包前设置识别头标和接受地址等。这种方式可以平衡线路负荷。传输费用与距离无关。另一种先进的传输技术是传真通信。它能把图像信息变成数字信息,通过电话线路传输。80年代出现高速传真设备,传输速度可达163000页/小时。

文献输入输出设备

情报检索系统采用高性能的输入输出设备来解决人与计算机大量交换信息的问题。光学字符识别器和数字扫描器是重要的输入设备。光学字符识别器可用于自动标引中识别各种字符。数字扫描器对整页文稿进行高速扫描,能将模拟信息转换成数字信息,并且密度很高,还能压缩信息。将光学字符识别与数字扫描技术结合而制成的输入设备,可高速输入文献全文以建立电子文档。高速智能传真复印机也可用作输入设备,它能将文献和图表变成数字信息输入存储器,并具有数字扫描和传真通信的能力。此外,它还能将存储器中的内容直接排版印刷。文献输出设备可采用高速打印机、绘图机和各种智能终端。近年来研制成功的计算机输出缩微胶片系统不仅速度快而且成本低,它将字符和图像变成缩微平片或缩微胶卷存入存储器,然后用扫描器变成电信号,再通过卫星传输到用户终端。计算机输出的缩微胶片是放在盒子里保存的。当输入一个检索词后由系统中的自动检索机器找到命中文献所在的缩微胶片位置,然后自动将胶片检出,在阅读器上显示出来。

参考书目
    C.J.Van Rijsbergen, Information Retrieval 2nd ed.,Batterworths, London,1979.F.W.Lancaster,Information Retrieval Systems: Characteristics, Testing, and evaluation, 2nd ed., Wiley, New York, 1979.

欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/bake/4630323.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-11-05
下一篇 2022-11-05

发表评论

登录后才能评论

评论列表(0条)

保存