计算机信息检索系统由几个部分组成?

计算机信息检索系统由几个部分组成?,第1张

一个完整的信息检索系统,通常由信息源、信息组织管理、系统功能、用户接口和系统支持技术等几个有机部分组成。

计算机信息检索系统:是利用计算机和一定的通信设备查找所需信息的检索方式,检索的系统就是人的设计 *** 作和计算机自动化处理相结合的系统。

计算机信息检索系统的保密性是通过对信息条目的存取控制机构来实现的。对于以文件系统为基础的信息检索系统,存取控制一般只能在文件一级,即通过在打开文件时核对口令来控制非授权的用户检索信息。

对于以数据库技术为基础的检索系统,存取控制可以在文件、记录,甚至在信息条目中某信息项一级,既可以通过核对口令方式,也可以采取调用用户编写的编码、译码子程序的方式阻止非授权的用户调用保密的信息。

扩展资料

常用的检索技术主要有以下六种:

1.布尔逻辑检索

利用布尔逻辑算符进行检索词或代码的逻辑组配,是现代信息检索系统中最常用的一种技术。常用的布尔逻辑算符有三种,分别是逻辑或“OR”、逻辑与“AND”和逻辑非“NOT”。

2.截词检索

截词检索是计算机检索系统中应用非常普遍的一种技术。由于西文的构词特性,在检索中经常会遇到名词的单复数形式不一致;同一个意思的词,英美拼法不一致;词干加上不同性质的前缀和后缀就可以派生出许多意义相近的词等等。这是就要用到截词检索。

3.位置检索位置检索也叫全文检索、邻近检索。所谓全文检索,就是利用记录中的自然语言进行检索,词与词之间的逻辑关系用位置算符组配,对检索词之间的相对位置进行限制。这是一种可以不依赖主题词表而直接使用自由词进行检索的技术方法。

4.字段限定检索

字段限定检索是指限定检索词在数据库记录中的一个或几个字段范围内查找的一种检索方法。在检索系统中,数据库设置的可供检索的字段通常有两种:表达文献主题内容特征的基本字段和表达文献外部特征的辅助字段。

5.加权检索

加权检索是某些检索系统中提供的一种定量检索技术。

加权检索同布尔检索、截词检索等一样,也是文献检索的一个基本检索手段,但与它们不同的是,加权检索的侧重点不在于判定检索词或字符串是不是在数据库中存在、与别的检索词或字符串是什么关系,而是在于判定检索词或字符串在满足检索逻辑后对文献命中与否的影响程度。

6.聚类检索

聚类是把没有分类的事物,在不知道应分几类的情况下,根据事物彼此不同的内在属性,将属性相似的信息划分到同一类下面。

参考资料来源:百度百科-计算机信息检索系统

一个完整的信息检索系统,通常由信息源、信息组织管理、系统功能、用户接口和系统支持技术等几个有机部分组成。

1. 信息源信息源是指计算机检索系统信息或数据的来源。信息检索系统中的数据主要来自各种公开文献,如一次文献中的期刊、图书、研究报告、会议论文、专科文献、政府出版物、学位论文;二次文献中的摘要、索引和目录;三次文献中的百科全书、专科词典、名录、指南、手册等。

2. 信息组织管理 信息组织管理主要是指信息标引的方法、组织方式和更新周期。信息组织管理科学、实用、合理与否,会直接关系到信息检索的效果。

3. 系统功能 信息检索系统的功能取决于系统所能提供的检索途径、检索方式和检索方法。信息检索系统功能的状况会在很大程度上影响到检索的结果,例如词表管理。

4.用户接口用户接口承担着 用户与系统之间的通讯功能,是二者之间实现通讯不可缺少的连接系统(软硬件)。它通常由用户模型、信息显示、命令语言和反馈机制等部分构成。

5. 系统技术支持 系统技术支持主要是指系统及其软、硬件平台的通用性、兼容性、可靠性和稳定性。用户输入检索词或提问式后,系统要将检索词或提问式与数据库中存储的数据进行比较运算,然后把运算结果输出给用户。

这位同学啊,书上都有啊!看书完全可以知道的

进行信息检索,一般来说要经过以下基本程序:分析检索课题,选择检索系统及数据库,确定检索词,构建检索提问式,上机检索并调整检索策略,输出检索结果。

1、分析检索课题

利用计算机信息检索系统获取文献信息的用户,一般分为直接用户和间接用户两种类型。直接用户是指最终使用获得的信息进行工作的用户(如,科研人员,管理者,决策者等);间接用户是指专门从事计算机检索服务的检索人员。检索人员在接到用户的检索课题时应首先分析研究课题,全面了解课题的内容以及用户对检索的各种要求,从而有助于正确选择检索系统及数据库,制定合理的检索策略等。分析检索课题时应从以下几方面进行:

(1)弄清用户信息需求的目的和意图。

(2)分析课题涉及的学科范围、主题要求。

(3)课题所需信息的内容及其特征。

(4)课题所需信息的类型,包括文献类型、出版类型、年代范围、语种、著者、机构等。

(5)课题对查新、查准、查全的指标要求。

2、选择检索系统和数据库

在全面分析检索课题的基础上,根据用户要求得到的信息类型、时间范围、课题检索经费支持等因素综合考虑后,选择检索系统和数据库。正确选择数据库,是保证检索成功的基础。选择数据库时必须从以下几个方面考虑:

(1)数据库收录的信息内容所涉及的学科范围;

(2)数据库收录的文献类型、数量、时间范围以及更新周期;

(3)数据库所提供的检索途径、检索功能和服务方式。

3、确定检索词

检索词是表达文献信息需求的基本元素,也是计算机检索系统中进行匹配的基本单元。检索词选择正确与否,直接影响着检索结果。在全面了解检索课题的相关问题后,提炼主要概念与隐含概念,排除次要概念,以便确定检索词。检索词的确定,一般有以下几种方法:

(1)先选用主题词。当所选的数据库具有规范化词表时,应优先选用该数据库词表中与检索课题相关的规范化主题词,从而可获得最佳的检索效果。

(2)选用数据库规定的代码。许多数据库的文档中使用各种代码来表示各种主题范畴,有很高的匹配性。例如,世界专利文摘数据库中的分类代码,化学文摘数据库中的化学物质登记号。

(3)选用常用的专业术语。在数据库没有专用的词表或词表中没有可选的词时,可以从一些已有的相关专业文献中选择常用的专业术语作为检索词。

(4)选用同义词与相关词。同义词、近义词、相关词、缩写词、词形变化等应尽量选全,以提高查全率。

4、构建检索提问式

检索提问式是计算机信息检索中用来表达用户检索提问的逻辑表达式,由检索词和各种布尔逻辑算符、位置算符、截词符以及系统规定的其他组配连接符号组成。检索提问式构建得是否合理,将直接影响查全率和查准率。构建检索提问式时,应正确运用逻辑组配运算符:

(1)使用逻辑“与”算符可以缩小命中范围,起到缩检的作用,得到的检索结果专指性强,查准率也就高。

(2)使用逻辑“或”算符可以扩大命中范围,得到更多的检索结果,起到扩检的作用,查全率也就高。

(3)使用“非”算符可以缩小命中范围,得到更切题的检索效果,也可以提高查准率,但是使用时要慎重,以免把一些相关信息漏掉。另外,在构建检索提问式时,还要注意位置算符、截词符等的使用方法,及各个检索项的限定要求及输入次序等。

5、上机检索并调整检索策略

构建完检索提问式后,就可以上机检索了。检索时,应及时分析检索结果是否与检索要求一致,根据检索结果对检索提问式作相应的修改和调整,直至得到比较满意的结果。

(1)检索结果信息量过多

产生检索结果信息量过多的原因可能有以下两点:一是主题词本身的多义性导致误检;二是对所选的检索词的截词截得太短。在这种情况下,就要考虑缩小检索范围,提高检索结果的查准率。调整检索策略的方法如下:

①减少同义词与同族相关词;

②增加限制概念,采用逻辑“与”连接检索词;

③使用字段限定,将检索词限定在某个或某些字段范围;

④使用逻辑”非”算符,排除无关概念;

⑤调整位置算符,由松变严,(F) (W)。

(2)检索结果信息量过少

造成检索结果信息量少的原因有以下几点:首先,选用了不规范的主题词或某些产品的俗称,商品名称作为检索词;其二,同义词、相关词、近义词没有运用全;其三,上位概念或下位概念没有完整运用。针对这种情况,就要考虑扩大检索范围,提高检索结果的查全率。调整检索策略的方法如下:

①选全同义词与相关词并用逻辑”或”将它们连接起来,增加网罗度;

②减少逻辑“与”的运算,丢掉一些次要的或者太专指的概念;

③去除某些字段限制;

④调整位置算符,由严变松,(W) (F)。

6、输出检索结果

根据检索系统提供的检索结果输出格式,选择需要的记录以及相应的字段(全部字段或部分字段),将结果显示在显示器屏幕上、存储到磁盘或直接打印输出,网络数据库检索系统还提供电子邮件发送,至此,完成整个检索过程。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/yw/12054284.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-20
下一篇 2023-05-20

发表评论

登录后才能评论

评论列表(0条)

保存