在计算机检索中可采取怎样的方法来提高查全率及查准率?

在计算机检索中可采取怎样的方法来提高查全率及查准率?,第1张

提高查全率的方法:

1、扩大检索课题的目标。使用主要概念,排除次要概念。

2、跨库检索。如使用CNKI的跨库检索功能实现对不同类型文献的一次性检索。

3、逐步扩大检索途径的范围。依次选择题名、关键词、文摘、主题、任意字段(全文)往往能逐步提高查全率。

4、取消或者放宽限定条件。例如,避免使用或者放宽信息类型、语种、地理范围、年代范围等检索途径。

5、降低检索词的专指度.可以从词表或检出文献中选一些上位词或相关词补充到检索式。

6、外文单词使用截词检索,可以采用前截断、后截断、前后截断等截词方法。在中文类数据库可以使用更简短的检索词。

7、逐步扩大算符的检索范围,逐步提高查全率的算符依次是:位置算符(w→nw→near)→逻辑算符(and→or)。

提高查准率的方法:

1、检索测量制定较为严谨,多使用概念严谨的主题词。

2、增加参与组配的检索词,提高检索词的专指度。

3、主题词的概念需求更加严谨。

扩展资料

影响查全率的因素主要有:

1、数据库收录文献信息不全;索引词汇缺乏控制和专指性;词表结构不完整;词间关系模糊或不正确等。

2、标引不详;标引前后不一致;标引人员遗漏了原文的重要概念或用词不当等。

3、检索策略过于简单;选词和进行逻辑组配不当;检索途径和方法太少等。

4、检索人员业务不熟练和缺乏耐心;检索系统不具备截词功能和反馈功能,检索时不能全面地描述检索要求等。

参考资料来源:百度百科-查全率

参考资料来源:百度百科-查准率

一、影响查全率的因素主要有:

1、文献储存方面:

①数据库收录文献信息不全;②索引词汇缺乏控制和专指性;③词表结构不完整;④词间关系模糊或不正确;⑤标引不详;⑥标引前后不一致;⑦标引人员遗漏了原文的重要概念或用词不当等。

2、信息检索方面:

①检索策略过于简单;②选词和进行逻辑组配不当;③检索途径和方法太少;④检索人员业务不熟练和缺乏耐心;⑤检索系统不具备截词功能和反馈功能,检索时不能全面地描述检索要求等。

二、影响查准率的因素主要有:

主要是检索出的相关信息量、检索出的信息总量。

查准率主要取决于检索语言的专指性和所拟定的检索策略能否准确表达用户真正的情报需求。若检索策略拟订得较宽泛,参与组配的检索词较少,主题词的概念比用户的情报需求宽泛,则查准率将降低,而查全率将增加,因为二者一般呈互逆相关关系。

扩展资料

查全率与查准率为互逆相关性,查全率一般为60%~70%,查准率约为40%~50%,当查全率超过70%时,若想再提高查全率就必然降低查准率。查准率标志某一检索系统运行过程中拒绝无关文献、选出有关文献的能力,同时也是用户从检出文献中进一步筛选出相关文献所需时间的一种间接测度。

为达到相同查全率,高的查准率意味着用户鉴别检索结果时只需用较少时间,不过这种测度主要适用于评价情报工作人员代替用户检索的情况。

参考资料来源:百度百科-查准率

参考资料来源:百度百科-查全率

衡量信息检索效率的指标有查全率、查准率、漏检率、误检率、检索速度。

查全率(Recall Ratio)是指从数据库内检出的相关的信息量与总量的比率。查全率绝对值很难计算,只能根据数据库内容、数量来估算。

查准率(Precision)(精度)是衡量某一检索系统的信号噪声比的一种指标,即检出的相关文献与检出的全部文献的百分比。

漏检率可解释为漏检比率和漏检概率。漏检比率是指检验人员在检验事件中未发现的不合格品占据当次检验批次总数量的百分比;漏检概率一般是指在使用某种抽样方式进行检验时,可能发生的未抽取到不合格品、抽取到不合格品占抽样数量比例与不合格品在整批产品实际比例不一致时的机率。

误检率是检出不相关文件与检出文件总数之比,可用下式表示:误检率=检出不相关文献数量/检出文献数量*100%。

检索速度简单地来说就是人们检索相关信息的的快慢(时间消耗)。检索在计算机的应用中无所不在。检索速度是衡量一个检索技术最重要的指标之一。检索速度主要受检索算法和硬件影响。

信息检索有广义和狭义的之分。广义的信息检索全称为“信息存储与检索”,是指将信息按一定的方式组织和存储起来,并根据用户的需要找出有关信息的过程。狭义的信息检索为“信息存储与检索”的后半部分,通常称为“信息查找”或“信息搜索”,是指从信息集合中找出用户所需要的有关信息的过程。狭义的信息检索包括3个方面的含义:了解用户的信息需求、信息检索的技术或方法、满足信息用户的需求。

由信息检索原理可知,信息的存储是实现信息检索的基础。这里要存储的信息不仅包括原始文档数据,还包括图片、视频和音频等,首先要将这些原始信息进行计算机语言的转换,并将其存储在数据库中,否则无法进行机器识别。待用户根据意图输入查询请求后,检索系统根据用户的查询请求在数据库中搜索与查询相关的信息,通过一定的匹配机制计算出信息的相似度大小,并按从大到小的顺序将信息转换输出。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/9952447.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-03
下一篇 2023-05-03

发表评论

登录后才能评论

评论列表(0条)

保存