进行信息检索,一般来说要经过以下基本程序:分析检索课题,选择检索系统及数据库,确定检索词,构建检索提问式,上机检索并调整检索策略,输出检索结果。
1、分析检索课题
利用计算机信息检索系统获取文献信息的用户,一般分为直接用户和间接用户两种类型。直接用户是指最终使用获得的信息进行工作的用户(如,科研人员,管理者,决策者等);间接用户是指专门从事计算机检索服务的检索人员。检索人员在接到用户的检索课题时应首先分析研究课题,全面了解课题的内容以及用户对检索的各种要求,从而有助于正确选择检索系统及数据库,制定合理的检索策略等。分析检索课题时应从以下几方面进行:
(1)弄清用户信息需求的目的和意图。
(2)分析课题涉及的学科范围、主题要求。
(3)课题所需信息的内容及其特征。
(4)课题所需信息的类型,包括文献类型、出版类型、年代范围、语种、著者、机构等。
(5)课题对查新、查准、查全的指标要求。
2、选择检索系统和数据库
在全面分析检索课题的基础上,根据用户要求得到的信息类型、时间范围、课题检索经费支持等因素综合考虑后,选择检索系统和数据库。正确选择数据库,是保证检索成功的基础。选择数据库时必须从以下几个方面考虑:
(1)数据库收录的信息内容所涉及的学科范围;
(2)数据库收录的文献类型、数量、时间范围以及更新周期;
(3)数据库所提供的检索途径、检索功能和服务方式。
3、确定检索词
检索词是表达文献信息需求的基本元素,也是计算机检索系统中进行匹配的基本单元。检索词选择正确与否,直接影响着检索结果。在全面了解检索课题的相关问题后,提炼主要概念与隐含概念,排除次要概念,以便确定检索词。检索词的确定,一般有以下几种方法:
(1)先选用主题词。当所选的数据库具有规范化词表时,应优先选用该数据库词表中与检索课题相关的规范化主题词,从而可获得最佳的检索效果。
(2)选用数据库规定的代码。许多数据库的文档中使用各种代码来表示各种主题范畴,有很高的匹配性。例如,世界专利文摘数据库中的分类代码,化学文摘数据库中的化学物质登记号。
(3)选用常用的专业术语。在数据库没有专用的词表或词表中没有可选的词时,可以从一些已有的相关专业文献中选择常用的专业术语作为检索词。
(4)选用同义词与相关词。同义词、近义词、相关词、缩写词、词形变化等应尽量选全,以提高查全率。
4、构建检索提问式
检索提问式是计算机信息检索中用来表达用户检索提问的逻辑表达式,由检索词和各种布尔逻辑算符、位置算符、截词符以及系统规定的其他组配连接符号组成。检索提问式构建得是否合理,将直接影响查全率和查准率。构建检索提问式时,应正确运用逻辑组配运算符:
(1)使用逻辑“与”算符可以缩小命中范围,起到缩检的作用,得到的检索结果专指性强,查准率也就高。
(2)使用逻辑“或”算符可以扩大命中范围,得到更多的检索结果,起到扩检的作用,查全率也就高。
(3)使用“非”算符可以缩小命中范围,得到更切题的检索效果,也可以提高查准率,但是使用时要慎重,以免把一些相关信息漏掉。另外,在构建检索提问式时,还要注意位置算符、截词符等的使用方法,及各个检索项的限定要求及输入次序等。
5、上机检索并调整检索策略
构建完检索提问式后,就可以上机检索了。检索时,应及时分析检索结果是否与检索要求一致,根据检索结果对检索提问式作相应的修改和调整,直至得到比较满意的结果。
(1)检索结果信息量过多
产生检索结果信息量过多的原因可能有以下两点:一是主题词本身的多义性导致误检;二是对所选的检索词的截词截得太短。在这种情况下,就要考虑缩小检索范围,提高检索结果的查准率。调整检索策略的方法如下:
①减少同义词与同族相关词;
②增加限制概念,采用逻辑“与”连接检索词;
③使用字段限定,将检索词限定在某个或某些字段范围;
④使用逻辑”非”算符,排除无关概念;
⑤调整位置算符,由松变严,(F) (W)。
(2)检索结果信息量过少
造成检索结果信息量少的原因有以下几点:首先,选用了不规范的主题词或某些产品的俗称,商品名称作为检索词;其二,同义词、相关词、近义词没有运用全;其三,上位概念或下位概念没有完整运用。针对这种情况,就要考虑扩大检索范围,提高检索结果的查全率。调整检索策略的方法如下:
①选全同义词与相关词并用逻辑”或”将它们连接起来,增加网罗度;
②减少逻辑“与”的运算,丢掉一些次要的或者太专指的概念;
③去除某些字段限制;
④调整位置算符,由严变松,(W) (F)。
6、输出检索结果
根据检索系统提供的检索结果输出格式,选择需要的记录以及相应的字段(全部字段或部分字段),将结果显示在显示器屏幕上、存储到磁盘或直接打印输出,网络数据库检索系统还提供电子邮件发送,至此,完成整个检索过程。
信息检索(Information Retrieval)是指信息按一定的方式组织起来,并根据信息用户的需要找出有关的信息的过程和技术。狭义的信息检索就是信息检索过程的后半部分,即从信息集合中找出所需要的信息的过程,也就是我们常说的信息查寻(Information Search 或Information Seek)。通常程序:发现问题,寻找信息源,确定检索工具,检索,信息利用,检索评价
文献检索的一般程序文献检索程序也就是文献检索的过程和步骤。工具书虽然说是为了能够迅速给人们提供所需
要的知识或资料而编写的,但如果对工具书的知识了解不多,又不熟悉有效的检索步骤和方法,
面对成千上万的各类工具书,只是胡乱翻翻,那是达不到满意效果的。熟悉或掌握检索程序,也
是文献或知识检索的一项基本功。大体上,分以下五步:
1、根据需要确定检索范围
应当熟悉自己所要检索的资料的性质,看看属于哪个学科或哪一类,应尽量缩小检索范围,
便于快速检索。如果一时确定不了比较正确的检索范围,就只能利用综合性工具书如《辞海》、
百科全书了。
2、熟悉和利用现有的对口工具书
工具书种类繁多,必须对各种工具书比较熟悉,才能够按图索骥。各类工具书都有一定的收
录范围和编纂目的。多多熟悉各种不同的工具书,检索资料就会起到事半功倍的效果。
3、查阅凡例和熟悉排检法,检索出所需资料
一般,工具书的凡例说明了该工具书的编纂原则,编纂时间、出版时间、所收词目数量和范
围、怎么注音、如何解释、如何使用检索等内容。目录里则排列出了本辞书的全部内容标题,列
出了各种不同的排检方法。供熟悉不同排检法的人选择使用。如一部《辞海》就有六种排检法可
供选择。所以,查阅凡例很重要。
4、摘录和复制资料
途径有:一是卡片摘录,这是针对所需要的资料很少的时候用的;二是复印,这是针对所需
要的资料很多、长篇大论都可以用的时候用的;三是下载打印,这是针对电子数据或资料而用
的;四是剪贴,这是针对自己订阅的报刊和书籍而用的,图书馆和其他公共场所的报刊是绝对不
能剪贴的;五是电脑保存,这是针对有自用电脑的人而言的,但必须做好多个备份或保存到多个
移动硬盘里,以免因计算机中病毒或重新安装系统或不小心格式化硬盘而造成数据或资料丢失。
5、整理资料。一般是分类整理:有笔记式、卡片箱式、袋装式等各种形式。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)