计算机信息检索基本算符??含义

计算机信息检索基本算符??含义,第1张

1.布尔逻辑算符

规定检索词之间的逻辑关系的算符,称为布尔逻辑算符。布尔逻辑算符包括逻辑"或(OR)"、"与(AND)"和"非(NOT)"。

(1) 或(OR)运算符。也可用"+"代替,是用来组配具有同义或同族概念的词,如同义词、相关词等。其含义是,检出的记录中,至少含有两个检索词中的一个。OR算符的基本作用是扩大检索范围,增加命中文献量,提高检索结果的查全率,OR运算符还有一个去重的功能。在实际检索中,同一组面中含义相同的词,相互之间都使用OR运算符。另外,在使用截词方法检索具有相同词干的检索词时,这些词之间也自动地隐含了逻辑"或"的关系。

 (2) 与(AND)运算符。也可用"*"代替,用来组配不同检索概念。其含义是检出的记录必须同时含有所有的检索词。AND算符的基本作用是缩小检索范围,减少命中文献量,提高检索结果的查准率。在实际检索中,不同概念组面之间以及同一组面内的不同含义的词之间通常使用AND算符。

(3) 非(NOT)运算符。也可用"-"代替,但在检索时建议使用NOT,以避免与词间的分隔符"-"混淆,NOT算符是排除含有某些词的记录的,即检出的记录中只能含有NOT算符前的检索词,但不能同时含有其后的词。NOT算符的基本作用是缩小检索范围,提高检索结果的查准率.

对于一个复杂的逻辑检索式,检索系统的处理是从左向右进行的。在有括号的情况下,先执行括号内的运算;有多层括号时,先执行最内层括号中的运算,逐层向外进行。在没有括号的情况下,And、Or、Not的运算次序,在不同的系统中有不同的规定。

2. 位置算符

位置算符又称邻接算符(adjacent operators),适用于两个检索词以指定间隔距离或者指定的顺序出现的场合,比如,以词组形式表达的概念;彼此相邻的两个或两个以上的词;被禁用词或特殊符号分隔的词等。位置算符是调整检索策略的一种重要手段。按照两个检索词出现的顺序和距离,可以有多种位置算符,而且对同一种位置算符,检索系统不同,规定的位置算符也不同。例如,Compendex光盘数据库使用的位置算符"(N)"(表示其两侧的检索词必须紧密相连,除开空格和标点符号外,不得插入其它词或字母,两词的词序可以颠倒)、"(F)"(表示其两侧的检索词必须在同一字段(例如同在题目字段或文摘字段)中出现,两词的词序可以颠倒)、"(S)"(表示其两侧的检索词必须在同一句子中出现,两词的词序可以颠倒)和"(W)"(表示其两侧的检索词必须紧密相连,除开空格和标点符号外,不得插入其它词或字母,两词的词序不可以颠倒)四种(如下所列)。

(1)(nW)算符:表示两个检索词(关键词、主题词)中间可以插入“n”个词,但他们之间的顺序不能颠倒,但允许有一空格或标点符号。

(2)(nN)算符:表示两个检索词(关键词、主题词)中间可以插入“n”个词,且词序可以颠倒。

(3)(F)算符:表示两个检索词(关键词、主题词)必须出现在同一个字段内,但两词的词序和中间插入的词数不限。

(4)(S)算符:表示两个检索词(关键词、主题词)必须出现在同一个子字段内,但两词的词序和中间插入的词数不限。

注意:在不同的数据库中,位置算符检索功能及算符不同,应参看数据库的使用说明。

 3.字段限制

字段限制也是调整检索策略的一种重要的手段。它是限定检索词必须在数据库记录中规定的字段范围内出现的文献,方为命中文献的一种检索方法。如果想指定在题名等字段中查找所希望的检索词,就需要使用字段限制。字段限制适用于在已有一定数量输出记录的基础上,通过指定字段的方法,减少输出篇数,提高检索结果的查准率的场合。由于字段限制采用前缀和后缀的形式,因此又称为前缀限制和后缀限制。例如Compendex光盘数据库基本字段限制的用法是在需要指定字段的检索词后加上后缀运算符"/"和段码。这个数据库辅助字段限制的用法是在需要指定字段的检索词(有时检索词须放在双引号内)之前加上段码和前缀运算符"="。

常用的字段代码有标题(TI)、文摘(AB)、叙词(DE)、识别词或自由词(ID)、作者(AU)、语种(LA)、刊名(JN)、文献类型(DT)、年代(PY)等。这些限制符在不同的数据库系统有不同的表达形式和使用规则。

4. 截词符检索(Truncation、Wildcard Symbols)

利用检索词(关键词、主题词)的词干或不完整词形进行查找的过程为截词检索。它可以起到扩大检索范围,提高查全率,减少检索词(关键词、主题词)(关键词、主题词)的输入量,节省检索时间。尤其在英文检索系统中检索时,若遇到名词的单复数形式,词的不同拼写法,词的后缀变化时,均可采用此方法。截词的方式有多种,可以分为有限截词、无限截词和中间截词。

EI compendex就指的是EI检索,现在EI数据库改名叫Compendex了。

Compendex 数据库中的核心数据:

数据的内容全面,主要包括:

论文标题(Title)

作者(Authors)

第一作者单位(First author affiliation)

英文文摘(Abstract)

论文所在期刊名称(Serial title)

卷(Volume)期(Issue)

论文页码(Pages)

分类码(Ei classification codes)

主题词(Ei main heading)

受控词(Ei controlled terms)自由词(Uncontrolled terms) 等等。

其中:分类码(Ei classification codes)主题词(Ei main heading)受控词(Ei controlled terms)自由词(Uncontrolled terms)需要专业人员单独给出。

2. Compendex 数据库中的非核心数据:

数据内容主要包括:

论文标题(Title)

作者(Authors)

论文所在期刊名称(Serial title)

卷(Volume)期(Issue)

论文页码(Pages)

部分数据带有英文文摘

第一作者单位(First author affiliation)。

不需要任何专业人员再做工作。

3. Compendex 数据库中的核心和非核心数据的主要区别在于:数据中是否有分类码(Ei classification codes)和主题词(Ei main heading)有这两项内容的数据是核心数据,反之是非核心数据。

ei检索式中wn意思是“within”的缩写。

表示将检索词限定在相应的字段中,检索式中如果用{}作精确限定,则其中的作者格式一定要与论文记录中的作者标引格式保持完全一致


欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/sjk/6704059.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-03-27
下一篇 2023-03-27

发表评论

登录后才能评论

评论列表(0条)

保存