标引的概念

标引的概念,第1张

标引(Indexing),顾名思义,标是标记,引是指引,就是通过标记指引人们方便、快捷地找到所需要的信息。通过对文献的分析,选用确切的检索标识(类号、标题词、叙词、关键词、人名、地名等),用以反映该文献内容的过程。标引是文献加工中的重要环节,通过标引,文献工作者赋予文献以检索标识,指明其内容特征的主题类属,而后用以配合书目信息编制出各种目录和索引,存储于计算机内,以实现文献的检索。标引可按使用检索语言的类型区分,使用分类检索语言时,称为分类标引;使用主题检索语言时,称为主题标引。主题标引又分为受控标引与非控标引。受控标引指须由事先指定的叙词表(主题词表)中选用相应规范词,对文献进行标引。非控标引又称为自由词标引,指不设规范词表而由标引人员直接选用文献内自然语言词,对文献进行标引。标引的实质,是按文献的内容特征对其进行主题类属的划分与区分。

标引的质量,对文献的检索效果有直接的决定性影响。衡量标引的质量,一般采用两个客观上可比的指标,即:穷举度与一致性。标引穷举度,指标引时是否将文献所讨论的全部主题反映出来;标引一致性,是指不同标引人员或同一标引人员在不同时期,对同一主题文献标引时,对其主题归属的一致程度。从文献检索的角度看,穷举度高,有利于提高查全率;一致性强,则有利于提高查准率。

虽然人们已经可以通过网络数据库实现全文检索,但这并不意味着标引的重要性的降低。与之相反,面对海量信息的检索与挖掘,标引反而显得愈发重要。而手工标引既费时又费力,以《中国地质文献数据库(中文)》为例,《中国地质文献数据库(中文)》是中国地质图书馆自建的文摘数据库,以中国地质图书馆馆藏期刊、图书为主要数据源,根据《地质学汉语叙词表(2010)》对文献进行受控标引,由十余名经验丰富的标引人员负责对其编辑加工。在《中国地质文献数据库(中文)》中检索了2013年的数据,共有7915条;在中国知网CNKI期刊数据库中,仅2013年地质学和地球物理学两个学科领域的数据就有24923条。手工标引不仅速度慢,而且一致性差。美国学者伦兹(P.Lunds)曾做过一个实验,他让六位标引人员同时标引相同的文献,其一致性是15.8%;两个人同时标引相同的文献,其一致性为54.3%;而同一个人在不同时间标引相同的文献,其一致性也只有66.2%。

可见手工标引已经无法满足当今信息爆炸性的增长,单靠增加人力也只能是穷途末路。而随着计算机检索系统的建立和文献数据库的应用与发展,出现了自动标引。自动标引(Automatic indexing)是指利用计算机系统从拟存储、检索的事实情报或文献(题目、文摘、正文)中抽取检索标志的过程。

在Microsoft SQL Server 7.0 中提供了全文索引服务(Full-Text Search Service),在查询性能上,对varchar,char,text类型的字段的匹配查询比用SQL语句使用Like *** 作符及匹配符的速度快10倍以上;在查询匹配上,提供了模糊匹配的高级搜索性能并能够返回查询的命中率。 Full Text Search Service包含在SQL Server 7.0中,在SQL Server 7 Destop版中不起作用。安装SQL Server时,无法缺省安装它,需要在Custom Installation 中选择。 服务安装完后在SQL Server EntERPrise Manager中的Support Services中显示为Full-text Search,在控制面版中的服务中显示为Microsoft Search.可以在SQL Server EnterPrise Manager中启动这个服务,就可以在表中加入全文索引了。要注意:只有有唯一索引栏的表才能建立全文索引,并且全文索引建立好之后就不能改变表了,如要改变表就必须得取出索引,然后再装入。

对表设置全文索引应用如下步骤:

1.选择要建立全文索引的表,然后选择: Full-Text Index Table ->Define Full-Text Indexing on a table

2.系统会启动SQL Server Full-Text Index 向导。

3.选择一个唯一索引。

4.选择一个要建立索引的字段。

5.选择catalog。

6.选择更新索引计划(由于全文索引和普通索引表不同,不能自动更新,所以得加入一个计划

)。

7.Finish。

8.选择在数据库Full-text catalogs中里的新建立的catalog,然后运行Start Population,Full Population 就可以了。

对表设置全文索引应用如下步骤:

1.选择要建立全文索引的表,然后选择: Full-Text Index Table ->Define Full-Text Indexing on a table

2.系统会启动SQL Server Full-Text Index 向导。

3.选择一个唯一索引。

4.选择一个要建立索引的字段。

5.选择catalog。

6.选择更新索引计划(由于全文索引和普通索引表不同,不能自动更新,所以得加入一个计划

)。

7.Finish。

8.选择在数据库Full-text catalogs中里的新建立的catalog,然后运行Start Population,Full Population 就可以了。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/6724608.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-03-27
下一篇 2023-03-27

发表评论

登录后才能评论

评论列表(0条)

保存