检索绪论

检索绪论,第1张

信息:信息是物质存在的一种方式、形态或运动状态,是事物的一种普遍属性,一般指数据、消息中包含的意义,可以使消息中所描述事件的不定性减少。

知识:人们在改造世界的实践中所获得的认识和经验的总和,是人的大脑通过思维重新组合的系统化的信息集合。

情报:为解决一个特定的问题所需要的激活了的、活化了的特殊知识或信息。

(情报的基本属性:知识性、传递性、效用性)

文献:记录有知识的一切载体。 (GB3792.1-83《文献著录总则》)

文献的四个基本要素:

①记录知识的具体内容;

②记录知识的手段,如文字、图像、符号、声频、视频等;

③记录知识的物质载体,如纸张、光盘、录像带等;

④记录知识的表现形态,如图书、期刊、专利说明等。

一、文献的类型(按载体类型分):

印刷型:传统的图书、期刊等

视听型:唱片、录音带、录像带等

缩微型:缩微胶卷、缩微胶片等

数字型(或电子型):电子图书、电子期刊、数据库

*零次文献:未经信息加工,直接记录在载体上的原始信息,如实验数据、试验记录、调查材料、设计草图、私人笔记、口头交流的信息等。

一次文献:即原始文献,指著者以其本人的研究成果(如实验、观察、调查研究等的结果)为基本素材写成的原始创作。

例如:专著、期刊论文、研究报告、会议文献、专利文献、学位论文、会议论文、译文、电子期刊、电子图书等。

二次文献:将大量无序、分散的一次文献收集、整理、加工、著录,并按一定的顺序加以编排,形成可供检索一次文献线索的新的文献形式。因其检索功能而称之为检索工具或检索系统。

例如:题录、目录、索引、文摘等。

题录:以期刊论文为例,加下划线部分为文献出处。

题名/著者//期刊名.年,卷(期).–页码

三次文献:围绕某一专题,利用二次文献的检索,在吸取一次文献内容的基础上形成的文献。如综述、述评、进展等期刊文献和百科全书、年鉴、指南、手册等参考工具书。

综述(Survey, Review)是指综合分析和描述一定时间范围内某一学科或专业科研发展和现状,并预测未来的一类文献。

检索的概念:

检索(Retrieval):利用检索工具查询问题答案的全过程。

文献检索(Literature retrieval):指以获取文献为目的,科学地借助各种检索工具,查询相关文献资料的过程。

信息检索(Information retrieval):指从任何信息集合中查出所需信息的活动、过程和方法,有广义和狭义两种理解。广义的信息检索还包括信息存储,合称信息存储与检索。狭义的信息检索仅指信息的查找过程。

检索语言是信息存储与检索过程中描述信息特征和表达用户信息提问的一种人工语言。

它是根据文献的外表特征或者内容特征,把某些具有检索意义的语言或符号加工编制成为文献信息检索服务的特殊语言。

检索语言的主要作用是对文献的外表特征和内容特征进行多层次描述,提供多种检索途径,以方便用户从不同角度进行检索查找。

分类语言:

中国图书馆图书分类法(中图法)

国际十进分类法(Universal Decimal Classification, UDC)

美国国会图书馆图书分类法(Library of Congress Classification, LC)

中图法基本大类:

A马克思主义、列宁主义、毛泽东思想

B哲学

C社会科学总论

D政治、法律

E军事

F 经 济

G文化、科学、教育、体育

H语言、文学

I 文学

J 艺术

K 历史、地理

N自然科学总论

O数理科学和化学

P 天文学、地球科学

Q生物科学

R 医药、卫生

S 农业科学

T工业技术

U交通运输

V航空、航天

X环境科学、劳动保护科学(安全科学)

Z 综合性图书

关键词:指出现在文献的标题、文摘或全文中,能表达文献实质内容的,或者能被人们作为检索入口的关键性专业名词术语。是一种没有规范化的自然语言,又称为自由词。

主题词:是一种反映文献内容主题、经过严格规范化了的人工语言。即是将反映文献主题的各种同义词进行书写形式的统一化后定下的检索语言。

数据库及其结构:

数据库(Database)是能满足某种特定目的或某一特定数据处理系统需要的一种数据集合,它可以由一个或多个文档组成。

文档(File)是数据库中一部分记录的集合。

记录(Record)是数据库中的基本文献单元,一条记录往往记录着一篇文献的相关信息。

字段(Field)是组成记录的基本信息单元。每一个字段都描述文献的某一方面的特征,包括外表特征和内容特征,如题名、作者、刊名、出版年、主题词等等。各个描述文献一部分特征的字段组合就成了记录。

布尔逻辑检索是检索系统中应用最为广泛的检索技术,是最简单、最基本的匹配模式,其理论基础是集合论与布尔逻辑。

布尔逻辑检索采用布尔逻辑表达式来表达用户的检索要求。布尔逻辑表达式是指通过布尔逻辑运算符来连接检索词,以及表示运算优先级的括号组成的一种表达检索要求的算式。

例: (肺癌 or 肺肿瘤)and 手术

位置检索(又称相邻度检索、邻近检索):检索时通过位置算符(又称邻近算符)规定检索词之间在原始文献中的相邻位置关系。

位置算符都隐含了逻辑算符AND的含义,即由它们连结的两个检索词(式)都必须出现,但位置算符还对连结的两个检索词的位置关系作了进一步的限定。

位置检索大致包括三种级别的检索:

字段级检索:限定检索词在同一字段范围内,如with(Medline光盘数据库);

子字段或自然句级检索:限制检索词在同一子字段或自然句中,如near(Medline光盘数据库);

词位置检索:限定检索词的相互位置满足某些条件,如彼此相隔多少个词(或字),是否以一定的先后顺序出现,一个词的出现是否不允许另一个词(或字)同时出现等,如nW、pre(ScienceDirect)。

截词检索是在检索时针对检索词附加一个截断符号,指明该检索词在与文献数据库的词比较时,采取完整匹配还是部分匹配。

截词符分为无限截断和有限截断。

无限截断:一个截词符代表多个字符,常用截词符 “*”。有前截断、中截断、后截断之分。

有限截断:一个截词符只能代表一个字符,常用截词符 “?”(又称通配符)。

指定字段检索是指为了达到某种检索目的,把检索的范围限制在某个或某几个字段内进行的检索方法。

知识是人的大脑经过思维加工而形成的有序化信息的集合,是一种信息产品,是信息的一部分;文献则是记录有人类知识的一切载体,是知识的一部分;情报是人们为解决特定问题而被活化了的知识,是知识的一部分,情报也蕴含在文献之中,但不是所有文献都是情报,因而信息、知识、文献、情报之间是一种包含与被包含的关系。

数据库是依照某种数据模型组织起来并存放二级存储器中的数据集合。这种数据集合具有如下特点:尽可能不重复,以最优方式为某个特定组织的多种应用服务,其数据结构独立于使用它的应用程序,对数据的增、删、改和检索由统一软件进行管理和控制。从发展的历史看,数据库是数据管理的高级阶段,它是由文件管理系统发展起来的。

数据库的基本结构分三个层次,反映了观察数据库的三种不同角度。

(1)物理数据层。它是数据库的最内层,是物理存贮设备上实际存储的数据的集合。这些数据是原始数据,是用户加工的对象,由内部模式描述的指令 *** 作处理的位串、字符和字组成。

(2)概念数据层。它是数据库的中间一层,是数据库的整体逻辑表示。指出了每个数据的逻辑定义及数据间的逻辑联系,是存贮记录的集合。它所涉及的是数据库所有对象的逻辑关系,而不是它们的物理情况,是数据库管理员概念下的数据库。

(3)逻辑数据层。它是用户所看到和使用的数据库,表示了一个或一些特定用户使用的数据集合,即逻辑记录的集合。

数据库不同层次之间的联系是通过映射进行转换的。数据库具有以下主要特点:

(1)实现数据共享。数据共享包含所有用户可同时存取数据库中的数据,也包括用户可以用各种方式通过接口使用数据库,并提供数据共享。

(2)减少数据的冗余度。同文件系统相比,由于数据库实现了数据共享,从而避免了用户各自建立应用文件。减少了大量重复数据,减少了数据冗余,维护了数据的一致性。

(3)数据的独立性。数据的独立性包括数据库中数据库的逻辑结构和应用程序相互独立,也包括数据物理结构的变化不影响数据的逻辑结构。

(4)数据实现集中控制。文件管理方式中,数据处于一种分散的状态,不同的用户或同一用户在不同处理中其文件之间毫无关系。利用数据库可对数据进行集中控制和管理,并通过数据模型表示各种数据的组织以及数据间的联系。

(5)数据一致性和可维护性,以确保数据的安全性和可靠性。主要包括:①安全性控制:以防止数据丢失、错误更新和越权使用;②完整性控制:保证数据的正确性、有效性和相容性;③并发控制:使在同一时间周期内,允许对数据实现多路存取,又能防止用户之间的不正常交互作用;④故障的发现和恢复:由数据库管理系统提供一套方法,可及时发现故障和修复故障,从而防止数据被破坏

一种程序对象,用于表示用户数据库中的数据结构和所包含的数据。

在Microsoft Visual Basic编辑器中,可以使用ADO对象以及ADO的附加组件(称为Microsoft ADO Extensions for DLL and Security(ADOX))来创建或修改表和查询、检验数据库、或者访问外部数据源。还可在代码中使用ADO来 *** 作数据库中的数据。

ADO (ActiveX Data Objects,ActiveX数据对象)是Microsoft提出的应用程序接口(API)用以实现访问关系或非关系数据库中的数据。

例如,如果希望编写应用程序从DB2或Oracle数据库中向网页提供数据,可以将ADO程序包括在作为活动服务器页(ASP)的HTML文件中。当用户从网站请求网页时,返回的网页也包括了数据中的相应数据,这些是由于使用了ADO代码的结果。

扩展资料:

ADO接口简介

1、_ConnectionPtr接口

返回一个记录集或一个空指针。通常使用它来创建一个数据连接或执行一条不返回任何结果的SQL语句,如一个存储过程。

2、_CommandPtr接口

返回一个记录集。它提供了一种简单的方法来执行返回记录集的存储过程和SQL语句。

3、_RecordsetPtr接口

是一个记录集对象。与以上两种对象相比,它对记录集提供了更多的控制功能,如记录锁定,游标控制等。

参考资料来源:百度百科-ActiveX Data Objects


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/6668078.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-03-26
下一篇 2023-03-26

发表评论

登录后才能评论

评论列表(0条)

保存