1
信息检索(information retrieval):是指将信息接一定的方式组织和贮存起来,并根据信息用户的需要找出有关信息的过程。所以,它的全称又叫信息存贮与检索(information storage and retrieval),这是广义的信息检索。狭义的信息检索则仅指该过程的后半部分,即根据课题的需要,主要借助于检索工具,从信息集合中找出所需信息的过程,相当于人们所说的信息查寻(information search)。信息检索的过程往往需要一个评价反馈途径,多次比较匹配,以获得最终的检索结果。
2
当你拿到一本书就会在封底或版权页看到由“ISBN”(国际标准书
号)和10位数字为标志组成的字样,其格式为:ISBN7-5004-1693-
8/I·200,它的含义是:ISBN组号-出版者号-书名号-校验号/图书
分类号·种次号。组号代表一个地区或地理区域、国家或集团的编号,
中国的编号是“7”;出版者号代表出版社的编号;书名号是出版社出
版的一种特定出版物的名称;校验号校验ISBN编号是否合法。中国加入
ISBN系统之后制定了相应的国家标准-中国标准书号,并于1987年1月
实施。
如此繁复的代号和数字组合有什么作用呢?其一,帮你了解图书的
出版规模。ISBN由十位数字组成,其中校验号恒定为一位数,组号可取
1-5位数。如果一个国家或地区的组号是五位数,其中出版者号与书名
号位数之和就是四位数,通过排列组合,这个国家或地区的出版量最多
只是一万种;而组号如果是一位数,那么其中出版号与书名号位数之和
就是八位数,其出版量将高达一亿种,组号的位数越大出版量越小,组
号的位数越小出版量越大。我国的组号是〃7〃,可见其出版量之大。
其二,帮你了解出版者。首先,可以了解出版者的出版规模和目前
的图书出版数量。ISBN的出版者号与书名号的位数之和恒等于八。目前
,我国出版者可取代码2至5位数,如果出版者号是三位,书名号就是五
位数,则出版量就是十万种,出版者号的位数越小,书名号的位数越大
,出版量也越多,反之出版量越少。例如:商务印书馆1996年7月出版
的《现代汉语词典》修订第三版,中国标准书号为ISBN7-100-01777
-7/H519。“100”是商务印书馆的代码,“01777”是书名号,表示
商务可出版10万种图书,至1996年7月已出版了1778种(出版者所出版
的第一种图书书名号从0计算)。另外,可以了解出版者是综合性的还
是专业性的。ISBN的书名号与种次号分别代表的是可以出版多少种图书
,已经出版了多少种和某一类目出版了多少种。例如,人民文学出版社
的《当今十大奇案》,中国标准书号是ISBN7-02-000420-2/I·421
其书名号与种次号相等,说明人民文学出版社是专业性的出版社,它以
出版文学类的图书为主。
其三,方便了图书馆工作人员。由于ISBN具有世界唯一性,所以通
过ISBN检索的准确性要高于通过书名检索的准确性。书名有重名现象,
比如茅盾有长篇小说《虹》,而英国的劳伦斯也有长篇小说《虹》。通
过ISBN检索具有唯一性,检索的速度也要高于通过书名检索的速度。书
名少则几个字,多则十几个字,而ISBN只有十个阿拉伯数字,一般的工
作人员都能够录入且速度要比录入书名的速度快得多。
总之,中国标准书号的最大特点是将国际标准书号(ISBN)和全国
统一书号中的分类号和种次号的成份结合起来,结构简单层次性强,便
于计算机处理和检索,给出版、发行、订购、统计、分编等提供很大的
方便,是读者进入图书馆查阅图书的一个重要检索点。
3
计 算 机 检 索 系 统 的 构 成
计算机检索系统由计算机硬件、软件、数据库和通讯网络构成。
一、计算机硬件
计算机硬件是系统采用的各种硬设备的总称,主要包括具有一定性能的主计算机、外围设备以及与数据处理或数据传送有关的其他设备。
二、软件
软件由系统维护软件与检索软件构成。系统维护软件,如数据库管理程序、词表管理程序等,其作用是保障检索系统的高效运转。检索软件是用户与系统的界面,用户通过检索软件进行检索,检索软件功能的强弱直接影响着检索效果。检索软件可以分为指令式、菜单式和智能接口等。
三、数据库
根据ISO/DIS 5127标准,数据定义为:“至少由一种文档组成,并能满足某一特定目的或某一特定数据处理系统需要的一种数据集合。”通俗地说,数据库就是在计算机存储设备上按一定方式存储的相互关联的数据集合。
按国际上通用的分类方法,数据库可以划分为以下类型:
1 参考数据库
参考数据库(Reference databases)是指引用户到另一信息源以获得原文或其他细节的一类数据库。它包括书目数据库(Bibliographic databases)和指南数据库(Referral database或Directory database)两种。
书目数据库是指存储某个领域的二次文献(如文摘、题录、目录等书目数据)的一类数据库,有时又称为二次文献数据库,或简称为文献数据库。如中国机械工程文摘数据库,属于此类型数据库。
指南数据库也称指示性数据库,是指存储关于某些机构、人物、出版物、项目、程序、活动等对象的简要描述,指引用户从其他有关信息源获取更详细的信息的一类数据库。如产品目录、机构名录、研发项目、基金项目等数据库均属于此类型。
2 源数据库
源数据库(Source databases)是指能直接提供原始资料或具体数据的数据库,用户不必再查阅其他信息源。它可以分为:
(1)数值数据库这是一种专门提供以数值方式表示的数据的源数据库,如统计数据库、财务数据库等。
(2)文本-数值数据库这是一种能同时提供文本信息和数值数据的源数据库,如企业信息数据库、产品数据库等。
(3)全文数据库这是一种存储文献全文或其中主要部分的源数据库,如法律法规全文库、期刊全文库等。
(4)术语数据库这是一种专门存储名词术语信息、词语信息以及术语工作和语言规范工作成果的源数据库,如名词术语信息库、各种电子化辞书等。
(5)图像数据库这是一种用来存储各种图像或图形信息及有关文字说明资料的源数据库,主要应用于建筑、设计、广告、产品、或照片等资料类型的计算机存储与检索。
除上述几种类型的数据库外,还有能同时存储多种不同类型数据的数据库,即混合型数据库。另外,按其载体不同又可分成磁媒体数据库、光盘数据库和多媒体数据库等。
四、通讯网络
由于现代通信技术的发展,公共数据传输技术为信息的传递提供了保障,信息检索逐渐发展成为网络检索,通过数据传输网将各个计算机连接起来。每个计算机成为网络中的一个节点,每个节点可含一个或多个数据库,网络上的每个节点和其终端只要有授权均可对网络中的数据库进行访问,实现资源共享。随着空间技术的发展,信息检索已进入了信息传递-卫星通讯-计算机技术三位一体的新阶段。
4
《中国图书馆分类法》有22大类:A 马克思主义、列宁主义、毛泽东思想、邓小平理论,B 哲学、宗教,C 社会科学总论,D 政治、法律,E 军事,F 经济,G 文化、科学、教育、体育,H 语言、文字,I 文学,J 艺术,K 历史、地理,N 自然科学总论,O 数理科学和化学,P 天文学、地球科学,Q 生物科学,R 医药、卫生,S 农业科学,T 工业技术,U 交通运输,V 航空、航天,X 环境科学、安全科学,Z 综合性图书。
详细类目可查阅图书馆主页《中国图书馆分类法》。
体育有:G 文化、科学、教育、体育
5
1是否支持全文检索
2检索结果如何排序,相关性,时间等,是否全面
3检索功能是否全面,如布尔逻辑检索、关键词检索、位置检索、截词检索、限制检索等等
4查询速度如何,维护更新如何
5界面是否简单易用,易用性是否强
建议你找本关于《信息检索》的书来看看,我说的特别简单,手头没有书,你要是想具体看看,还得看书。人大出版社的那本信息检索不错。
6
根据文献的有关信息查找相应的馆藏目录或联合目录,找到收藏单位,再索取或复制原文。如果本单位图书馆没有收藏所需文献,用户可以通过馆际互借或文献传递服务获取。
7
学术性图书馆当然以国家图书馆最权威,各高校图书馆都收藏有相应的学术资源,可通过中国高校文献保障系统(Calis)来查重要高校的馆藏和信息服务情况。
ISBN是国际标准书号,international standard book number的缩写。
现在不用ISCN了,应该是ISSN,国际标准连续出版物号,International Standard Serial Number。
这只可以查出是什么书,是什么杂志,而且单纯上网不是那么好查的,要使用图书馆里的数据库。
ISBN:7-5062-7841-3
2007年开始改作978-7-5062-7841-3,有意义的是:5062-7841,5062代表出版社的编号,7841代表出版顺次。
这是淘宝的新规定
2009年9月25日以后所有的图书都要输入ISBN号。
如果淘宝数据库中没有这个ISBN号,图书就不能上传,已上传的图书系统自动下架。
下面是淘宝小二发的旺旺通知:
为了更好的保护知识产权,打击侵权,维护书籍类目商品整洁性。在2009年9月16日至9月25日期间,希望所有书籍类目卖家配合在将店铺下所有书籍商品绑定到正规的ISBN编码产品下,9月25日后ISBN编码将作为所有书籍的唯一的必选属性,我们将对未绑定ISBN编码的商品进行下架处理。
1、代表含义不同
ISSN是国际标准连续出版物号,CN是国内统一连续出版物号,ISBN则是国际标准书号。
2、格式上有区别
ISSN格式
该编号是以ISSN为前缀,由8位数字组成。8位数字分为前后两段各4位,中间用连接号相连,格式为ISSN XXXX-XXXX,前7位数字为顺序号,最后一位是校验位。
CN刊号标准格式是:CNXX-XXXX,其中前两位是各省(区、市)区号。
ISBN由10位数字组成,分四个部分:组号(国家、地区、语言的代号),出版者号,书序号和检验码。2007年1月1日起,实行新版ISBN,新版ISBN由13位数字组成,分为5段,即在原来的10位数字前加上3位EAN(欧洲商品编号)图书产品代码“978”。
扩展资料
ISSN由设在法国巴黎的国际ISDS中心管理。1975年起建立世界性的连续出版物标准书目数据库,已有近200个国家和地区出版的65万种期刊(包括已停刊的)登记入库,成为国际上最权威的期刊书目数据网络系统。
我国于1985年建立了ISSN中国分中心(设在北京图书馆),负责中国期刊ISSN号的分配与管理,已有近5000种中文期刊分配了ISSN号并进入了国际ISSN数据系统。
ISSN通常都印在期的封面或版权页上,国际标准刊号可以面向国内和国外同时发行刊物,用国际标总管国际标准书号的机构是设在德国柏林国立普鲁士文化遗产图书馆的国际标准书号管理局。该机构的主要工作之一是向下一级地区机构分配地区号码。
一般的地区机构都设在国家图书馆内,但是一些大的国家和地区却不是这样。
例如,英国的地区机构是惠特克公司,该公司在国际标准书号尚未问世前,就是英国的国家书号中心,可以说是国际标准书号的先驱;美国的地区中心是鲍克公司。
我国的地区机构设在新闻出版署。地区机构的主要工作是接受出版社的申请,批给第二段号码,即出版社的代码。第三个号码和校验码就由出版社自己决定了。准刊号发行的刊物属于合法出版物。
参考资料来源:百度百科-刊号
百度百科-国际标准书号
国际标准书号在数据库中存储一般用字符类型。
以SQL Server为例,用varchar类型即可。
原因:
国际标准书号(International Standard Book Number),简称ISBN,是专门为识别图书等文献而设计的国际编号。
一共是5组号,长度应为1+2+3+4+5+4=19(其中最后一个4为各组数之间的“-”)。
把ISBN号输入百度就可以查了,当然也可以到专业ISBN数据库查询,可以知道出版信息:
>
国际标准书号的英文全称为International Standard Book Number,简称ISBN。
国际标准书号由十位数字组成。被三条短横线分为四段,每一段都有不同的含义。
第一个号码段是地区号,又叫组号(Group Identifier),最短的是一位数字,最长的达五位数字,大体上兼顾文种、国别和地区。把全世界自愿申请参加国际标准书号体系的国家和地区,划分成若干地区,各有固定的编码:0、1代表英语,使用这两个代码的国家有:澳大利亚、加拿大、爱尔兰、新西兰、波多黎各、南非、英国、美国、津巴布韦等;2代表法语,法国、卢森堡以及比利时、加拿大和瑞士的法语区使用该代码;3代表德语,德国、奥地利和瑞士德语区使用该代码;4是日本出版物的代码;5是俄罗斯出版物的代码;7是中国出版物使用的代码。
组号分为五个档次,长度为1—5位数字,其具体设置范围如下:
组号位数
设置范围
可分配的组区数
每组号允许出版量(种)
每档总计出版量(种)
一位
0~7
8
1亿
800亿
二位
80~94
15
01亿
150亿
三位
950~997
48
001亿
048亿
四位
9980~9989
10
0001亿
001亿
五位
99900~99999
100
00001亿
001亿
合计
181
1000亿
第二段号码是出版社代码(Publisher Identifier),由其隶属的国家或地区ISBN中心分配,允许取值范围为2-5位数字。出版社的规模越大,出书越多,其号码就越短。
第三个段是书序号(Title Identifier)由出版社自己给出,而且每个出版社的书序号是定长的。最短的一位,最长的六位。出版社的规模越大,出书越多,序号越长。
第十位是电子计算机的校验码(Check Digit)。固定一位,起止号为0-10,10由X代替。
四段数字之间应该用连字符( - )连接(例如:2-02-033598-0)。但是,有些图书馆集成系统不能自动分配连字符,图书馆编目人员也对ISBN的分段方式不甚了解,所以人们经常在书目记录中省略连字符(例如:2020335980)。
标准书号的核对方法是加权法,即用10至2这9个数分别去乘标准书号的前9位数,其乘积之和加上校验码再除以常数11,如能整除,说明书号正确,如不能整除,表明书号错误。
国际标准书号的使用范围是:印刷品、缩微制品、教育电视或**、混合媒体出版物、微机软件、地图集和地图、盲文出版物、电子出版物。
总管国际标准书号的机构是设在德国柏林国立普鲁士文化遗产图书馆(Staatsbibliothek zu Berlin - Preußischer Kulturbesitz)的国际国际标准书号管理局(International ISBN Agency)。该机构的主要工作之一是向下一级地区机构分配地区号码。一般的地区机构都设在国家图书馆内,但是一些大的国家和地区却不是这样。例如,英国的地区机构是惠特克公司(Whitaker),该公司在国际标准书号尚未问世前,就是英国的国家书号中心,可以说是国际标准书号的先驱;美国的地区中心是鲍克公司(RR Bowker);我国的地区机构设在新闻出版署。地区机构的主要工作是接受出版社的申请,批给第二段号码,即出版社的代码。第三个号码和校验码就由出版社自己决定了。
要让全世界出版的书,每一种都有一个编号,又不重复,这决不是一件易事。要把书号严格控制在10位以内,就必须有一套精密的设计安排。首先是地区号。世界上应用最广泛的文种英、法、德、日、中、俄都只占一位,目的是留下更多的位数安排大量的出版社和图书。而最小的地区,如苏里南、特立尼达和多巴哥则占用五位数。最让国际标准书号设计者头痛的是出版社号码。以英文为例,除了地区号和校验码,还有八位用来解决英文地区的每个出版社和每一种书。出版社号码定为2至7位,书号定为1至5位,各出版社国际标准书号的分配成如下格局:
出版社号码位数
出版社起始号
书号位数
可出版的图书种数
2
00
6
1 000 000
3
200
5
100 000
4
7000
4
10 000
5
85000
3
1 000
6
900000
2
100
7
9500000
1
10
最小的出版社只有10个书号,很容易用完,用完后可向地区机构申请再给一个号码。
例:
0-13-001660-8是美国Prentice-Hall出版社的一个ISBN;
0-471-00084-1是美国Wiley出版社的一个ISBN;
2-7000-2444-3是法国Gründ出版社的一个ISBN;
4-80970-182-4是日本东洋文库的一个ISBN;
1-919876-03-0是南非NAEP出版社的一个ISBN;
3-9800462-3-0是德国Freitag für Umwelttechnik的一个ISBN;
981-238-187-2是新加坡World Scientific出版社的一个ISBN
有的出版社在不同国家或地区的分社出版的同一种书,用两个不同的ISBN。例如,德国施普林格出版社(Springer-Verlag)出版的Introduction to the Mori Program一书,在纽约出版用0-387-98465-8,在柏林出版则用3-540-98465-8。对于这个出版社,两个ISBN的后六位(书序号和校验位)都相同。对于这种情况,图书馆员要从实践中总结经验,通过多个途径检索,减少查重中的遗漏。不过,许多出版社在不同地点出版的书的书序号不同。不过,许多出版社在不同国家或地区出版时,不同的ISBN之间并没有必然的关系。
国际标准书号问世后,很快得到推广。主要是因为是出版商首先倡议的,对出版商、书商的工作有很大的益处。其优点主要体现在:国际标准书号是机读的编码,从图书的生产到发行、销售始终如一,对图书的发行系统起了很大的作用;它的引入使图书的定购、库存控制、帐目和输出过程等任何图书业的分支程序都简化了;国际标准书号也对图书馆和文献中心的订购、采选、编目和流通程序都有促进作用;ISBN系统的引入也服务于书目信息的流动和使用,而且为一个国家的图书生产提供经济的书目控制;ISBN对图书市场更有效率,它能确定国际上出版的任何图书及其出版社。在书业中习惯称ISBN为库藏码(Stock Number),就是因为被普遍应用于书库管理。可见,它对书业的发展的作用很大。
下面主要说一下国际标准书号的采用对图书馆的影响。出版商和书商与图书馆的着眼点不同。图书馆侧重于区别书的品种,最好是同样内容的书只有一个ISBN号。这样,查重时,只要查ISBN就能确定是否重复。但在出版商那里,一个ISBN说明了一本书的版本、装帧、文种、材料和出版地等内容。同一内容的书,因版本、装帧、文种、材料和出版地的不同,ISBN就不同。这样,ISBN与图书之间就出现了一些特殊关系,一种书就出现了多个ISBN,给图书馆采选人员带来了很大的麻烦,不能仅仅根据ISBN的不同来确定是否复本。能否利用ISBN查重,看法不一。可以这样说,ISBN具有唯一性,只要其相同,肯定是同一种书。这样,可以避免因目录报导有误,订单打错,排片错误造成的重复;但目前ISBN还不是唯一的查重方法,必须与书名等项目相结合。另外,ISBN是适应电子计算机的需要产生的机读编码,利用其通过计算机查重,可以节省时间。
由于国际标准书号是书目数据中唯一可以识别一种出版物的国际通用代码,所以现在许多图书馆将其应用于采访和编目中的查重。例如,对于普通图书,各个机构的编目方式可能略有差异,出版社和书商的信息报道也不尽相同,所以我们几乎不可能让计算机通过著者或书名进行查重。但是国际标准书号具有唯一性和标准性,人们可以让计算机自动对其查重,从而省去了不少手工劳动,然后再进行人工判断。
但是,我们也应当在使用国际标准书号查重时注意由于一些特殊问题。有些书可能有三个书号(丛书书号、分丛书书号、本书书号)。例如,英国罗德里奇(Routledge)出版社出版的《文明史》(History of Civilization: a Complete History of Mankind from Pre-Historic Times)共有50卷,其总的ISBN是0-415-14380-2;它下面分六个部分,包括《希腊文明》(Greek Civilization)(7册)(ISBN 0-415-15612-2)、《东方文明》(Eastern Civilization)(10册)(ISBN 0-415-15614-9)等;而各个部分下的每一册也有自己的ISBN,包括《马其顿帝国主义和东方的希腊化》(Macedonian Imperialism and the Hellenization of the East) (ISBN 0-415-15577-0)、《中国文明》(Chinese Civilization) (ISBN 0-415-15591-6)等。在这套书中,每本书上都印有三个ISBN。此外,同一种书在不同国家出版有不同的书号,不同的装帧形式(例如平装和精装)有不同的书号;这些情况都是很常见的。
以上就是关于信息检索的一些概念,急求!!!!全部的内容,包括:信息检索的一些概念,急求!!!!、ISCN,ISBN分别是什么的缩写,表示什么意思。知道了文章的ISCN,ISBN编号,怎么查找文章、淘宝上书籍ISBN编号等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)