目录(Catalog)是以完整的出版单元(如一种图书、一种期刊)为单位,按照一定次序编排的对文献信息进行描述和报道的工具,也称书目。目录对文献的描述比较简单,每条记录的字段主要包括:文献题名、责任者、出版事项、分类号、主题词等。一种出版物经过如此描述后形成一条记录,将所有的记录组织起来就形成了目录。
何为元数据库?
什么是元数据?
元数据(Meta Date),关于数据的数据或者叫做用来描述数据的数据或者叫做信息的信息。
这些定义都很是抽象,我们可以把元数据简单的理解成,最小的数据单位。元数据可以为数据说明其元素或属性(名称、大小、数据类型、等),或其结构(长度、字段、数据列),或其相关数据(位于何处、如何联系、拥有者)。
举几个简单的例子:
使用过数码相机的同学都应该知道,每张数码照片都会存在一个EXIF信息。它就是一种用来描述数码图片的元数据。根据EXIF标准,这些元数据包括:Image Description(图像描述、来源. 指生成图像的工具 )、Artist(作者)、Make( 生产者)、Model (型号)、….、等等。
生活中我们填写的《个人信息登记表》,包括姓名、性别、民族、政治面貌、一寸照片、学历、职称等等这些就是锁定kent.zhu这个人的元数据。
通常情况下元数据可以分为以下三类:固有性元数据、管理性元数据、描述性元数据。
固有性元数据;与事物构成有关的元数据。
管理性元数据;与事物处理方式有关的元数据。
描述性元数据;与事物本质有关的元数据。
当然,并不是说所数据总能清晰的划分在以上3类中。比如:一张由kent拍摄的大小为20K的JPG格式的印着一只小狗的圣诞卡照片。
它的固有性元数据包括:20K、JPG;管理性元数据:kent拍摄、圣诞卡;描述性元数据:狗、小狗、圣诞、照片、圣诞节、…
但是,圣诞卡则可以放在以上任何一个分类中。与事物构成有关(说明这个东东是什么)、与事物处理方式有关(说明这个东东的用途是什么)、与事物本质有关(可以直接用来描述这个东东)。
元数据之于信息架构的意义
元数据是一种很有效的方法,用以确保网站上各种形式的内容确实都能被查找到。比如我们常常为搜索很久之前看到的一张美女图片犯愁,而如果一个图片网站如果信息架构足够好,我们就能凭借我们回忆到的元数据(关于武藤兰的?2000年拍摄的?)清晰的找到。
元数据之于信息架构就像是房子的砖瓦,它可以根据需要摆放成不同的信息检索系统。元数据是所有组织系统的基础,从搜索到电子商务网站上的导航系统都强烈的依赖于元数据。
前面提到,元数据实际上是为产品的可查找性(Findability)服务的。而用户在查找信息的时候不会按照机器思维去找(不会输入该照片的ID),而是直接输入关于信息的描述性信息如:“小狗 圣诞卡”。也就意味着在创建关于描述性元数据的时候要尽量的提取出任官关于这个对象所讲述的故事,这些才是人们能记住的和习惯搜索的细节。
我们会发现,机械生成的元数据常常是不靠谱的,如在UCH系统下发布日志的时候系统会自动根据标题进行机械分析生成的一些元数据。
而充分利用手工元数据(handcrafted metadate)是提高可查找性的一个好方法。最常见的例子就是我们见到的Tag。Tag就是一种用户自创的元数据,其特点是无层次结构、自定义。比如这张Flickr照片下的手工元数据就为在Flickr上查找提供了更多的方便。
什么是数据库?数据库(Database)是按照数据结构来组织、存储和管理数据的仓库,它产生于距今六十多年前,随着信息技术和市场的发展,特别是二十世纪九十年代以后,数据管理不再仅仅是存储和管理数据,而转变成用户所需要的各种数据管理的方式。数据库有很多种类型,从最简单的存储有各种数据的表格到能够进行海量数据存储的大型数据库系统都在各个方面得到了广泛的应用。
一、书目数据库
①文摘索引数据库
文摘索引数据库的内容与书本式文摘索引相同,主要是简单记载有关领域某一时期发表的文章,供人们检索和查询。它提供文献确定的来源信息,即文摘对应的原始文献,但一般不提供原始文献的馆藏信息。
②图书馆目录数据库
图书馆目录数据库,通常又称为机读目录(Machine ReadableCatalogue,MARC)。它是指以特定代码形式和特定结构预三录在计算机存储载体上的、用计算机识别和处理的目录。简单地说,就是一种经过人们编辑、组织,以机读形式出现的书目记录的集合
二、文献数据库
定义:文献数据库是指计算机可读的、有组织的相关文献信息的集合。在文献数据库中,文献信息不是以传统的文字,而是将文字用二进制编码的方式表示,按一定的数据结构,有组织地存储在计算机中,从而使计算机能够识别和处理。文献数据库是当前通过遍布于全世界的通信网络进行联机情报检索的最早的和主要的处理和检索对象。
基本单位
一种书刊或一篇文献的内容和形式特征经著录后形成一条款目。款目是文献信息的基本单位。在文献数据库中,一条款目称为一条记录,记录也是构成文献数据库的基本单位。
文献数据库的起源
文献数据库起源于二次文献编辑出版的计算机化。由于机器可读信息大多记录在计算机的磁带上,因此也称文献数据库为磁带版二次文献。早期的文献数据库有1964年正式对外发行的美国国立医学图书馆的医学文献分析与检索系统(MEDLARS),美国化学文摘社的<化学文摘数据库>(CACON)等
三、多种全文数据库
通过研讨所了解的全文数据库:
中文全文数据库有中国期刊全文数据库、中文科技期刊数据库、万方系统的数字化期刊全文数据库。
英文全文数据库有OVID全文期刊库、荷兰的SDOS、美国UMI公司的ProQuest .Medical Library。
我们常用的全文数据库:
常用中国期刊全文数据库、中文科技期刊数据库、万方系统的数字化期刊全文数据库学校拥有数据库。
常用全文数据库所包含学科领域
中国期刊全文数据库:包含理工A(数理化天地生)、理工B(化学化工能源与材料)、理工C(工业技术)、农业、医药卫生、文史哲、经济政治与法律、教育与社会科学 、电子技术与信息科学等学科领域。
中文科技期刊数据库:包括社会科学、自然科学、工程技术、农业科学、医药卫生、经济 管理、教育科学和图书情报等学科领域。
万方系统的数字化期刊全文数据库:覆盖自然科学、工程技术、农林、医学等学科领域。
对我们帮助较大的全文数据库
中国期刊全文数据库是对我们帮助较大的全文数据库。
它是目前世界上最大的连续动态更新的中国期刊全文数据库,积累全文文献800万篇,题录1500余万条,分九大专辑,126个专题文献数据库。
设有包括全文检索在内的众多检索入口,用户可以通过某个检索入口进行初级检索,也可以运用布尔算符等灵活组织检索提问式进行高级检索。
多样化的产品形式,及时的数据更新,可满足不同类型、不同行业、不同规模用户个性化的信息需求,数据检索结果较全面。
四、常用数据库
中国知网是中国学术期刊电子杂志社编辑出版的以《中国学术期刊 ( 光盘版 ) 》全文数据库为核心的数据库,目前已经发展成为 “ CNKI 数字图书馆 ”。收录资源包括期刊、博硕士论文、会议论文、报纸等学术与专业资料;覆盖理工、社会科学、电子信息技术、农业、医学等广泛学科范围,数据每日更新,支持跨库检索。
超星数字图书馆成立于1993年,是国内专业的数字图书馆解决方案提供商和数字图书资源供应商。超星数字图书馆,是国家“863”计划中国数字图书馆示范工程项目, 2000年1月,在互联网上正式开通。它由北京世纪超星信息技术发展有限责任公司投资兴建,目前拥有数字图书八十多万种。
覆盖范围:涉及哲学、宗教、社科总论、经典理论、民族学、经济学、自然科学总论、计算机等各个学科门类。本馆已订购67万余册。
收录年限:1977年至今。
万方数据库是由万方数据公司开发的,涵盖期刊、会议纪要、论文、学术成果、学术会议论文的大型网络数据库;是一个以科技信息为主,集经济、金融、社会、人文信息为一体,以Internet为网络平台的大型科技、商务信息服务系统。也是和中国知网齐名的中国专业的学术数据库。其开发公司万方数据股份有限公司是国内第一家以信息服务为核心的股份制高新技术企业,是在互联网领域,集信息资源产品、信息增值服务和信息处理方案为一体的综合信息服务商。
一) 按对信息收录的学科范围划分1.综合性数据库所收录信息覆盖学科范围广,涉及多门学科,检索范围广泛。如Web of
Science、中国知网(CNKI)、万方数据知识服务平台等。
2.专业性数据库所收录信息仅展于某一学科领城,专业性强,用于检索特定专业文献。
如PubMed/MEDLINE、CA 和中国生物医学文献数据库Chinese BioMedial Literature Database,
以下简称CBM )等。
3.专题性数据库收录信息仅限于某一特定对象或专题,适用于专题检索。如中国药物专利数据库、GenBank( 核酸序列数据库)等。
(二) 按收录信息内容的类型不同划分
1.文献型数据库( literature database) 是指以各类型文献为内容的数据库,包括书目数据库( bibliographic database )和全文数据库(full-text database )。
书目数据库是指存储次文献信息的数据库,包括题录数据库、文摘数据库、目录数据库等,是信息检索最常用的数据库。为检索者提供文献出处,检索结果是文献的线索而非原文。
如中国生物医学文献数据库(CBM )、MEDLINE 等。
全文数据库是存储文献全文的数据库,包括图书全文数据库、期刊全文数据库、学位论文全文库等,是信息检索中最受欢迎的数据库。如书生之家数字图书馆、超数字图书馆CNKI、万方数据知识服务平台等都拥有不同类型文献的全文数据库。
2.数值型数据库( numerical database ) 是存就有关科研数据、教们,包括各种统计教据、实验数据、临床检验数据等数值型信息的数据库。如美国国医学图书编制的化学物质毒性数据库RTECS,包含了10 万多种化学物质的急慢性毒理实验数据。
3.事实型数据库( fact database ) 也称指南数据库( directory database ),主要存储某种具体事实、知识数据的非文献信息源的一般参考性、指示性资料信息,每个条目都是对一个事实确切、完整的描述。如人物数据库、机构名录数据库、产品或商品信息数据库以及指南库、术语数据库等。如美国医生数据咨询库PDQ( Physician Data Query ),为医生提供肿瘤诊断、治疗、预后、临床研究等详细资料,相当于一部有关肿瘤的百科全书。
4.图像数据库( image database) 是指以图像、图面、图形等为信息主体数据集合。如美国国立医学图书馆( NLM )的可视人计划数据库( the visible human project)和哈佛大学医学院的全脑图谱数据库(the whole brain atlas )等。
5.多媒体数据库( multimedia database) 是存储数值、文字、表格、图形、图像、声音等多种媒体信息的数据库,如NLM 的医学史数据库( history of medcine )。
打开新浪新闻
回到首页 查看更多精彩
打开新浪新闻,阅读体验更佳
相关视频
中国货轮抵达巴西,巴西人民围观惊呆!
505249次播放
00:35
国务院联防联控机制:接下来所有医疗机构都要接诊阳性患者……
235695次播放
00:05
终于碰到个关门的了
5602849次播放
00:16
大家都在看
人社局回复感染后居家薪资怎么算
583万
热
钟南山回应新冠后遗症
569万
把方舱医院升级改造成亚定点医院
474万
保定:感染者确实不少 秩序正恢复
400万
所有医疗机构都要接诊新冠阳性患者
386万
深夜看球吃泡面有多爽
381万
热
查看全部实时热点
相关新闻
点击查看更多
告别!江西籍巨星陨落
都市现场
再熬2天,3生肖财路畅通,大发横财,注定大富大贵
迪迪说体育
独家!深圳突放大招:可延期!
21财闻汇
江西两地任免一批领导干部
江西发布
推荐阅读
点击查看更多
王大陆蔡卓宜公开恋情 经纪人回应目前感情稳定
邓伦被曝傍上富二代 与顾家家居千金恋爱中
1娱乐红闪闪
最水金童!踢球脏,喊他滚回西班牙当王室赘婿,别踢球了?
7新氧医美App
上午9点,国足新帅曝光!足协提供1063万年薪,换李霄鹏冲世界杯
33小贤爱足球
再见姆巴佩!皇马王炸签约达成,7200万买16岁天才,未来头牌已定
2视水见行
俄军包围15000多乌军,却发现大量外国雇佣兵?美国态度变了
409兵之佳
27岁女歌手突然失踪,3天后竟在废车后备箱中被发现!尸体被塞进桶中……
4英国报姐
詹俊:或许荷兰实力不如2014年,但全队上下都会为范加尔拼尽所有
6直播吧
世界杯这场球有疑点!教练赛前分钱,让太太团留宿,队长罚点脚软
1三十年莱斯特城球迷
竞争太激烈!皇马当红天才帝星惨遭主帅蒂特冷落 沦为世界杯边缘人
1零度眼看球2018
多门海马斯抵达前线,数万乌军通信信号全部消失!大战终究要来了
7深度军事内参
谷爱凌男友身高1米93,全家都是运动员!基因太强,下一代无解
7一只眼体育
张天爱长肉了!紧身裙包裹下超级有料,不愧是风情万种的代名词
7背锅少女伊云斯
李铁被带走后,里皮首次发声!直戳中国足球弊病:主教练更像傀儡
574吴权林
巴西队吃牛排被骂炫富:国内有5千万人挨饿!国脚回击:少管闲事
36三十年莱斯特城球迷
S家族风波升级!小S丈夫被曝上海养多位情人,私生子如今已3岁
2叶师傅看八卦-
范加尔:阿根廷丢球后梅西不参与比赛 这给我们机会
417新浪体育
10胜2负!西部第一!全联盟天赋最强球队,天赋异禀果然非同一般
1康泳哥
5年15亿美元的超级大合同,买的NBA版权,现在来看赔了吗?
34体坛哈士奇
天亮了!黑哨被撵出世界杯,乌拉圭因他出局,国足碰他基本没赢过
9三十年莱斯特城球迷
视频 直播 美图 博客 新浪 政务 搞笑 八卦 情感 旅游 佛学 众测
首页 导航 反馈 登录
Sina.cn(京ICP0000007) 2022-12-09 17:16
说说你的看法
0
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)