后端编程Python3-数据库编程

后端编程Python3-数据库编程,第1张

1

信息检索(information retrieval):是指将信息接一定的方式组织和贮存起来,并根据信息用户的需要找出有关信息的过程。所以,它的全称又叫信息存贮与检索(information storage and retrieval),这是广义的信息检索。狭义的信息检索则仅指该过程的后半部分,即根据课题的需要,主要借助于检索工具,从信息集合中找出所需信息的过程,相当于人们所说的信息查寻(information search)。信息检索的过程往往需要一个评价反馈途径,多次比较匹配,以获得最终的检索结果。

2

当你拿到一本书就会在封底或版权页看到由“ISBN”(国际标准书

号)和10位数字为标志组成的字样,其格式为:ISBN7-5004-1693-

8/I·200,它的含义是:ISBN组号-出版者号-书名号-校验号/图书

分类号·种次号。组号代表一个地区或地理区域、国家或集团的编号,

中国的编号是“7”;出版者号代表出版社的编号;书名号是出版社出

版的一种特定出版物的名称;校验号校验ISBN编号是否合法。中国加入

ISBN系统之后制定了相应的国家标准-中国标准书号,并于1987年1月

实施。

如此繁复的代号和数字组合有什么作用呢?其一,帮你了解图书的

出版规模。ISBN由十位数字组成,其中校验号恒定为一位数,组号可取

1-5位数。如果一个国家或地区的组号是五位数,其中出版者号与书名

号位数之和就是四位数,通过排列组合,这个国家或地区的出版量最多

只是一万种;而组号如果是一位数,那么其中出版号与书名号位数之和

就是八位数,其出版量将高达一亿种,组号的位数越大出版量越小,组

号的位数越小出版量越大。我国的组号是〃7〃,可见其出版量之大。

其二,帮你了解出版者。首先,可以了解出版者的出版规模和目前

的图书出版数量。ISBN的出版者号与书名号的位数之和恒等于八。目前

,我国出版者可取代码2至5位数,如果出版者号是三位,书名号就是五

位数,则出版量就是十万种,出版者号的位数越小,书名号的位数越大

,出版量也越多,反之出版量越少。例如:商务印书馆1996年7月出版

的《现代汉语词典》修订第三版,中国标准书号为ISBN7-100-01777

-7/H519。“100”是商务印书馆的代码,“01777”是书名号,表示

商务可出版10万种图书,至1996年7月已出版了1778种(出版者所出版

的第一种图书书名号从0计算)。另外,可以了解出版者是综合性的还

是专业性的。ISBN的书名号与种次号分别代表的是可以出版多少种图书

,已经出版了多少种和某一类目出版了多少种。例如,人民文学出版社

的《当今十大奇案》,中国标准书号是ISBN7-02-000420-2/I·421

其书名号与种次号相等,说明人民文学出版社是专业性的出版社,它以

出版文学类的图书为主。

其三,方便了图书馆工作人员。由于ISBN具有世界唯一性,所以通

过ISBN检索的准确性要高于通过书名检索的准确性。书名有重名现象,

比如茅盾有长篇小说《虹》,而英国的劳伦斯也有长篇小说《虹》。通

过ISBN检索具有唯一性,检索的速度也要高于通过书名检索的速度。书

名少则几个字,多则十几个字,而ISBN只有十个阿拉伯数字,一般的工

作人员都能够录入且速度要比录入书名的速度快得多。

总之,中国标准书号的最大特点是将国际标准书号(ISBN)和全国

统一书号中的分类号和种次号的成份结合起来,结构简单层次性强,便

于计算机处理和检索,给出版、发行、订购、统计、分编等提供很大的

方便,是读者进入图书馆查阅图书的一个重要检索点。

3

计 算 机 检 索 系 统 的 构 成

计算机检索系统由计算机硬件、软件、数据和通讯网络构成。

一、计算机硬件

计算机硬件是系统采用的各种硬设备的总称,主要包括具有一定性能的主计算机、外围设备以及与数据处理或数据传送有关的其他设备。

二、软件

软件由系统维护软件与检索软件构成。系统维护软件,如数据库管理程序、词表管理程序等,其作用是保障检索系统的高效运转。检索软件是用户与系统的界面,用户通过检索软件进行检索,检索软件功能的强弱直接影响着检索效果。检索软件可以分为指令式、菜单式和智能接口等。

三、数据库

根据ISO/DIS 5127标准,数据定义为:“至少由一种文档组成,并能满足某一特定目的或某一特定数据处理系统需要的一种数据集合。”通俗地说,数据库就是在计算机存储设备上按一定方式存储的相互关联的数据集合。

按国际上通用的分类方法,数据库可以划分为以下类型:

1 参考数据库

参考数据库(Reference databases)是指引用户到另一信息源以获得原文或其他细节的一类数据库。它包括书目数据库(Bibliographic databases)和指南数据库(Referral database或Directory database)两种。

书目数据库是指存储某个领域的二次文献(如文摘、题录、目录等书目数据)的一类数据库,有时又称为二次文献数据库,或简称为文献数据库。如中国机械工程文摘数据库,属于此类型数据库。

指南数据库也称指示性数据库,是指存储关于某些机构、人物、出版物、项目、程序、活动等对象的简要描述,指引用户从其他有关信息源获取更详细的信息的一类数据库。如产品目录、机构名录、研发项目、基金项目等数据库均属于此类型。

2 源数据库

源数据库(Source databases)是指能直接提供原始资料或具体数据的数据库,用户不必再查阅其他信息源。它可以分为:

(1)数值数据库这是一种专门提供以数值方式表示的数据的源数据库,如统计数据库、财务数据库等。

(2)文本-数值数据库这是一种能同时提供文本信息和数值数据的源数据库,如企业信息数据库、产品数据库等。

(3)全文数据库这是一种存储文献全文或其中主要部分的源数据库,如法律法规全文库、期刊全文库等。

(4)术语数据库这是一种专门存储名词术语信息、词语信息以及术语工作和语言规范工作成果的源数据库,如名词术语信息库、各种电子化辞书等。

(5)图像数据库这是一种用来存储各种图像或图形信息及有关文字说明资料的源数据库,主要应用于建筑、设计、广告、产品、或照片等资料类型的计算机存储与检索。

除上述几种类型的数据库外,还有能同时存储多种不同类型数据的数据库,即混合型数据库。另外,按其载体不同又可分成磁媒体数据库、光盘数据库和多媒体数据库等。

四、通讯网络

由于现代通信技术的发展,公共数据传输技术为信息的传递提供了保障,信息检索逐渐发展成为网络检索,通过数据传输网将各个计算机连接起来。每个计算机成为网络中的一个节点,每个节点可含一个或多个数据库,网络上的每个节点和其终端只要有授权均可对网络中的数据库进行访问,实现资源共享。随着空间技术的发展,信息检索已进入了信息传递-卫星通讯-计算机技术三位一体的新阶段。

4

《中国图书馆分类法》有22大类:A 马克思主义、列宁主义、毛泽东思想、邓小平理论,B 哲学、宗教,C 社会科学总论,D 政治、法律,E 军事,F 经济,G 文化、科学、教育、体育,H 语言、文字,I 文学,J 艺术,K 历史、地理,N 自然科学总论,O 数理科学和化学,P 天文学、地球科学,Q 生物科学,R 医药、卫生,S 农业科学,T 工业技术,U 交通运输,V 航空、航天,X 环境科学、安全科学,Z 综合性图书。

详细类目可查阅图书馆主页《中国图书馆分类法》。

体育有:G 文化、科学、教育、体育

5

1是否支持全文检索

2检索结果如何排序,相关性,时间等,是否全面

3检索功能是否全面,如布尔逻辑检索、关键词检索、位置检索、截词检索、限制检索等等

4查询速度如何,维护更新如何

5界面是否简单易用,易用性是否强

建议你找本关于《信息检索》的书来看看,我说的特别简单,手头没有书,你要是想具体看看,还得看书。人大出版社的那本信息检索不错。

6

根据文献的有关信息查找相应的馆藏目录或联合目录,找到收藏单位,再索取或复制原文。如果本单位图书馆没有收藏所需文献,用户可以通过馆际互借或文献传递服务获取。

7

学术性图书馆当然以国家图书馆最权威,各高校图书馆都收藏有相应的学术资源,可通过中国高校文献保障系统(Calis)来查重要高校的馆藏和信息服务情况。

按国际上通用的分类方法,数据库分为以下三大类:

1参考数据库(Reference databases),是能指引用户到另一信息源获取原文或其他细节的数据库,包括书目数据库(Bibliographic databases)如题录库、文摘索引库、图书馆机读目录库,和指南数据库(Referral databases或Directory databases),如企业名录库、产品数据库等;

2源数据库(Source databases),指能直接提供所需原始资料或具体数据的数据库。包括数值数据库(Numeric databases)、全文数据库(Full text databases)、术语数据库(Terminological databases)和图像数据库(Graphic databases)。具体的如新闻消息全文库、法律法规全文库、商情全文库、期刊论文数据库、财务数据库、科技报告数据库、各种统计数据库、含有或照片的产品目录库、资料库等;

3混合型数据库(Mixed databases),能同时存贮多种类型数据的数据库。

规模

易观国际近期发布《IT产品和服务-2007年第1季度中国数据库软件市场数据监测》,考察了中国数据库管理软件市场。数据显示,中国商业数据库市场2007年第1季度整体规模达到543亿人民币,比去年同期增长15%,与上季度环比增长153%。

从厂商竞争格局来看,国际软件巨头占据市场的绝大多数份额。Oracle、IBM、Microsoft和Sybase牢牢占据国内数据库软件市场前四位,拥有938%的市场份额。国产数据库的市场份额在本季度继续提升,正在抓住国家提倡自主创新的机遇,以“有自主知识产权”的产品为契机,满足部委和地方政府的信息整合平台需求

应用

随着信息时代的发展,数据库也相应产生了一些新的应用领域。主要表现在下面6个方面。

1.多媒体数据库

这类数据库主要存储与多媒体相关的数据,如声音、图像和视频等数据。多媒体数据最大的特点是数据连续,而且数据量比较大,存储需要的空间较大。

2.移动数据库

该类数据库是在移动计算机系统上发展起来的,如笔记本电脑、掌上计算机等。该数据库最大的特点是通过无线数字通信网络传输的。移动数据库可以随时随地地获取和访问数据,为一些商务应用和一些紧急情况带来了很大的便利。

3.空间数据库

这类数据库目前发展比较迅速。它主要包括地理信息数据库(又称为地理信息系统,即GIS)和计算机辅助设计(CAD)数据库。其中地理信息数据库一般存储与地图相关的信息数据;计算机辅助设计数据库一般存储设计信息的空间数据库,如机械、集成电路以及电子设备设计图等。

4.信息检索系统

信息检索就是根据用户输入的信息,从数据库中查找相关的文档或信息,并把查找的信息反馈给用户。信息检索领域和数据库是同步发展的,它是一种典型的联机文档管理系统或者联机图书目录。

5.分布式信息检索

这类数据库是随着Internet的发展而产生的数据库。它一般用于因特网及远距离计算机网络系统中。特别是随着电子商务的发展,这类数据库发展更加迅猛。许多网络用户(如个人、公司或企业等)在自己的计算机中存储信息,同时希望通过网络使用发送电子邮件、文件传输、远程登录方式和别人共享这些信息。分布式信息检索满足了这一要求。

6.专家决策系统

专家决策系统也是数据库应用的一部分。由于越来越多的数据可以联机获取,特别是企业通过这些数据可以对企业的发展作出更好的决策,以使企业更好地运行。由于人工智能的发展,使得专家决策系统的应用更加广泛。

键码:实体和一个属性或者一组属性

主关键字:候选键和主键都具有唯一性,有多个可以表示唯一性的属性时,选择其中一个表示这个表的唯一性,就是主关键键,剩下的唯一性的属性自然都是候选关键字

公共关键字

在关系数据库中,关系之间的联系是通过相容或相同的属性或属性组来表示的。如果两个关      系中具有相容或相同的属性或属性组,那么这个属性或属性组被称为这两个关系的公共关键字

4外关键字

如果公共关键字在一个关系中是主关键字,那么这个公共关键字被称为另一个关系的外关键字

见下面实例:

这是有一张班级表:

CREATE TABLE Classes(

  cid  INT PRIMARY KEY,// 这是主关键字

  cname VARCHAR(20) NOT NULL

)

下面是一张学生表:

CREATE TABLE Student(

  sId  INT PRIMARY KEY,// 这是主关键字

cid INT REFERENCES Classes(cid),// 这是班级表的外键(也就是外关键字),对这个表插入数据时,会检查该外键是否存在于班级表,如果不存在这不能插入数据,相当于用户只能在已经存在的班级中加入学生

)

上面两张表中:

在班级表和学生表中:两张表的主关键字分别是:cid和sid,公共关键字是:cid,同时cid也是学生表中的外关键字。

以上就是关于后端编程Python3-数据库编程全部的内容,包括:后端编程Python3-数据库编程、带你深入了解数据库设计中的英文术语表、信息检索的一些概念,急求!!!!等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/9408532.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-28
下一篇 2023-04-28

发表评论

登录后才能评论

评论列表(0条)

保存