非关系型数据库有哪些优缺点

非关系型数据库有哪些优缺点,第1张

非关系型数据严格上不是一种数据库,应该是一种数据结构化存储方法的集合,可以是文档或者键值对等。当初我在黑马程序员培训时候就学过。

优点:

1、格式灵活:存储数据的格式可以是key,value形式、文档形式、形式等等,文档形式、形式等等,使用灵活,应用场景广泛,而关系型数据库则只支持基础类型。

2、速度快:nosql可以使用硬盘或者随机存储器作为载体,而关系型数据库只能使用硬盘;

3、高扩展性;

4、成本低:nosql数据库部署简单,基本都是开源软件。

缺点:

1、不提供sql支持,学习和使用成本较高;

2、无事务处理;

3、数据结构相对复杂,复杂查询方面稍欠。

非关系型数据库的分类和比较:

1、文档型

2、key-value型

3、列式数据库

4、图形数据库

万方数据库、维普资讯网、中国知网的区别\x0d\简单比较:\x0d\1、从收录情况来看,维普收录最久,万方收录时间最短,但是现刊万方收录最好,维普最近两年的很多期刊都没有了,特别是医学类的。\x0d\2、文档的清晰度:万方最高,维普最差。\x0d\3、使用方便性:知网和万方差不多,维普最差。\x0d\4、其它:万方的期刊浏览功能做的很好。\x0d\更加深入比较:\x0d\中国知识资源总库(CNKI)《中国知识资源总库》是由清华大学主办、中国学术期刊(光盘版)电子杂志社出版、清华同方知网(北京)技术有限公司发行、数百位科学家、院士、学者参与建设,精心打造的大型知识服务平台和数字化学习系统。目前,《总库》囊括了自然科学、人文社会科学及工程技术各领域知识,拥有期刊、报纸、博硕士培养单位的博士和优秀硕士学位论文、全国重要会议论文、中小学多媒体教辅以及1000多个加盟数据库。全文采用CAJ和PDF格式,必须下载专门的CAJ和PDF浏览器才可阅读。\x0d\中国知识资源总库的重点数据库有:\x0d\\x0d\《中国期刊全文数据库(CJFD)》截至2007年3月共收录了国内8127种期刊,全文文献总量已达2272万多篇,收录起始时间一般为1994年,个别追溯到1979年或创刊年,按学科分126个专题,内容每日累增。产品形式有网络形式、光盘形式、《中国期刊专题全文数据库光盘版》。\x0d\\x0d\《中国优秀博硕士学位论文全文数据库(CDMD)》收录2000年至今300多个博硕士培养单位的学位论文,内容每日累增。\x0d\\x0d\《中国重要报纸全文数据库(CCND)》收录2000年至今1000多种重要报纸,内容每日累增。\x0d\\x0d\《中国重要会议论文集全文数据库》(CPCD)收录2000年至今400家学术团体的会议论文,内容每日累增。\x0d\\x0d\《中国企业知识仓库(CEKD)》收录国内5400余种核心与专业特色期刊、博硕论文、报纸、行业标准、法律法规、行业经济数据统计、行业深度研究报告、技术发展动态、国外经济发展动态等信息,涵盖企业技术创新、经营决策、企业管理、WTO、行业动态等专业资料信息。\x0d\\x0d\《中国图书全文数据库》《中国年鉴数据库》《各行业百科数据库》《声像资料数据库 》《《保持***员先进性教育》专题数据库》等。\x0d\以中国期刊全文数据库为例讲解CNKI的检索方式。中国期刊全文数据库有分类检索、初级检索、高级检索和专业检索四种方式。在每种方式的检索结果(包括二次检索的检索结果)里都可以进行二次检索,可以无数次的进行,逐步缩小检索范围,直至检索结果为零。\x0d\\x0d\重庆维普资讯有限公司是科学技术部西南信息中心下属的一家大型的专业化数据公司,是中文期刊数据库建设事业的奠基人。自1989年以来,一直致力于期刊等信息资源的深层次开发和推广应用,集数据采集、数据加工、光盘制作发行和网上信息服务于一体;收录有中文期刊8000种,中文报纸1000种,外文期刊4000种,拥有固定客户2000余家。目前已成为推动我国数字图书馆建设的坚强支柱之一。\x0d\\x0d\在以上的数据库中,最为常用也最受大家欢迎的是《中文科技期刊数据库》。它源于重庆维普资讯有限公司1989年创建的《中文科技期刊篇名数据库》,其全文和题录文摘版一一对应,经过16年的推广使用和完善,全面解决了文摘版收录量巨大但索取原文繁琐的问题。全文版的推出受到国内广泛赞誉,同时成为国内各省市高校文献保障系统的重要组成部分。《中文科技期刊数据库》还是目前世界最大的连续动态更新的中文期刊全文数据库,积累全文文献728多万篇,分七大专辑:自然科学专辑、农业科学专辑、医药卫生专辑、教育科学专辑、经济管理专辑、图书情报专辑、工程技术专辑 。\x0d\\x0d\万方数据库简介\x0d\\x0d\知识来源:万方数据股份有限公司是国内第一家以信息服务为核心的股份制高新技术企业,作为国内第一批开展互联网服务的企业之一,万方数据坚持以信息资源建设为核心,努力发展成为中国第一的信息服务提供商,开发独具特色的信息处理方案和信息增值产品,为用户提供从数据、信息到知识的全面解决方案,服务于国民经济信息化建设,推动中国全民信息素质的成长。\x0d\\x0d\覆盖范围:自然科学、数理化、天文、地球、生物、医药、卫生、工业技术、航空、环境、社会科学、人文地理等各学科领域。\x0d\\x0d\收录年限:《中国会议论文全文数据库》主要收录1998年以来国家级学会、协会、研究会组织召开的全国性学术会议论文。

优点:

极高的装载速度

(最高可以等于所有硬盘IO

的总和,基本是极限了)

适合大量的数据而不是小数据

实时加载数据仅限于增加(删除和更新需要解压缩Block

然后计算然后重新压缩储存)

高效的压缩率,不仅节省储存空间也节省计算内存和CPU。

非常适合做聚合 *** 作。

缺点:

不适合扫描小量数据

不适合随机的更新

批量更新情况各异,有的优化的比较好的列式数据库(比如Vertica)表现比较好,有些没有针对更新的数据库表现比较差。

不适合做含有删除和更新的实时 *** 作。

Apache Cassandra数据库的优缺点有哪些?

TAG标签: 数据库 Apache 优缺点 Cassandra

本文将超越众所周知的一些细节,探讨与 Cassandra 相关的不太明显的细节。您将检查 Cassandra 数据模型、存储模式设计、架构,以及与 Cassandra 相关的潜在惊喜。

在数据库历史文章 “What Goes Around Comes Around”中,Michal Stonebraker 详细描述了存储技术是如何随着时间的推移而发展的。实现关系模型之前,开发人员曾尝试过其他模型,比如层次图和有向图。值得注意的是,基于 SQL 的关系模型(即使到现在也仍然是事实上的标准)已经盛行了大约 30 年。鉴于计算机科学的短暂历史及其快速发展的步伐,这是一项非凡的成就。关系模型建立已久,以至于许多年来,解决方案架构师很容易为应用程序选择数据存储。他们的选择总是关系数据库。

诸如增加系统、移动设备、扩展的用户在线状态、云计算和多核系统的用户群之类的开发已经导致产生越来越多的大型系统。Google 和 Amazon 之类的高科技公司都是首批触及规模问题的公司。他们很快就发现关系数据库并不足以支持大型系统。

为了避免这些挑战,Google 和 Amazon 提出了两个可供选择的解决方案:Big Table 和 Dynamo,他们可以由此放松关系数据模型提供的保证,从而实现更高的可扩展性。Eric Brewer 的 “CAP Theorem”后来官方化了这些观察结果。它宣称,对于可扩展性系统,一致性、可用性和分区容错性都是权衡因素,因为根本不可能构建包含所有这些属性的系统。不久之后,根据 Google 和 Amazon 早期的工作,以及所获得的对可扩展性系统的理解,计划创建一种新的存储系统。这些系统被命名为 “NoSQL” 系统。该名称最初的意思是 “如果想缩放就不要使用 SQL”,后来被重新定义为 “不只是 SQL”,意思是说,除了基于 SQL 的解决方案外,还有其他的解决方案。

有许多 NoSQL 系统,而且每一个系统都缓和或改变了关系模型的某些方面。值得注意的是,没有一个 NoSQL 解决方案适用于所有的场景。每一个解决方案都优于关系模型,且针对一些用例子集进行了缩放。我的早期文章 “在 Data Storage Haystack 中为您的应用程序寻找正确的数据解决方案” 讨论了如何使应用程序需求和 NoSQL 解决方案相匹配。

Apache Cassandra是其中一个最早也是最广泛使用的 NoSQL 解决方案。本文详细介绍了 Cassandra,并指出了一些首次使用 Cassandra 时不容易发现的细节和复杂之处。

Apache Cassandra

Cassandra 是一个 NoSQL 列族 (column family) 实现,使用由 Amazon Dynamo 引入的架构方面的特性来支持 Big Table 数据模型。Cassandra 的一些优势如下所示:

高度可扩展性和高度可用性,没有单点故障

NoSQL 列族实现

非常高的写入吞吐量和良好的读取吞吐量

类似 SQL 的查询语言(从 08 起),并通过二级索引支持搜索

可调节的一致性和对复制的支持

灵活的模式

这些优点很容易让人们推荐使用 Cassandra,但是,对于开发人员来说,至关重要的一点是要深入探究 Cassandra 的细节和复杂之处,从而掌握该程序的复杂性。

什么是列?

列 有点用词不当,使用名称单元格 很可能更容易理解一些。我会坚持使用列,因为这是一种习惯用法。

Cassandra 数据模型包括列、行、列族和密钥空间 (keyspace)。让我们逐一进行详细介绍它们。

•列:Cassandra 数据模型中最基本的单元,每一个列包括一个名称、一个值和一个时间戳。在本文的讨论中,我们忽略了时间戳,您可以将一个列表示为一个名称值对(例如 author="Asimov")。

•行:用一个名称标记的列的集合。例如,清单 1 显示了如何表示一个行:

清单 1 行的示例

"Second Foundation"-> {

author="Asimov",

publishedDate="",

tag1="sci-fi", tag2="Asimov"

}

Cassandra 包括许多存储节点,并且在单个存储节点内存储每一个行。在每一行内,Cassandra 总是存储按照列名称排序的列。使用这种排序顺序,Cassandra 支持切片查询,在该查询中,给定了一个行,用户可以检索属于给定的列名称范围内的列的子集。例如,范围 tag0 到 tag9999 内的切片查询会获得所有名称范围在 tag0 和 tag9999 内的列。

•列族:用一个名称标记的行的集合。清单 2 显示了样例数据的可能形式:

清单 2 列族示例

Books->{

"Foundation"->{author="Asimov", publishedDate=""},

"Second Foundation"->{author="Asimov", publishedDate=""},

}

人们常说列族就像是关系模型中的一个表格。如下例所示,相似点将不复存在。

•密钥空间:许多列族共同形成的一个组。它只是列族的一个逻辑组合,并为名称提供独立的范围。

最后,超级列位于一个列族中,该列族对一个密钥下的多个列进行分组。正如开发人员不赞成使用超级列一样,在此,我对此也不作任何讨论。

Cassandra 与 RDBMS 数据模型

根据以上对 Cassandra 数据模型的描述,数据被放入每一个列族的二维 (2D) 空间中。要想在列族中检索数据,用户需要两个密钥:行名称和列名称。从这个意义上来说,尽管还存在多处至关重要的差异,关系模型和 Cassandra 仍然非常相似。

•关系列均匀分布在表中的所有行之间。数据项之间通常有明显的纵向关系,但这种情况并不适用于 Cassandra 列。这就是 Cassandra 使用各个数据项(列)来存储列名称的原因。

•有了关系模型,2D 数据空间就完整了。2D 空间内的每一个点至少应当拥有存储在此处的 null 值。另外,这种情况不适用于 Cassandra,Cassandra 可以拥有只包括少数项的行,而其他行可以拥有数百万个项。

•有了关系模型,就可以对模式进行预定义,而且在运行时不可以更改模式,而 Cassandra 允许用户在运行时更改模式。

•Cassandra 始终存储数据,这样就可以根据其名称对列进行排序。这使得使用切片查询在列中搜索数据变得很容易,但在行中搜索数据变得很困难,除非您使用的是保序分区程序。

•另一个重要差异是,RDMBS 中的列名称表示与数据有关的元数据,但绝不是数据。而在 Cassandra 中,列名称可以包括数据。因此,Cassandra 行可以拥有数百万个列,而关系模型通常只有数十个列。

•关系模型使用定义良好的不可变模式来支持复杂的查询,这些查询中包括 JOIN 和聚合等。使用关系模型,用户无需担心查询就可定义数据模式。Cassandra 不支持 JOIN 和大多数 SQL 搜索方法。因此,模式必须满足应用程序的查询要求。

Access的优点:

(1)存储方式简单,易于维护管理,Access的对象有表、查询、窗体、报表、页、宏和模块,以上对象都存放在后缀为(mdb或accdb)的数据库文件中,便于用户的 *** 作和管理。

(2)面向对象 Access是一个面向对象的开发工具,这种基于面向对象的开发方式,使得开发应用程序更为简便。

(3)界面友好、易 *** 作,Access是一个可视化工具,是风格与Windows完全一样,用户想要生成对象并应用,只要使用鼠标进行拖放即可,非常直观方便。系统还提供了表生成器、查询生成器、报表设计器以及数据库向导、表向导、查询向导、窗体向导、报表向导等工具,使得 *** 作简便,容易使用和掌握。

(4)集成环境、处理多种数据信息,Access基于Windows *** 作系统下的集成开发环境,该环境集成了各种向导和生成器工具,极大地提高了开发人员的工作效率,使得建立数据库、创建表、设计用户界面、设计数据查询、报表打印等可以方便有序地进行。

(5)Access支持ODBC(开发数据库互连,Open Data Base Connectivity),利用Access强大的DDE(动态数据交换)和OLE(对象的联接和嵌入)特性,可以在一个数据表中嵌入位图、声音、Excel表格、Word文档,还可以建立动态的数据库报表和窗体等。Access还可以将程序应用于网络,并与网络上的动态数据相联接。利用数据库访问页对象生成HTML文件,轻松构建Internet/Intranet的应用。

(6)支持广泛,易于扩展,d性较大 能够将通过链接表的方式来打开EXCEL文件、格式化文本文件等,这样就可以利用数据库的高效率对其中的数据进行查询、处理。还可以通过以Access作为前台客户端,以SQL Server作为后台数据库的方式(如ADP)开发大型数据库应用系统。

总之,Access是一个既可以只用来存放数据的数据库,也可以作为一个客户端开发工具来进行数据库应用系统开发;即可以开发方便易用的小型软件,也可以用来开发大型的应用系统。

Access的缺点:

ACCESS是小型数据库,既然是小型就有它的局限性(下面关于性能方面的缺点仅指用Access作为数据库的情况下,不包括用Access作为客户端前台,用SQL Server作为后台数据库的情况):

1 数据库过大,一般百M以上(纯数据,不包括窗体、报表等客户端对象)性能会变差。

2 虽然理论上支持255个并发用户,但实际上根本支持不了那么多,如果以只读方式访问大概在100个用户左右,而如果是并发编辑,则大概在10-20个用户。

3 记录数过多,单表记录数过百万性能就会变得较差,如果加上设计不良,这个限度还要降低。

4 不能编译成可执行文件(exe),必须要安装Access运行环境才能使用。

综上,所以access一般用作小型网站的数据库,以及小公司的数据库或应用软件开发。

一、数据库中创建索引的优点

1、创建唯一性索引,保证数据库表中每一行数据的唯一性。

2、加快数据的检索速度,这也是创建索引的最主要的原因。

3、减少磁盘IO(向字典一样可以直接定位)。

4、通过使用索引,可以在查询的过程中,使用优化隐藏器,提高系统的性能。

5、加速表和表之间的连接,特别是在实现数据的参考完整性方面特别有意义。

二、数据库中创建索引的缺点

1、创建索引和维护索引要耗费时间,这种时间随着数据量的增加而增加。

2、索引需要占用物理空间,特别是聚集索引,需要较大的空间。

3、当对表中的数据进行增加、删除和修改的时候,索引也要动态的维护,这样就降低了数据的维护速度。

扩展资料:

索引的功能

1、分解功能

把文献中的资料单元(如篇名、机构、短语、概念、物名、地名、书名、人名、字词、符号等)一一分解,这就是索引的分解功能。它是索引工作的起跑线和索引编纂的基础,没有对文献内容的这种分解功能,就没有索引。分解功能是索引作用于文献的特殊功能,是它和其他检索工作不同之处。

2、梳理功能

梳理功能是索引分解的后继。如果只有分解功能而没有梳理的功能,那么分解功能就没有价值。梳理是对资料单元的初分。如是字序,只要按笔划或音序归类即可;如是类序只要按大类归纳即可。就像小姑娘梳头,先把长发梳顺,而编什么辫子或梳什么发型则是下一步的要求了。

3、组合功能

把梳理后的资料单元按照分类的要求,严密地组织它们的类别层次以及类目下的专题和同类目下款目的序列关系;或按字序的要求,严密地把标目的结构正装 或倒装、考虑限定词对标目的限定和修饰的级数、或考虑字序和类序相结合的可能。

参考资料:

数据库索引-百度百科

优点:

1、大大加快数据的检索速度;

2、创建唯一性索引,保证数据库表中每一行数据的唯一性;

3、加速表和表之间的连接;

4、在使用分组和排序子句进行数据检索时,可以显著减少查询中分组和排序的时间。

缺点:

1、索引需要占物理空间。

2、当对表中的数据进行增加、删除和修改的时候,索引也要动态的维护,降低了数据的维护速度。

发展历史:

索引最早出现于西方,主要是中世纪欧洲宗教著作的索引。18世纪以后西方开始有主题索引,至19世纪末,内容分析索引被广泛使用。中国的索引出现较晚。一般认为,明末傅山所编的《两汉书姓名韵》是现存最早的人名索引。清代乾嘉时期,章学诚曾力倡编纂群书综合索引。

20世纪20年代,随着西方索引理论与编制技术的传入,中国现代意义上的索引编制与研究才蓬勃展开 。1930年钱亚新发表《索引和索引法》,1932年洪业发表《引得说》,标志着具有中国特色的现代索引理论、技术已迅速发展起来。

20世纪50年代,计算机技术被运用于索引编制 。此后,机编索引的大量出现,使索引编制理论、技术、索引载体形式发生了深刻变革。

SQL标准中没有涉及索引,但商用关系数据库管理系统一般都支持索引机制,只是不同的关系数据库管理系统支持的索引类型不尽相同。

索引已经成为关系数据库非常重要的部分。它们被用作包含所关心数据的表指针。通过一个索引,能从表中直接找到一个特定的记录,而不必连续顺序扫描这个表,一次一个地去查找。对于大的表,索引是必要的。没有索引,要想得到一个结果要等好几个小时、好几天,而不是几秒钟。

以上就是关于非关系型数据库有哪些优缺点全部的内容,包括:非关系型数据库有哪些优缺点、万方、中国知网、维普三个文献数据库的异同、优缺点各是什么、列式数据库的优缺点等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/9349177.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-27
下一篇 2023-04-27

发表评论

登录后才能评论

评论列表(0条)

保存