hadoop与传统的关系型数据库(如oracle)相比,有什么优势及劣势?_sql

hadoop的hdfs支持海量数据量存储mapreduce支持对海量数据的分布式处理\x0d\x0aoracle虽然可以搭建集群但是当数据量达到一定限度之后查询处理速度会变得很慢且对机器性能要求很高\x0d\x0a其实这两个东西不是同类hadoop是一个分布式云处理架构，倾向于数据计算而oracle是一个关系型数据库，倾向于数据存储。要说比较可以比较hbase与oracle。\x0d\x0ahbase是一种nosql数据库，列式数据库，支持海量数据存储，支持列的扩展，但是查询 *** 作较复杂，不如oracle这类关系型数据库简单，且只支持一个索引，但是Hbase在表结构设置合理情况下，查询速度跟数据量大小没有太大关系，即数据量的大小不会影响到查询速度，顺便说句Hbase查询速度可以达到ms级

关系型资料库与Hadoop的本质区别在什么地方

两者的思路是一样，都是分散式并行处理。本质肯定一样，不同的是应用场景不一样：

1、hadoop是个轻量级的产品，又是开源的，不像dpf那么复杂，还要购买商业软体，搭个DPF环境需要费挺大力气的。

2、hadoop能处理半结构化，非结构化资料。

但hadoop要写map reduce函式，这个比起SQL来，方便灵活性差太多了。。。

在处理结构化资料方面，个人觉得MPP的资料库效能其实不会比hadoop差，只是一提起MPP大家就会想到要伺服器，外部储存，光纤网路，还要做很好的规划，觉得成本很高，所以都去追捧hadoop去了：）

参考：:itpub./thread-1566914-1-1.

这完全是两个东西啊！一个是资料库，一个是分散式系统基础架构，两个没有可比性吧！

我猜你想问的应该是hadoop的hbase这个nosql与关系型资料库的区别吧！

:zhihu./question/20059632

一般来说，关系型资料库都拿来做高效响应即时查询。但在大资料离线分析上比较弱。而hadoop很适合拿来做大资料离线分析。

面试题关系型资料库和非关系型资料库的区别

索引实际上是一组指向表中资料的指标,索引的排列顺序其实就是这组指标的顺序.聚集索引:表的物理储存顺序与指标(即逻辑)顺序相同非聚集索引:物理与逻辑顺序不同因为一个表只能有一个物理顺序,所以,聚集索引的个数最多只能是1.其中唯一索引是给所做的索引增加了唯一性的约束,新增,修改索引列中资料时,不允许出现重复值.它可以是聚集索引,也可以是非聚集的。主键不允许有NULL，唯一索引可以。但是唯一索引只允许一个NULL。主键索引是把主键列定义为索引,主键具有唯一性,所以主键索引是唯一索引的一种特殊形式

关系型和非关系型资料库的区别

非关系型资料库的实质：非关系型资料库产品是传统关系型资料库的功能 *** 版本，通过减少用不到或很少用的功能，来大幅度提高产品效能。

关系式资料结构把一些复杂的资料结构归结为简单的 二元关系(即二维表格形式) 。

非关系型资料库通常分为层次式资料库、网路式资料库。按照 网状资料结构 建立的资料库系统称为网状资料库系统。用数学方法可将网状资料结构转化为层次资料结构。

层次结构模型实质上是一种有根结点的定向有序树(在数学中"树"被定义为一个无回的连通图)。

当前主流的关系型资料库有Oracle、DB2、Microsoft SQL Server、Microsoft Aess、MySQL等。

非关系型资料库有 NoSql、Cloudant。

nosql和关系型资料库比较？

优点：

1）成本：nosql资料库简单易部署，基本都是开源软体，不需要像使用oracle那样花费大量成本购买使用，相比关系型资料库价格便宜。

2）查询速度：nosql资料库将资料储存于快取之中，关系型资料库将资料储存在硬碟中，自然查询速度远不及nosql资料库。

3）储存资料的格式：nosql的储存格式是key,value形式、文件形式、图片形式等等，所以可以储存基础型别以及物件或者是集合等各种格式，而资料库则只支援基础型别。

4）扩充套件性：关系型资料库有类似join这样的多表查询机制的限制导致扩充套件很艰难。

缺点：

1）维护的工具和资料有限，因为nosql是属于新的技术，不能和关系型资料库10几年的技术同日而语。

2）不提供对sql的支援，如果不支援sql这样的工业标准，将产生一定使用者的学习和使用成本。

3）不提供关系型资料库对事物的处理。

hbase和关系型资料库的区别

Mongodb用于储存非结构化资料，尤其擅长储存json格式的资料。储存的量大概在10亿级别，再往上效能就下降了，除非另外分库。

Hbase是架构在hdfs上的列式储存，擅长rowkey的快速查询，但模糊匹配查询（其实是前模糊或全模糊）不擅长，但储存的量可以达到百亿甚至以上，比mongodb的储存量大多了。

关系型资料库与实时型资料库有什么区别？

■关系资料库 facts and information

关系资料库是建立在集合代数基础上，应用数学方法来处理资料库中的资料。现实世界中的各种实体以及实体之间的各种联络均用关系模型来表示。

关系模型由关系资料结构、关系 *** 作集合、关系完整性约束三部分组成。

全关系系统十二准则

全关系系统应该完全支援关系模型的所有特征。关系模型的奠基人E.F.Codd具体地给出了全关系系统应遵循的基本准则。

''准则0'' : 一个关系形的关系资料库系统必须能完全通过它的关系能力来管理资料库。

''准则1'' 资讯准则 : 关系资料库系统的所有资讯都应该在逻辑一级上用表中的值这一种方法显式的表示。

''准则2'' 保证访问准则 : 依靠表名、主码和列名的组合，保证能以逻辑方式访问关系资料库中的每个资料项。

''准则3'' 空值的系统化处理 : 全关系的关系资料库系统支援空值的概念，并用系统化的方法处理空值。

''准则4'' 基于关系模型的动态的联机资料字典 : 资料库的描述在逻辑级上和普通资料采用同样的表述方式。

''准则5'' 统一的资料子语言 :

一个关系资料库系统可以具有几种语言和多种终端访问方式，但必须有一种语言，它的语句可以表示为严格语法规定的字串，并能全面的支援各种规则。

''准则6'' 检视更新准则 : 所有理论上可更新的检视也应该允许由系统更新。

''准则7'' 高阶的插入、修改和删除 *** 作 : 系统应该对各种 *** 作进行查询优化。

''准则8'' 资料的物理独立性 : 无论资料库的资料在储存表示或存取方法上作任何变化，应用程式和终端活动都保持逻辑上的不变性。

''准则9'' 资料逻辑独立性 : 当对基本关系进行理论上资讯不受损害的任何改变时，应用程式和终端活动都保持逻辑上的不变性。

''准则10'' 资料完整的独立性 : 关系资料库的完整性约束条件必须是用资料库语言定义并存储在资料字典中的。

''准则11'' 分布独立性 : 关系资料库系统在引入分布资料或资料重新分布时保持逻辑不变。

''准则12'' 无破坏准则 : 如果一个关系资料库系统具有一个低阶语言，那么这个低阶语言不能违背或绕过完整性准则。

■实时资料库是资料库系统发展的一个分支，它适用于处理不断更新的快速变化的资料及具有时间限制的事务处理。实时资料库技术是实时系统和资料库技术相结合的产物，研究人员希望利用资料库技术来解决实时系统中的资料管理问题，同时利用实时技术为实时资料库提供时间驱动排程和资源分配演算法。然而，实时资料库并非是两者在概念、结构和方法上的简单整合。需要针对不同的应用需求和应用特点，对实时资料模型、实时事务排程与资源分配策略、实时资料查询语言、实时资料通讯等大量问题作深入的理论研究。实时资料库系统的主要研究内容包括：

实时资料库模型

实时事务排程：包括并发控制、冲突解决、死锁等内容

容错性与错误恢复

访问准入控制

记忆体组织与管理

I/O与磁碟排程

主记忆体资料库系统

不精确计算问题

放松的可序列化问题

实时SQL

实时事务的可预测性

研究现状与发展实时资料库系统最早出现在1988年3月的ACM SIGMOD Record的一期专刊中。随后，一个成熟的研究群体逐渐出现，这标志着实时领域与资料库领域的融合，标志着实时资料库这个新兴研究领域的确立。此后，出现了大批有关实时资料库方面的论文和原型系统。人机互动技术与智慧资讯处理实验室实时资料库小组一直致力于实时系统、实时智慧、实时资料库系统及相关技术的研究与开发，并取得了一定的成绩。

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/sjk/6759687.html

hadoop与传统的关系型数据库(如oracle)相比,有什么优势及劣势?

发表评论

评论列表（0条）