hadoop的hdfs支持海量数据量存储 mapreduce支持对海量数据的分布式处理
oracle虽然可以搭建集群 但是当数据量达到一定限度之后查询处理速度会变得很慢 且对机器性能要求很高
其实这两个东西不是同类 hadoop是一个分布式云处理架构,倾向于数据计算 而oracle是一个关系型数据库,倾向于数据存储。要说比较可以比较hbase与oracle。
hbase是一种nosql数据库,列式数据库,支持海量数据存储,支持列的扩展,但是查询 *** 作较复杂,不如oracle这类关系型数据库简单,且只支持一个索引,但是Hbase在表结构设置合理情况下,查询速度跟数据量大小没有太大关系,即数据量的大小不会影响到查询速度,顺便说句Hbase查询速度可以达到ms级
1、传统数据库可以运行在传统设备上,但HANA数据库必须使用HANA认证机型;
2、传统数据库取数时从存储中取,HANA数据库从内存中读取数据,从这个角度上说HANA快些;
3、使用传统数据库ECC用啥版本都行,HANA必须ERP60+EHP7以上;
4、按SAP的说法在HANA上的财务模块,有些版本减少了一些冗余的中间表,但存在和原来同构的视图,所以迁移后不影响自开发的程序的运行。
数据仓库较之传统的数据库(这个数据库是关系型数据库)的优势还是很大的。
数据仓库目前比较成熟的是SAS数据仓库系统,其可以建筑于普通的数据库管理系统之上,例如ORACLE、DB2等,也可以单独使用SAS的数据库管理功能,但其优势不是数据的管理能力,而是对数据的挖掘能力。
而这个数据挖掘能力是SAS数据仓库真正的优势所在,SAS数据仓库是美国SAS研究所基于统计学原理为基础开发的一个完全满足统计学基础的统计分析工具。
简单的描述无法完全准确的介绍这个软件,你可以自己找寻一些资料和去书店购买这方面的书籍学习。
数据库使用电脑,用软件去管理
管理方便,备份也方便
但这时代黑客有点多
安全措施要搞好
传统文件主要就是写在纸上
耗费人力资源大
管理起来也不方便
但安全措施还算是好一点吧
它主要是物理上的安全
数据库就不一样了
背后的漏洞就多了
就是没有攻不破的墙的
HBase与传统关系数据库的区别?
答:主要体现在以下几个方面:1数据类型。关系数据库采用关系模型,具有丰富的数据类型和储存方式。HBase则采用了更加简单的数据模型,它把数据储存为未经解释的字符串,用户可以把不同格式的结构化数据和非结构化数据都序列化成字符串保存到HBase中,用户需要自己编写程序把字符串解析成不同的数据类型。
2数据 *** 作。关系数据库中包含了丰富的 *** 作,如插入、删除、更新、查询等,其中会涉及复杂的多表连接,通常是借助多个表之间的主外键关联来实现的。HBase *** 作则不存在复杂的表与表之间的关系,只有简单的插入、查询、删除、清空等,因为HBase在设计上就避免了复杂的表与表之间的关系,通常只采用单表的主键查询,所以它无法实现像关系数据库中那样的表与表之间的连接 *** 作。
3存储模式。关系数据库是基于行模式存储的,元祖或行会被连续地存储在磁盘页中。在读取数据时,需要顺序扫描每个元组,然后从中筛选出查询所需要的属性。如果每个元组只有少量属性的值对于查询是有用的,那么基于行模式存储就会浪费许多磁盘空间和内存带宽。HBase是基于列存储的,每个列族都由几个文件保存,不同列族的文件是分离的,它的优点是:可以降低I/O开销,支持大量并发用户查询,因为仅需要处理可以回答这些查询的列,而不是处理与查询无关的大量数据行;同一个列族中的数据会被一起进行压缩,由于同一列族内的数据相似度较高,因此可以获得较高的数据压缩比。
4数据索引。关系数据库通常可以针对不同列构建复杂的多个索引,以提高数据访问性能。与关系数据库不同的是,HBase只有一个索引——行键,通过巧妙的设计,HBase中所有访问方法,或者通过行键访问,或者通过行键扫描,从而使整个系统不会慢下来。由于HBase位于Hadoop框架之上,因此可以使用Hadoop MapReduce来快速、高效地生成索引表。
6数据维护。在关系数据库中,更新 *** 作会用最新的当前值去替换记录中原来的旧值,旧值被覆盖后就不会存在。而在HBase中执行更新 *** 作时,并不会删除数据旧的版本,而是生成一个新的版本,旧有的版本仍旧保留。
7可伸缩性。关系数据库很难实现横向扩展,纵向扩展的空间也比较有限。相反,HBase和BigTable这些分布式数据库就是为了实现灵活的水平扩展而开发的,因此能够轻易地通过在集群中增加或者减少硬件数量来实现性能的伸缩。
但是,相对于关系数据库来说,HBase也有自身的局限性,如HBase不支持事务,因此无法实现跨行的原子性。
注:本来也想来问这个问题,然后复制一下的。结果找不到,只好自己手打了,麻烦复制拿去用的同学点下赞呗。
传统关系数据库可能永远不会消失——至少不会很快,但其辉煌的日子已经远去。许多新兴的NoSQL数据库的普及,例如MongnDB和Cassandra。这很好的弥补了传统数据库系统的局限性。相对于NoSQL蓬勃发展的情况基于SQL的关系数据库系统确实显得有些死气沉沉。但这是数据库厂商的错,而不是SQL的错。关系数据库长期以来一直作为企业部署的关键组成部分,但现在出现了更好的选择,以适应新的数据结构和现代化硬件系统。如IBM、微软和甲骨文等厂商都将继续使用关系数据库主导其金融交易的核心功能。但是NoSQL数据库似乎更适应当今的海量数据时代。如Apache Hadoop和MapReduce技术。Bloor集团的首席分析师Robin Bloor表示传统的关系数据库已经过时了,其架构需要更新。Bloor的理由是随着多CPU计算机和固态硬盘技术的不断成熟,访问磁盘的数据已经不再重要。固态硬盘的速度更快,所以在磁盘和内存之间读取速率将会加强。明尼苏达州明尼阿波利斯的一位元数据策略顾问Dan McCreary指出SQL数据库的也有自己的问题,例如其不具备很好的伸缩性。当数据增长超过一台服务器所能承受的极限时,就必须分享或分割数据到多台服务器上,跨越多台服务器是一个复杂的过程。此外如外部链接带来的问题。例如多个表中数据的融合,跨越服务器执行一些 *** 作可能会产生一些问题。NoSQL的崛起和“NewSQL”的出现NoSQL将改变数据的定义范围。它不再是原始的数据类型,如整数、浮点。数据可能是整个文件。NoSQL可能会吓到DBA,因为他们担心失去他们自己的领域。NoSQL数据库是非关系的、水平可扩展、分布式并且是开源的。MongoDB的创始人Dwight Merriman表示NoSQL可作为一个Web应用服务器、内容管理器、结构化的事件日志、移动应用程序的服务器端和文件存储的后背存储。分布式数据库公司VoltDB的首席技术官Michael Stonebraker表示NoSQL数据库可提供良好的扩展性和灵活性,但他们也有自己的不足。由于不使用SQL,NoSQL数据库系统不具备高度结构化查询等特性。NoSQL其他的问题还包括不能提供ACID(原子性、一致性、隔离性和耐久性)的 *** 作。另外不同的NoSQL数据库都有自己的查询语言,这使得很难规范应用程序接口。Stonebraker表示数据库系统的滞后通常可归结于多项因素。诸如以恢复日志为目的的数据库系统维持的缓冲区池,以及管理锁定和锁定的数据字段。在VoltDB的测试中发现以上这些行为消耗系统96%的资源。RDBMSes处理的数据大约只有16%“虽然关系数据库感觉到了新技术到来的压力,但RDBMS仍然在企业计算中占有一些之地。目前RDBMS的市场约350亿美元。其中包括账户的软件许可、服务、技术支持以及维护”,Forrester的分析师Noel Yuhanna说道。Forrester预计,在企业中的业务数据将有25%是结构化数据,其中至少有65%在使用RDBMS或其他传统关系数据库,而RDBMS在交易数据中,RDBMSes至少有16%的份额。企业将有75%的业务数据与半结构化文件(如XML、电子邮件和EDI)和非结构化数据(如文档、、音频和视频)相结合。Yuhanna表示,大约有5%的数据驻留在关系数据库之中,其他的都分布在非关系数据库和文件格式之中。此外,列式数据恐怕将成为数据库领域发生变化的过度候选产品,他们或将使关系数据库产品更简单。传统的关系型数据厂商比如IBM、微软和Oracle在其RDBMS领域肯定是有新的计划的,他们也不会选择公开自己的计划。Bloor表示,没有人会注意到RDBMS可能会死去。
技术面临的挑战。
传统的数据库都是单个服务器提供的,一台服务器就能提满足存储和处理的需求。可靠的方案用的机器都是企业级的服务器,如IBM的服务器。对可靠性敏感的都是用企业级的存储方案,如EMC的产品。通过主从复制的方式提供热备。
以上就是关于hadoop与传统的关系型数据库(如oracle)相比,有什么优势及劣势全部的内容,包括:hadoop与传统的关系型数据库(如oracle)相比,有什么优势及劣势、sap ecc版本使用的传统数据库和hana数据库的区别、数据仓库较之传统的 *** 作型数据库的优势等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)