hadoop和mysql区别_随笔

hadoop和mysql严格的来说没有任何关系，区别为hadoop是一种分布式计算框架，用于处理大量的数据，而mysql是数据库用来存放数据的。

但是一般来说，配合hadoop的数据库不是mysql这类传统的关系型数据库，因为当数据量非常大的时候，这些数据库的处理速度会非常慢（就算做了集群也一样慢），取而代之的则是hbase这类非关系型数据库，在大量数据处理过程中，处理速度会比较稳定。

2. hadoop跟mysql的区别是什么？

举个简单的例子。mysql就是一个麻袋，里面装的是数据。而hadoop则是一种很强大的工具，它的作用就是去处理包括这些麻袋在内的大数据。

所以，实际上他俩是不存在直接关系的。

1、MySQL

MySQL是一个开源的关系型数据库管理系统，为甲骨文公司产品。支持多种存储引擎、集群、全文索引、支持多线程、充分利用CPU资源、支持多用户等其它许多非常专业的功能。

MySQL由于性能高、成本低、可靠性好已经成为最流行的开源数据库，并且被广泛应用在Web应用程序以及其它中小型项目上。从WordPress到Movable

Type都把MySQL作为默认的数据库。此外，自甲骨文收购MySQL以后，又将MySQL闭源的潜在风险，因此社区采用分支的方式避开这种风险，开发并运营着完全兼容MySQL的MariaDB数据库。

2、MongoDB

MongoDB是一款开源、面向文档并且也是当下人气最旺的Nosql数据库，它也是一款介于关系数据库和非关系数据库之间的产品。Mongo最大特点是它支持的查询语言非常强大，其语法有点类似于面向对象的查询语言，几乎可以实现类似关系数据库单表查询的绝大部分功能，而且还支持对数据建立索引。还具有高性能、易部署、易使用，存储数据非常方便等特点。

3、Hadoop

Hadoop是一个开源的、基于列存储模型的分布式数据库，它是Apache Hadoop项目的一部分，开发语言为Java。

Hadoop不同于一般的关系数据库，它是一个适合于非结构化数据存储的数据库。另一个不同的是Hadoop基于列的而不是基于行的模式。且具有高可靠性、高性能、可伸缩、并建立在关系模型基础上的分布式数据库。

4、Redis

Redis是一个开源、支持网络、基于内存、键值对存储数据库。开发者无需存储数字和字符串即可dump整个哈希值、列表、集合以及其它复杂的结果存储，此外，Redis还提供复制/同步和持久化等功能。

Redis是一个高性能的键值对数据库。Redis的出现，很大程度补偿了memcached这类key/value存储的不足，在部分场合可以对关系数据库起到很好的补充作用。

5、MariaDB

MariaDB数据库管理系统是MySQL的一个分支，完全兼容MySQL，包括API和命令行，使之能轻松成为MySQL的代替品。在存储引擎方面，使用XtraDB来代替MySQL的InnoDB。另外又添加了一些功能，以支持本地的非阻塞 *** 作和进度报告。这意味着，所有使用MySQL的连接器、库和应用程序也将会在MariaDB下工作。

不能。

不是一个概念。mysql是传统的关系型数据库。hdfs是nosql hadoop的存储方式。hdfs是分布式的自带高可用存储，文件格式跟mysql的存储引擎不一样。大数据离线存储，当然是hdfs更合适。通过Map/Reduce进行批处理递送到Apache Hadoop仍然是中枢环节。但随着要从“超思维速度“分析方面获取竞争优势的压力递增，因此Hadoop(分布式文件系统)自身经历重大的发展。

科技的发展允许实时查询，如Apache Drill, Cloudera Impala和Stinger Initiative正脱颖而出，新一代的资源管理Apache YARN 支持这些。为了支持这种日渐强调实时性 *** 作,我们正发布一个新MySQL Applier for Hadoop(用于Hadoop的MySQL Applier)组件。它能够把MySQL中变化的事务复制到Hadoop / Hive / HDFS。Applier 组件补充现有基于批处理Apache Sqoop的连接性。

欢迎分享，转载请注明来源：内存溢出

原文地址: https://outofmemory.cn/zaji/6140643.html

hadoop和mysql区别

发表评论

评论列表（0条）