hadoop和mysql严格的来说没有任何关系,区别为hadoop是一种分布式计算框架,用于处理大量的数据,而mysql是数据库用来存放数据的。
但是一般来说,配合hadoop的数据库不是mysql这类传统的关系型数据库,因为当数据量非常大的时候,这些数据库的处理速度会非常慢(就算做了集群也一样慢),取而代之的则是hbase这类非关系型数据库,在大量数据处理过程中,处理速度会比较稳定。
2. hadoop跟mysql的区别是什么?
举个简单的例子。mysql就是一个麻袋,里面装的是数据。而hadoop则是一种很强大的工具,它的作用就是去处理包括这些麻袋在内的大数据。
所以,实际上他俩是不存在直接关系的。
hadoop一般是应用于冷数据处理,对于实时数据,如果非要使用,可以变着方法使用。方法一:在hadoop上使用hbase数据库,以为hbase是不走Map/Reduce的,所以 *** 作在毫秒级。方法二:将业务数据用程序分成实时数据和冷数据,实时数据存于关系数据库,冷数据存到hadoop。比如:将最近一个月的数据存到关系数据库,用做实时响应业务处理。将一个月以前的数据存到hadoop,用作历史数据查询以及统计分析,数据挖掘等。欢迎分享,转载请注明来源:内存溢出
评论列表(0条)