mongodb是一个文档型的分布式数据库,侧重点在于数据库,有索引等传统数据库的概念在里面,里面存储的一般是伪JSON。
hadoop目前不单单指某一个产品,指的是一个生态,主要侧重点在于数据分析。里面组件一般有(都是分布式产品):HDFS、MapRedcue、Tez、spark、Yarn、Hbase、Cassandra等,可以访问http://hadoop.apache.org/ 其中Hbase、Cassandra也可以为一个数据库。
可以做的包括:ETL、数据分析、流式实时计算、机器学习、在线查询等。
hadoop的强处在于分布式存储及运算,mongodb则是一个数据库。它们都能用map-reduce,hadoop是多台机器协同运算,mongodb则仅是单机多核运算。
python学习网,大量的免费MongoDB入门教程,欢迎在线学习!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)