Hive简介:
Hive:由 Facebook 开源用于解决海量结构化日志的数据统计工具。
Hive 是基于 Hadoop 的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类 SQL 查询功能。
其本质是将hql转化成mapreduce在hadoop平台上执行
Hive优缺点:
优点:写法与sql类似,学习成本低;基于hadoop分布式平台,便于处理大数据
缺点:成也分布式,败也分布式,其架构专为进行大数据分析,所以在处理小型数据量时,其效率反而不如oralce等传统关系型数据库
Hive架构
Hive和传统关系型数据库比较
写法上二者类似,但hive实际是调用了mapreduce程序,hive上更注重对大量数据的计算,传统关系型数据库针对小型数据。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)