Hive理论

Hive理论,第1张

Hive理论

    Hive简介:
    Hive:由 Facebook 开源用于解决海量结构化日志的数据统计工具。
    Hive 是基于 Hadoop 的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类 SQL 查询功能。
    其本质是将hql转化成mapreduce在hadoop平台上执行

    Hive优缺点:
    优点:写法与sql类似,学习成本低;基于hadoop分布式平台,便于处理大数据
    缺点:成也分布式,败也分布式,其架构专为进行大数据分析,所以在处理小型数据量时,其效率反而不如oralce等传统关系型数据库

    Hive架构

    Hive和传统关系型数据库比较
    写法上二者类似,但hive实际是调用了mapreduce程序,hive上更注重对大量数据的计算,传统关系型数据库针对小型数据。

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/5715709.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-17
下一篇 2022-12-17

发表评论

登录后才能评论

评论列表(0条)

保存