Hive和Pig的区别_软件运维

Hive的替代工具中最有名的就是Pig了（http://pig.apache.org) 。Pig是由Yahoo开发完成的，而同时期Fackbook正在开发Hive。因此Pig现在同样也是一个和Hadoop紧密联系的顶级Apache项目，它同样也是一个大数据分析的产品。

Pig hadoop 和 Hive hadoop 有一个相似的目标——它们是减轻编写复杂 java MapReduce 程序的工具。他们可以用 Pig Latin 或 Hive SQL 语言来构建 MapReduce 程序，从而减少了整体开发和测试时间。但是，他们两者有啥区别，首先看下pig的设计原理。

Pig 是一个在 Hadoop 集群上运行的脚本平台，旨在处理和分析大型数据集。Pig常用一种叫做Pig Latin 的语言，类似SQL，来分析查询数据。虽然它与SQL类似，但是语法上有着显著不同。

Pig 的突出之处在于它可以处理各种类型的数据，包括结构化、半结构化和非结构化数据，Pig 都能处理。

Apache Pig 旨在分析大型数据集，而无需使用耗时且复杂的 Java 代码，基本上10行代码需要java200行代码来完成，Pig 设计的初衷就是为非程序员开发的。

Hive 和 Pig 都是出色的数据分析工具，都有自己的优缺点，但它们确实具有不同的功能和特性。

《Pig编程指南》百度网盘pdf最新全集下载:

链接: https://pan.baidu.com/s/1FgqJ5zs9lsbW1SB8jOZH1g

?pwd=ur7s 提取码: ur7s

简介：不仅为初学者讲解ApachePig的基础知识，同时也向有一定使用经验的高级用户介绍更加综合全面的Pig重要特性，如PigLatin脚本语言、控制台shell交互命令以及用于对Pig进行拓展的用户自定义函数(UDF)等。

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/yw/7926636.html

Hive和Pig的区别

发表评论

评论列表（0条）