Pig hadoop 和 Hive hadoop 有一个相似的目标——它们是减轻编写复杂 java MapReduce 程序的工具。他们可以用 Pig Latin 或 Hive SQL 语言来构建 MapReduce 程序,从而减少了整体开发和测试时间。 但是,他们两者有啥区别,首先看下pig的设计原理。
Pig 是一个在 Hadoop 集群上运行的脚本平台,旨在处理和分析大型数据集。Pig常用一种叫做Pig Latin 的语言,类似SQL,来分析查询数据。虽然它与SQL类似,但是语法上有着显著不同。
Pig 的突出之处在于它可以处理各种类型的数据,包括结构化、半结构化和非结构化数据,Pig 都能处理。
Apache Pig 旨在分析大型数据集,而无需使用耗时且复杂的 Java 代码,基本上10行代码需要java200行代码来完成,Pig 设计的初衷就是为非程序员开发的。
Hive 和 Pig 都是出色的数据分析工具,都有自己的优缺点,但它们确实具有不同的功能和特性。
《Pig编程指南》百度网盘pdf最新全集下载:
链接: https://pan.baidu.com/s/1FgqJ5zs9lsbW1SB8jOZH1g
?pwd=ur7s 提取码: ur7s简介:不仅为初学者讲解ApachePig的基础知识,同时也向有一定使用经验的高级用户介绍更加综合全面的Pig重要特性,如PigLatin脚本语言、控制台shell交互命令以及用于对Pig进行拓展的用户自定义函数(UDF)等。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)