Spark综合学习笔记(十八)SparkSQL数据抽象

Spark综合学习笔记(十八)SparkSQL数据抽象,第1张

Spark综合学习笔记(十八)SparkSQL数据抽象 学习致谢

https://www.bilibili.com/video/BV1Xz4y1m7cv?p=53

引言

SparkCore的数据抽象:RDD
SparkStreaming的数据抽象:DStream,底层是RDD
SparkSQL的数据抽象:Dataframe和DataSet,底层是RDD

Dataframe是什么

Dataframe=RDD-泛型+Schema约束(指定了字段名和类型)+SQL *** 作+优化
Dataframe就是在RDD的基础之上做了进一步的封装,支持SQL *** 作!
Dataframe就是一个分布式表!

DataSet是什么

DataSet=Dataframe+泛型
DataSet = RDD + Schema约束(指定了字段名和类型)+SQL *** 作+优化
DataSet就是在RDD的基础之上做了进一步的封装,支持SQL *** 作!
DataSet就是一个分布式表!

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/5610792.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-15
下一篇 2022-12-15

发表评论

登录后才能评论

评论列表(0条)

保存