Delta Lake 版本管理(13)

Delta Lake 版本管理(13),第1张

Delta Lake 版本管理(13) Delta Lake 版本管理

前面我们在学习Delta Lake 时间旅行的时候已经提到过这个版本管理了,但是我们没有深入探究,其实版本管理这个概念并不陌生,我们知道我们用的git 就是一个开源的分布式版本控制系统,还有就是我们的业务系统数据库也经常做按照时间的快照备份,其实这也是版本的一种。

Delta Lake 版本管理与时间旅行

Delta Lake 版本管理的原理也是Delta Lake 实现时间旅行的原因,Delta Lake 的时间旅行,其实就是版本切换,不同的是它不光提供了根据版本号切换的功能,也提供了根据时间切换的功能,这是因为我们的每一个版本版本号,还记录了这个版本的时间,所以Delta Lake 才能根据时间进行版本切换。

其实关于版本管理的实现原理前面我们或多或少的提到过,今天我们这里就总结一下,开始之前请你先阅读:

  1. Delta Lake 时间旅行
  2. Delta Lake DML 内部原理
  3. Delta Lake 事务日志

因为这三篇文章中涉及到了一些底层的剖析,你可以做个事先的了解,还有就

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/5654723.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-16
下一篇 2022-12-16

发表评论

登录后才能评论

评论列表(0条)

保存