理解 MVCC_随笔_内存溢出

理解 MVCC

MongoDB、MySQL、Oracle、PostgreSQL 等事务型数据库都有 mvcc 的概念。

MVCC：即多版本并发控制，主要是为了提高数据库的读写性能，让数据库在读写的时候不用去加锁。

mvcc 主要是处理读请求，这个读指的是快照读，而不是当前读，快照读就是普通的 select 查询。

而当前读，其实就是一种悲观锁，要靠加锁实现，比如我们执行 update 或 delete 的时候，你需要先把数据读出来，然后再进行修改 *** 作。

比如 select xx for update, 这种排他锁，还有 select xxx lock in share mode 共享锁，这种加锁的方式就是当前读，是需要用锁来保证数据的强一致性。

快照读是用 mvcc 实现的，他的目的是读写数据行的时候，不用去竞争锁，提升数据库的并发性能。

数据库的事务有 acid 的特性，原子性用 undo log 实现，持久性是 redo log，而隔离性则是通过加锁和 mvcc 实现。

mysql 事务有 4 中隔离级别: 读未提交，读已提交，可重复读，串行化。

一般常用的是读已提交，可重复读这两种。

读已提交，可重复读他们的快照读都是基于 mvcc 实现的。

mvcc 常见的几个概念：（图片来源百度）

（1）undo log

（2）版本链

id = 1 这条记录，经过了多次修改。

修改的历史版本都保存在了 undo log 里。

数据库里的每行记录实际上包含一个回滚指针 ( 这是一个隐藏字段 )，指向上一个版本记录，如果你想得到 name=”张三“ 的记录，需要通过版本链多次回滚才行。

（3）Readview 可见性

readview 其实就是一次快照（相当于python 的一个 class 对象），但是有个问题，当查询 select id=1 的时候，我应该读哪个版本呢，难道总是读最新吗？ readview 的作用就是让你知道，你要选择读哪个快照版本。

readview 有一些参数：

m_ids: 表示在生成 Readview 时当前系统中活跃（指还未commit 的事务）的读写事务的事务id 列表。

min_trx_id: 表示在生成 readview 时当前系统中活跃的读写事务最小的事务id，也就是 m_ids 中最小的值。

max_trx_id: 表示生成 readview 时系统中应该分配下一个事务的 id 值。

create_trx_id: 表示生成 readview 的事务的事务id。

也就是谁生成了这个 readview。

（我自己的事务 id。

相当于是自己记录自己。

）

可能不太直观，举个栗子如下：

eg：当前实例中 show proceeelist 查看活跃的事务列表是 m_ids = [2，3，4, 5] ，那么 min_trx_id=2，max_trx_id=6。

readview 视图如何判断版本链中的哪个版本可用呢？他有4 种判断逻辑

【1】trx_id == create_trx_id：可以访问这个版本; # trx_id 指的就是如下图中的每条记录的事务 ID。

trx_id == create_trx_id 意味着，这条记录是我自己本身（当前 session）生成的事务（readview），我读取我自己创建的这条记录，当然是可读的。

别人不可读是为了阻塞，我自己不可能阻塞我自己，没有意义。

【2】trx_id < min_trx_id：可以访问这个版本。

说明，我这个 trx_id 就不是一个活跃的 id ，他已经commit 了。

【3】trx_id > max_trx_id: 不可以访问这个版本。

因为该 readview 还没有生成。

【4】min_trx_id <= trx_id <= max_trx_id : 如果 trx_id 在 m_ids 中，那么是不可以访问这个版本的，在 m_ids 列表里说明当前事务是活跃事务。

MVCC 是针对 RC 和 RR 隔离级别的：

RC 和 RR 级别本质的区别是他俩生成 readview 的时机不同：

【1】RC 中以每个 select 的查询为单位（update, delete 的查询也算），每次 select 都会生成一个新的 readview，如果一个事务执行的过程中执行了多次 select，那么事务执行的过程中就要生成多个 readview 。

本质是一个事务生成了多了 readview 。

RC 有不可重复读的问题。

【2】RR 生成 readview 是以事务为单位的。

比如一个事务有三个 select 语句，但是只会生成一个 readview，后面两个 select 使用的 readview 和第一个一样，他不会再继续生成 readview，所以在可重复读级别下， readview 是以事务为级别的，一个事务只会生成一个 readview。

RR 级别就是用这个方法解决了不可重复读的问题。

Eg: 我现在开启了一个事务，包含了两个 select 动作，在执行第一个 select 的时候生成了这个 readview，第一个 select 查询到的是 name=“张三”，那么就算另一个 session 的 update 事务 commit 了，我这个事务的第二个 select 查询用到的依然是第一个 select 的 readview name = “张三”，第一次生成的 readview 是什么样，之后的这个 readview 就是什么样，直到我这个事务执行完毕。

RR 虽然解决了不可重复的问题，但还是存在幻读的问题，所以要加锁（间隙锁 + next key lock ）解决幻读的问题。

幻读只是在 RR 级别才会出现的。

我们知道快照读是通过 mvcc 实现的，当前读都是通过加锁实现的：快照读是如何解决幻读的问题呢？

RR 级别因为事务开始的时候只会生成一分 readview，那么外界再怎么对这个数据进行增加，都对我这个readview 视图没有影响，我读的还是我第一次生成的视图，外部的数据再怎么更新，新增，对于我这个视图都没有影响，这种方式解决了幻读的问题。

当前读是通过间隙锁 + next key lock 实现，间隙锁是锁住了一段范围。

RR 级别默认开启了间隙锁。

欢迎分享，转载请注明来源：内存溢出

原文地址: https://outofmemory.cn/zaji/586716.html

理解 MVCC

发表评论

评论列表（0条）