文章目录

  • 一、Innodb MVCC版本控制
  • 1、什么是MVCC版本控制?
  • 2、Innodb MVCC 核心
  • 3、事物版本号、隐藏列、undo log日志的协调工作机制
  • 4、Read view
  • 5、举例讲解MVCC流程
  • 6、InnoDB 引擎不同隔离级别MVCC的区别
  • 7、MVCC是否解决了幻读的问题



一、Innodb MVCC版本控制

1、什么是MVCC版本控制?

MVCC是在并发访问那数据库时,通过对数据版本的控制,避免使用加锁从而造成读取阻塞的情况,比如某个事物进行写操作之后,依然可以读取旧版本的数据,这就是MVCC。

2、Innodb MVCC 核心

  • 事务版本号 :

每次开启事务都会有一个唯一id,该id是递增的,可以从id的大小来观察事物开启的顺序。

  • 表的隐藏列:

DB_TRX_ID

记录操作该数据事务的事务ID;

DB_ROLL_PTR

指向上一个版本数据在undo log 里的位置指针;

DB_ROW_ID

隐藏ID ,当创建表没有合适的索引作为聚集索引时,会用该隐藏ID创建聚集索引;

  • undo log :

回滚日志,记录了事物修改之前的数据信息,当事物回滚时候,通过undo log日志回滚数据。

用途:

1、保证事物rollback时的原子性和一致性,当事物回滚时候,从undo log日志进行恢复。

2、在MVCC快照读取时,通过读取undo log日志读取历史数据,以此避免了使用锁从而造成阻塞的问题。

  • read view :

trx_ids: 当前系统活跃(未提交)事务版本号集合。

low_limit_id: 创建当前read view 时“当前系统最大事务版本号+1”所以若数据的事物id大于该值,一定在当前事物开启之后提交的。

up_limit_id: 创建当前read view 时“系统正处于活跃事务最小版本号”,所以若数据的事物id小于该值,一定在当前事物开启之前就已经提交了。

creator_trx_id: 创建当前read view的事务版本号;

3、事物版本号、隐藏列、undo log日志的协调工作机制

假设 user表数据如下所示:

MySQL版本指令 mysql 版本控制_mysql

开启事物,修改数据

update user set name = '哈哈哈' where id = 1;
  • 首先获得一个事物id编号DB_TRX_ID为100
  • 修改user表之前的数据复制到undo log日志中。
  • 修改user表的数据name为哈哈哈
  • 将此时数据的版本号改成当前事务版本号100,把DB_ROLL_PTR作为指向undo log日志的指针,以此找到修改前的数据。

最后大致如下所示会形成一个版本链:

MySQL版本指令 mysql 版本控制_数据_02

4、Read view

在innodb引擎中,每次开启事物都会获得一个read view,内部主要包含了此时活跃事物的信息,以及活跃与非活跃临界值的事物ID,如下所示:

  • trx_ids: 系统中活跃事物版本号的集合。
  • low_limit_id : 创建当前的read view时 当前事物版本号的最大值+1。
  • up_limit_id: 创建当前的read view时,活跃事物版本号的最小值。
  • creator_trx_id: 创建当前read view的事务版本号。

在读取时,有一下几种情况:

数据的事物id 简称 dataId

1、dataId > low_limit_id,则无法显示

如果事物id比创建read view内的最大事物版本号+1还要大,说明该数据在当前事物开启之后修改的,则无法访问,需要去undo log日志中寻找符合的数据。

2、dataId < up_limit_id,则显示

如果事物id比创建read view内的最小活跃事物还要小,说明该数据在开启当前事物之前就已经提交了,可以直接读取。

3、up_limit_id <= dataId <= low_limit_id,则观察 trx_ids 集合。

  • 查看是否存在该数据的事物版本号,若存在说明操作该条数据的事物还未提交,则无法显示。
  • 若不存在,说明操作该数据的事物已经提交了或就是当前事物操作的,则可以显示。

以上所有无法显示的情况,都会通过指针去undo log日志中找到前一次的数据,再次通过上述判断是否可以显示,以此递归直到返回数据或返回空。

5、举例讲解MVCC流程

MySQL版本指令 mysql 版本控制_数据_03

如上所示:

开启事务A:执行SQL,获得事物id为100

update user set name ='张三' where id = 3;

开启事务B:执行SQL,获得事物id为101

select * from user where id = 3;

事物B会生成read view。

  • trx_ids: [100]
  • low_limit_id : 102
  • up_limit_id: 100
  • creator_trx_id: 101

然后拿着id为3的数据去与read view进行条件判断:

1、首先判断100是否比low_limit_id大,若成立不显示,反之继续判断。
2、判断100是否比up_limit_id小,若小可以显示,反之继续判断。
3、判断100是否在trx_ids集合内,若在集合内,不显示;反之说明事物已经提交,则显示

判断之后发现,结果为不显示,则去undo log里面获取修改前的数据,再次判断,若满足显示则返回,若不满足则继续找寻前一条数据,继续判断。

这儿最终返回的是事物id为99的数据。

6、InnoDB 引擎不同隔离级别MVCC的区别

RR级别: 在事物开启后, 只会在事务开启的一瞬间生成一个read view ,所以解决了RC级别不可重复读的问题。

RC级别: 在事物开启后,每一次查询数据都会生成一个read view,所以有可能出现读取数据不一致的情况。

7、MVCC是否解决了幻读的问题

首先严格意义上来说没有, MVCC利用版本链,undo log,Read View可以在快照读模式下解决幻读问题,并且不用加锁解决读写冲突问题,极大的增加了数据库的并发量。 但在当前读模式下仅仅依靠MVCC不能解决幻读问题,必须依赖next-key锁(行锁+gap锁)来解决,这是因为当前读必须获取最新数据。