mysql undo表空间详解 mysql中undo和redo

转载

footballboy 2023-11-14 07:15:35

文章标签 mysql undo表空间详解数据库运维数据结构与算法重做日志 文章分类 MySQL 数据库

mysql通过锁机制来实现事务的隔离性，用redo log实现事务的原子性和持久性，用undo log实现事务的一致性。undo并不是redo的逆过程，redo和undo都可以看做一种恢复过程，redo恢复事务修改的页操作，redo记录的是物理日志，记录的是页的物理修改操作，redo log基本上都是顺序写的，在数据库运行时不需要对redo log的文件进行读取操作。undo回滚行记录到某个版本，undo记录的是逻辑日志，根据每行记录进行记录，undo log是需要进行随机读取的。

redo log是innodb存储引擎产生的，二进制日志则是mysql数据库层产生的，redo log在事务进行中不断的被写入redo log，这导致日志并不是随着事务的提交顺序进行写入的，而二进制日志只在事务提交后进行一次写入日志。

redo

redo日志由两部分构成：redo log buffer、redo log file。innodb是支持事务的存储引擎，在事务提交时，必须先将该事务的所有日志写入到redo日志文件中，待事务的commit操作完成才算整个事务操作完成。在每次将redo log buffer写入redo log file后，都需要调用一次fsync操作，因为重做日志缓冲只是把内容先写入操作系统的缓冲系统中，并没有确保直接写入到磁盘上，所以必须进行一次fsync操作。因此，磁盘的性能在一定程度上也决定了事务提交的性能。

但是，关于fsync这个操作用户是可以干预的，因为每次提交事务都执行一次fsync，确实影响数据库性能。通过innodb_flush_log_at_trx_commit来控制redo log刷新到磁盘的策略。该参数的默认值为0，表示每次提交事务时都执行一次fsync操作。0则表示事务提交时不进行写入重做日志，这个写入操作由master thread进程来完成，master thread每一秒会进行一次重做日志文件的fsync操作。2则表示事务提交时将重做日志写入重做日志文件，但仅写入文件系统的缓存中，并不进行fsync操作。用户可以通过设置0或者2啦提高事务提交的性能，也可以设置1来要求确保redo log是写入文件中的，总之三种方法各有利弊。redo log buffer将内存中的log block刷新到磁盘是有一定的规则的：事务提交时(前面已经提到)、当log buffer中有一半的内存空间被使用时、log checkpoint时。

innodb存储引擎中，redo log以512字节进行存储，这意味着重做日志是以块的方式保存的，如果一个页中的重做日志大于512字节，则需要分隔到多个块中进行存储。重做日志块由三部分构成：日志块头(12字节)、日志块尾(8字节)、日志本身。redo log buffer是由log block(512字节)组成的。redo log group其中包含多个重做日志文件，可以有多个log group，log group只是一个逻辑概念，并没有一个实际存储的物理文件来表示log group的信息。在log group中的每个重做日志文件大小都是相同的，在innodb版本1.2之前，重做日志文件的总大小要小于4G，1.2版本之后总大小提高到512G。重做日志文件中存储的就是在之前log buffer中保存的log block，因此其也是根据块的方式进行物理存储管理的，大小也是512字节。log block会被追加写入到redo log file的最后面，当一个redo log file被写满时，会接着写入下一个rdo log file，其使用方式是轮转的。redo log file除了保存log buffer刷新到磁盘的信息外，还保存了一些其他信息，每个redo log file的前2KB不保存log block信息，这2KB会保存log file header信息和一些checkpoint信息。

innodb引擎的存储管理是基于页的，因此其重做日志格式也是基于页的。在重做日志中有个LSN比较重要，它的全称是log sequence number，其代表的是日志序列号。LSN在存储引擎中单调递增，它表示重做日志写入的总量(单位为字节)、checkpoint的位置、页的版本。在每个页中有一个值记录了该页的LSN，在页中LSN表示该页最后刷新时LSN的大小，以为重做日志记录的是每个夜的日志，因此页中的LSN用来判断页是否需要进行恢复操作。假如：重做日志中的LSN小于页中的LSN则表示不需要重做，如果重做日志中的LSN大于页中的LSN，则表示需要将重做日志恢复到页中。

innodb存储引擎在启动时不管上次数据库是否正常关闭，都会尝试进行恢复操作，因为重做日志记录的是物理日志，因此恢复起来比逻辑日志要快，由于checkpoint记录的是已经刷新到磁盘页上的LSN，因此在恢复过程中仅需要恢复checkpoint开始的日志。

undo

undo就是对事务进行回滚操作的，innodb引擎在对数据库进行修改时，不但会产生redo也会产生一定量的undo。例如用户执行rollback时就会利用undo信息进行回滚。redo有redo log，undo则存放在数据库内部的一个特殊段中，称为undo段，undo段位于共享表空间内，undo是逻辑日志，因此只是将数据库逻辑的恢复到原来的样子，所有的修改都被逻辑的取消，但是数据结构和页本身在回滚之后可能不相同。因此，不能将一个页回滚到事务开始的样子，因为同一时刻可能还有其他事务在访问该页。

当innodb引擎进行回滚时，实际上做的是与之前相反的操作，例如对insert执行delete操作，undo除了回滚功能外，还有另外一个作用是MVCC，innodb中的MVCC是通过undo实现的。当用户读取一行记录，该记录被其他事务占用时，可以通过undo信息读取之前的行版本信息。不过要注意，undo会产生redo log。

innodb对undo的管理采用段的方式，innodb有rollback segment，每个rollback segment记录了1024个undo log segment，在每个undo log segment中申请undo页。在innodb1.1之后支持128个rollback segment。

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。