后写日志

Write behind logging

基本思想

NVM的优点是可字节寻址、接近内存的高性能、顺序访问和随机访问差距不大。2016VLDB会议上《write behind logging》论文专门针对NVM设计了一种新的日志记录及恢复协议。主要思想是去掉了传统的append onlyredoundo日志,但仍然需要保留undo信息用来回滚未提交事务。事务提交前需要将该事务的所有修改强制刷盘,之后在log中记录commit标记,即这里所说的WBL。恢复过程中,通过分析commit标记将未提交的事务通过undo信息回滚掉。

而这篇论文在这个思想基础上又进行了一系列优化,下面介绍其机制。首先吐槽一下,这篇论文写得不是很清晰,理解起来比较困难。下面是深入理解后的机制,有不当地方还望指正。

机制

1、几个概念

DTT表中元组结构:事务ID+ID+更改位置

数据页中的元组结构

tuple id+trx id+begin commit时间戳+ end commit时间戳+上个版本号的tuple ID +data

Cp:该时间戳之后的提交的事务其数据不保证已经持久化到磁盘

2、一个事务操作过程

Begin;

执行操作,修改DRAM中的数据页

添加一个元祖到DTT表中,该元祖不包括插入后的值

Commit

1)记录下各个该事务的提交时间戳t1

2)扫描DTT表得到该事务相关元组

3)计算cpcd

4)将DTT表中元组持久化到磁盘,此时元组中加上了提交时间戳t1

5)将cpcd构成的WBL持久化到NVM

6)通知完成组提交,释放DTT

Rollback

    1)通过DTT中信息进行回滚。

3、一个事务操作过程图示

 后写日志论文解析_持久内存 日志

若在trx6 commit的时间点,系统故障,那么重启时从WBL日志文件中遍历得到最后一个WBL{4,(5,100},得到活跃的事务为4,大于5的事务都未提交。分析到这里恢复就完成,即可接受新事务。

但是磁盘上的脏数据怎么处理?会启用一个单独的回收线程,扫描表中记录,若记录的时间戳大于5,比如事务6的记录,他是不可见的,即将它回收掉;对于1,3,2,5都是可见的,不做处理,对于4,他在组提交未提交的事务链表里,也将它回收掉。

4、缺点及疑惑

1)文中没有详细说明记录是如何回收的,是后续事务访问到进行判断处理,还是说只是另外回收线程全部扫描进行判断。数据量如果特别大的话,扫描的代价岂不是很大?全部扫描完后,才将不用的WBL回收掉?

2)如果在高可用场景下,无法满足要求,仍然需要相应的WAL进行复制

3)后续的可见性判断比较复杂,文中没有详细说明

原文及参考

http://www.vldb.org/pvldb/vol10/p337-arulraj.pdf

http://mysql.taobao.org/monthly/2019/01/01/

https://github.com/cmu-db/peloton/wiki/Write-Ahead-Logging