由于业务需求,需要从几千万条数据中根据某些规则,删除掉一些数据,所以必须采用多线程处理。

多线程,每次处理一万条数据,符合某种规则的话,就需要批量删除其中的数据。

测试的时候,就出现了 Lock wait timeout exceeded; try restarting transaction 死锁的问题。经过分析发现

由于删除的表中数据量有几百万条,而且有索引,还是多线程批量删除,通过where条件delete时比较耗时,导致超时错误,由于MySQL默认的超时时间时50s

SHOW GLOBAL VARIABLES LIKE 'innodb_lock_wait_timeout';

 增加超时时间

SET GLOBAL innodb_lock_wait_timeout=300;

  检查innodb_rollback_on_timeout是否开启

show VARIABLES like 'innodb_rollback_on_timeout';

SET innodb_rollback_on_timeout=1; (1=OFF/0=ON)

MySQL的官网对这个参数的解释,大概就是说在MySQL 5.6&5.7中默认值为OFF,当InnoDB默认情况下仅回滚事务超时的最后一条语句。如果innodb_rollback_on_timeout值为ON,则事务超时后将导致InnoDB中止并回滚整个事务。到这儿问题大概就清晰了,因为这个参数,所以这个事务只回滚了最后出现死锁的那条SQL,将这个值改成ON,再测试发现一切正常。

还有一个需要重点注意的问题,就是需要减少每次删除数据的粒度

由于我每次处理的数据是一万条,导致时间过长,而且又是多线程,所以这种情况很容易导致表死锁的现象。

因此,减少每个线程删除数据的数量,比如1000条,这样就会避免表死锁。

每天学习一点点,你就进步一点点。