最近发布到市场的版本频繁出现数据库表损坏的情况,具体的现象是select表提示表不存在,但是查看data文件,对应表的ibd和frm文件都在。

通过对多个故障的统计,找到几个频繁出现损坏的表,在分析过程中,发现这些数据表都使用了truncate清除数据,所以怀疑是truncate操作的问题。

设计如下过程来验证这个分析结果:

1、 创建存储过程如下,对一张表模拟频繁调用TRUNCATE

DROP PROCEDURE IF EXISTS prcTest5; CREATE PROCEDURE prcTest5(in ic int) BEGIN declare i int; set i=0; while(i<5) DO truncate table alarmtest5; insert into alarmtest5 select * from port limit ic; set i=i+1; END WHILE;

END;

2、 使用SOAP UI创建压力测试用例

发起的线程为5 测试时间间隔0.5s

3、 使用bat脚本周期taskkill mysqld进程并重新启动

@echo off :loop echo kill taskkill /f /im mysqld.exe echo RegMysqlServer call RegMysqlServer.bat call:sleep 20000 ::调用方法call:sleep [毫秒] (1秒=1000毫秒)

goto loop

:sleep set tmp="%temp%\tmp.vbs" echo wscript.sleep %1>%tmp%&%tmp%&del %tmp% goto :eof

4、 启动测试,持续5-10分钟,关闭测试,打开数据库,发现数据表损坏。

select * from alarmtest5;

提示表不存在,实际到data目录下看,frm和ibd文件都在。

5、 怀疑是多线程导致问题,将线程数降为1,运行5-10分钟后,依然出现数据库表损坏现象。 6、 将存储过程修改为使用DELETE语句,测试线程数5,没有出现数据库表损坏的情况。

DROP PROCEDURE IF EXISTS prcTest4; CREATE PROCEDURE prcTest4(in ic int) BEGIN declare i int; set i=0; while(i<5) DO delete from alarmtest4; insert into alarmtest4 select * from port limit ic; set i=i+1; END WHILE;

END; 7、查看MySQL官方文档,When a table is truncated, it is dropped and re-created in a new .ibd file,结合自测的情况,怀疑是我们每张表使用一个ibd文件,TRUNCATE表是重建ibd文件过程中mysql进程中断,导致ibd文件损坏。

7、 重新创建一个数据库,将innodb_file_per_table = 1参数去掉,所有表共享一个ibd文件。 重复上面的测试,运行15分钟没有出现数据库表损坏的情况。

分析结论

innodb_file_per_table = 1,使用TRUNCATE会重新创建ibd文件,如果这个过程中mysqld进程意外中断,有很大概率出现数据库表损坏的现象。