Mysql千万级别数据优化方案

目录

目录... 1

一、         目的与意义... 2

1)     说明... 2

二、         解决思路与根据(本测试表中数据在千万级别)... 2

1)     建立索引... 2

2)     数据体现(主键非索引,实际测试结果   其中fid建立索引)... 2

3)     MySQL分页原理... 2

4)     经过实际测试当对表所有列查询时... 2

三、         总结... 3

1)     获得分页数据... 3

2)     获得总页数:创建表 记录大数据表中总数  通过触发器来维护... 3

 

一、      目的与意义

1)        说明

在MySql单表中数据达到千万级别时数据的分页查询结果时间过长,对此进行优达到最优效果,也就是时间最短;(此统计利用的jdbc连接,其中fid为该表的主键;)

二、      解决思路与根据(本测试表中数据在千万级别)

1)        建立索引

优点:当表中有大量记录时,若要对表进行查询,第一种搜索信息方式是全表搜索,是将所有记录一一取出,和查询条件进行一一对比,然后返回满足条件的记录,这样做会消耗大量数据库系统时间,并造成大量磁盘I/O操作;第二种就是在表中建立索引,然后在索引中找到符合查询条件的索引值,最后通过保存在索引中的ROWID(相当于页码)快速找到表中对应的记录。

缺点:当对表中的数据进行增加、删除和修改的时候,索引也要动态的维护,降低了数据的维护速度。

2)        数据体现(主键非索引,实际测试结果   其中fid建立索引)

未创建索引:SELECT fid from t_history_data  LIMIT 8000000,10  结果:13.396s

创建索引:SELECT fid fromt_history_data  LIMIT 8000000,10  结果:2.896s

select * from t_history_datawhere fid in ( 任意十条数据的id )  结果:0.141s

首先通过分页得到分页的数据的ID,将ID拼接成字符串利用SQL语句

select * from table where ID in (ID字符串)此语句受数据量大小的影响比较小(如上测试);

3)        MySQL分页原理

MySQL的limit工作原理就是先读取n条记录,然后抛弃前n条,读m条想要的,所以n越大,性能会越差。 
优化前SQL: SELECT * FROM v_history_data  LIMIT 5000000, 10  10.961s
优化后SQL: SELECT* FROM v_history_data INNER JOIN (SELECT fid FROM t_history_data LIMIT 5000000,10) a USING (fid)          1.943s

分别在于,优化前的SQL需要更多I/O浪费,因为先读索引,再读数据,然后抛弃无需的行。而优化后的SQL(子查询那条)只读索引(Cover index)就可以了,然后通过member_id读取需要的列

4)        经过实际测试当对表所有列查询时

select * from table 会比 select (所有列名) from table 快些(以查询8000000处数据分页实验)。

select  *  from t_history_dataLIMIT 8000000,10      结果:10.735s

select (总共14列)from t_history_data LIMIT 8000000,10  结果:11.594s

 

三、      总结

1)        获得分页数据

创建索引:CREATE UNIQUE INDEX index_name ON t_history_data  (fid)

相应的查询语句:SELECT * FROM v_history_data INNER JOIN (SELECT fid FROM t_history_dataLIMIT 5000000, 10) a USING (fid)    (原理位于上方红色标记处,该方法查询速度将近提升10倍)

相对应的有条件查询根据需要建立索引

2)        获得总页数:创建表记录大数据表中总数  通过触发器来维护

创建表:  CREATETABLE `t_total` (
`Id` int(11) NOT NULL AUTO_INCREMENT,
`tableName` char(25) DEFAULT NULL,
`sum` int(11) DEFAULT NULL,
PRIMARY KEY (`Id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;

表初始化

写触发器

CREATE TRIGGER t1 AFTER INSERT
ON t_history_data FOR EACH ROW
BEGIN
DECLARE i int;
SELECT sum INTO i from t_total WHEREtablename = 't_history_data' ;
set i = i+1;
UPDATE t_total set sum=i where tablename ='t_history_data' ;
END

 

CREATE TRIGGER t2 AFTER DELETE
ON t_history_data FOR EACH ROW
BEGIN
DECLARE i int;
SELECT sum INTO i from t_total WHERE tablename = 't_history_data' ;
set i = i-1;
UPDATE t_total set sum=i where tablename = 't_history_data' ;
END