官网:缓冲池是主内存中的一个区域,用于在 InnoDB访问表和索引数据时对其进行缓存。缓冲池允许直接从内存中访问经常使用的数据,从而加快处理速度。在专用服务器上,多达 80% 的物理内存通常分配给缓冲池。

缓冲池是InnoDB内存结构中比较重要的结构,主要目的就是解决CPU速度与磁盘速度之间的鸿沟,从而提高整体的性能。

缓冲池其实就是一块内存区域,在数据库进行数据读取时,会将从磁盘读取到的数据页缓存到缓冲池中,下一次再读取到相同的页时,首先就先判断缓冲池中是否有命中的缓存页,如果有就直接读取,没有再去磁盘读取。所以缓存页的命中率也是优化的一个手段。

当数据发生改变时,首先会修改缓存池中的页,然后通过Master Thread线程以一定的频率刷新到磁盘中,需要注意的是,并不是修改了一个页就会刷新到磁盘中,这里需要通过checkpoint机制来刷新到磁盘。

根据上面的介绍,不要误以为缓冲池中只会缓存 数据页 和 索引页,其实还有其他各种页:

具体来看,缓冲池的缓存的页类型为:数据页、索引页、undo页、插入缓冲页(insert buffer)、自适应哈希索引、锁信息、数据字典信息等,而数据页 和 索引页占用较大部分的区域。

mysql一个缓存页的大小是多少 mysql 缓冲区_mysql一个缓存页的大小是多少

为了提高InnoBD引擎的并发能力,允许有多个缓冲池实例,目的减少数据库内资源竞争。设置方式以后统一介绍。

通过上面我们了解到了InnoDB引擎缓冲池的作用以及缓存的数据页类型,但是缓冲池本质也是内存区域,资源是有限的,那么它是如果对其进行管理的呢?

1、LRU列表、Free列表、Flush列表

LRU列表

通常来说缓冲池是通过LRU算法(近期最少使用算法来进行管理的,但是InnoBD引擎对其进行改造,新增了MidPoint位置,所下图所示,5/8的比例为新页,3/8为旧页。

                                  

mysql一个缓存页的大小是多少 mysql 缓冲区_大数据_02

通俗的描述:当从磁盘中读取到新页时,并不是放到new的首部,而是放入到LRU列表的MidPoint位置。当LRU列表不能再存放更多的页时,会首先释放LRU尾部的页。

那为什么要加入MidPoint位置呢?

其实是这样的,如果直接将新的页加入到首部,再LRU列表内存不足的情况下,必然会导致旧页的刷出,但是可能新的页占用很大内存而且也不是热点数据,为了防止这种情况,会将新的页放到Midpoint位置,然后通过配置:innodb_old_blocks_time 来指定页被读取到MidPoint位置后,多久会被加入到LRU列表的热端。

Free列表

LRU列表用来管理已经读取到的页,但是数据库刚启动时,是没有LRU列表数据的,也就是说这是是没有页的。而这时页都被放入Free列表中。当LRU列表需要分页时,首先从Free列表中查询是否有可用的页,如果有则直接将该页再Free列表中删除,加入到LRU列表中。LRU算法中,淘汰旧的页,将该内存空间分配给新的页。

Flush列表

当LRU列表中页被修改后,就导致缓存的页数据和磁盘数据不一致,那这样的页被称为”脏页“。那这些脏页会被存如Flush列表中,需要注意的是,”脏页“即存在与LRU列表,也存在与Flush列表。

 LRU列表用来管理缓存池中页的可用性,Flush列表用于管理将页刷新到磁盘中,两这个互不影响。

2、CheckPoint机制

上面已经了解到,InnoDB引擎中数据操作是有限再内存中完成的,其目的为了提高引擎的性能。再对数据进行修改后,也是优先修改内存中的页,这样就导致了数据的不一致性,被称为”脏页“,那这样的页是需要被刷新到磁盘中的。如果没操作一次数据进行一次刷新动作,会非常影响性能,开销非常大,而且如果耍新过程中出现宕机等情况会造成数据丢失。

为了避免这种情况的发生,当前的事务性数据库系统都采用了Write Ahead Log策略:当事务提交后,先写入重做日志缓冲区(稍后按照一定频率刷新到磁盘的重做日志文件),再修改缓冲区中页。这样即使发生宕机情况,内存中的页没来得及刷新到磁盘,可以通过重写日志完成数据恢复。这也就是ACID中持久性的表现。