页缓存(PageCache)和预读机制(readahead )
页缓存(PageCache)是操作系统(OS)对文件的缓存,用于加速对文件的读写。
page 是内存管理分配的基本单位, Page Cache 由多个 page 构成,page 在操作系统中通常为 4KB 大小,而 Page Cache 的大小则为 4KB 的整数倍。
一般来说,程序对文件进行顺序读写的速度几乎接近于内存的读写速度,主要原因就是由于OS使用PageCache机制和预读机制对读写访问操作进行了性能优化,将一部分的内存用作PageCache,大大减少磁盘 I/O 次数,加快了数据的访问。
对于数据的写入,OS会先写入至PageCache内,随后通过异步的方式由pdflush内核线程将PageCache内的数据刷盘至物理磁盘上。
对于数据的读取,由于操作系统为基于 Page Cache 的读缓存机制提供预读机制(readahead),如果一次读取文件时未命中PageCache,OS从物理磁盘上读取文件的同时,会顺序对其他相邻块的数据文件进行预读取,然后缓存到PageCache。
假设用户线程请求读取磁盘上文件 A 的 offset 为 0-3KB 范围内的数据,由于磁盘的基本读写单位为 page(4KB),于是操作系统至少会读 0-4KB 的内容,这恰好可以在一个 page 中装下,但是操作系统出于局部性原理,会选择将相邻磁盘块 offset [4KB,8KB)、[8KB,12KB) 以及 [12KB,16KB) 都加载到PageCache,于是额外在PageCache中申请了 3 个 page用于缓存