PC_替换算法/cache回写策略

关注 cxxu

文章目录

文章目录
常见替换算法
随机算法RAND
先进先出算法FIFO
最近最少使用LRU
实现思路
LRU计数器变化(维护)规则:
命中时(caseA)
cache未被命中(caseB)
例🎈
最不经常使用算法LFU
Cache写策略
Cache 写命中( write hit)
全写法
回写法
小结
Cache 写不命中
写分配法
非写分配法
小结
分离的Cache结构

PC_替换算法/cache回写策略

原创

cxxu 2022-12-04 01:11:41 ©著作权

文章标签 java 开发语言主存数据数据块 文章分类 数据结构与算法人工智能

©著作权归作者所有：来自51CTO博客作者cxxu的原创作品，请联系作者获取转载授权，否则将追究法律责任

文章目录

常见替换算法

随机算法RAND
先进先出算法FIFO
最近最少使用LRU

实现思路

LRU计数器变化(维护)规则:

命中时(caseA)
cache未被命中(caseB)

例🎈

最不经常使用算法LFU

Cache写策略

Cache 写命中( write hit)

全写法

写缓冲

回写法
小结

Cache 写不命中

写分配法
非写分配法
小结

分离的Cache结构

常见替换算法

替换算法应用在

cache块-主存块替换
主存-外存的页面替换

随机算法RAND

随机地确定要被替换的cache块
实现简单,但是由于不符合程序局部性原理,可能使得命中率较低

先进先出算法FIFO

选择最早调入的cache块进行替换(根据停留在cache中的时间来判断)
也比较容易实现,同样不符合程序局部性原理

较早进入cache的主存块,及时它非常频繁地被使用,也会由于存在于cache中较长时间而导致被替换
可见,仅仅依赖于存留时间是不太理想的替换标准
如果能够知道某个块距离上一次访问时间间隔来综合考虑,那么会避免上述的弊端

这样,如果某个常用的块在主存中停留了较长时间,但是由于它被频繁访问,因此它的上一次被访问时间点 $PC_替换算法/cache回写策略_java$ 和当下要执行替换操作的时间点 $PC_替换算法/cache回写策略_数据_02$ 的间隔不会大,而且应该是比较小的

最近最少使用LRU

LRU:Least Recently Used
这个算法比较符合程序局部性原理
算法选择近期一段时间内较长世界未被访问的Cache行替换掉
平均命中率比FIFO高,且实现开销不是太大

实现思路

采用数值记录主存块的使用情况
LRU要求对每个cache行设置一个计数器

计数器充当一个淘汰权重,的角色,数值越大,被淘汰的优先级越高

$PC_替换算法/cache回写策略_数据_03$ :不妨把数值记为 $PC_替换算法/cache回写策略_数据_03$ ,表示第 $PC_替换算法/cache回写策略_数据块_05$ 个cache块的淘汰权重
$PC_替换算法/cache回写策略_开发语言_06$ :同时, $PC_替换算法/cache回写策略_数据_03$ 还反映该行最近的被访问情况,不妨用 $PC_替换算法/cache回写策略_主存_08$ 来描述访问的频繁程度

$PC_替换算法/cache回写策略_java_09$ 越大,表示访问第 $PC_替换算法/cache回写策略_开发语言_10$ 个cache块也经常被使用

根据计数值选择淘汰某个块,计数值的位数和cache组大小有关
2路组相联采用1位LRU位
4路组相联采用2位LRU位

LRU计数器变化(维护)规则:

cpu每次访存,都会影响计数器
即,需要对每一行cache行的计数器执行检查/更新操作
就算是没有被访问的cache,或者没有命中的访存操作也可能发生计数值的变化

命中时(caseA)

🎈SIK操作约定(命中时执行)

被命中的行的计数器清零 $PC_替换算法/cache回写策略_java_11$ (Set)

表示刚刚这些cache行被访问过了

比 $PC_替换算法/cache回写策略_java_12$ 小的计数器+1(Increment)
其余( $PC_替换算法/cache回写策略_主存_13$ 的)的计数器值保持不变Keep

这么约定可以计数器的最大值控制在一定的范围内,同时也不影响算法的有效性
理论上这种情况计数器应该是也要+1的(也没有错),但是数值太大不利于表示

假设说,cache(分组)的空间足够大,程序很小而且十分符合局部性原理.以至于大量的访问总是可以在分组内完成(命中)

再极端一点考虑,cpu执行某个简单循环,总是访问同一条指令,cache组内的其他R-1条已知没有再次被访问,如果不使用keep策略,那么会导致这R-1条的计数器爆增
而如果采用keep策略,就可以避免这种爆增情况
认真分析可以发现,+1操作能够使得所有计数器的上限值增大的情况,总是发生在未命中的时候🎄)

cache未被命中(caseB)

🎈FSI约定操作(未命中时执行):

填充置位更新操作(Fill+Set+Increment),简称为FSI操作

CB1:如果cache中还有空闲空间(空闲cache行)

那么将本次访问主存单元所在块(新数据块)调入cache的空闲行
FSI操作

CB2:如果cache已满

执行LRU淘汰操作,空出某(些)行
将新的数据块从主存调入这些新的空行
FSI操作

cache未被命中(另一种描述):

CB1:如果cache中还有空闲空间(空闲cache行)

那么将本次访问主存单元所在块(新数据块)调入cache的空闲行
CB2:如果cache已满

执行LRU淘汰操作,空出某(些)行
将新的数据块从主存调入这些新的空行

🎈CB1,CB2两类情况均要以FSI操作收尾

特点:

当(映射到同一个cache分组的)集中访问的(主存)存储区域(或者说区域容量)超过了cache组的大小
命中率可能会变得很低
这种现象称为抖动

例🎈

假定采用4路组相联,用5个不同的主存块{ $PC_替换算法/cache回写策略_数据块_14$ }映射到cache的同一个组

上述的5个块在主存中可能使任意的顺序,且未必是相邻的
将5个块简写为{1,2,3,4,5}
假设主存访问序列是1,2,3,4,1,2,5,1,2,…

cache分组的4个cache行\访问的主存块序列	1		2		3		4		1		2		5		1		2
0	0	1	1	1	2	1	3	1	0	1	1	1	2	1	0	1	1	1
1			0	2	1	2	2	2	3	2	0	2	1	2	2	2	0	2
2					0	3	1	3	2	3	3	3	0	5	1	5	2	5
3							0	4	1	4	2	4	3	4	3	4	3	4

每一大列

左分列表示该cache行的计数器值( $PC_替换算法/cache回写策略_数据_03$ )
右分列表示该cache行调入(持有)的主存块(块号 $PC_替换算法/cache回写策略_java_16$ )
本例中, $PC_替换算法/cache回写策略_数据块_17$

最不经常使用算法LFU

LFU:Least Frequently Used
和LRU类似
将一段时间内被访问次数最少的存储行换出
每一行cache行设置一个被访问次数计数器
新行建立后从0开始计数
每被访问一次,被访问的行计数器+1
在需要替换时比较各特定行的计数值,将计数值最小的

Cache写策略

因为Cache中的内容是主存块副本，当对Cache中的内容进行更新时，就需选用写操作策略使Cache内容和主存内容保持一致.
此时分两种情况(双向)

cache写入主存
主存调入(写入)cache

Cache 写命中( write hit)

全写法

全写法（也叫写直通法,write-through).
当CPU对Cache 写命中时，必须把数据同时写入Cache 和主存.

当某一块需要替换时(不命中)，不必把这一块写回主存，用新调入的块直接覆盖即可.

优点:

这种方法实现简单，能随时保持主存数据的正确性.

缺点

是增加了访存次数，降低了Cache的效率.

写缓冲

为减少全写法直接写入主存的时间损耗，在Cache和主存之间加一个写缓冲(Write Buffer )，
CPU同时写数据到Cache 和写缓冲中，写缓冲再将内容写入主存.
写缓冲是一个FIFO 队列，写缓冲可以解决速度不匹配的问题.

但若出现频繁写时，会使写缓冲饱和溢出.

回写法

回写法( write-back).
当CPU对 Cache 写命中时，只把数据写入Cache，而不立即写入主存，只有当此块被换出时才写回主存.这种方法减少了访存次数，但存在不一致的隐患.
为了减少写回主存的开销，每个Cache 行设置一个修改位（脏位).

若修改位为1，则说明对应Cache行中的块被修改过，替换时需要写回主存;
若修改位为0，则说明对应 Cache行中的块未被修改过，替换时无须写回主存.

小结

全写法和回写法都对应于Cache写命中（要被修改的单元在Cache中）时的情况.

Cache 写不命中

写分配法

写分配法 ( write-allocate).

加载主存中的块到Cache 中，然后更新这个Cache块.
它试图利用程序的空间局部性，但缺点是每次不命中都需要从主存中读取一块.

非写分配法

非写分配法( not-write-allocate)

只写入主存，不进行调块.

小结

非写分配法通常与全写法合用，写分配法通常和回写法合用.

分离的Cache结构

随着新技术的发展（如指令预取)，需要将指令Cache和数据Cache分开设计，这就有了分离的Cache结构.

统一Cache 的优点是设计和实现相对简单，但由于执行部件存取数据时，指令预取部件要从同–Cache读指令，会引发冲突.
采用分离Cache 结构可以解决这个问题

而且分离的指令和数据Cache还可以充分利用指令和数据的不同局部性来优化性能.

现代计算机的Cache 通常设立多级Cache，假定设3级Cache，按离CPU的远近可各自命名为Ll Cache、L2 Cache、L3 Cache，离CPU越远，访问速度越慢，容量越大.

指令Cache与数据Cache分离一般在L1级，此时通常为写分配法与回写法合用.

例如
L1 Cache对 L2 Cache使用全写法，
L2 Cache对主存使用回写法，

由于L2 Cache的存在，其访问速度大于主存，因此避免了因频繁写时造成的写缓冲饱和溢出.

赞
收藏
评论
分享
举报

上一篇：PC_高速缓冲存储器cache和局部性原理

下一篇：OS_虚拟内存@请求分页系统@驻留集@内存分配策略

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

cxxu

关注

分类列表 更多

职场话题

2024软考

华为认证

K8s

数据库

近期文章

文章目录

文章目录
常见替换算法
随机算法RAND
先进先出算法FIFO
最近最少使用LRU
实现思路
LRU计数器变化(维护)规则:
命中时(caseA)
cache未被命中(caseB)
例🎈
最不经常使用算法LFU
Cache写策略
Cache 写命中( write hit)
全写法
回写法
小结
Cache 写不命中
写分配法
非写分配法
小结
分离的Cache结构

举报文章

请选择举报类型

内容侵权涉嫌营销内容抄袭违法信息其他

具体原因

包含不真实信息涉及个人隐私

原文链接（必填）

补充说明

0/200

上传截图

格式支持JPEG/PNG/JPG，图片不超过1.9M

已经收到您得举报信息，我们会尽快审核

鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程厂商认证 IT技术 24年11月软考 PMP项目管理免费题库

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

51CTO博客

首页
关注
排行榜
精品课程
免费直播
软考题库

科目全、试题精、讲解专业，扫码免费刷

搜索历史清空

热门搜索

查看【】的结果
写文章
创作中心
登录注册