Charlie's Blog

09_高速缓冲存储器（Cache）

Charlie

2023-01-28 17:03 2023-01-28 17:03 创建 2024-07-05 12:55:04 2024-07-05 12:55:04 更新

2022Fall_计算机组织与结构

2022Fall_计算机组织与结构课程

1.Cache的基本思路

Cache存放主存的“副本”
解决内存墙

2.Cache的工作流程

2.1 是否命中判断

CPU通过位置对主存中的内容进行寻址，不关心存储在其中的内容
Cache通过标记（tags） 来标识其内容在主存中的对应位置

2.2 平均访问时间

hit的情况要远远多于miss的情况
不考虑数据回传时间

2.3 cache访存过程

3.Cache设计要素

3.1 容量

扩大cache容量带来的结果：

增大了命中率
增加了cache的开销和访问时间

3.2 映射策略

cache中的行数据:主存块数据+tag
tag!=address，但可表示地址
tag是额外信息，tag位数越少，可表示cache行越多
1块!=内存中的1个字
访存：主存地址=块号+块内地址

3.2.1 直接映射

直接映射：把主存的每一块直接映射到cache的固定可用行
- 主存地址被分为三个字段：tag+cache行号+块内地址

cache行号 = 主存块号 mod cache行数
- 假设cache有行，主存有块。cache行号就是m位主存块号的低c位
- 对应关系为多对一
标记tag：地址中的高n位
- 同一块中的字地址高位都相同
优点
- 简单
- 快速映射
- 快速检查
缺点
- 抖动现象（Thrashing）：如果一个程序重复访问两个需要映射到同一行中且来自不同块的字，则这两个块不断地被交换到cache中， cache的命中率将会降低
适合大容量cache

3.2.2 全关联映射

关联映射：一个主存块可以装入cache的任意一行

标记tag:地址中最高m位
- tag为块号
- 每行标记直接记录改行来自哪个块
优点
- 避免抖动
缺点
- 复杂
- Cache搜索代价很大，即在检查的时候需要去访问cache的每一行
适合小容量cache

3.2.3 组关联映射

组关联映射：Cache分为若干组，每一组包含相同数量的行，每个主存块被映射到固定组的任意一行
假设s为cache组号，j为主存块号，S为组数，C为cache行数
- s= j mod S
- K路组关联映射：K=C/S

标记tag：地址最高位

3.2.4 三种映射方式比较

如果 𝐾 = 1，组关联映射等同于直接映射
如果 𝐾 = 𝐶，组关联映射等同于关联映射

关联度：

3.3 替换算法

一旦cache行被占用，当新的数据块装入cache中时，原先存放的数据块将会被替换掉
对于直接映射，每个数据块都只有唯一对应的行可以放置，没有选择的机会
替换算法通过硬件来实现

3.3.1 最近最少使用算法（LRU）

3.3.2 先进先出算法（FIFO）

3.3.3 最不经常使用算法（LFU）

3.3.4 随机替换算法（Random）

3.4 写策略

主存和cache的一致性
- 当cache中的某个数据块被替换时，需要考虑该数据块是否被修改
- 如果没被修改，则该数据块可以直接被替换掉
- 如果被修改，则在替换掉该数据块之前，必须将修改后的数据块写回到主存中对应位置

3.4.1 写回法（write back）

利用脏位(dirty bit)标记块是否被修改
优点
- 减少了访问主存的次数
缺点
- 部分主存数据可能不是最新的
  - I/O模块存取时可能无法获得最新的数据，为解决该问题会使得电路设计更加复杂且有可能带来性能瓶颈
- 多CPU时存在一致性问题

3.4.2 写直达（write through）

所有写操作都同时对cache和主存进行
优点
- 确保主存中的数据总是和cache中的数据一致，总是最新的
缺点
- 产生大量的主存访问，减慢写操作

3.5 行大小

行大小与cache命中率关系较复杂

3.6 Cache数目

标题: 09_高速缓冲存储器（Cache）
作者: Charlie
创建于 : 2023-01-28 17:03:00
更新于 : 2024-07-05 12:55:04
链接: https://chillcharlie357.github.io/posts/f00fff12/
版权声明: 本文章采用 CC BY-NC-SA 4.0 进行许可。

#2022Fall_计算机组织与结构课程

评论

此页目录

09_高速缓冲存储器（Cache）