lecture13



Similar documents
《C语言基础入门》课程教学大纲

Template BR_Rec_2005.dot

I

说 明 为 了 反 映 教 运 行 的 基 本 状 态, 为 校 和 院 制 定 相 关 政 策 和 进 行 教 建 设 与 改 革 提 供 据 依 据, 校 从 程 资 源 ( 开 类 别 开 量 规 模 ) 教 师 结 构 程 考 核 等 维 度, 对 2015 年 春 季 期 教 运 行 基

 编号:

国债回购交易业务指引

<433A5C446F63756D656E E E67735C41646D696E F725CD7C0C3E65CC2DBCEC4CFB5CDB3CAB9D3C3D6B8C4CFA3A8BCF2BBAFA3A95CCAB9D3C3D6B8C4CF31302D31392E646F63>

修改版-操作手册.doc

何 秋 琳 张 立 春 视 觉 学 习 研 究 进 展 视 觉 注 意 视 觉 感 知

世华财讯模拟操作手册

正 规 培 训 达 规 定 标 准 学 时 数, 并 取 得 结 业 证 书 二 级 可 编 程 师 ( 具 备 以 下 条 件 之 一 者 ) (1) 连 续 从 事 本 职 业 工 作 13 年 以 上 (2) 取 得 本 职 业 三 级 职 业 资 格 证 书 后, 连 续 从 事 本 职 业

第 三 章 审 计 证 据 2

第2章 数据类型、常量与变量

<4D F736F F D20BFC9B1E0B3CCD0F2BFD8D6C6CFB5CDB3C9E8BCC6CAA6B9FABCD2D6B0D2B5B1EAD7BC2E646F63>

深圳市新亚电子制程股份有限公司

龚 亚 夫 在 重 新 思 考 基 础 教 育 英 语 教 学 的 理 念 一 文 中 援 引 的 观 点 认 为 当 跳 出 本 族 语 主 义 的 思 维 定 式 后 需 要 重 新 思 考 许 多 相 连 带 的 问 题 比 如 许 多 发 音 的 细 微 区 别 并 不 影 响 理 解 和

定 位 和 描 述 : 程 序 设 计 / 办 公 软 件 高 级 应 用 级 考 核 内 容 包 括 计 算 机 语 言 与 基 础 程 序 设 计 能 力, 要 求 参 试 者 掌 握 一 门 计 算 机 语 言, 可 选 类 别 有 高 级 语 言 程 序 设 计 类 数 据 库 编 程 类

·岗位设置管理流程



中 日 信 息 化 的 比 较 与 合 作 一 中 日 信 息 化 的 规 模 比 较

Microsoft Word - 第7章 图表反转形态.doc

第 六 章 债 券 股 票 价 值 评 估 1 考 点 一 : 债 券 价 值 的 影 响 因 素 2

教师上报成绩流程图

i 1) 系 统 运 作 前 设 定 *1. [2.1 网 页 主 机 名 称 设 定 ] -- 设 定 校 务 系 统 的 主 机 IP 地 址, 以 供 其 他 个 人 电 脑 连 接 及 使 用 该 系 统 *2. [2.3.1 输 入 / 修 改 学 校 资 料 ] -- 输 入 系 统 使

中 国 软 科 学 年 第 期!!!

¹ º ¹ º 农 业 流 动 人 口 是 指 户 口 性 质 为 农 业 户 口 在 流 入 地 城 市 工 作 生 活 居 住 一 个 月 及 以 上 的 流 动 人 口 非 农 流 动 人 口 是 指 户 口 性 质 为 非 农 户 口 在 流 入 地 城 市 工 作 生 活 居 住 一 个

采 取 行 动 的 机 会 90% 开 拓 成 功 的 道 路 2

随着执业中医师资格考试制度的不断完善,本着为我校中医学专业认证服务的目的,本文通过对我校中医类毕业生参加2012年和2013年的中医执业医师考试成绩及通过率、掌握率进行分析,并与全国的平均水平进行差异比较分析,以此了解我校执业中医师考试的现状,进而反映我校中医类课程总体教学水平,发现考核知识模块教学中存在的不足,反馈给相关学院和教学管理部门,以此提高教学和管理水平。

Microsoft Word - 第5章.doc

Microsoft Word - 第3章.doc


国际财务报告准则第13号——公允价值计量

<4D F736F F D D323630D6D0B9FAD3A6B6D4C6F8BAF2B1E4BBAFB5C4D5FEB2DFD3EBD0D0B6AF C4EAB6C8B1A8B8E6>

0 年 上 半 年 评 价 与 考 核 细 则 序 号 部 门 要 素 值 考 核 内 容 考 核 方 式 考 核 标 准 考 核 ( 扣 原 因 ) 考 评 得 3 安 全 生 产 目 30 无 同 等 责 任 以 上 道 路 交 通 亡 人 事 故 无 轻 伤 责 任 事 故 无 重 大 质 量


,,,,, :,, (.,, );, (, : ), (.., ;. &., ;.. &.., ;, ;, ),,,,,,, ( ) ( ),,,,.,,,,,, : ;, ;,.,,,,, (., : - ),,,, ( ),,,, (, : ),, :,

18 上 报 该 学 期 新 生 数 据 至 阳 光 平 台 第 一 学 期 第 四 周 至 第 六 周 19 督 促 学 习 中 心 提 交 新 增 专 业 申 请 第 一 学 期 第 四 周 至 第 八 周 20 编 制 全 国 网 络 统 考 十 二 月 批 次 考 前 模 拟 题 第 一 学

HSK( 一 级 ) 考 查 考 生 的 日 常 汉 语 应 用 能 力, 它 对 应 于 国 际 汉 语 能 力 标 准 一 级 欧 洲 语 言 共 同 参 考 框 架 (CEF) A1 级 通 过 HSK( 一 级 ) 的 考 生 可 以 理 解 并 使 用 一 些 非 常 简 单 的 汉 语

PowerPoint 演示文稿

精 勤 求 学 自 强 不 息 Born to win! 解 析 : 由 极 限 的 保 号 性 知 存 在 U ( a) 当 a 时 f ( ) f ( a) 故 f ( ) 在 点 a 不 取 极 值 f ( ) f ( a) f ( ) f ( a) lim lim a a a a ( a)

3 复 试 如 何 准 备 4 复 试 成 绩 计 算 5 复 试 比 例 6 复 试 类 型 7 怎 么 样 面 对 各 种 复 试 04 05

目 录 一 系 统 访 问... 1 二 门 户 首 页 申 报 用 户 审 核 用 户... 2 三 系 统 登 录 用 户 名 密 码 登 录 新 用 户 注 册 用 户 登 录 已 注 册 用

(Microsoft Word - NCRE\314\345\317\265\265\367\325\37313\324\27221\272\3051.doc)

珠江钢琴股东大会

IntelBook_cn.doc

上证指数

一 公 共 卫 生 硕 士 专 业 学 位 论 文 的 概 述 学 位 论 文 是 对 研 究 生 进 行 科 学 研 究 或 承 担 专 门 技 术 工 作 的 全 面 训 练, 是 培 养 研 究 生 创 新 能 力, 综 合 运 用 所 学 知 识 发 现 问 题, 分 析 问 题 和 解 决

<4D F736F F D20B2CEBFBC3232C6DAD1A7CFB0D3EBCBBCBFBCC4DAD2B3>

一、资质申请

投 资 者 可 在 基 金 管 理 人 指 定 的 销 售 机 构 申 购 和 赎 回 美 元 等 外 币 销 售 的 基 金 份 额, 具 体 详 见 基 金 管 理 人 相 关 公 告 2 在 三 申 购 与 赎 回 的 原 则 部 分 增 加 : 1 本 基 金 采 用 多 币 种 销 售,

Microsoft Word - 资料分析练习题09.doc

用节点法和网孔法进行电路分析

Microsoft PowerPoint - 7输入输出系统-2.ppt

Microsoft Word - GT21L16S2W简要说明V3.7.doc

电信系教学大纲的基本规范

2006年顺德区高中阶段学校招生录取分数线

目 录 一 激 活 账 号... 2 二 忘 记 密 码 后 如 何 找 回 密 码?... 3 三 如 何 管 理 学 校 信 息 及 球 队 学 生 教 师 等 信 息... 6 四 如 何 发 布 本 校 校 园 文 化? 五 如 何 向 教 师 发 送 通 知? 六

生产支援功能 使用说明书(IP-110 篇)

附 件 : 上 海 市 建 筑 施 工 企 业 施 工 现 场 项 目 管 理 机 构 关 键 岗 位 人 员 配 备 指 南 二 一 四 年 九 月 十 一 日 2

抗 日 战 争 研 究 年 第 期

第四章 投资性房地产

!!!!!!!!!!

登录、注册功能的测试用例设计.doc

上海证券交易所会议纪要

证券代码: 证券简称:长城电脑 公告编号:

2 熟 悉 Visual Basic 的 集 成 开 发 环 境 3 了 解 可 视 化 面 向 对 象 编 程 事 件 驱 动 交 互 式 开 发 等 基 本 概 念 4 了 解 Visual Basic 的 特 点 环 境 要 求 与 安 装 方 法 1 Visual Basic 开 发 应 用

金 不 少 于 800 万 元, 净 资 产 不 少 于 960 万 元 ; (3) 近 五 年 独 立 承 担 过 单 项 合 同 额 不 少 于 1000 万 元 的 智 能 化 工 程 ( 设 计 或 施 工 或 设 计 施 工 一 体 ) 不 少 于 2 项 ; (4) 近 三 年 每 年

( ) 信 号 与 系 统 Ⅰ 学 科 基 础 必 修 课 教 周 2016 年 06 月 13 日 (08:00-09:35) ( )

类 似 地, 又 可 定 义 变 下 限 的 定 积 分 : ( ). 与 ψ 统 称 为 变 限 积 分. f ( ) d f ( t) dt,, 注 在 变 限 积 分 (1) 与 () 中, 不 可 再 把 积 分 变 量 写 成 的 形 式 ( 例 如 ) 以 免 与 积 分 上 下 限 的

Microsoft Word - 文件汇编.doc

抗 日 战 争 研 究 % 年 第 期! # # % %


第二讲 数列

附件1:

云信Linux SSH认证代理用户手册

一 开 放 性 的 政 策 与 法 规 二 两 岸 共 同 的 文 化 传 承 三 两 岸 高 校 各 自 具 有 专 业 优 势 远 见 杂 志 年 月 日


自 服 务 按 钮 无 法 访 问 新 系 统 的 自 服 务 页 面 因 此 建 议 用 户 从 信 网 中 心 ( 主 页, 右 下 角 位 置 的 常 用 下 载, 或 校 园 网 用 户 自 服 务 ( 首 页

DLJ1.nps

<4D F736F F D DB9FAD5AEC6DABBF5B1A8B8E6CAAEC8FDA3BAB9FAD5AEC6DABBF5B5C4B6A8BCDBBBFAD6C6D3EBBBF9B2EEBDBBD2D7D1D0BEBF>

公 开 刊 物 须 有 国 内 统 一 刊 (CN), 发 表 文 章 的 刊 物 需 要 在 国 家 新 闻 出 版 广 电 总 局 ( 办 事 服 务 便 民 查 询 新 闻 出 版 机 构 查 询 ) 上 能 够 查 到 刊 凡 在 有 中 国 标 准 书 公 开

党建评估

<433A5C C6B73625C B746F705CB9FABCCAD6D0D2BDD2A9D7A8D2B5B8DFBCB6BCBCCAF5D6B0B3C6C6C0C9F3C9EAC7EBD6B8C4CFA3A CDA8D3C3B0E6A3A92E646F63>

<443A5C6D B5C30312EB9A4D7F7CEC4B5B55C30322EBACFCDACCEC4B5B55C C30342EC8CBC9E7CCFC5C31332ECFEEC4BFC5E0D1B55C E30385C322EB2D9D7F7CAD6B2E12E646F63>

3 月 30 日 在 中 国 证 券 报 上 海 证 券 报 证 券 时 报 证 券 日 报 和 上 海 证 券 交 易 所 网 站 上 发 出 召 开 本 次 股 东 大 会 公 告, 该 公 告 中 载 明 了 召 开 股 东 大 会 的 日 期 网 络 投 票 的 方 式 时 间 以 及 审

<4D F736F F D20D0A3B7A2A1B A1B BAC5B9D8D3DAD7E9D6AFBFAAD5B9C8ABD0A3BDCCD6B0B9A4B8DACEBBC6B8D3C3B1E4B6AFB9A4D7F7B5C4CDA8D6AA2E646F63>

第三章 作业

抗 战 时 期 国 民 政 府 的 银 行 监 理 体 制 探 析 % # % % % ) % % # # + #, ) +, % % % % % % % %

目 录 关 于 图 标... 3 登 陆 主 界 面... 3 工 单 管 理... 5 工 单 列 表... 5 搜 索 工 单... 5 工 单 详 情... 6 创 建 工 单... 9 设 备 管 理 巡 检 计 划 查 询 详 情 销 售 管

Cybozu Garoon 3 管理员手册

一 鹏 华 资 源 A(150100) 投 资 策 略 1 持 有 策 略 : 鹏 华 资 源 A 具 有 长 期 投 资 获 取 每 年 定 期 分 红 的 投 资 价 值, 适 合 稳 健 风 格 的 投 资 者 鹏 华 资 源 A 的 约 定 收 益 率 为 一 年 期 定 期 存 款 利 率

<4D F736F F D C4EAB9A4B3CCCBB6CABFCAFDD1A7D7A8D2B5BFCEBFBCCAD4B4F3B8D9D3EBD2AAC7F3>

第 一 部 分 MagiCAD for Revit 安 装 流 程

GB

2009—2010级本科课程教学大纲与课程简介格式

马 克 思 主 义 公 正 观 的 基 本 向 度 及 方 法 论 原 则!! # #

数 学 标 准 不 练 习 1.1 理 解 问 题 并 坚 持 解 决 这 些 问 题 1.2 以 抽 象 和 定 量 方 式 推 理 1.3 建 构 可 行 参 数 和 评 判 他 人 的 推 理 1.4 使 用 数 学 方 法 建 模 1.5 策 略 性 地 使 用 合 适 的 工 具 1.6

关于修订《沪市股票上网发行资金申购

2. 本 次 修 改 后, 投 资 者 申 购 新 股 的 持 有 市 值 要 求 市 值 计 算 规 则 及 证 券 账 户 使 用 的 相 关 规 定 是 否 发 生 了 变 化? 答 : 未 发 生 变 化 投 资 者 申 购 新 股 的 持 有 市 值 是 指, 以 投 资 者 为 单 位

Transcription:

Lecture 13: Cache V 1

Cache 大 小 Block 大 小 和 缺 失 率 的 关 系 Cache 性 能 由 缺 失 率 确 定, 而 缺 失 率 与 Cache 大 小 Block 大 小 Cache 级 数 等 有 关 Cache 大 小 :Cache 越 大,Miss 率 越 低, 但 成 本 越 高! Block 大 小 :Block 大 小 与 Cache 大 小 有 关, 且 不 能 太 大, 也 不 能 太 小!

Block Size Tradeoff ( 块 大 小 的 选 择 ) 块 大 能 很 好 利 用 spatial locality, BUT: 块 大, 则 需 花 更 多 时 间 读 块, 缺 失 损 失 变 大 块 大, 则 Cache 行 数 变 少, 缺 失 率 上 升 Average Access Time: = Hit Time x (1 - Miss Rate) + Miss Penalty x Miss Rate Miss Penalty Miss Rate Exploits Spatial Locality Fewer blocks: compromises temporal locality Average Access Time Increased Miss Penalty & Miss Rate Block Size Block Size Block Size 所 以, 块 大 小 必 须 适 中!

系 统 中 的 Cache 数 目 刚 引 入 Cache 时 只 有 一 个 Cache 近 年 来 多 Cache 系 统 成 为 主 流 多 Cache 系 统 中, 需 考 虑 两 个 方 面 : [1] 单 级 / 多 级? 片 内 (On-chip)Cache: 将 Cache 和 CPU 作 在 一 个 芯 片 上 外 部 (Off-chip)Cache: 不 做 在 CPU 内 而 是 独 立 设 置 一 个 Cache 单 级 Cache: 只 用 一 个 片 内 Cache 多 级 Cache: 同 时 使 用 L1 Cache 和 L2 Cache, 有 些 高 端 系 统 甚 至 有 L3 Cache,L1 Cache 更 靠 近 CPU, 其 速 度 比 L2 快, 其 容 量 比 L2 大 [2] 联 合 / 分 立? 分 立 : 指 数 据 和 指 令 分 开 存 放 在 各 自 的 数 据 和 指 令 Cache 中 一 般 L1 Cache 都 是 分 立 Cache, 为 什 么? L1 Cache 的 命 中 时 间 比 命 中 率 更 重 要! 为 什 么? 联 合 : 指 数 据 和 指 令 都 放 在 一 个 Cache 中 一 般 L2 Cache 都 是 联 合 Cache, 为 什 么? L2 Cache 的 命 中 率 比 命 中 时 间 更 重 要! 为 什 么? 因 为 缺 失 时 需 从 主 存 取 数, 并 要 送 L1 和 L2cache, 损 失 大!

多 核 处 理 器 中 的 多 级 Cache

多 级 cache 的 性 能 采 用 L2 Cache 的 系 统, 其 缺 失 损 失 的 计 算 如 下 : 若 L2 Cache 包 含 所 请 求 信 息, 则 缺 失 损 失 为 L2 Cache 访 问 时 间 否 则 访 问 主 存, 并 取 到 L1 Cache 和 L2 Cache( 缺 失 损 失 更 大 ) 例 子 : 某 处 理 器 在 无 cache 缺 失 时 CPI 为 1, 时 钟 频 率 为 5GHz 假 定 访 问 一 次 主 存 的 时 间 ( 包 括 所 有 的 缺 失 处 理 ) 为 100ns, 平 均 每 条 指 令 在 L1 Cache 中 的 缺 失 率 为 2% 若 增 加 一 个 L2 Cache, 其 访 问 时 间 为 5ns, 而 且 容 量 足 够 大 到 使 全 局 缺 失 率 减 为 0.5%, 问 处 理 器 执 行 指 令 的 速 度 提 高 了 多 少? 解 : 如 果 只 有 一 级 Cache, 则 缺 失 只 有 一 种 即 L1 缺 失 ( 需 访 问 主 存 ), 其 缺 失 损 失 为 :100nsx5GHz=500 个 时 钟,CPI=1+500x2%=11.0 如 果 有 二 级 Cache, 则 有 两 种 缺 失 : L1 缺 失 ( 需 访 问 L2 Cache):5nsx5GHz=25 个 时 钟 L1 和 L2 都 缺 失 ( 需 访 问 主 存 ):500 个 时 钟 因 此,CPI=1+25x2%+500x0.5%=4.0 二 者 的 性 能 比 为 11.0/4.0=2.8 倍!

Cache 性 能 评 估 与 改 善 CPU 时 间 :CPU 执 行 时 间 + 等 待 内 存 访 问 时 间 即 : CPU 时 间 =(CPU 时 钟 数 +Cache 缺 失 引 起 阻 塞 的 时 钟 数 ) X 时 钟 周 期 Cache 缺 失 引 起 阻 塞 的 时 钟 数 = 读 操 作 阻 塞 时 钟 数 + 写 操 作 阻 塞 时 钟 数 读 操 作 阻 塞 时 钟 数 =( 读 的 次 数 / 程 序 ) x 读 缺 失 率 x 读 缺 失 损 失 写 操 作 的 情 况 较 复 杂 : 回 写 (write back): 替 换 时, 需 要 一 次 性 回 写 一 个 块, 故 会 产 生 一 些 附 加 回 写 阻 塞 写 操 作 阻 塞 时 钟 数 =( 写 次 数 / 程 序 ) x 写 缺 失 率 x 写 缺 失 损 失 + 回 写 阻 塞 直 写 (write through): 包 括 写 缺 失 和 write buffer 阻 塞 两 部 分 写 操 作 阻 塞 时 钟 数 =( 写 次 数 / 程 序 ) x 写 缺 失 率 x 写 缺 失 损 失 + 写 缓 冲 阻 塞 假 定 回 写 阻 塞 或 写 缓 冲 阻 塞 可 以 忽 略 不 计, 则 可 将 读 和 写 综 合 考 虑 : 内 存 阻 塞 时 钟 数 =( 访 存 次 数 / 程 序 ) x 缺 失 率 x 缺 失 损 失 内 存 阻 塞 时 钟 数 =( 指 令 条 数 / 程 序 ) x ( 缺 失 数 / 指 令 ) x 缺 失 损 失

举 例 : 缺 失 带 来 的 损 失 到 底 多 大? 设 代 码 Cache 缺 失 率 为 2%, 数 据 Cache 缺 失 率 为 4% 假 定 一 个 CPU 在 没 有 任 何 存 储 阻 塞 时 CPI 为 2, 缺 失 损 失 为 100 个 时 钟 如 果 用 SPECint2000 衡 量, 则 使 用 无 缺 失 Cache 时 CPU 速 度 会 快 多 少? 分 析 过 程 如 下 : 指 令 的 缺 失 时 钟 数 为 :Ix2%x100=2.0xI SPECint2000 的 访 存 指 令 (Load 和 Store) 频 度 为 :36%, 所 以 数 据 的 缺 失 时 钟 数 为 :Ix36%x4%x100=1.44xI 指 令 和 数 据 总 的 缺 失 时 钟 数 为 :2xI+1.44xI=3.44I, 也 即 : 平 均 每 条 指 令 要 有 3.44 个 时 钟 处 在 存 储 器 阻 塞 状 态 因 此, 因 为 存 储 器 阻 塞 而 使 得 CPI 数 增 大 到 2+3.44=5.44. 故 : CPU time with stalls CPU time with perfect cache = IxCPIstallxClock cycle IxCPIperfectxClock cycle = 5.44 如 果 Cache 不 发 生 缺 失, 则 CPU 速 度 会 快 2.72 倍 2

举 例 : 处 理 器 速 度 提 高 而 存 储 器 不 变 时 的 情 况 例 1: 假 定 上 例 中 CPI 减 为 1, 时 钟 宽 度 不 变, 则 : 因 为 存 储 器 阻 塞 而 使 得 CPI 数 增 大 到 1+3.44=4.44. 故 : CPU time with stalls CPU time with perfect cache = IxCPIstallxClock cycle = 4.44 IxCPIperfectxClock cycle 1 由 此 可 知 : 存 储 器 阻 塞 所 花 时 间 占 整 个 执 行 时 间 的 比 例 从 : 3.44 / 5.44=63% 上 升 到 3.44 / 4.44=77% 结 论 :CPI 越 小,Cache 阻 塞 的 影 响 越 大

举 例 : 处 理 器 速 度 提 高 而 存 储 器 不 变 时 的 情 况 例 2: 假 定 上 例 中 时 钟 频 率 加 倍, CPI 不 变, 则 : 主 存 速 度 不 会 改 变, 故 绝 对 时 间 不 变, 所 以 缺 失 损 失 为 200 个 时 钟 每 条 指 令 发 生 的 总 缺 失 时 钟 数 为 2%x200+36%x(4%x200)=6.88 故 : 存 储 器 阻 塞 使 得 CPI 数 增 大 到 2+6.88=8.88 时 钟 快 的 机 器 的 性 能 时 钟 慢 的 机 器 的 性 能 = IxCPIslow xclock cycle IxCPIfast xclock cycle/2 = 5.44 8.88/2 =1.23 由 此 可 知 : 时 钟 快 的 机 器 的 性 能 只 是 较 慢 时 钟 机 器 的 1.2 倍 如 果 没 有 Cache 缺 失 的 话, 应 该 是 2 倍! 结 论 :CPU 时 钟 频 率 越 高,Cache 缺 失 损 失 就 越 大 上 述 两 个 例 子 说 明 : 处 理 器 性 能 越 高, 高 速 缓 存 的 性 能 就 越 重 要!

设 计 支 持 Cache 的 存 储 器 系 统 指 令 执 行 若 发 生 Cache 缺 失, 必 须 到 DRAM 中 取 数 据 或 指 令 在 DRAM 和 Cache 之 间 传 输 的 单 位 是 Block 问 题 : 怎 样 的 存 储 器 组 织 使 得 Block 传 输 最 快 ( 缺 失 损 失 最 小 )? 假 定 存 储 器 访 问 过 程 : CPU 发 送 地 址 到 内 存 :1 个 总 线 时 钟 访 问 内 存 的 初 始 化 时 间 :10 个 总 线 时 钟 从 总 线 上 传 送 一 个 字 :1 个 总 线 时 钟 CPU MM 可 以 有 三 种 不 同 的 组 织 形 式! 假 定 一 个 Block 有 4 个 字, 则 缺 失 损 失 各 为 多 少 时 钟?

设 计 支 持 Cache 的 存 储 器 系 统 假 定 存 储 器 访 问 过 程 : CPU 发 送 地 址 到 内 存 :1 个 总 线 时 钟 内 存 访 问 时 间 :10 个 总 线 时 钟 从 总 线 上 传 送 一 个 字 :1 个 总 线 时 钟 4x(1+10+1)=48 缺 失 损 失 为 48 个 时 钟 周 期 代 价 小, 但 速 度 慢!

假 定 存 储 器 访 问 过 程 : 设 计 支 持 Cache 的 存 储 器 系 统 CPU 发 送 地 址 到 内 存 :1 个 总 线 时 钟 内 存 访 问 时 间 :10 个 总 线 时 钟 从 总 线 上 传 送 一 个 Block:1 个 总 线 时 钟 Two-word: 2x(1+10+1)=24 Four-word: 1+10+1=12 缺 失 损 失 各 为 24 或 12 个 时 钟 周 期 速 度 快, 但 代 价 大!

设 计 支 持 Cache 假 定 存 的 储 存 器 访 储 问 器 过 系 程 : 统 CPU 发 送 地 址 到 内 存 :1 个 总 线 时 钟 内 存 访 问 时 间 :10 个 总 线 时 钟 从 总 线 上 传 送 一 个 字 :1 个 总 线 时 钟 Interleaved four banks one-word: 1+1x10+4x1=15 缺 失 损 失 为 15 个 时 钟 周 期 代 价 小, 而 且 速 度 快!

复 习 :SPARCstation 20 s Memory Module DRAM Chip 15 512 cols DRAM Chip 0 256K x 8 = 2 Mb One page 512 rows 256K x 8 = 2 Mb 8 bits 512 8 SRAM bits<127:120> 行 缓 冲 512 8 SRAM bits<7:0> 交 叉 编 址 方 式! Memory Bus<127:0> Cache 行 读 从 内 存 读 一 块 连 续 数 据 区 只 要 给 定 一 个 首 地 址, 后 续 数 据 连 续 读 出, 称 为 突 ( 猝 ) 发 传 输 方 式

复 习 :128MB 的 DRAM 存 储 器 ( 行 地 址 i, 列 地 址 j) 交 叉 编 址 方 式! DRAM 0 8 个 芯 片 同 时 读 出! 若 再 构 DRAM 7 成 多 个 模 块, 地 址 A 4096 行 则 可 轮 流 启 动 每 个 模 块 进 行 bits 56-63 bits 48-55 bits 40-47 bits 32-39 bits 24-31 bits 16-23 bits 8-15 bits 0-7 读 写! 芯 片 容 量 : 16MB=4096X4096X8 位 63 56 55 48 47 40 39 32 31 24 23 16 15 8 7 主 存 储 器 地 址 A 处 的 64-bit 数 据 64-bit 双 字 0 存 储 控 制 器 : 行 列 地 址 为 (i,j) 的 8 个 单 元

实 例 : 奔 腾 机 的 Cache 组 织 主 存 :4GB=2 20 x 2 7 块 x 2 5 B/ 块 Cache:8KB=128 组 x2 行 / 组 替 换 算 法 : LRU, 每 组 一 位 LRU 位 该 位 为 0, 下 次 淘 汰 第 0 路 ; 该 位 为 1, 下 次 淘 汰 第 1 路 写 策 略 : 默 认 为 Write Back, 可 动 态 设 置 为 Write Through Cache 一 致 性 : 支 持 MESI 协 议

是 MIPS 结 构 的 嵌 入 式 微 处 理 器 Hit V Tag 18 tag 实 例 : 内 置 FastMATH 处 理 器 31 Index Memory Address 2 18 8 4 2 Byte offset 1 512 data 各 Cache 有 : 256 (16KB / 64B) 行 0 Byte 5 Block offset Mux Word 256 lines 1 8 32 32 32 = 3 Mux 3 2 4 Data 写 比 读 复 杂! CPU 提 供 了 写 通 过 和 写 回 两 种 方 式, 由 OS 决 定 采 用 何 种 策 略 SPEC2000int 的 指 令 数 据 和 综 合 缺 失 率 分 别 为 :0.4%, 11.4%, 3.2%

前 端 总 线 总 线 接 口 部 件 预 取 控 制 逻 辑 L2 cache (48GB/s) 实 例 :Pentium 4 的 cache 存 储 器 64 位, 时 钟 频 率 有 3 个 cache, 分 成 两 级 : L1cache 指 令 cache 及 指 令 预 取 部 件 数 据 缓 存 (L1 数 据 cache), ),8KB 指 令 缓 存, 8KB L2 cache, 容 量 为 256 KB~2MB 256 位, 时 钟 频 率 L1 数 据 cache(8kb)

缓 存 在 现 代 计 算 机 中 无 处 不 在 问 题 : 缓 存 技 术 可 以 应 用 在 哪 些 方 面? 问 题 : 缓 存 技 术 的 实 现 手 段 和 目 的 各 是 什 么?

小 结 引 入 Cache 的 基 础 是 程 序 访 问 的 局 部 化 特 性 引 入 Cache 减 少 了 对 内 存 的 访 问,CPU 能 在 快 速 的 Cache 中 得 到 信 息 Cache 和 主 存 之 间 的 映 射 方 式 直 接 映 射 ( 模 映 射 ): 地 址 = 标 记 行 索 引 块 内 地 址 全 相 联 映 射 ( 全 映 射 ): 地 址 = 标 记 块 内 地 址 组 相 联 映 射 ( 组 间 模 映 射, 组 内 全 映 射 ): 地 址 = 标 记 组 索 引 块 内 地 址 如 何 提 高 cache 的 命 中 率? 增 大 cache 容 量, 适 中 的 块 大 小 采 用 多 级 cache 技 术 (L1 / L2 / L3) 采 用 快 速 查 找 算 法, 并 采 用 并 行 判 定 是 否 命 中 缺 失 时, 采 用 有 效 替 换 算 法, 淘 汰 cache 中 暂 不 使 用 的 内 容 编 译 器 优 化 目 标 程 序 程 序 员 写 出 cache-friendly 的 程 序 Cache 的 写 策 略 Write Back 和 Write Through