一次访存请求最后真正的平均访存次数 =(71.3%*0)+(23.8%*1)+(3.8%*2)+(1.3%*3)=0.35 (2) 写回法 cache 访问命中, 有两种情况 : 读命中, 不访问主存 ; 写命中, 不访问主存 采用写回法, 只有当修改的 cache 块被换出时, 才写入主存 ; 访

Similar documents
<4D F736F F D20B5DAC8FDCBC4D5C2D7F7D2B5B4F0B0B82E646F63>

Training

Microsoft Word - 2.doc

多 种 途 径, 让 学 生 通 过 实 践 性 教 学, 事 半 功 倍 地 接 受 理 解 老 师 讲 授 的 知 识, 教 学 过 程 跟 踪 国 外 金 融 市 场 动 态 与 国 内 外 著 名 专 家 学 者 的 交 流 与 区 域 金 融 机 构 的 交 流, 形 成 探 究 式 教

标题

Microsoft PowerPoint - 《??省企?集体合同?例》解?(?莞).ppt [Compatibility Mode]

PowerPoint Presentation

Microsoft PowerPoint - 3章例题.ppt

untitled

计算机组成原理 第四章 存储器

Microsoft Word - 附件.doc

第 一 部 分 投 标 邀 请 一. 项 目 名 称 : 北 京 大 学 附 属 中 学 副 食 品 商 店 协 议 供 货 商 招 标 项 目 二. 项 目 内 容 : 北 京 大 学 附 属 中 学 采 购 中 心 现 就 学 校 副 食 品 商 店 的 供 货 协 议 商 进 行 招 标, 中

Microsoft Word - 愛吐沙的蛤蜊

i

标题

我 可 以 向 你 们 保 证 以 下 的 内 容 100% 真 实, 请 您 一 定 耐 心 看 完 从 医 15 年 来, 我 也 反 复 告 诉 病 人 这 些 事 实 但 是 没 有 人 愿 意 去 听, 更 没 有 人 愿 意 去 相 信 或 许, 我 们 的 同 胞 们 真 的 需 要


科展作品說明書--情定水果 香邀你我

高雄市102年度「安全‧健康‧食在高雄」種子教師研習實施計畫

壹:教育文化公益慈善機關或團體免納所得稅適用標準

《2012年中国区域金融运行报告》专栏和主要行业提纲

YYW1.nps

表 决, 审 议 程 序 符 合 有 关 法 律 法 规 和 本 公 司 章 程 的 规 定 3 本 议 案 尚 需 提 交 股 东 大 会 审 议, 与 该 等 交 易 有 利 害 关 系 的 关 联 股 东 将 放 弃 在 股 东 大 会 上 对 相 关 议 案 的 投 票 权 ( 二 ) 公

<4D F736F F D20B9F0D5FEB0ECB7A2A3A A3A93532BAC52E646F63>

103_02.xls

<313032A655A874B2D5B3CCA743BFFDA8FABCD0B7C7AAED2E786C73>

柳州历史上的今天内文改版式.FIT)

生 產 準 備 您 接 近 生 產 之 注 意 事 項 : 備 妥 住 院 用 物, 勿 遠 行 ( 生 產 用 物 包 ) 最 好 有 人 在 家 陪 伴, 或 和 陪 產 者 保 持 連 繫, 有 任 何 狀 況 可 立 即 趕 到 可 做 家 事 散 步 蹲 下 等 運 動, 以 不 太 累

省十二届人大常委会

Q8. 公 營 事 業 機 構 之 公 務 員 兼 具 勞 工 身 分 者, 於 97 年 3 月 19 日 以 前, 原 選 擇 參 加 勞 保, 調 任 其 他 公 營 事 業 機 構 時, 應 改 參 加 公 保 所 謂 調 任 其 他 公 營 事 業 機 構 之 判 別 依 據 ( 或 標

untitled

学生工作部处2010年工作总结

決議、附帶決議及注意事項

天人炁功行入與感應經驗分享

穨邱秀玲綜合展望報告.PDF

主要内容 一 ZFS 文件系统二 ZFS 文件系统数据完整性 1 一 ZFS 文件系统 ZFS 文件系统简介存储池 2 二 ZFS 文件系统数据完整性什么是数据完整性


1 行 业 发 展 不 平 衡 我 国 房 地 产 中 介 服 务 业 起 步 较 晚, 专 业 分 工 程 度 和 国 外 发 达 国 家 相 比 还 有 很 大 差 距 房 地 产 中 介 服 务 行 业 的 发 展 水 平 与 房 地 产 开 发 行 业 的 市 场 化 水 平 密 切 相 关

汇集全球21位医生的经验和智慧,总结出最实用的专业建议,这些都是最值得你牢记的健康提醒

第十号 上市公司关联交易公告

<4D F736F F D20B6C0AE78B0EDAABAC0B8A740B8D65FA7EBA7BAA54EA4E5BEC7ACE3A873C24FA55AA15E2E646F63>

Microsoft Word - F5.docx

Microsoft Word - 朗诵诵材.doc

<4D F736F F D20C8CBB8A3D2BDD2A9BCAFCDC5B9C9B7DDB9ABCBBECFEACABDC8A8D2E6B1E4B6AFB1A8B8E6CAE9A3A8CEE4BABAB5B1B4FABFC6BCBCB2FAD2B5BCA

06-07周年報告template.PDF

KV-cache 1 KV-cache Fig.1 WorkflowofKV-cache 2.2 Key-value Key ; Key Mem-cache (FIFO) Value Value Key Mem-cache ( Value 256B 100 MB 20%

水晶分析师

两会概况

摘 要 网 络 欺 诈 催 生 黑 色 产 业 链, 商 业 运 作 模 式 日 渐 成 熟 互 联 网 + 的 飞 速 发 展 催 生 了 黄 牛 打 码 手 羊 毛 党 等 日 趋 专 业 的 黑 产 团 伙, 他 们 分 布 在 产 业 链 的 各 个 环 节, 为 黑 产 利 益 链 条 提

股份有限公司

L7 Cache I

智慧健康简报

1 2 2

Microsoft Word 第104期.doc

2015年土地市场发展报告-网站

计算机组成原理 第 5 章存储系统 Cache

RAID( 磁盘阵列 ) 内容导航 第 1 页 :RAID 基本介绍 第 2 页 :RADI 0 第 3 页 :RAID 1 第 4 页 :RAID 10 或 RAID 0+1 第 5 页 :RAID 3 第 6 页 :RAID 5 第 7 页 :RAID 6 第 8 页 :RAID 7 第 9 页

学习贯彻十一届全国人大三次会议精神 特约报告员 刚刚闭幕的十一届全国人大三次会议 全面贯彻党的十七 大和十七届三中 四中全会及中央经济工作会议精神 高举中 国特色社会主义伟大旗帜 以邓小平理论和 三个代表 重要 思想为指导 深入贯彻落实科学发展观 以对人民高度负责的 态度 圆满完成了各项议程 一 大

括 教 育 在 内 西 学 得 以 力 推 广 制 颁 发 和 癸卯 学制 实 施 更 使 教 育在 学 校 教 育 占 据 相 当 重 要 地 位 达到 了 前所 未 有 程度 以 学为 例 科 学 时数 占 总 学 时数 比 例 甚至超 过 国 文科 壬寅学 直维持 在 约 辛亥 革命 以 后

1. AMD BIOS RAID 安装指南 AMD BIOS RAID 安装指南介绍如何在 BIOS 环境中使用板载 FastBuild BIOS 实用程序配置 RAID 功能 制作 SATA 驱动程序磁盘后, 按 <F2> 或 <Del> 进入 BIOS 设置, 然后按照支持光盘上 用户手册 的详

Microsoft Word - 目次範例-catalog doc

2G1.S2

内部资料·注意保存

第三期芳草地彩版.doc

僑生(含港澳生)及外籍生參加全民健康保險實施要點

PowerPoint Presentation

PowerPoint Presentation

untitled

动物学

壹、

05Cv1.mps

% 34 10% 3,432 9,923 / 6% 38 3% 24 13% 2, / 8.44% 17 35% 16 3% 1, / 6.56% 4 3%2.9 22% /19% %3.6

生 產 準 備 您 接 近 生 產 之 注 意 事 項 : 備 妥 住 院 用 物, 勿 遠 行 ( 生 產 用 物 包 ) 最 好 有 人 在 家 陪 伴, 或 和 陪 產 者 保 持 連 繫, 有 任 何 狀 況 可 立 即 趕 到 可 做 家 事 散 步 蹲 下 等 運 動, 以 不 太 勞

0,,, IT,,,,,,,,, : ,,,, ;,, ( CIP) /. :, ( ) ISBN X F49 CIP ( 2005) : : h

Microsoft Word - A 中文.doc

國家圖書館典藏電子全文

2 04%; 6 62, , , GDP50162, ( ) 2014, , ; , 9 9 ; 82558, 300/10, 158, 0 57/10 ; 25 73/10 ; 4 68 ( )

版面2

标题


<4D F736F F D20C7B0CBC4D5C2D7F7D2B5CCE22E646F6378>

Page 2

营 业, 因 业 务 往 来 关 系, 与 宜 宾 大 小 商 帮 比 较 熟 悉 曹 九 龄 熊 郁 村 便 约 我 参 加 共 同 发 起 熊 曹 二 人 与 我 又 是 世 交, 在 实 业 救 国 思 想 激 励 下, 同 时 也 为 个 人 将 来 发 展 前 途 计, 我 也 欣 然 乐

帝国CMS下在PHP文件中调用数据库类执行SQL语句实例

粤技组〔2010〕24号

¸ßÐÛÊÐÕþ¸®½ÌÓý¾ÖôßËù„ÙŽCêP„WУ¾ÅÊ®ÄêÈËÊÂÈ˃TŁþ‹óôßÆ·¹ÜȦÌá°¸

Microsoft PowerPoint - Chapter7_DiskManagement.pptx

1-28(长江二号)

关于印发广东省“互联网+”现代农业行动计划( 年)的通知

郑 州 市 人 民 政 府 关 于 落 实 新 建 郑 州 至 焦 作 铁 路 郑 州 市 段 建 设 用 地 的 通 告 (43) 郑 州 市 人 民 政 府 关 于 落 实 郑 州 市 南 出 口 暨 郑 州 至 新 郑 快 速 通 道 改 建 工 程 建 设 用 地 的 通 告 (44) 郑

( 总 第 1124 期 ) 浙 江 省 人 民 政 府 主 办 2016 年 7 月 18 日 出 版 目 省 政 府 令 浙 江 省 行 政 执 法 证 件 管 理 办 法 ( 浙 江 省 人 民 政 府 令 第 346 号 ) (3) 省 政 府 办 公 厅 文 件 浙 江 省 人 民 政 府

五 參 與 政 治 活 動 之 限 制 綜 觀 中 立 法, 其 重 點 在 於 適 度 規 範 公 務 人 員 參 與 政 治 活 動, 可 分 為 消 極 性 的 行 為 規 範 及 積 極 性 參 與 政 治 活 動 的 限 制 規 範 兩 種 前 者 除 依 法 行 政 公 平 對 待 等

需 求 拉 动 显 著 利 润 分 配 或 向 上 游 倾 斜 二 季 度 伊 始, 从 小 盘 题 材 向 大 盘 蓝 筹 的 风 格 转 换, 似 乎 刚 刚 开 始 就 又 戛 然 而 止 我 们 认 为, 虽 然 没 有 充 分 证 据 表 明 整 体 经 济 持 续 过 热, 但 局 部

6.disk.pptx

浙江省劳动和社会保障厅信息中心

(Microsoft Word - \245\300\250\305\255\367\250|Q&A.docx)


穨資料題_中三_中五適用__慈禧太后的功過_林麗貞_20

幸 福 就 业 工 程 建 设 工 作 提 供 了 参 考

Microsoft Word - C-THE DAY AND THE TIME.doc

Transcription:

Homework5: 1. 在 Cache 主存 层次中, 主存的更新算法有哪几种?? 它们各有什么特点? (1) 写直达法 : 易于实现, 而且下一级存储器中的数据总是最新的 (2) 写回法 : 速度块, 写 操作能以 Cache 存储器的速度进行 而且对于同一单元的多个写最后只需一次写回下一级存储器, 有些 写 只到达 Cache, 不到达主存, 因而所使用的存储器频带较低 2. 组相联 Cache 比相同容量的之直接映象 Cache 的失效率低 由此是否可以得出结论 : 采用组相联 Cache 一定能带来性能上的提高? 为什么? 答 : 不一定 因为组相联命中率的提高是以增加命中时间为代价的, 组相联需要增加多路选择开关 3. 写出三级 Cache 的平均访问时间 TA 的公式 平均访存时间 = 命中时间 + 失效率 失效开销只有第 I 层的失效时才会访问第 I+1 设三级 Cache 的命中率分别为 HL1 Hl2 HL3, 失效率分别为 Ml1 Ml2 ML3, 第三级 Cache 的失效开销为 PL3 平均访问时间 TA =HL1+Ml1{Hl2+Ml2(HL3+ML3 PL3)} 4. 解 : 平均访问时间 = 命中时间 + 失效率 失效开销平均访问时间 1- 路 =2.0+1.4%*80=3.12ns 平均访问时间 2- 路 =2.0*(1+10%)+1.0%*80=3.0ns 两路组相联的平均访问时间比较低 CPUtime=(CPU 执行 + 存储等待周期 )* 时钟周期 CPUtime=IC(CPI 执行 + 总失效次数 / 指令总数 * 失效开销 ) * 时钟周期 =IC(( CPI 执行 * 时钟周期 )+( 每条指令的访存次数 * 失效率 * 失效开销 * 时钟周期 )) 直接映像 CPU 时间低 ~~~~ Homework6: 1. 简述减小 Cache 失效的几种方法 (1) 让读失效优先于写 (2) 子块放置技术 (3) 请求字处理技术 (4) 非阻塞 Cache 技术 (5) 采用两级 Cache 2 ( 1) 写直达 cache 访问命中, 有两种情况 : 读命中, 不访问主存 ; 写命中, 更新 cache 和主存, 访问主存一次 访问失效, 有两种情况 : 读失效, 将主存中的块调入 cache 中, 访问主存两次 ; 写失效, 将要写的块调入 cache, 访问主存两次, 再将修改的数据写入 cache 和主存, 访问主存一次, 共三次 上述分析如下表所示

一次访存请求最后真正的平均访存次数 =(71.3%*0)+(23.8%*1)+(3.8%*2)+(1.3%*3)=0.35 (2) 写回法 cache 访问命中, 有两种情况 : 读命中, 不访问主存 ; 写命中, 不访问主存 采用写回法, 只有当修改的 cache 块被换出时, 才写入主存 ; 访问失效, 有一个块将被换出, 这也有两种情况 : 如果被替换的块没有修改过, 将主存中的块调入 cache 块中, 访问主存两次 ; 如果被替换的块修改过, 则首先将修改的块写入主存, 需要访问主存两次 ; 然后将主存中的块调入 cache 块中, 需要访问主存两次, 共四次访问主存 3. 添加条件 : 数据访问中 25% 为写访问 解 : CPI=CPI 执行 + 存储停顿周期数 / 指令数 存储停顿由下列原因引起 : 从主存中取指令 load 和 store 指令访问数据 由 TLB 引起 存储停顿周期数取指令停顿数据访问停顿 +TLB 停顿 = + 指令数指令数指令数停顿周期数存储访问 = 失效率 失效开销指令数指令数存储停顿周期数 TLB 停顿 R 指令 P指令 +( f 数据 R 数据 P数据 )+ 指令数指令数 (1) 对于理想 TLB,TLB 失效开销为 0 而对于统一 Cache,R 指令 =R 数据 P1=P 指令 = 主存延迟 + 传输一个块需要使用的时间 =40+32/4=48( 拍 ) 若为读失效,P 数据 = 主存延迟 + 传输一个块需要使用的时间 =40+32/4=48( 拍 ) 若为写失效, 且块是干净的, P 数据 = 主存延迟 + 传输一个块需要使用的时间 =40+32/4=48( 拍 ) 若为写失效, 且块是脏的, P 数据 = 主存延迟 + 传输两个块需要使用的时间 =40+64/4=56( 拍 ) CPI=1.5+[RP1+(RP2*20%)+0 ] 指令访存全是读, 而数据传输指令 Load 或 Store 指令, f 数据 *P 数据 = 读百分比 *(f 数据 *P 数据 )+ 写百分比 *(f 数据 *P 干净数据 * 其对应的百分比 +f 数据 *P 脏数据 * 其对应的百分比 )=f( 数据 )*P2= =20%*(75% 48+25%*(50%*48+50%*(48+16)))=50( 拍 ), 其中读百分比为 75%, 写百分比为 25% 然后将 P1 和 P2 代人上面的 CPI 计算公式得到结果 16-KB 直接映像 unified cache, 采用写回法, 失效率为 0.049, 此时 CPI=1.5+0.049*48+0.049*0.2*50; 16-KB 2 路组相联 unified Cache, 采用写回法, 失效率为 0.041 32-KB 直接映像 unified cache, 采用写回法, 失效率为 0.042

homework7: 第一问为 homework6 中的第三题, 下面分析后面两问 : (b): TLB停顿存储访问次数 TLB访问 ( ) TLB失效率 TLB失效开销指令数指令数存储访问次数 将 f 数据 ( 数据访问指令频率 ),R t 和 P t ( 分别是 TLB 的失效率和失效开销 ),R c 和 P w ( 分 别是 Cache 的失效率和写回的频率 ) 代入公式得 : TLB 停顿 / 指令数 ={[1+f 数据 ]*[R c (1+R w )]}R t P t 其中,1+f 数据 : 每条指令的访问内存次数 ;R c (1+R w ): 每次内存访问需要的 TLB 访问次数 由条件得 :TLB 停顿 / 指令数 ={[1+20%]*[R c (1+25%)]}0.2% 20 (c) 结合物理 cache 虚拟 cache TLB 原理来分析 如果仅仅从性能上面来分析, 我认为虚拟 cache 可以实现部分并行, 其性能更好 但是由于虚拟 cache 存在同义, 即别名问题, 所以 现在很多设计都使用的是物理 cache. homework8: 1 假设一台计算机的 I/O 处理占 10%, 当其 CPU 性能改进到原来的 100 倍时, 而 I/O 性能仅改进为原来的两倍时, 系统总体性能会有什么改进? 解 :(Amdahl 定律 ) 加速比 : 1/(10%/2+90%/100) 2. 平均磁盘访问时间 = 平均寻道时间 + 平均旋转延迟 + 传输时间 + 控制器开销 磁盘计量 1MB=1000K (care?p296) 3. 盘阵列有哪些分级? 各有什么特点? RAID0 亦称数据分块, 即把数据分布在多个盘上, 实际上是非冗余阵列, 无冗余信息 RAID1 亦称镜像盘, 使用双备份磁盘 每当数据写入一个磁盘时, 将该数据也写到另一个冗余盘, 这样形成信息的两份复制品 如果一个磁盘失效, 系统可以到镜像盘中获得所需要的信息 镜像是最昂贵的解决方法 特点是系统可靠性很高, 但效率很低 RAID2 位交叉式海明编码阵列 原理上比较优越, 但冗余信息的开销太大, 因此未被广泛应用 RAID3 位交叉奇偶校验盘阵列, 是单盘容错并行传输的阵列 即数据以位或字节交叉的方式存于各盘, 冗余的奇偶校验信息存储在一台专用盘上 RAID4 专用奇偶校验独立存取盘阵列 即数据以块 ( 块大小可变 ) 交叉的方式存于各盘, 冗余的奇偶校验信息存在一台专用盘上 RAID5 块交叉分布式奇偶校验盘阵列, 是旋转奇偶校验独立存取的阵列 即数据以块交叉的方式存于各盘, 但无专用的校验盘, 而是把冗余的奇偶校验信息均匀地分布在所有磁盘上 RAID6 双维奇偶校验独立存取盘阵列 即数据以块 ( 块大小可变 ) 交叉的方式存于各盘, 冗余的检 纠错信息均匀地分布在所有磁盘上 并且, 每次写入数据都要访问

一个数据盘和两个校验盘, 可容忍双盘出错 RAID7 是采用 Cache 和异步技术的 RAID6, 使响应速度和传输速率有了较大提高 Homework9 Homework9 HHoommeewwoorrkk99 4. 同步总线和异步总线各有什么优缺点? 总线的主要参数有哪些? 各是什么含义? 同步总线上所有设备通过统一的总线时钟进行同步 同步总线成本低, 因为它不需要设备之间相互确定时序的逻辑 但是同步总线也有缺点, 总线操作必须以相同的速度运行 由于各种设备都要精确地以公共时钟为定时参考, 因此在时钟频率很高时容易产生时钟相对漂移错误 异步总线上的设备之间没有统一的时钟, 设备自己内部定时 设备之间的信息传送用总线发送器和接收器控制 异步总线容易适应更广泛的设备类型, 扩充总线时不用担心时钟时序和时钟同步问题 但在传输时, 异步总线需要额外的同步开销 总线常用的参数有 3 个 : (1) Tp: 总线信号传输延迟 即在总线上的每个设备都取到和识别一个信号需要的最大时间 (2) Tsk: 响应其它设备的最大时间, 这个参数在同步总线中是一个重要的参数 (3) Top: 设备的操作时间 5. 在有 Cache 的计算机系统中, 进行 I/O 操作时, 会产生哪些数据不一致问题? 如何克服? (1) 存储器中可能不是 CPU 产生的最新数据, 所以 I/O 系统从存储器中取出来的是陈旧数据 (2)I/O 系统与存储器交换数据之后, 在 Cache 中, 被 CPU 使用的可能就会是陈旧数据 第一个问题可以用写直达 Cache 解决 第二个问题操作系统可以保证 I/O 操作的数据不在 cache 中 如果不能, 就作废 Cache 中相应的数据 6. 每个主存页有 32K/128=256 块 因为是按块传输, 所以 I/O 传输本身并不引起 Cache 失效 但是它可能要替换 Cache 中的有效块 如果这些被替换块中有 60% 是被修改过的, 将需要 (256 60%) 30=4608 个时钟周期将这些被修改过的块写回主存 这些被替换出去的块中, 有 95% 的后继需要访问, 从而产生 95% 256=244 次失效, 将再次发生替换 由于这次被替换的 244 块中数据是从 I/O 直接写入 Cache 的, 因此所有块都为被修改块, 需要写回主存 ( 因为 CPU 不会直接访问从 I/O 来的新页中的数据, 所以它们不会立即从主存中调入 Cache), 需要时间是 244 (40+30)=17080 个时钟周期 没有 I/O 时, 每一页平均使用 200 万个时钟周期,Cache 失效 36000 次, 其中 60% 被修改过, 所需的处理时间为 : (36000 40%) 40+(36000 60%) (40+30)=2088000( 时钟周期 ) 时钟 I/O 造成的额外性能损失比例为

(4608+17080) (2000000+2088000)=0.53% 即大约产生 0.53% 的性能损失