lecture21

Similar documents
1 CPU

<4D F736F F D20B5DAC8FDCBC4D5C2D7F7D2B5B4F0B0B82E646F63>

untitled

邏輯分析儀的概念與原理-展示版

第七章 中断

Microsoft PowerPoint - CA_02 Chapter5 Part-I_Single _V2.ppt

9 什 么 是 竞 争 与 冒 险 现 象? 怎 样 判 断? 如 何 消 除?( 汉 王 笔 试 ) 在 组 合 逻 辑 中, 由 于 门 的 输 入 信 号 通 路 中 经 过 了 不 同 的 延 时, 导 致 到 达 该 门 的 时 间 不 一 致 叫 竞 争 产 生 毛 刺 叫 冒 险 如

Huawei Technologies Co

URISC 处理器设计一 URISC 处理器功能描述 URISC 处理器是只有一条指令的超级精简指令集计算机, 它是由 Mavaddat 和 Parham 提出的一种 RISC 结构 尽管 URISC 只有一条指令, 却也是一种通用计算机, 所有的复杂操作都可以由这条指令来完成 URISC 指令要完


Training

<4D F736F F D20B5DAC1F9D5C2CFB0CCE2B4F0B0B8A3A8CDF8D5BEA3A92E646F63>

Microsoft PowerPoint - notes3-Simple-filled12

Microsoft PowerPoint - 第9讲-08.ppt [兼容模式]

<4D F736F F D20C7B0CBC4D5C2D7F7D2B5CCE22E646F6378>

Microsoft PowerPoint - CA_03 Chapter5 Part-II_multi _V1.ppt

Ps22Pdf

<4D F736F F F696E74202D DB5DABEC5BDB22DCEA2B4A6C0EDC6F7B5C4D3B2BCFEBDE1B9B9A3A8D2BBA3A92E >

nb.PDF

第五章 重叠、流水和现代处理器技术

Tel:

数字逻辑设计2013

Microsoft PowerPoint - vlsi_chapter02

CH559指令周期.doc

Edge-Triggered Rising Edge-Triggered ( Falling Edge-Triggered ( Unit 11 Latches and Flip-Flops 3 Timing for D Flip-Flop (Falling-Edge Trigger) Unit 11

L1 computer system overview

101

378高雄市都市計畫說明書

<4D F736F F F696E74202D20B5DA35D5C2CEA2B4A6C0EDC6F7B9A4D7F7D4ADC0ED2E707074>

a b c d e f g C2 C1 2

Microsoft PowerPoint - chx09_org14_pipelining_1.ppt

Microsoft PowerPoint - BECKHOFF技术_ADS通讯 [Compatibility Mode]

xilinx FPGA 串口设计笔记 在设计中, 需要用 FPGA 读取 GPS 内部的信息,GPS 的通信方式为串口, 所以在 FPGA 中移植了串口程序 本次移植的程序源代码是特权的串口程序, 本以为移植应该很快就能完成, 但其中还是出了一写小问题, 耽误了不少的时间, 下面将问题进行一个总结!

Microsoft PowerPoint - CA_04 Chapter6 v ppt

PowerPoint Presentation

PowerPoint Presentation

寻医问药指南(十七)

投影片 1

数字电子技术与微处理器基础

计算机组成原理

PowerPoint Presentation

单周期数据通路

《佛子行三十七颂》讲记1

(给多有拉姆)佛子行三十七颂1——7

至 尊 法 王 蒋 阳 龙 朵 加 参 尊 者 上 师 瑜 伽 皈 依 境

多 种 途 径, 让 学 生 通 过 实 践 性 教 学, 事 半 功 倍 地 接 受 理 解 老 师 讲 授 的 知 识, 教 学 过 程 跟 踪 国 外 金 融 市 场 动 态 与 国 内 外 著 名 专 家 学 者 的 交 流 与 区 域 金 融 机 构 的 交 流, 形 成 探 究 式 教

标题

Microsoft PowerPoint - 《??省企?集体合同?例》解?(?莞).ppt [Compatibility Mode]

Microsoft Word - 2.doc

计算机组成与系统结构

User ID 150 Password - User ID 150 Password Mon- Cam-- Invalid Terminal Mode No User Terminal Mode No User Mon- Cam-- 2

¸ß¼¶¼ÆËã»úÌåϵ½á¹¹

98年度即測即評學科測試與即測即評即發證技術士技能檢定簡章

Microsoft Word 箕æ−¥ï¼‹å®ı稿;

计组复习提纲

untitled

AT89C2051中文资料.doc

Microsoft Word - FM12232C.doc

第一章

合金投资年报正文.PDF

从 宾 馆 到 又 一 城 是 十 五 分 钟, 从 又 一 城 到 邵 逸 夫 是 十 分 钟, 去 时 一 路 上 坡 很 辛 苦, 回 时 一 路 下 坡 很 轻 松, 很 像 上 小 学 时 的 心 情, 这 是 最 初 几 天 最 深 的 感 受 有 段 时 间 很 少 走 校 内 的 路


<4D F736F F F696E74202D20B5DAC1F9D5C220D7F7D2B5B2CEBFBCB4F0B0B8>

untitled

KV-cache 1 KV-cache Fig.1 WorkflowofKV-cache 2.2 Key-value Key ; Key Mem-cache (FIFO) Value Value Key Mem-cache ( Value 256B 100 MB 20%

Microsoft Word ZW-11111

JLX

DPJJX1.DOC

第1章 概论

ebook105-12

[Group 9] Give an example of structural hazard ans 1. 假設下列指令是在只有單一記憶體的 datapath 中執行 lw $5, 100($2) add $2, $7, $4 add $4, $2, $5 sw $5, 100($2)

Training

1 1

Chapter 6

《垓下歌》 項羽

交 通 部 公 路 總 局 新 竹 區 監 理 所 104 年 第 2 次 契 約 服 務 員 甄 試 試 場 序 號 試 場 序 號 姓 名 A01 A02 A03 A04 A05 A06 A07 A08 A09 A10 A11 A12 A13 A14 A15 A16 張 齡 文 王 美 蕙 吳



报 告 简 要 丽 江 古 城 位 于 云 南 省 西 北 部, 始 建 于 宋 末 元 初 古 城 西 北 方 30 公 里 处 是 海 拔 5596 米 的 玉 龙 雪 山 及 第 四 世 冰 川 遗 迹 丽 江 古 城 在 南 宋 时 期 就 初 具 规 模, 已 有 八 九 百 年 的 历

有 不 良 企 图 时, 就 要 立 即 躲 开 他 当 你 实 在 难 以 分 辨 对 方 是 真 心 实 意 还 是 虚 情 假 意 时, 可 向 父 母 老 师 或 周 围 较 成 熟 和 亲 近 的 朋 友 请 教, 请 他 们 帮 你 分 析 情 况, 做 出 判 断 此 时, 拒 绝 帮

內 容 及 試 題 範 例 術 科 評 量 規 範 評 分 標 準 一 (, 工 具 與 材 料 由 本 校 提 供, 考 生 無 須 自 備 ) ( 一 ) 基 本 焊 接 工 具 操 作 及 辨 識 基 本 手 工 具 設 備 ( 二 ) 測 驗 時 間 50 分 鐘 ( 三 ) 工 具 與 材

2.??,,,,, ;,,,,,,,, 3.?,,?,?,

宜蘭縣風景區管理所五峰旗風景特定風景區開放行動咖啡車作業投標須知

第 二 十 七 章 一 夜 苦 熬 第 二 十 八 章 租 房 同 居 第 二 十 九 章 二 人 世 界 第 三 十 章 取 消 面 试 第 三 十 一 章 中 暑 卧 床 第 三 十 二 章 找 到 工 作 第

美 国 研 究

玻璃幕墙工程质量检验标准 JGJ/T

玻璃幕墙工程质量检验标准 JGJ/T

2

B 6 A A N A S A +V B B B +V 2

<4D F736F F F696E74202D20D7BFD4BDB9A4B3CCCAA6D6AE454441BCBCCAF5BCB0D3A6D3C3B5DA34BDB22E BBCE6C8DDC4A3CABD5D>

2/80 2

Gowin可配置功能单元(CFU)

Microsoft Word - LMB402CBC-AppNote-V0.1.doc

逢 甲 大 學

L18 CPU III

<4D F736F F D20BCAFB3C9B5E7C2B7D3EBD6C7C4DCCFB5CDB3B4B4D0C2BBF9B5D8B2E2CAD4CCE22E646F63>

第一章.doc

Microsoft PowerPoint - IC-HG-Review.ppt

Transcription:

Lecture 21: CPU - Datapath and Control 中央处理器 : 数据通路和控制器

singlepath2 单周期数据通路的设计 主要内容 CPU 的功能及其与计算机性能的关系 数据通路的位置 单周期数据通路的设计 数据通路的功能和实现 - 操作元件 ( 组合逻辑部件 ) - 状态 / 存储元件 ( 时序逻辑部件 ) 数据通路的定时 选择 MIPS 指令集的一个子集作为 CPU 的实现目标 下条指令地址计算与取指令部件 R 型指令的数据通路 访存指令的数据通路 立即数运算指令的数据通路 分支和跳转指令的数据通路 综合所有指令的数据通路

CPU 功能及其与计算机性能的关系 CPU 执行指令的过程 : - 取指令 - PC+1 送 PC - 指令译码 - 进行主存地址运算 - 取操作数 singlepath3 取指阶段 - 进行算术 / 逻辑运算 - 存结果 - 判断和检测 异常 事件 译码和执行阶段 - 若有异常, 则自动切换到异常处理程序 - 检测是否有 中断 请求, 有则转中断处理 CPU 的实现与计算机性能的关系 计算机性能 ( 程序执行快慢 ) 由三个关键因素决定 : - 指令数目 CPI 时钟周期 指令数目由编译器和指令集决定 时钟周期和 CPI 由 CPU 的实现来决定 因此,CPU 的设计与实现非常重要! 它直接影响计算机的性能 指令执行过程

组成指令功能的四种基本操作 每条指令的功能总是由以下四种基本操作来实现 : (1) 读取某一主存单元的内容, 并将其装入某个寄存器 ; (2) 把一个数据从某个寄存器存入给定的主存单元中 ; (3) 把一个数据从某个寄存器送到另一个寄存器或者 ALU; (4 进行某种算术运算或逻辑运算, 将结果送入某个寄存器 操作功能可形式化描述 描述语言称为寄存器传送语言 RTL (Register Transfer Language) 本章所用的 RTL 规定如下 : (1) 用 R[r] 表示寄存器 r 的内容 ; (2) 用 M[addr] 表示读取主存单元 addr 的内容 ; (3) 传送方向用 表示, 传送源在右, 传送目的在左 ; (4) 程序计数器 PC 直接用 PC 表示其内容 ; (5) 用 OP[data] 表示对数据 data 进行 OP 操作 singlepath4

CPU 基本组成原理图 指令寄存器 ----IR 程序计数器 ---PC 执行部件 CPU 由执行部件和控制部件组成 CPU 包含数据通路和控制器 singlepath5 控制部件控制器由指令译码器和控制信号形成部件组成

数据通路的位置 计算机的五大组成部分 : CPU Control Memory Input Datapath Output 什么是数据通路 (DataPath)? 指令执行过程中, 数据所经过的路径, 包括路径中的部件 它是它是指令的执行部件 控制器 (Control) 的功能是什么? 对指令进行译码, 生成指令对应的控制信号, 控制数据通路的动作 能对执行部件发出控制信号, 是指令的控制部件指令的控制部件 singlepath6

数据通路的基本结构 数据通路由两类部件组成 组合逻辑元件 ( 也称操作元件 ) 存储元件 ( 也称状态元件 ) 元件间的连接方式 总线连接方式 分散连接方式 数据通路如何构成? 由 操作元件 和 存储元件 通过总线方式或分散方式连接而成 数据通路的功能是什么? 进行数据存储 处理处理 传送 因此, 数据通路是由操作元件操作元件和存储元件存储元件通过总线方式或分散方式连接而成的进行数据存储 处理处理 传送的路径传送的路径 singlepath7

操作元件 : 组合逻辑电路 加法器 (Adder) 多路选择器 (MUX) A B A Select MUX Adder CarryIn Y B Sum Carry 加法器需要什么控制信号? 译码器 (Decoder) 3 Decoder 何时要用到 adder, ALU, MUX or Decoder? 控制信号 out0 out1 out2 out7 算逻部件 (ALU) A B OP ALU Result Zero 组合逻辑元件的特点 : 其输出只取决于当前的输入 即 : 输入一样, 其输出也一样 定时 : 所有输入到达后, 经过一定的逻辑门延时, 输出端改变, 并保持到下次改变, 不需要时钟信号来定时 singlepath8

状态元件 : 时序逻辑电路 状态 ( 存储 ) 元件的特点 : 具有存储功能, 在时钟控制下输入被写到电路中, 直到下个时钟到达 输入端状态由时钟决定何时被写入, 输出端状态随时可以读出 定时方式 : 规定信号何时写入状态元件或何时从状态元件读出 边沿触发 (edge-triggered) 方式 : - 状态单元中的值只在时钟边沿改变 每个时钟周期改变一次 上升沿 (rising edge) 触发 : 在时钟正跳变时进行读 / 写 下降沿 (falling edge) 触发 : 在时钟负跳变时进行读 / 写 falling edge cycle time rising edge 最简单的状态单元 ( 回顾 : 数字逻辑电路课程内容 ): D 触发器 : 一个时钟输入 一个状态输入 一个状态输出 singlepath9

存储元件中何时状态被改变? 这期间 D 的变化不影响 Q Q 总是在 clock-to-q 后跟着 D 变化 ( Latch Prop - 锁存延迟 ) 切记 : 状态单元的输入信息总是在一个时钟边沿到达后的 Clk-to-Q 时才被写入到单元中, 此时的输出才反映新的状态值数据通路中的状态元件有两种 : 寄存器 ( 组 ) + 存储器 singlepath10

存储元件 : 寄存器和寄存器组 寄存器 (Register) 有一个写使能 (Write Enable-WE) 信号 0: 时钟边沿到来时, 输出不变 1: 时钟边沿到来时, 输出开始变为输入 若每个时钟边沿都写入, 则不需 WE 信号 寄存器组 (Register File) 两个读口 ( 组合逻辑操作 ):busa 和 busb 分别由 RA 和 RB 给出地址 地址 RA 或 RB 有效后, 经一个 取数时间 (AccessTime),busA 和 busb 有效 一个写口 ( 时序逻辑操作 ): 写使能为 1 的情况下, 时钟边沿到来时,busW 传来的值开始被写入 RW 指定的寄存器中 Data In busw Clk Write Enable N Clk Data Out N Write Enable RW RA RB 5 5 5 -bit Registers busa busb singlepath11

寄存器组的内部结构 Write Enable RA RB RW 0 1 -to-1 Decoder 30 31 C D C D Register 0 Register 1 M U busa busw C D C D Register 30 Register 31 X Clk 每个寄存器由 个触发器组成 ; 输入数据来自 busw, 读出数据分别送 busa 和 busb; WriteEnable 信号控制是否写入新值 M U X busb singlepath12

存储元件 : 理想存储器 理想存储器 ( idealized memory ) Data Out: 位读出数据 Data In: 位写入数据 Address: 读写公用一个 位地址 Address Write Enable Data In DataOut 读操作 : 地址 Address 有效后, 经一个 取数时间 AccessTime,Data Out 上数据有效 写操作 : 写使能为 1 的情况下, 时钟 Clk 边沿到来时,Data In 传来的值开始被写入 Address 指定的存储单元中 Clk 为简化数据通路操作说明, 把存储器简化为带时钟信号 Clk 的理想模型 singlepath13

数据通路与时序控制 同步系统 (Synchronous system) 所有动作有专门时序信号来定时 由时序信号规定何时发出什么动作例如, 指令执行过程每一步都有控制信号控制, 由定时信号确定控制信号何时发出 作用时间多长 什么是时序信号? 同步系统用于同步控制的定时信号, 如时钟信号 什么叫指令周期? 取并执行一条指令的时间 每条指令的指令周期肯定一样吗? 早期计算机的三级时序系统 机器周期 - 节拍 - 脉冲 指令周期可分为取指令 读操作数读操作数 执行并写结果等多个基本工作周期, 称为机器周期 机器周期有取指令 存储器读存储器读 存储器写存储器写 中断响应等不同类型 singlepath14

数据通路与时序控制 现代计算机已不再采用三级时序系统, 机器周期的概念已逐渐消失 整个数据通路中的定时信号就是时钟, 一个时钟周期就是一个节拍 singlepath15

数据通路与时序控制 现代计算机的时钟周期 Clk Setup Hold 寄存器的输入可变化 Setup Hold 数据通路由 + 状态元件 + 操作元件 ( 组合电路 ) + 状态元件 + 组成 只有状态元件能存储信息, 所有操作元件都须从状态单元接收输入, 并将输出写入状态单元中 其输入为前一时钟生成的数据, 输出为当前时钟所用的数据 假定采用下降沿触发 ( 负跳变 ) 方式 ( 也可以是上升沿方式 ) 所有状态单元在下降沿写入信息, 经过 Latch Prop (clk-to-q) 后输出有效 Cycle Time = Latch Prop + Longest Delay Path + Setup + Clock Skew( 最大偏移 ) 约束条件 :(Latch Prop + Shortest Delay Path - Clock Skew) > Hold Time singlepath16 Clk Clk

早期累加器型指令系统数据通路 最简单的数据通路结构 取指令数据路径为 : PC MAR, Read M, M MBR IBR IR 取操作数 运算 送结果的数据路径为 : 操作数地址 MAR, Read M, M MBR ALU 输入端, AC ALU 输入端, ALU 操作, ALU 结果 MBR, Write M AC: 累加器 MQ: 乘商寄存器 PC IR ALU IBR MBR:? singlepath17 IAS 计算机 ( 冯 诺依曼等设计 ) 是现代计算机的原型

单总线数据通路 四种基本操作的时序 在通用寄存器之间传送数据 R0out,Yin 完成算术 逻辑运算 R1out,Yin R2out,Add,Zin Zout,R3in 从主存取字 R[R2] M[R[R1]] R1out,MARin Read, WMFC ( 等待 MFC) MDRout,R2in 写字到主存 M[R[R1]] R[R2] R1out,MARin R2out,MDRin, Write, WMFC CPU 访存有两种通信方式 早期 : 直接访问 MM, 异步 方式, 用 MFC 应答信号 ; 现在 : 先 Cache 后 MM, 同步 方式, 无需应答信号 singlepath18 Read/Write 时间更长, 故以此为准! 通用寄存器 OP: Add Sub And Or 等

三总线数据通路 单总线中一个时钟内只允许传一个数据, 因而指令执行效率很低 可采用多总线方式, 同时在多个总线上传送不同数据, 提高效率 例如 : 三总线数据通路 总线 A B 分别传送两个源操作数, 总线 C 传送结果 单总线中的暂存器 Y 和 Z 在此可取消, Why? 采用双口通用寄存器组 三个总线各自传不同数据, 不会发生冲突, 故无需 Y 和 Z 如何实现 : R[R3] R[R1] op R[R2] R1outA,R2outB,op,R3inC 只要一个时钟周期 ( 节拍 ) 即可! Y 通用寄存器组 Z 目前, 计算机大都采用流水线方式执行指令, 上述单总线或三总线数据通路很难实现指令流水执行 以下以 MIPS 指令系统为例介绍非总线式 CPU 的设计 singlepath19