Achieving One TeraFLOPS with 28-nm FPGAs

Similar documents
Optical Transport Networks for 100G Implementation in FPGAs

Support All Industrial Ethernet Standards on Your Next "Drive" Design White Paper


前言



Python a p p l e b e a r c Fruit Animal a p p l e b e a r c 2-2

考 纲 解 读 14 浙 江 省 普 通 高 考 语 文 科 考 纲 研 读 吴 美 琴 今 年 的 考 试 说 明, 我 用 了 八 个 字 进 行 概 括, 那 就 是 稳 中 微 调, 关 注 生 活 稳 中 微 调 :14 年 的 语 文 考 试 说 明 是 近 几 年 来 调 整 幅 度








1

<4D F736F F D20CCABB1A3CAD9A3A A3A BAC5B8BDBCFE3836CAC0BCCDD0D0C8CBC9EDD2E2CDE2C9CBBAA6B1A3CFD5A3A843BFEEA3A9CCF5BFEE2E646F63>

Overcome Copper Limits with Optical Interfaces

<4D F736F F D20D0C5CFA2BBAFB7A2D5B9D6D8B5E3D7A8CFEEB9E6BBAE2E646F63>

关于建立境内违法互联网站黑名单管理制度的通知

? 這 全 都 是 市 政 府 提 供 給 我 的 資 料 低 底 盤 公 車 計 畫 96 年 預 算 新 台 幣 4,500 萬 元 97 年 預 算 新 台 幣 1 億 6,500 萬 元 98 年 預 算 新 台 幣 3 億 2,300 萬 元, 共 有 307 台 低 底 盤 公 車,99

CC213

她 氣 色 很 差 我 跟 她 打 了 兩 次 招 呼 她 才 回 我 這 樣 妳 去 打 個 電 話 給 她 看 看 她 現 在 人 在 哪 裡 好 資 料 應 該 在 這 裡 這 地 方 是 前 幾 天 不 是 怎 麼 了 在 找 什 麼 尹 小 姐 下 午 就 出 去 到 現 在 還 沒 回

2016 年 地 质 工 程 系 教 学 工 作 安 排 2016 学 年 我 系 将 在 总 结 过 去 工 作 的 基 础 上, 结 合 今 年 学 院 以 抓 质 量 强 内 涵 促 改 革 调 结 构 建 品 牌 细 管 理 重 过 程 为 宗 旨, 以 规 范 管 理 深 化 内 涵 为

<4D F736F F D203136BCADBBD8D2E4D3EBD1D0BEBF2E646F63>

萧山中学课程建设方案.doc


Microsoft Word - 9pinggb_A4.doc

Microsoft Word - 9pinggb_A4-f4.doc

理 论 探 索 事 业 单 位 改 革 的 五 点 思 考 余 路 [ 摘 要 ] 事 业 单 位 改 革 是 中 国 改 革 的 重 要 环 节, 其 影 响 力 和 难 度 不 亚 于 国 有 企 业 改 革 本 文 着 重 围 绕 推 进 事 业 单 位 改 革 应 考 虑 的 五 个 方 面

日 本 位 于 亚 洲 东 部, 太 平 洋 西 北 角, 是 我 国 东 方 的 一 个 岛 国 在 洪 积 世 ( 注 1) 的 大 部 分 时 期 内, 日 本 与 大 陆 相 连 大 约 在 洪 积 世 晚 期 至 冲 积 世 ( 注 2) 初 期, 日 本 各 地 发 生 海 进, 出 现

2深化教育教学改革、创新人才培养模式


Microsoft Word - 9pinggb_let.doc

实 习 上 下 点 表 格 解 释 和 相 关 纪 律 要 求 : 1 表 格 中 所 有 名 词 都 为 简 称, 包 括 医 院 名 称 四 年 级 五 年 级 各 专 业 名 称 等 所 有 时 间 都 为 学 生 装 好 行 李 出 发 时 间, 请 提 前 0 分 钟 将 行 李 运 到

3 基 金 杠 杆 从 分 级 基 金 的 概 念, 我 们 知 道 了 分 级 基 金 的 A 份 额 是 每 年 获 得 固 定 收 益 的 稳 健 份 额,B 份 额 是 具 有 杠 杆 效 应 的 激 进 份 额 分 级 基 金 中 的 杠 杆 一 般 有 三 类 : 份 额 杠 杆 =(A

简报158期.doc

Microsoft Word - 9pingb5_let.doc

退休權益.ppt [相容模式]

Microsoft Word - 1.《國文》試題評析.doc

Ps22Pdf

$%%& ()*+, %&, %-&&%%,. $ %,, $,, & /$- 0(1 $%%& %& 234 %-%, 5&%6&633 & 3%%, 3-%, %643 -%%% :::; 7<9; %-%, 3$%$ :::;

# $# #!# # # # # # # %# # # &# # # # #! "

zt

untitled

四川省普通高等学校

untitled

下 篇 男 性 酷 刑 太 監 考 第 四 章 太 監 名 目 何 其 多 第 五 章 太 監 恢 復 性 機 能

第 一 百 一 十 条 增 加 药 品 适 应 症 或 者 功 能 主 治 修 改 药 品 标 准 变 更 辅 料 等 的 补 充 申 请, 由 省 自 治 区 直 辖 市 药 品 监 督 管 理 局 提 出 审 核 意 见, 报 送 国 家 药 品 监 督 管 理 局 审 批, 并 通 知 申 请

图 片 展 示 : 资 源 简 介 : FPGA Altera CycloneII EP2C5T144C8 (4608 个 LE) 2 路 有 源 晶 振 (50M,25M) AS & JTAG 标 准 接 口 VGA 接 口 UART 接 口 蜂 鸣 器 8bit 并 行 DAC 8 路 按 键

<4D F736F F D20A5F1A4FBA473A6DBA662C149AE76BB50B0A8AFAAB944A440AC78A67BA976C149BEC7ABE4B751AABAB56FAE692E646F63>


彩圖 6 彩圖 7 彩圖 8 3

第 二 章 古 代 慢 慢 睁 开 眼 睛, 我 的 面 前 出 现 一 个 女 孩 子, 大 约 十 六 七 岁, 身 穿 淡 绿 色 布 裙, 头 上 两 个 小 圆 髻 特 别 娇 俏 可 爱 医 院 什 么 时 候 出 现 这 么 一 个 可 爱 的 古 装 护 士 啊! 这 医 院 真 有

Microsoft Word - 095_ 什麼最快樂 (白話與經文加註)-ok .doc

逢甲大學



untitled

<4D F736F F D DB0AAA4A4BDD2B57BBCC6BEC7ACECA2DFA1AEA2CF2E646F63>

Microsoft Word - å�¦ä¹€å¿…å¾Šå’‹éłƒï¼‹å®ı稿;(.doc

国家测绘局政府网站

项目背景

项目背景

前程_ _MK04_行銷企劃_西式膠裝424p

目錄- doc

105年度全國檢定學科試務工作行政委託甄選文件

附件1:



ATMEL AT90S8515 AVR CPU AVR AVR AVR ATMEL RISC 32 8 r0 r X Y Z R0 R1 R2 R13 R14 R15 R16 R17 R26 R27 R28 R29 R30 R31 0x00 0x


7 FPGA 99 VGA FPGA Nios II Nios II Fig 1 Block diagram of video tracking system CMOS FPGA 1 FPGA SOPC Nios II CMOS RGB SDRAM Avalon Nios

按 系 统 提 示 完 成 安 装 并 生 成 交 易 图 标, 双 击 图 标 即 可 运 行 金 阳 光 独 立 委 托 系 统 通 讯 设 置 按 钮 中 行 情 地 址 交 易 地 址 高 级 设 置, 其 中 行 情 地 址 交 易 地 址 可 以 分 别 用 来 设 置 服 务 器 地

4. 27(2) ,000,000 1,000,000,

<3935BCC6A5D2C1CDB6D52E747066>


5 132, ,838 (43,899) (49,366) 88,858 93, ,432 17,810 (21,294) (18,163) (11,976) (10,216) (6,806) (3,551) 74,214 79,352 6(a) (31) (1,620)

教育情境中的情緒管理成長社群

办函[2004]号

圍城劇本最終版

TDS5000B MyScope MyScope MyScope MyScope TDS5000B TDS5000B (DPO 1 GHz 5 GS/s 16M DPO MyScope TDS5000B TDS5000B DPO DPX 100,000 DPX DPO 2

A 20%

TDS5000B MyScope MyScope MyScope MyScope TDS5000B TDS5000B (DPO 1 GHz 5 GS/s 16M DPO MyScope TDS5000B TDS5000B DPO DPX 100,000 DPX DPO 2

,, : ;,,, (CIP) /. :, 005. ISBN TB301 CIP (005) : : 17, : : ( 09 ) : : : 787 mm1 09 mm 1/ 16 : 5.75

untitled

lim f(x) lim g(x) 0, lim f(x) g(x),

院 責 任 制 使 命 交 付 凝 聚 共 識 新 任 主 管 佈 達 祈 福 派 遣 菲 律 賓 Holy Name University 校 長 參 訪 與 輔 大 簽 訂 姊 妹 校 合 約 本 報 訊 為 落 實 天 主 教 大 學 精 神, 積 極 面 對 以 院 為 責 任 中 心 之

C Ann.indd

Microsoft Word - 孙洪祥论文.doc

为 边 数 的 两 倍, 显 然 必 为 偶 数 而 ii 和 iii 则 不 一 定 正 确, 如 : 对 顶 点 数 N 1 无 向 完 全 图 不 存 在 一 个 顶 点 的 度 为 1, 并 且 边 数 与 顶 点 数 的 差 要 大 于 1 8. 考 查 m 阶 B- 树 的 定 义 A

384 : FPGA O-QPSK O-QPSK Fig.1 ProcessofO-QPSK modulationanddemodulation 3 O-QPSK FPGA d Iout d Q Indarrange clk d arrange 20 nsclr

(1) C

考 研 数 学 三 部 曲 之 大 话 高 等 数 学 0. 考 研 数 学 高 等 数 学 部 分 其 实 就 是 一 座 大 楼 房 间 80 房 间 80 第 八 层 房 间 80 房 间 804 房 间 805 房 间 70 房 间 70 房 间 70 第 七 层 房 间 704 房 间 7

:,,,, ( CIP ) /,. :, ISBN CIP ( 2001) : : 127, : : : ht t p: / / www. nwpup. com : :

KT-SOPCx开发套件简明教程

α 2

,,, PCB, AR M VxWorks DSP,,,,,,,,,,, (CIP) /,,.:,2005 ISBN TP36 CIP (2005) : ( 10 ) : : (010 ) : (010)


Transcription:

28nm FPGA TeraFLOPS WP011421.0 DSP 101 Innovation Drive San Jose, CA 95134 www.altera.com 2010 Altera ALTERA ARRIA CYCLONE HARDCOPY MAX MEGACORE NIOS QUARTUS STRATIX Altera www.altera.com/common/legal.html Altera Altera Altera Altera Altera Altera 2010 9 Altera

2 FPGA 4500 4000 4096 3500 3000 2500 2000 1500 1000 500 0 3.2X 2048 1288 896 1.4X 6.4X 512 322 224 89 128 4X 1.4X EP3SE110 EP4SGX230 EP5SGSD8 18x18 Multipliers SinglePrecision FloatingPoint Multipliers DoublePrecision FloatingPoint Multipliers FPGA 28nm FPGA TeraFLOPS 2010 9 Altera

FPGA 3 +/ Mantissa1 Mantissa2 Exponent1 Exponent2 +/ +/ Slightly largerwider operands Denormalize Normalize True floatingpoint mantissa (not just 1.0 1.99..) +/ +/ Remove Normalization Mantissa Exponent Do not apply special or error conditions here 2010 9 Altera 28nm FPGA TeraFLOPS

4 / 8x8 32x32 64x64 128x128 E SD F 57.60 9.40 5.33 2.29 459.18 44.30 36.94 7.60 E HD F 10.38 2.73 1.65 1.27 47.10 10.36 7.36 5.33 2 z n + 1 = z n + c e (c) x single (c) Square 2 double (c) + c mag Mag double 4 C1 a a>=b b CmpGE boolean 1 single (c) x single (c) Square double (c) 2 point + 3 nz 20 Maxlter a a>=b b CmpGE1 boolean l Finished boolean 4 exit 1 qpoint 3 count + int16 2 1 qcount Maxlter1 Coord2 28nm FPGA TeraFLOPS 2010 9 Altera

5 Math.h SIN POW(x,y) COS LDEXP TAN FLOOR ASIN CEIL ACOS F ATAN SQRT EXP DIVIDE LOG 1/SQRT LOG10 LU QR 2010 9 Altera 28nm FPGA TeraFLOPS

6 1TeraFLOPS 1TeraFLOPS +/ Mantissa1 Mantissa2 Exponent1 Exponent2 27 18 +/ +/ Slightly largerwider operands 64 Accum Denormalize True floatingpoint mantissa (not just 1.0 1.99..) +/ Normalize +/ Remove Normalization Mantissa Exponent Do not apply special or error conditions here 18x18, 27x27, 36x36 seamless tradeoff Greatly increased multiplier density High fmax with logic and routing reductions FPGA 703K (LE) 282K (ALM) 574K (ALUT) 1128K 4096 ( 18x18 ) 2048 ( 27x27 ) 55Mb RAM ( 20k ) 28nm FPGA TeraFLOPS 2010 9 Altera

GFLOP 7 ( f MAX ALMs DSP M9K M144K MemBits ) GFLOPS 8x8 8x8 8 3,367 32 26 14,986 420 209 6.30 16x16 16x16 8 3,585 32 27 55,562 421 611 6.32 32x32 32x32 16 6,301 64 76 339,718 419 2,172 13.00 64x64 64x64 32 11,822 128 80 16 2,382,318 388 8,353 24.45 64 ALUT 13.4K 21.6K 16.4K 28.9K GFLOP 2010 9 Altera 28nm FPGA TeraFLOPS

8 IP IP 13.4K ALUT = 127 = 49 GFLOPS 574 / 13.4 = 43 43 49 GFLOPS = 2107 GFLOPS 16.4K = 127 = 49 GLOPS 1128 / 16.4 = 69 69 49 GFLOPS = 3381 GFLOPS 64 (27x27) 2048 / 64 = 32 32 49 GFLOPS = 1568 GFLOPS = 100% = 75% = 46% 28nm FPGA TeraFLOPS 2010 9 Altera

IP 9 2010 9 Altera 28nm FPGA TeraFLOPS

10 Stratix IV EP4SGX530 406,465 424,960 96 ALUT 308,521 424,960 73 Reg 294,579 424,960 69 M9K 1,280 1,280 100 M144K 64 64 100 DSP 18 896 1,024 88 f MAX 222.72 MHz 4.5977 µs ( 0.3284 µs) Stratix IV EP4SGX530 300,000 424,960 70 ALUT 224,000 424,960 53 Reg 210,000 424,960 49 M9K 1,280 1,280 100 M144K 64 64 100 DSP 18 896 1,024 88 f MAX 300+ MHz 3.4 µs ( 0.24 µs) 28nm FPGA TeraFLOPS 2010 9 Altera

11 1. Altera www.altera.com/products/ip/dsp/arithmetic/maltfloatpoint.html 2. 7542008 IEEE http://ieeexplore.ieee.org 3. Suleyman S. Demirsoy and Martin Langhammer, Fused Datapath Floating Point Implementation of Cholesky Decomposition, Proceedings of the ACM/SIGDA International Symposium on Field Programmable Gate Arrays, February 22 24, 2009: http://portal.acm.org/dl.cfm Michael Parker DSP IP Altera 2010 9 1.0 2010 9 Altera 28nm FPGA TeraFLOPS