Microsoft PowerPoint - aspdac_presentation_yizhu

Similar documents
12 Differential Low-Power 6x6 12 bit multiply 1

34 7 S R θ Z θ Z R A B C D PTP θ t 0 = θ 0 θ t 0 = 0 θ t 0 = 0 θ t = θ θ t = 0 θ t = 0 θ t V max θ t a max 3 θ t A θ t t 0 t / V max a max A = 3 4 S S

Microsoft PowerPoint - Aqua-Sim.pptx

(baking powder) 1 ( ) ( ) 1 10g g (two level design, D-optimal) 32 1/2 fraction Two Level Fractional Factorial Design D-Optimal D

3 9 1 V α = R s + pl α pl αβ α - snθ r + ωλ m V pl β αβ R s + plβ β cosθ r 1 V λ L α β α β R s p ω λ m θ r 3 V αs s 8 N /S V αs p λ α s λ β λ α λ 5 -

Microsoft Word - 004王皓 doc

SC-106T simply manual.cdr

untitled

热设计网


BC04 Module_antenna__ doc

Force-Velocty Relatonshp of Vscous Dampers F D C u& sgn ( u& ) Lne : F D C N V, Nonlnear Damper wth < Lne : F D C L V, Lnear Damper Lnear Vscous Dampe

基于词语关联度的查询缩略*

基于VC++6.0和数据库的案例推理认知引擎

标题

SVM [6] PCA+SVM 79.75% 9 FERE FERE. PCA LDA Adaboost SVM 5 1 SVM Moghaddam [6] M (x,y ) x R N y x y {0,1} M f ( x) = y α k( x, x ) + b x k f(x) = 1 x

UDC Empirical Researches on Pricing of Corporate Bonds with Macro Factors 厦门大学博硕士论文摘要库

ENGG1410-F Tutorial 6

「當前賦稅改革重點」相關問題研析 - 國家政策研究基金會

CMOS线性响应测试

三维网格模型的骨架抽取

Microsoft Word - HC20138_2010.doc

DOI /j.cnki.cjhd MPS,,, , MLParticle-SJTU MLParticle-SJTU MLParticle-SJTU U661.1 A Numerical

目 录

24 26,,,,,,,,, Nsho [7] Nakadokoro [8],,,, 2 (Tradtonal estmaton of mage Jacoban matrx), f(t 1 ) p(t 2 ) : f(t 1 ) = [f 1 (t 1 ), f 2 (t 1 ),, f m (t

Microsoft Word - 11-秦华伟.doc

UDC 厦门大学博硕士论文摘要库

Huawei Technologies Co

% % % % % % % % : 11. 9: 12. 8:

Microsoft PowerPoint - talk8.ppt

穨_1_.PDF

标题

目 录 一 重 要 提 示... 3 二 公 司 主 要 财 务 数 据 和 股 东 变 化... 3 三 重 要 事 项... 8 四 附 录 / 28

System Design and Setup of a Robot to Pass over Steps Abstract In the research, one special type of robots that can pass over steps is designed and se

主报告

Microsoft PowerPoint - ryz_030708_pwo.ppt

論文集29-1_前6P.indd

z x / +/- < >< >< >< >< > 3 b10x b10x 0~9,a~f,A~F, 0~9,a~f,A~F, x,x,z,z,?,_ x,x,z,z,?,_ h H 0~9,_ 0~9,_ d D 0~7,x,X,z,Z

C/C++ - 字符输入输出和字符确认

Abstract After over ten years development, Chinese securities market has experienced from nothing to something, from small to large and the course of

Microsoft PowerPoint - STU_EC_Ch08.ppt


Chapter 24 DC Battery Sizing

穨control.PDF

循环经济发展战略及近期行动计划⤊⽃牥慴楯湄慴攠⡄㨲〱㌰㈲㘲㈵㌵㘫〸✰〧⤊⽐牯摵捥爠⡐䑆汩戠㜮〮㌠⡃⬫⽗楮㌲�

C doc

Rotary Switch Catalogue

JOURNAL OF EARTHQUAKE ENGINEERING AND ENGINEERING VIBRATION Vol. 31 No. 6 Dec

"航海王"人物人格特質探究doc

第一章

國家圖書館典藏電子全文

SHIMPO_表1-表4

untitled

41 10 Vol. 41, No ACTA AUTOMATICA SINICA October, ,, (Least square support vector machines, LS-SVM)., LS-SVM,,,, ;,,, ;,. DOI,,,,,

2 : 237.,. [6 7] (Markov chan Monte Carlo, MCMC). MCMC, [8 9].,,, [0 ].,, : ),,,.,, ; 2),,.,.,. : ),.,,. ; 2),.,,. ; 3), EM, EM,.,, EM, EM. K M,.,. A

PowerPoint Presentation

Tokyo Tech Template

TFP TFP HK TFP Hseh Klenow HK 9 8 TFP Aok TFP Aok 10 TFP TFP TFP TFP TFP HK TFP 1 Y Y CES θ Y 1 TFP HK θ = 1 θ

C/C++程序设计 - 字符串与格式化输入/输出

WTO

COCO18-DensePose-BUPT-PRIV

On Macro-Planning for China s English Education from Elementary to Tertiary Levels in the Era of Globalization MEI Deming ZHAO Meijuan Abstract This p

20

Medium induced modified Fragmentation Function for Multiple Parton Scattering

<4D F736F F D20CCABB1A3CAD9A3A A3A BAC5B8BDBCFE3836CAC0BCCDD0D0C8CBC9EDD2E2CDE2C9CBBAA6B1A3CFD5A3A843BFEEA3A9CCF5BFEE2E646F63>

ebook105-12



untitled

Microsoft Word - 系统建设1.doc

第三章 国内外小组合作学习的应用情况

中文模板


參 加 第 二 次 pesta 的 我, 在 是 次 交 流 營 上 除 了, 與 兩 年 沒 有 見 面 的 朋 友 再 次 相 聚, 加 深 友 誼 外, 更 獲 得 與 上 屆 不 同 的 體 驗 和 經 歴 比 較 起 香 港 和 馬 來 西 亞 的 活 動 模 式, 確 是 有 不 同 特

Microsoft Word - 2B802內文.doc

東區校園中法治教育種子師資教學研習營

閱 讀 素 材 V.S 分 組 方 式 的 差 異 化 教 學 工 具 表 班 級 :( ) 閱 讀 素 材 V.S 分 組 方 式 獨 立 閱 讀 夥 伴 閱 讀 ( 同 質 性 ) 夥 伴 閱 讀 ( 異 質 性 ) 友 善 陪 伴 虛 心 受 教 國 語 日 報 新 聞 生 活 文 藝 兒 童

Microsoft Word - 1HF12序.doc

Microsoft Word - 讀報看科普─人體篇_橫_.doc

鍟嗗搧瑙傚療鈥㈤挗鏉

席 远 杨 一 人 了, 正 当 她 开 枪 时 却 发 现 子 弹 没 了 该 死, 只 能 赤 手 空 拳 了 洛 水 云 与 席 远 杨 交 起 手 来, 洛 水 云 出 手 招 招 致 命 想 那 席 远 杨 也 不 是 泛 泛 之 辈, 很 快 掌 握 了 洛 水 云 出 招 路 数 看

股票代码: 股票简称: 海润光伏

中 醫 診 斷 蒐 集 資 訊 - 望 聞 問 切 邏 輯 推 斷 - 辨 證 論 治


by industrial structure evolution from 1952 to 2007 and its influence effect was first acceleration and then deceleration second the effects of indust

T e = K 1 Φ m I 2 cosθ K 1 Φ m I cosθ 2 1 T 12 e Φ / 13 m I 4 2 Φ m Φ m 14 I 2 Φ m I 2 15 dq0 T e = K 2 ΦI a 2 16

國家圖書館典藏電子全文

由社會發展趨勢探討國人睡眠品質

untitled

% % 34

國家圖書館典藏電子全文

000

156 ( ) [2] [ 3 ] [ 4 ] [5] [6] 1747 [ 7 ] ( ) [ 8 ] [2] 12 [3] [4] [5] [6] [7] [


WFC40810

2

<4D F736F F D20BEDBC9B3B3C9CBFEA1AAA1AAC9CCBDADBDCCD3FDCEC4BCAF20A3A8D6D0A3A92E646F63>

Cube20S small, speedy, safe Eextremely modular Up to 64 modules per bus node Quick reaction time: up to 20 µs Cube20S A new Member of the Cube Family

城 乡 建 设 亩 在 此 基 础 上, 上 报 纳 入 增 减 挂 钩 试 点 管 理 使 用 先 行 复 垦 建 设 用 地 指 标 用 地 17 个 批 次, 上 报 用 地 总 面 积 6792 亩 ( 农 用 地 6095 亩 ), 其 中 : 市 本 级 上 报 3 个

SHIMPO_表1-表4

里 再 说 吓 唬 了 孩 子, 肯 定 方 宁 不 忍 所 以 她 不 死 便 罢, 倘 若 死, 只 有 到 办 公 室 沈 若 鱼 冷 静 得 好 像 在 评 点 某 一 电 视 剧 中 的 女 主 角 你 说 她 是 怎 么 死 的? 先 生 又 感 惊 骇 吃 安 眠 药 沈 若 鱼 成

Transcription:

Tmng-Power Optmzaton for Mxed-Radx Lng Adders by Integer Lnear Programmng Y Zhu Janhua Lu Haun Zhu and Chung-Kuan Cheng Department of Computer Scence & Engneerng Unversty of Calforna San Dego

Outlne Prefx Adder Problem Bacground & Prevous Wor Extensons Hgh-radx Lng Our Wor Area/Tmng/Power Models ILP Formulaton Expermental Results Future Wor 2

Bnary Addton Input two n-bt bnary numbers 0 and b n... bb one bt carry-n c 0 0 Output n-bt sum s... s s n 0 and one bt carry out c n Prefx Addton Carry generaton & propagaton Generate Propagate c + s g c g p + p ( a a b a b c b ) a n... a a 3

4 Prefx Addton Formulaton b a p a b g Preprocessng Postprocessng Prefx Computaton c p s c P G c + + 0 0 0 P P P G P G G +

Prefx Adder Prefx Structure Graph 4 3 2 a b gp gp generator Preprocessng GP GP - Prefx Computaton GP GP cell G 0 s p 4 3 2 Postprocessng sum generator 5

Hgh-Radx Adders Each cell has more than two fan-n s Pros less logc levels 6 levels (radx-2) vs. 3 levels (radx-4) for 64-bt addton Cons larger delay and power n each cell 6

Radx-3 Slansy & Kogge- Stone Adder Davd Harrs Logcal Effort of Hgher Valency Adders 7

8 Lng Adders b a p a b g Preprocessng Postprocessng Prefx Computaton c p s c P G c + 0 0 0 P P P G P G G + Prefx Lng ( ) * 0 * 0 + p d G d G s b a p a b g * * + + p p P g g G * 2 * * * G P G G + * 2 * * P P P * 0 G p c

An 8-bt Lng Adder 8 7 6 5 4 3 2 H 8 H 7 H 6 H 5 H 4 H 3 H 2 H 9

An 8-bt Lng Adder 8 7 6 5 4 3 2 H 8 H 7 H 6 H 5 H 4 H 3 H 2 H 0

Area Model Dstngush physcal placement from logcal structure but eep the bt-slce structure. Logcal level Bt poston Bt poston 8 7 6 5 4 3 2 8 7 6 5 4 3 2 Physcal level Logcal vew Physcal vew Compact placement

Tmng Model Cell delay calculaton d f + Effort Delay p Intrnsc Delay f g h Logcal Effort Electrcal Effort Cout/Cn (fanouts+wrelength) / sze Intrnsc propertes of the cell 2

Power Model Total power consumpton Dynamc power + Statc Power Statc power leaage current of devce P sta λ*#cells Dynamc power current swtchng capactance P dyn ρ C load ρ s the swtchng probablty ρ ( s the logcal level*) Ptotal Pdyn+ Psta Cload + λ # cells * Vanchayobon S etc Power-speed Trade-off n Parallel Prefx Crcuts 3

ILP Formulaton Overvew Structure varables GP cells Connectons (wres) Physcal postons Capactance varables Gate cap Vertcal wre cap Horzontal wre cap Power Obectve ILP ILOG CPLEX Tmng varables Input arrval tme Output arrval tme Optmal Soluton 4

Integer Lnear Programmng (ILP) ILP Lnear Programmng wth nteger varables. Dffcultes and technques Constrants are not lnear Lnearze usng pseudo lnear constrants Search Space too large Reduce search space Search s slow Add redundant constrants to speedup 5

6 Lnearzaton ) ( ) ( R h L h y y ) ( ) ( R l L l y y ) 2 2 ( 2) 2 ( R l L l y y ) ( ) ( R L y y f ) ( ) ( + (l) wr wl(h) y y L l R h f ) ( ) ( ) ( + wl(h) l wr y l R h ) ( ) ( ) ( + wl(h)) ( n l wr y l R h ) ( ) ( ) ( + + wl(h)) ( n l wr y l R h y L ) ( Lnearze Pseudo Lnear

Search Space Reducton Lng s adder separate odd and even bts Double the bt-wdth we are able to search 7

Redundant Constrants Cell () s nown to have logc level before wre connecton Assume load s MnLoad (fanout wth mnmum wre length) P ( ) MnLoad +λ Cell () has a path of length - Assume each cell along the path has MnLoad T ( ) ( PD+ LE MnLoad) 8

Experments 6-bt Unform Tmng 9

Mn-Power Radx-2 Adder 6 5 4 3 2 0 9 8 7 6 5 4 3 2 6 5 4 3 2 0 9 8 7 6 5 4 3 2 20

Mn-Power Radx-2&4 Adder 6 5 4 3 2 0 9 8 7 6 5 4 3 2 6 5 4 3 2 0 9 8 7 6 5 4 3 2 Radx-2 Cell Radx-4 Cell 2

Mn-Power Mxed-Radx Adder 6 5 4 3 2 0 9 8 7 6 5 4 3 2 6 5 4 3 2 0 9 8 7 6 5 4 3 2 Radx-2 Cell Radx-3 Cell Radx-4 Cell 22

Experments 6-bt Non-unform Tme ILP s able to handle non-unform tmngs Lng adders are most superor n ncreasng arrval tme faster carres 23

Experments 64-bt Herarchcal Structure Handle hgh bt-wdth applcatons 6x4 and 8x8 a 64 b 64 a 49 b 49 a 48 b 48 a 33 b 33 a 32 b 32 a 7 b 7 a 6 b 6............ a b Level ILP Bloc ILP Bloc ILP Bloc ILP Bloc... GP* 4949... GP* 3333... GP* 77... GP* GP* 6450 GP* 4834 GP* 328 GP* 62 Level 2 ILP Bloc..................... H 64 H 49 H 48 H 33 H 32 H 7 H 6 H 24

Experments 64-bt Herarchcal Structure TSL a 64-bt hgh-radx three-stage Lng adder V. Olobdza and B. Zeydel Energy-Delay Characterstcs of CMOS Adders n Hgh-Performance Energy-Effcent Mcroprocessor Desgn pp. 47-70 2006 25

ASIC Implementaton - Results 64-bt herarchcal desgn by ILP vs. fast carry loo-ahead adder by Synopsys Module Compler TSMC 90nm standard cell lbrary was used Method Area (nm 2 ) Delay (ns) Power (mw) MC 352.0644 5.47 ILP 3833 0.9425 2.54 ILP 3636 0.9607 2.353 ILP 34.278.973 26

Future Wor ILP formulaton mprovement Expected to handle 32 or 64 bt applcatons wthout herarchcal scheme Optmzng other computer arthmetc modules Comparator Multpler 27

Q & A Than You! 28

Prevous Wors Classcal prefx 8 7 adders 6 5 4 3 2 8 7 6 5 4 3 2 8 7 6 5 4 3 2 8 7 6 5 4 3 2 Brent-Kung Logcal levels 2log 2 n Max fanouts 2 Wre tracs 8 7 6 5 4 3 Slansy Logcal levels log 2 n Max fanouts n/2 Wre tracs 2 8 7 6 5 4 3 Kogge-Stone Logcal levels log 2 n Max fanouts 2 Wre tracs n/2 2 29

Experments 6-bt Unform Tmng (CPU Tme) CPU Tme for Optmal Lng Adders 00000 0000 CPU (sec) 000 00 0 Radx-2 Lng Radx-2&4 Lng Mxed-Radx Lng 5 0 5 20 25 Delay Smaller Delay Const -> Less accurate of LP 30

ASIC Implementaton ILP Formulaton ILOG CPLEX Optmal Soluton Synthess Program Power Prme Power TSMC 90nm Standard Cell Lbrary Verlog Fle Physcal Compler Placement Astro Routng Tmng Analyss Verlog Fle Module Compler Area Delay 3