VASP应用运行优化

Similar documents
热设计网

团 市 委 首 笔 爱 心 捐 款 及 物 资 已 送 至 芦 山 地 震 灾 区 : 近 日, 团 市 委 从 省 青 少 年 发 展 基 会 获 悉, 团 市 委 为 地 震 灾 区 募 集 的 首 笔 爱 心 捐 款 和 捐 赠 物 资 已 送 至 芦 山 地 震 灾 区 4 月 20 日,

Microsoft PowerPoint - CH 04 Techniques of Circuit Analysis

<4D F736F F D205F FB942A5CEA668B443C5E9BB73A740B5D8A4E5B8C9A552B1D0A7F75FA6BFB1A4ACFC2E646F63>

可 愛 的 動 物 小 五 雷 雅 理 第 一 次 小 六 甲 黃 駿 朗 今 年 暑 假 發 生 了 一 件 令 人 非 常 難 忘 的 事 情, 我 第 一 次 參 加 宿 營, 離 開 父 母, 自 己 照 顧 自 己, 出 發 前, 我 的 心 情 十 分 緊 張 當 到 達 目 的 地 後

A VALIDATION STUDY OF THE ACHIEVEMENT TEST OF TEACHING CHINESE AS THE SECOND LANGUAGE by Chen Wei A Thesis Submitted to the Graduate School and Colleg

Microsoft Word - 十月號.doc

99 學年度班群總介紹 第 370 期 班群總導 陳怡靜 G45 班群總導 陳怡靜(河馬) A 家 惠如 家浩 T 格 宜蓁 小 霖 怡 家 M 璇 均 蓁 雴 家 數學領域 珈玲 國燈 英領域 Kent

100學年度大學推甄申請面試題庫

202,., IEC1123 (1991), GB8051 (2002) [4, 5],., IEC1123,, : 1) IEC1123 N t ( ). P 0 = , P 1 = , (α, β) = (0.05, 0.05), N t = [4]. [6

國立中山大學學位論文典藏.PDF

Microsoft Word - TIP006SCH Uni-edit Writing Tip - Presentperfecttenseandpasttenseinyourintroduction readytopublish

《婚姻看法大全》

前 言 一 場 交 換 學 生 的 夢, 夢 想 不 只 是 敢 夢, 而 是 也 要 敢 去 實 踐 為 期 一 年 的 交 換 學 生 生 涯, 說 長 不 長, 說 短 不 短 再 長 的 路, 一 步 步 也 能 走 完 ; 再 短 的 路, 不 踏 出 起 步 就 無 法 到 達 這 次

Microsoft Word - A _ doc

Microsoft Word - 08_科普作品選讀示例一_ doc

Fun Time (1) What happens in memory? 1 i n t i ; 2 s h o r t j ; 3 double k ; 4 char c = a ; 5 i = 3; j = 2; 6 k = i j ; H.-T. Lin (NTU CSIE) Referenc

A dissertation for Master s degree Metro Indoor Coverage Systems Analysis And Design Author s Name: Sheng Hailiang speciality: Supervisor:Prof.Li Hui,

Microsoft Word - Final Exam Review Packet.docx

UDC The Policy Risk and Prevention in Chinese Securities Market


南華大學數位論文

<D0D0D5FED7A8CFDF2E696E6464>

高雄市左營國民小學八十九學年度第一學期一年級總體課程教學進度表

Japan He Bin Professor, School of Humanities and Social Sciences Tokyo Metropolitan University Abstract In daily life, the food on the table in the fa

4. 每 组 学 生 将 写 有 习 语 和 含 义 的 两 组 卡 片 分 别 洗 牌, 将 顺 序 打 乱, 然 后 将 两 组 卡 片 反 面 朝 上 置 于 课 桌 上 5. 学 生 依 次 从 两 组 卡 片 中 各 抽 取 一 张, 展 示 给 小 组 成 员, 并 大 声 朗 读 卡

目 感恩与代祷 录 编 者 1 牧者心声 勒住你的舌头 龚明鹏 3 见证与分享 我的见证 吴权伟 8 相信就能够看见 卓艳梅 12 再述主恩 爱的雕凿 张英治 19 万怡杉 28 母亲节征文 记念母亲节 凌励立 43 父母的爱和神的爱 曹 红 47 Love Lisa Wang 50

IP TCP/IP PC OS µclinux MPEG4 Blackfin DSP MPEG4 IP UDP Winsock I/O DirectShow Filter DirectShow MPEG4 µclinux TCP/IP IP COM, DirectShow I

Shanghai International Studies University THE STUDY AND PRACTICE OF SITUATIONAL LANGUAGE TEACHING OF ADVERB AT BEGINNING AND INTERMEDIATE LEVEL A Thes


\\Lhh\07-02\黑白\内页黑白1-16.p

Logitech Wireless Combo MK45 English

2. 佔 中 對 香 港 帶 來 以 下 影 響 : 正 面 影 響 - 喚 起 市 民 對 人 權 及 ( 專 制 ) 管 治 的 關 注 和 討 論 o 香 港 市 民 總 不 能 一 味 認 命, 接 受 以 後 受 制 於 中 央, 沒 有 機 會 選 出 心 中 的 理 想 特 首 o 一


TLLFDEC2013.indd

新竹市建華國民中學九十四學年度課程計畫

岳西职教中心

參 加 第 二 次 pesta 的 我, 在 是 次 交 流 營 上 除 了, 與 兩 年 沒 有 見 面 的 朋 友 再 次 相 聚, 加 深 友 誼 外, 更 獲 得 與 上 屆 不 同 的 體 驗 和 經 歴 比 較 起 香 港 和 馬 來 西 亞 的 活 動 模 式, 確 是 有 不 同 特

2006中國文學研究範本檔

國立中山大學學位論文典藏.PDF

高中英文科教師甄試心得

<4D F736F F D203338B4C12D42A448A4E5C3C0B34EC3FE2DAB65ABE1>

國立桃園高中96學年度新生始業輔導新生手冊目錄

096STUT DOC

<4D F736F F D203033BDD7A16DA576B04FA145A4ADABD2A5BBACF6A16EADBAB6C0ABD2A4A7B74EB8712E646F63>

自由軟體教學平台

穨6街舞對抗中正紀念堂_林伯勳張金鶚_.PDF

(Microsoft Word - 11-\261i\256m\253i.doc)

<4D F736F F D C4EAC0EDB9A4C0E04142BCB6D4C4B6C1C5D0B6CFC0FDCCE2BEABD1A15F325F2E646F63>


Microsoft Word - xb 牛尚鹏.doc

untitled


10 ( ) ( ) [5] 1978 : [1] (P13) [6] [1] (P217) [7] [1] (P19) : : [1] [4] (P1347) (P18) 1985 : [1] (P343) 1300 : [1] (P12) 1984 :

I

P4V88+_BIOS_CN.p65

國立中山大學論文典藏.PDF



ZHFX1302.mps

关于试行《高等学校从事有害健康工种人员营养保健等级和标准的暂行规定》的通知

课题调查对象:

《红楼梦》中茗烟与李贵的对比分析

2015年4月11日雅思阅读预测机经(新东方版)

建协质(2005)20号

%

多核心CPU成長日記.doc

《计算机应用基础》学习材料(讲义)


2-7.FIT)

学者一周观察

<4D F736F F D20A677AC57A4A4BEC7A470A4BBAE61AAF8B1DFB77CAE61AAF8B4A3B0DDAABAA65EC0B D31322D >

中華傳遁會安柱中學

101 年 全 國 高 職 學 生 實 務 專 題 製 作 競 賽 暨 成 果 展 報 告 書 題 目 :Beat CNN`s Report, 驚 艷 外 國 人 的 嘴 - 皮 蛋 之 大 改 造 指 導 老 師 : 林 佩 怡 參 賽 學 生 : 胡 雅 吟 楊 椀 惇 張 毓 津 許 巧 文

林教授2.PDF

南華大學數位論文

1對外華語文詞彙教學的策略研究_第三次印).doc

Untitiled


(2008) 主 张 教 师 在 课 文 教 学 中 应 让 学 生 有 意 识 地 注 意 语 块, 并 指 出 语 块 教 学 对 大 学 生 的 英 语 写 作 能 力 有 着 重 要 的 意 义 于 秀 莲 (2008) 以 大 学 生 为 受 试 对 象, 在 对 不 同 学 生 分 别

Untitled-3

國立中山大學學位論文典藏.PDF

*王心齋說得好:「天理者,」

hks298cover&back

瞿佑詞校勘輯佚及板本探究

编号:CEL——

6 月 18 日 上 午, 绿 叶 制 药 集 团 成 立 十 八 周 年 庆 典 暨 产 业 园 一 期 工 程 落 成 典 礼 在 烟 台 高 新 技 术 开 发 区 举 行, 烟 台 市 政 协 副 主 席 高 新 区 工 委 书 记 刘 洪 波, 区 工 委 副 书 记 管 委 常 务 副

Microsoft Word - ChiIndexofNHE-03.doc

PowerPoint Presentation

ch_code_infoaccess

untitled

Microsoft Word - D-2°w¶Ë¬ì¹ï¤U�Iµh®{¤âÀˬd¬yµ{_¬x°ö�×__P _.doc

Microsoft Word - ChineseSATII .doc

元代題畫女性詩歌研究

UTI (Urinary Tract Infection) - Traditional Chinese

<4D F736F F D20B2F8A74AA4AF5FA578C657A175BCC6A6ECB6D7AC79A176BB50A46AB3B0A175A454BAF4A658A440A176AC46B5A6A641B1B4>

Lorem ipsum dolor sit amet, consectetuer adipiscing elit

吴 郁 玲 等 : 农 户 对 宅 基 地 使 用 权 确 权 效 应 的 认 知 研 究 以 武 汉 市 为 例 29 the paper tried to provide a basis to improve the confirmation policy efficiency and to f

(Microsoft Word - \262\263\250\245\260\ _combined version-2)

The Belief in Monk Ji-Gong and His Temples in South Taiwan Chang Chung-Liang Lecturer, General Education Center, Tainan Woman s College of Arts Techno

Transcription:

1 VASP wszhang@ustc.edu.cn April 8, 2018 Contents 1 2 2 2 3 2 4 2 4.1........................................................ 2 4.2..................................................... 3 5 4 5.1.......................................................... 4 5.2.................................................... 5 6 6 6.1..................................................... 6 6.2........................................................ 6 7 7 7.1 E5V4.................................................... 7 7.2 NCORE.................................... 8 7.3 E5V3.................................................... 9 7.4 E3V5.................................................... 10 7.5 Fat144.................................................... 11 7.6 KNL ( )............................................. 12 7.7.............................................. 14

2 1 VASP VASP VASP VASP 2 VASP Geun Ho Gu, University of Delaware For the NPAR, I recommend doing a test to find out the most efficient number. e.g. run a same calculations multiple times with different NPAR. Also, do the same for LPLANE parameter as well. The manual instructs to use the number of node as NPAR as each parallel calculation can be run at each node minimizing communication overhead between each node. If not optimized, VASP takes extra time to comminucate between nodes, eating up your computation time. However, I have found that this instruction does not always hold up, and, really, this parameter is heavily dependent on the batch server/ node configuration. So, it is wise to do your own test to optimize this parameter (and other parameters as well). VASP 50% [1] VASP VASP VASP 3 ZrNCl KPOINTs Gamma 1. 18 Atoms (Zr6N6Cl6) 272 irreducible k-points 2. 221 71 Atoms (Zr24N24Cl23) 36 irreducible k-points 3. 221 71 Atoms (Zr24N24Cl23) Gamma point 4. 441 284 Atoms (Zr96N96Cl92) Gamma point 5. 661 630 Atoms (Zr96N96Cl92) Gamma point A18K272 A71K36 A71K1 A284K1 A630K1 K-points vasp_std Gamma kpoints VASP Gamma vasp_gam 4 4.1 :

3 SYSTEM = ZrNCl ISTART = 0 ISMEAR = 0 SIGMA = 0.4 ENCUT=400 PREC=Normal NELM = 5 NELMIN = 5 NELMDL = 0 ISYM = 1 EDIFF = 1E-7 LREAL = Auto LPLANE =.TRUE. KPAR = $KPAR # 1 2 4 8 16 default: 1 NCORE = $NCORE # 1 2 4 8 16 default: 1 #NPAR = $NPAR # 4 6 8 16 #NSIM = $NSIM # default:4 KPAR NPAR/NCORE KPAR KPOINT NCORE BAND CPU NPAR BAND NCORE NPAR 32 KPAR=4 NCORE=4, 4 KPOINTs KPOINT 8 KPOINT 4 CPU BAND 2 BAND KPOINT BAND VASP VASP NSIM ECUT 4.2 VASP TC4600 KPOINTs NPAR = 4 ~ approx SQRT( number of cores) For optimal performance we recommend to set NCORE = 4 - approx SQRT( number of cores) NCORE specifies how many cores store one orbital (NPAR=cpu/NCORE). This setting can greatly improve the performance of VASP for DFT. KPOINT NPAR = number of cores per compute node [2] 2 not recommend attempting run with KPAR>compute nodes, even though you may have more k-points than compute nodes. [3] E5V4 KPOINTs KPAR NCORE NPAR

4 [1] NPAR NCORE NCORE NPAR NCORE ( 4 E3V5 ) NCORE = 8 [4,16] VASP KPAR=1 & NCORE=1 E5V4-A18K272 E5V4-A71K36 24 64 256 128 10 630 E5V4-A630K1 256 384 354s 183s K NKpoints Natoms [3] KPOINT Natoms/2 KPOINTs 8-16 KPOINTs NKpoints KPOINTs NCORE NCORE BAND KPOINT BAND KPOINT BAND KPOINT KPAR KPOINT 1-2 BAND BAND 7.2 A18K272 KPAR 1 4 NCORE 8/7 130/124 40/28 7.2 A18K272 56 KPAR 1 NCORE 8 7 NCORE 7 NCORE 8 79% 72% 50s 254s 182s 5 5.1 Intel Xeon CPU ( E5V3/E5V4 E3V5 Fat144) Xeon Phi KNL ( All2All Cluster mode & Flat Memory Mode AF Mode Quadrant Cluster mode & Cache Memory Mode QC Mode) GPU GPU VASP & GPU [4] CPU (DDR4) E5V4 2*E5-2680 v4(2.4ghz-3.3ghz, 35MB L3 Cache) 28 128GB 2400MHz 240GB 100Gbps OPA E5V3 2*E5-2680 v3(2.5ghz-3.3ghz, 30MB L3 Cache) 24 64GB 2133MHz 300GB 56Gbps FDR E3V5 1*E3-1240 v5(3.5ghz-3.9ghz,8mb Cache) 4 32GB 2400MHz 500GB 100Gbps EDR Fat144 8*E7-8860 v4(2.2ghz-3.2ghz,45mb L3 Cache) 144 1TB 2400MHz 480GB 100Gbps OPA KNL-AF 1*Xeon Phi 7210(64 1.3GHz-1.5GHz 16 GB MCDRAM 96GB 2133MHz 160GB 100Gbps OPA AF Mode) KNL-QC 1*Xeon Phi 7210(64 1.3GHz-1.5GHz 16 GB MCDRAM QC Mode) 96GB 2133MHz 160GB 100Gbps OPA Table 1:

5 5.2 TC4600 E5V4 E5V3 10%-30% E5V4 E5V3 Cache/ OPA E5V4 A284K1 E5V4 E5V3 E3V5 E5V4 E3V5 E5V4 VASP 100Gbps E3V5 VASP E3V5 A18K272 128 E3V5 24s E5V4 31s KPAR x NCORE 1 x 16 E3V5 E5V4 E3V5 VASP A71K36 E3V5 96 E5V4 128 Gamma Only A284K1 128 E3V5 E5V4 36s/44s 128 96 0.86/0.77 E5V3 E5V4 Fat144 8 18 CPU 32~48 E5V4 VASP 7.5 64 Fat144 VASP E5V4 CPU CPU KNL 64 4 QC AF KNL 64 VASP AF 7.6 KNL3 A284K1 KNL25 A284K1 128 2 AF 64 VASP QC KNL E5V4 A18K272 120 90 E5V4 A284K1, 130 140 Intel 56 E5V4 KNL 3637: 1997 KNL KNL KNL KNL VASP KNL E5V4 KNL 7.7 7.1 A18K272 KNL 96 123s E5V4 256 22s A284K1 KNL 48 133s E5V4 96 52s KNL

6 6 6.1 Intel MKL Sequential/OpenMP ScaLAPACK Enable / Disable FFT implementation: Intel wrapper / Juergen Furtmueller (JF) DCACHE_SIZE 4000 / 0 V8: Intel MKL Sequential & Enable ScaLAPACK & Intel FFT & DCACHE_SIZE = 4000 3 V12 : JF FFT V14 : Disable ScaLAPACK V16 : DCACHE_SIZE = 0 V16 CACHE_SIZE=0 has a special meaning. It performs the FFT s in x and y direction plane by plane, abc cba z direction 6.2 V8 V12 Intel FFT JF FFT VASP 2/5 1/5 FFT VASP V8 V14 ScaLapack NP>24/28 V8 V16 VASP DCACHE_SIZE 0 V16 Z

7 7 7.1 E5V4 Figure 7.1: E5V4 5

8 7.2 NCORE Figure 7.2: E5V4 28 NCORE 3 A18K272 56 KPAR 1 NCORE 8 7

9 7.3 E5V3 Figure 7.3: E5V3

10 7.4 E3V5 Figure 7.4: E3V5

11 7.5 Fat144 Figure 7.5: Fat144

12 7.6 KNL ( ) Figure 7.6: KNL AF Mode KNL3 KNL3 128 KNL24 KNL2 KNL4 64

Figure 7.7: KNL QC Mode KNL6 KNL78 KNL678 KNL6 KNL7 KNL8 60 13

14 7.7 NELMDL Figure 7.8:

Figure 7.9: 多种编译选项与数学库测试结果 15

16 References [1] http://www.hector.ac.uk/support/documentation/software/vasp/ncore_and_npar_summary.pdf [2] https://cms.mpi.univie.ac.at/vasp/vasp/parallelisation_npar_ncore_lplane_kpar_tag.html [3] https://www.nsc.liu.se/~pla/blog/2015/01/12/vasp-how-many-cores/ [4] https://www.slideshare.net/jmskelton/vaspgpu-on-balena-usage-and-some-benchmarks