(science demonstration phase) 2 2 l = 30 b = 0 l = 59 b = 0 5 PACS 70 µm 160 µm SPIRE 250 µm 350 µm 500 µm Hi-GAL GPU 2 GPU 3 GPU GPU

Similar documents
Microsoft Word 定版

2 ( 自 然 科 学 版 ) 第 20 卷 波 ). 这 种 压 缩 波 空 气 必 然 有 一 部 分 要 绕 流 到 车 身 两 端 的 环 状 空 间 中, 形 成 与 列 车 运 行 方 向 相 反 的 空 气 流 动. 在 列 车 尾 部, 会 产 生 低 于 大 气 压 的 空 气 流

1 引言

1 VLBI VLBI 2 32 MHz 2 Gbps X J VLBI [3] CDAS IVS [4,5] CDAS MHz, 16 MHz, 8 MHz, 4 MHz, 2 MHz [6] CDAS VLBI CDAS 2 CDAS CDAS 5 2

VLBI2010 [2] 1 mm EOP VLBI VLBI [3 5] VLBI h [6 11] VLBI VLBI VLBI VLBI VLBI GPS GPS ( ) [12] VLBI 10 m VLBI 65 m [13,14] (referen

untitled

θ 1 = φ n -n 2 2 n AR n φ i = 0 1 = a t - θ θ m a t-m 3 3 m MA m 1. 2 ρ k = R k /R 0 5 Akaike ρ k 1 AIC = n ln δ 2

MHz 10 MHz Mbps 1 C 2(a) 4 GHz MHz 56 Msps 70 MHz 70 MHz 23 MHz 14 MHz 23 MHz 2(b)

F4

Vol. 22 No. 4 JOURNAL OF HARBIN UNIVERSITY OF SCIENCE AND TECHNOLOGY Aug GPS,,, : km, 2. 51, , ; ; ; ; DOI: 10.

Vol. 15 No. 1 JOURNAL OF HARBIN UNIVERSITY OF SCIENCE AND TECHNOLOGY Feb O21 A

Microsoft Word - ED-774.docx

,, [1 ], [223 ] :, 1) :, 2) :,,, 3) :,, ( ),, [ 6 ],,, [ 3,728 ], ; [9222 ], ;,,() ;, : (1) ; (2),,,,, [23224 ] ; 2,, x y,,, x y R, ( ),,, :

Microsoft Word - A doc

E T 0 = γ 0 = 1 + R γ = nσ n nσ n ΔT 2 i - Σ n ΔT i T Pi - Σ n Σ n

km km mm km m /s hpa 500 hpa E N 41 N 37 N 121

Microsoft Word - 1--齐继峰_new_.doc

CH01.indd

~ ~ ~

N E LaCoste ±7 µgal ±10 µgal (1 Gal = 0.01 m/s 2 ) Kringe [8] ξ η = 1 2π

物理学报 Acta Phys. Sin. Vol. 62, No. 14 (2013) 叠 [4]. PET 设备最重要的部件就是探测器环, 探测 备重建图像具有减少数据插值的优势. 器环的性能直接影响 PET 的成像能力. 探头与探头 之间得到的符合直线叫做投影线. 所有的投影线在

1 119 Clark 1951 Martin Harvey a 2003b km 2

untitled

Microsoft Word - 专论综述1.doc

Chinese Journal of Applied Probability and Statistics Vol.25 No.4 Aug (,, ;,, ) (,, ) 应用概率统计 版权所有, Zhang (2002). λ q(t)

11 25 stable state. These conclusions were basically consistent with the analysis results of the multi - stage landslide in loess area with the Monte

为 止, 以 集 中 式 光 伏 发 电 系 统 为 主, 其 主 要 原 因 是 我 国 政 策 推 动 方 面 以 国 家 主 导 为 主, 这 种 自 上 而 下 的 政 策 和 运 行 方 式, 更 容 易 迅 速 推 动 集 中 式 光 伏 系 统 的 建 设 集 中 式 光 伏 发 电

[1] Nielsen [2]. Richardson [3] Baldock [4] 0.22 mm 0.32 mm Richardson Zaki. [5-6] mm [7] 1 mm. [8] [9] 5 mm 50 mm [10] [11] [12] -- 40% 50%

1 GIS 95 Y = F y + (1 F) (1) 0 0 Y0 kg/hm 2 /day F y 0 y c kg/hm 2 /day [12] y m 20 kg/hm 2 /hour Y = cl cn ch G [ F( y ) T m yo + (2) (1 F)(

[1-3] (Smile) [4] 808 nm (CW) W 1 50% 1 W 1 W Fig.1 Thermal design of semiconductor laser vertical stack ; Ansys 20 bar ; bar 2 25 Fig


(1) ( 1965 ),, 1952 [9] 2.1 (2) 1 53 (E i ), 2 (P i ) (G E (G P, 31 (Q i ) 3, : G E (x,y)= (E i Q(x i, y i )) E i G P (x,y)=

, [3 ] Petri, 25 7, 500, [4,5 ], 3, (2), 2003, [ 6 ],,, ,, [7 ], 569, 26, ( ) : 2 ; 3 ; 4, ; 5, : (a) ( ) :,,

1556 地 理 科 学 进 展 30 卷 他 关 于 农 村 住 房 结 构 与 抗 震 性 能 的 研 究, 则 多 是 从 工 程 抗 灾 的 角 度, 研 究 某 种 构 造 类 型 的 房 屋, 力 图 找 到 传 统 房 屋 的 结 构 失 误 和 新 建 房 屋 中 存 在 的 问 [

Microsoft Word - A _ doc

标题

2005 3,? :; ;, ;,,,,,,1 % %,,,,, 1 %,,,, : () ;, ;,,,,,,,,,,,,, (2004) ( GBΠT ) 16 (2004), (2004) 47

/MPa / kg m - 3 /MPa /MPa 2. 1E ~ 56 ANSYS 6 Hz (a) 一阶垂向弯曲 (b) 一阶侧向弯曲 (c) 一阶扭转 (d) 二阶侧向弯曲 (e) 二阶垂向弯曲 (f) 弯扭组合 2 6 Hz


Microsoft Word doc

mm 400 mm 15 mm EOF mm/10a Fig. 1 Distributions

Z-I A b Z-I A b Z Z-I A A b Z-I Miller [5] Z i I i Z-I [6] Z-I Z-I Z-I Z-I Z I Wilson [7] 1970 [8] [9] 20.32% Sasaki [10] Nino- miya [11] [12]

host society. Unlike other specialized guild organizations or political institution the ethnic Chinese associations in the Netherlands exhibit a multi

~ ~

by industrial structure evolution from 1952 to 2007 and its influence effect was first acceleration and then deceleration second the effects of indust

IP TCP/IP PC OS µclinux MPEG4 Blackfin DSP MPEG4 IP UDP Winsock I/O DirectShow Filter DirectShow MPEG4 µclinux TCP/IP IP COM, DirectShow I

Outline Speech Signals Processing Dual-Tone Multifrequency Signal Detection 云南大学滇池学院课程 : 数字信号处理 Applications of Digital Signal Processing 2

z

1 BDS GNSS GNSS BDS [1] [2] BDS (GEO) (IGSO) (MEO) GEO MEO BDS BDS ICD (Interface Control Document) [2] [2, 3] GPS WAAS (Wide Area Augme

Fig. 1 1 a-a b-b a-a σ ma = MPa σ a = MPa σ 0a = MPa 0. 9 σ t =135 MPa b-b σ mb = MPa τ b = MPa σ 0b =

,2(1) 基 礎 上, 各 種 數 據 均 以 圖 形 化 方 式 表 達, 因 此 各 級 分 析 結 果 均 可 以 隨 時 檢 驗 另 外, 由 於 系 統 是 以 網 站 形 式 發 佈, 任 何 用 戶 均 可 通 過 網 絡 查 詢 瀏 覽 系 統 中 的 數 據, 因

输电线路智能监测系统通信技术应用研究

Microsoft Word - 2.v3n1.gjtm.docx

11 : 1345,,. Feuillebois [6]. Richard Mochel [7]. Tabakova [8],.,..,. Hindmarsh [9],,,,,. Wang [10],, (80 µm),.,. Isao [11]. Ismail Salinas [12],. Kaw

Microsoft PowerPoint - Performance Analysis of Video Streaming over LTE using.pptx

中国的知识分子与民间(社会)

护理10期.indd

《嵌入式系统设计》教学大纲

%

2/80 2

WTO

<4D F736F F D BFC6BCBCB9A4D7F7C4EAB1A82D FD0DEB8B4B5C45F2E646F63>

( ) [11 13 ] 2 211,,, : (1),, 1990 ( ) ( ),, ; OD, ( ) ( ) ; , ( ), (2) 50 %,, 1999 ( ) ( ) ; (3),,

a a a 1. 4 Izumi et al Izumi & Bigelow b

111 OF

Fig. 1 1 The sketch for forced lead shear damper mm 45 mm 4 mm 200 mm 25 mm 2 mm mm Table 2 The energy dissip

successful and it testified the validity of the designing and construction of the excavation engineering in soft soil. Key words subway tunnel

第 37 卷 第 5 期 自 然 论 坛 亿, 相 当 于 总 人 口 的 1/4; 到 2050 年, 比 重 将 达 到 1/3, 相 当 于 三 个 人 中 就 有 一 个 老 年 人 2013 年 上 海 市 60 岁 及 以 上 老 年 人 口 为 万 人, 占 总 人 口

(Pattern Recognition) 1 1. CCD

1 科 学 谋 划, 有 序 促 进 扶 贫 工 作 的 持 续 发 展 1.1 科 学 定 位, 精 准 发 现 地 方 的 需 求 按 照 国 家 生 态 功 能 区 的 划 分, 库 伦 旗 属 重 点 生 态 保 护 开 发 区 这 里 生 态 环 境 优 良 特 色 作 物 资 源 优 势

續論

2013_6_3.indd

United Nations ~ ~ % 2010

标题

Microsoft Word - 19王建华.doc

72 (2001) group waves. Key words: Correlation coefficient for consecutive wave heights, mean run length (1993) (1996) (1998) (1999) (1993) (

The Development of Color Constancy and Calibration System

《红楼梦》中茗烟与李贵的对比分析

3 : 505.,,,,,,,,,, 21 [1,2 ] , 21,, 21,, : [3 ]. 1. 3,, 10, 2 ( ),,, ; ; 40, [4 ]. 46, : (1),, (2) 16,,,,, (3) 17, (4) 18,, (5) 19,, (6) 20

Corporate Social Responsibility CSR CSR CSR 1 2 ~ CSR 6 CSR 7 CSR 8 CSR 9 10 ~ CSR 14 CSR CSR 2013 A A 23.

标题


< F63756D656E D2D796E2DB9A4D7F72D31C6DABFAF2D31D6D0D2BDD2A9CFD6B4FABBAF2D C4EA2DB5DA35C6DA2D30352D31302DC1C9C4FEBBF9B5D82DB8BEB6F9B2A12E6D6469>

戊 酸 雌 二 醇 片 联 合 宫 颈 注 射 利 多 卡 因 用 于 绝 经 后 妇 女 取 环 的 临 床 效 果 评 价 陆 琴 芬, 等 371 Keywords groups, no removal difficulties and failure, was statistically s

SWAN min TITAN Thunder Identification Tracking Analysis SWAN TITAN and Nowcasting 19 TREC Tracking Radar Echo by Correlaction T

0896-电力信息与系统通信-02期.indb

coverage2.ppt

132 包 装 工 程 2016 年 5 月 网 产 品 生 命 周 期 是 否 有 与 传 统 产 品 生 命 周 期 曲 线 相 关 的 类 似 趋 势 旨 在 抛 砖 引 玉, 引 起 大 家 对 相 关 问 题 的 重 视, 并 为 进 一 步 研 究 处 于 不 同 阶 段 的 互 联 网

Microsoft Word - 33-p skyd8.doc

: ;,, 0 0, 60, 0 80,, 76 78, (Deregulation),,,, (Open Sky), (ACI),006.%.8%,.7% 008,, 000, ( ), ( )0, / 6, ; 8, ;, ; 7, ; 06, 6, 006 0, ( ) 0,.%; 0 60,

Microsoft Word doc

國立中山大學學位論文典藏.PDF

IT 36% Computer Science Teachers Association, CSTA K K-12 CSTA K-12 K-12 K-6 K6-9 K STEM STEM STEM

VLBI VLBI VLBI (Annual Review of Astronomy and Astrophysics, ARA&A) 20 (Fermi bubble) (active galactic nuclei, AGN) AGN AGN X BL Lac

Anthropology in My Imagination An Interview wit h Ant hropologist s (37) XU Jie2shun, WAN G Ming2ming ( Guan g x i U ni versit y f or N ationalities,

Microsoft Word - 体育学刊2009年12期.doc

3 : 121,, [1 ] (Stage Theory),,,,,,, 1 :, ;,,,,, 1 :11, 6,116 ; , 2003 ; 31 = Π ; 2, 1996 ;1996,,2000, Walt Rostow (1960, 1971), A. F. K. Organ

90.1% 70% 95% % 24,0006,3003% 30% Livermore 2

交流活动

Microsoft Word - 4期中文目次.doc

Transcription:

31 4 Vol. 31, No. 4 2013 11 PROGRESS IN ASTRONOMY Nov., 2013 doi: 10.3969/j.issn.1000-8349.2013.04.05 GPU 1,2 1 ( 1. 100012 2. 100049 ) (GPU) GPU GPU GPU GPU CUDA PyOpenCL GPU GPU GPU N37 P141.91 A 1 (graphics processing unit GPU) GPU (NVIDIA) CPU GPU NVIDIA AMD CPU GPU GPU CPU NVIDIA Tesla C2075 448 1030 Gflops CPU GPU Hi-GAL [1] (Herschel infrared Galactic Plane Survey) SDP 2013-05-20 2013-06-26 (KJCX2-YW-T20)

470 31 (science demonstration phase) 2 2 l = 30 b = 0 l = 59 b = 0 5 PACS 70 µm 160 µm SPIRE 250 µm 350 µm 500 µm 10 5 10 6 Hi-GAL GPU 2 GPU 3 GPU GPU GPU 2 GPU GPU GPU NVIDIA CUDA (Compute Unified Device Architecture) GPU CUDA C C++ C GPU CUDA [2] CUDA NVIDIA GPU GPU OpenCL [3] (Open Computing Language) NVIDIA AMD IBM Intel OpenCL OpenCL OpenCL GPU CPU CUDA OpenCL C CUDA OpenCL [2, 3] (1) CPU ( host code) (2) GPU (kernel) CUDA CPU GPU (thread) (block) OpenCL (work item) (work group) (ID) GPU GPU GPU 3 GPU Hi-GAL GPU CUDA C

4 GPU 471 PyOpenCL (OpenCL Python ) GPU GPU 3.1 GPU 3.1.1 ( 0.01 µm) 50 µm [4] Hi-GAL CPU Hi-GAL l = 30 4 PACS 160 µm SPIRE 250 µm 350 µm 500 µm SPIRE 500 µm 313 917 GPU 3.1.2 GPU CLOUDY [5] GPU CUDA C 3 (1) CPU (2) CPU GPU CPU GPU CPU (3) GPU GPU CPU 1 /* GPU */ global static void pixels(float *gpudata,float *res) { long which; const int tid=threadidx.x;/* ID*/ const int bid=blockidx.x;/* ID*/

472 31 /* */ for(which=bid*threads_num+tid;which<line; which+=threads_num*block_num){ /* CPU */... } } /*CPU */ main() { /* */... /* GPU */... /* GPU */ cudamalloc((void**) &gpudata, sizeof(float)*width*line); cudamemcpy2d(gpudata, sizeof(float)*width, sed30, sizeof(float)*width,sizeof(float)*width, LINE, cudamemcpyhosttodevice);... /* GPU <<<...>>> GPU */ pixels<<<block_num,threads_num,parameters>>>(gpudata, res); /* GPU CPU */ cudamemcpy2d(result, sizeof(float)*width, res, sizeof(float)*width, sizeof(float)*width, LINE, cudamemcpydevicetohost);... } 1

4 GPU 473 3.1.3 GPU 87 500 NVIDIA GeForce 9400M IDL7.1 CPU (Xeon E5620 1 ) 34 h GPU (NVIDIA GeForce 9400M) 0.5 h 68 ( 1) NVIDIA GeForce 9400M GPU GPU CPU IDL7.1 CPU (Xeon E5620 1 ) 1000 45 s l = 30 827 h CUDA NVIDIA Tesla C2075 GPU 9 min 4 5513 ( 2) 1 CPU GPU (t/min) CPU(Xeon E5620 1 ) 2040 68 GPU(NVIDIA GeForce 9400M) 30 2 CPU GPU (t/min) CPU(Xeon E5620 1 ) 49620 5513 GPU(NVIDIA Tesla C2075) 9 1 2 GPU GPU 2 NVIDIA Tesla C2075 GPU l = 30 [6] 2 l = 30

474 31 3.2 GPU 3.2.1 Hi-GAL 10 pc 10 pc 10 pc 10 pc (spherical coordinates) (r, θ, φ) (d, π/2 b, l) d l b GRS [7] 100 pc 0.2 0.2 l = 30 4493 ( ) GPU CPU 100 pc 0.2 0.2 CPU (Xeon E5620 1 ) Python 2.7 6.8 min Hi-GAL 500 µm ( 0.01 ) CPU ( ) CPU GPU 3.2.2 GPU CPU CPU CPU GPU GPU 3 NVIDIA Tesla C2075 GPU 0.043 s (20 000 ) GPU 95% CPU 9535 ( 3) GPU GPU 10 5

4 GPU 475 3 3 CPU GPU (t/s) CPU(Xeon E5620 1 ) 410 GPU 0.043 9535 PyOpenCL GPU PyOpenCL Python Python OpenCL OpenCL GPU CUDA C PyOpenCL [8] (i, j, k) 0 i<max(i) 0 j<max( j) 0 k<max(k) MAX(i) MAX( j) MAX(k) GPU (500 pc, 0.4, 0.6 ) (5, 2, 3)

476 31 3.2.3 CPU GPU CPU GPU CPU GPU GPU (1) GPU CPU (2) GPU CPU GPU GPU GPU 3.3 GPU [3] (1) CPU GPU (2) (Local Memory) (Global Memory) GPU GPU NVIDIA Tesla C2075 GPU K20m GPU 0.1 s 4 4 K20m GPU C2075 GPU 40% GPU C2075 GPU 1024, 1024 64 GPU 2000 GPU 1000 GPU 1000 1000 GPU GPU GPU CPU GPU GPU GPU GPU GPU GPU

4 GPU 477 4 K20m C2075 (t/s) K20m C2075 K20m/C2075 20 000 0.027 0.043 63% 200 000 0.029 0.049 59% 4 GPU GPU GPU CPU GPU CPU GPU GPU GPU GPU Rainer Spurzem Peter Berczik Peter Schwekendiek NVIDIA Tesla K20m GPU [1] Molinari S, et al. A& A, 2010, 518: L100 [2] NVIDIA Corporation. NVIDIA CUDA C Programming Guide version 4.2, http://wwwteor.mi.infn.it/ vicini/cuda/doc/ CUDA_C_Programming_Guide.pdf, 2012 [3] Advanced Micro Devices, Inc. AMD Accelerated Parallel Processing OpenCL Programming Guide, http://www. primeval-slayer.com/amd-accelerated-parallel-processing-opencl-programming-guide/read/41855/, 2012 [4] Draine B T. ARA&A, 2003, 41: 241 [5] Ferland G J, Korista K T, Verner D A, et al. PASP, 1998, 110: 761 [6] Zhu J L, Huang M. 2013, in preparation [7] Roman-Duval J, Jackson J M, Heyer M, et al. ApJ, 2009, 699: 1153 [8] Andreas K. PyOpenCL documentation, http://documen.tician.de/pyopencl/, 2013

478 31 Applying GPU Parallel Computing Technologies to Process Herschel Far Infrared Galactic Plane Survey Data ZHU Jia-li 1,2, HUANG Mao-hai 1 ( 1. National Astronomical Observatories, Chinese Academy of Sciences, Beijing 100012, China; 2. University of Chinese Academy of Sciences, Beijing 100049, China ) Abstract: The Hi-GAL (Herschel infrared Galactic Plane Survey) images provide data with extraordinary spatial coverage and resolution for studying the FIR emission in the Galactic Plane. Graphics processing unit (GPU) parallel computing technologies are well suitable for accelerating processing and mining of this massive data. We illustrate the application of GPU parallel computing technologies in two examples of Hi-GAL data processing. We spare the unnecessary physical details and focus on the method of using GPU in Herschel infrared data processing. In the first example, we demonstrate a simple and straightforward application of GPU parallel computing technologies by fitting the far-infrared spectral energy distribution of the dust continuum emission in the Hi-GAL l = 30 field. There are over 3 10 5 pixels in image of the l = 30 field. The fitting procedure for every pixel is performed in parallel by a GPU. Comparing the time-cost for fitting the entire image, the acceleration factor of the build-in GPU on a low performance laptop is 68, and a specialized GPU is 5513 times faster than a Xeon E5620 with one core. In the second example, we demonstrate a more sophisticated application of GPU parallel computing technologies. Based on the Hi-GAL l = 30 field data, the distribution of molecular clouds derived from GRS (Galactic Ring Survey) data, and the properties of H II regions, we construct a 3D model of the interstellar medium to calculate the absorption of dust grains associated with molecular clouds. The resolution of the 3D model is 100 pc 0.2 0.2 for a spherical grid. For this resolution, there are 4493 cells in total responsible for absorbing FUV photons. The absorption of these cells is calculated in parallel by a GPU. The resulted absorption is then compared with observations using Monte Carlo fitting method. In every iteration, CPU samples the free parameters and computes the goodness of fitting. The GPU part of the calculation is 95% of the total time. Comparing the time-cost for one iteration, NVIDIA C2075 GPU is 9535 times as fast as a Xeon E5620. Key words: GPU; parallel computing; Hi-GAL; data analysis