Vol.39 No. 8 August 2017 Hyeonwoo Noh [4] boundng box PASCALV VOC PASCAL VOC Ctyscapes bt 8 bt 1 14 bt

Similar documents
Microsoft Word - 系统建设1.doc

Microsoft Word - A doc

2 北 京 邮 电 大 学 学 报 第 35 卷 习 一 个 认 知 模 型, 从 而 解 决 在 不 同 特 征 空 间 进 行 知 识 迁 移 的 问 题. 特 征 迁 移 问 题 一 般 被 归 为 直 推 式 迁 移 学 习 [6], 其 定 义 为 : 给 定 源 数 据 空 间 D s

RPN 2 DeepParts 22 part pool 2 3 HOG 12 LBP 13 Harr - like 15 DPM 16 Deformable Parts Model VGG16 X. Wang 14 VGG Convolutiona

24 26,,,,,,,,, Nsho [7] Nakadokoro [8],,,, 2 (Tradtonal estmaton of mage Jacoban matrx), f(t 1 ) p(t 2 ) : f(t 1 ) = [f 1 (t 1 ), f 2 (t 1 ),, f m (t

基于词语关联度的查询缩略*

SVM [6] PCA+SVM 79.75% 9 FERE FERE. PCA LDA Adaboost SVM 5 1 SVM Moghaddam [6] M (x,y ) x R N y x y {0,1} M f ( x) = y α k( x, x ) + b x k f(x) = 1 x

Microsoft Word 战玉丽C.doc

中文模板

1 引言

报 告 1: 郑 斌 教 授, 美 国 俄 克 拉 荷 马 大 学 医 学 图 像 特 征 分 析 与 癌 症 风 险 评 估 方 法 摘 要 : 准 确 的 评 估 癌 症 近 期 发 病 风 险 和 预 后 或 者 治 疗 效 果 是 发 展 和 建 立 精 准 医 学 的 一 个 重 要 前

T e = K 1 Φ m I 2 cosθ K 1 Φ m I cosθ 2 1 T 12 e Φ / 13 m I 4 2 Φ m Φ m 14 I 2 Φ m I 2 15 dq0 T e = K 2 ΦI a 2 16

Microsoft PowerPoint - Aqua-Sim.pptx

2 : 237.,. [6 7] (Markov chan Monte Carlo, MCMC). MCMC, [8 9].,,, [0 ].,, : ),,,.,, ; 2),,.,.,. : ),.,,. ; 2),.,,. ; 3), EM, EM,.,, EM, EM. K M,.,. A

SVM OA 1 SVM MLP Tab 1 1 Drug feature data quantization table

F3

Microsoft Word - 专论综述1.doc

作为市场化的人口流动

acl2017_linguistically-regularized-lstm-MinlieHuang

Microsoft Word - T 田新广.doc

中文模板

Microsoft Word - 11-王思明_oee180008_xeQzyx.doc

Microsoft Word - A _ doc

untitled

untitled

PowerPoint 演示文稿

(Pattern Recognition) 1 1. CCD

Microsoft Word - 004王皓 doc

untitled

P(x,y) P(x-1,y) P(x,y-1) P(x,y+1) P(x+1,y) Sobel LaplacePrewittRoberts Sobel [2] Sobel [6] 0 1 1: P(x,y) t (4-connectivity) 2: P(x,y) t 3:

标题

附件4

85% NCEP CFS 10 CFS CFS BP BP BP ~ 15 d CFS BP r - 1 r CFS 2. 1 CFS 10% 50% 3 d CFS Cli

(2002) Gartner Group Toelle and Tersine(1989) VMI (1998) (VMI,Vender-Managed Inventory) (2003) (VMI,Vender-Managed Inventory) VMI AHP VMI - 133

2 ( 自 然 科 学 版 ) 第 20 卷 波 ). 这 种 压 缩 波 空 气 必 然 有 一 部 分 要 绕 流 到 车 身 两 端 的 环 状 空 间 中, 形 成 与 列 车 运 行 方 向 相 反 的 空 气 流 动. 在 列 车 尾 部, 会 产 生 低 于 大 气 压 的 空 气 流

彩色地图中道路的识别和提取

穨_1_.PDF

标题

目 录 一 重 要 提 示... 3 二 公 司 主 要 财 务 数 据 和 股 东 变 化... 3 三 重 要 事 项... 8 四 附 录 / 28

國立中山大學學位論文典藏.PDF

74 14 PWM 1 PWM L a I a I a R a E a = U a 1 PID 2 3 T e = J D θ K D θ T M 2 fuzzy cerebellar model artculaton controller FCMAC E a = K e θ 3 T

标题

中文模板

,, 2,,,,,,,,, S7-400 PLC, F M mm ;, AGC 6 mm ;,, 3 AGC AFC ( ) ( ), I/O ET 200M, PROFIBUS-DP S7 400 PLC 1 S7-400 PLC ( HMI) ET200M, PROFIBUS

國立台灣大學圖書資訊學系四十週年系慶學術研討會論文格式

I ln I V = α + ηln + εt, 1 V t, t, t, 1 t, 1 I V η η >0 t η η <0 η =0 22 A_,B_,C0_,C1_,C2_,C3_,C4_,C5_,C6_,C7_,C8_,C99_,D_,E_,F_,G_,H_,I_,J_,K_,L_,M_

标题

34 7 S R θ Z θ Z R A B C D PTP θ t 0 = θ 0 θ t 0 = 0 θ t 0 = 0 θ t = θ θ t = 0 θ t = 0 θ t V max θ t a max 3 θ t A θ t t 0 t / V max a max A = 3 4 S S

COCO18-DensePose-BUPT-PRIV

PCA+LDA 14 1 PEN mL mL mL 16 DJX-AB DJ X AB DJ2 -YS % PEN

2013_6_3.indd

小论文草稿2_邓瀚

/3 CAD JPG GIS CAD GIS GIS 1 a CAD CAD CAD GIS GIS ArcGIS 9. x 10 1 b 1112 CAD GIS 1 c R2VArcscan CAD MapGIS CAD 1 d CAD U

Microsoft Word - 11-秦华伟.doc

<4D F736F F D BD75A457B943C0B8A5C7B86FBCD2A6A1A4C0AA52A4A7B9EAC3D2ACE3A8732E646F63>

普 通 高 等 教 育 十 二 五 重 点 规 划 教 材 计 算 机 系 列 中 国 科 学 院 教 材 建 设 专 家 委 员 会 十 二 五 规 划 教 材 操 作 系 统 戴 仕 明 姚 昌 顺 主 编 姜 华 张 希 伟 副 主 编 郑 尚 志 梁 宝 华 参 编 参 编 周 进 钱 进

Microsoft Word - sbs.doc

穨423.PDF

Microsoft Word 中的文档

2 3. 1,,,.,., CAD,,,. : 1) :, 1,,. ; 2) :,, ; 3) :,; 4) : Fig. 1 Flowchart of generation and application of 3D2digital2building 2 :.. 3 : 1) :,

OncidiumGower Ramsey ) 2 1(CK1) 2(CK2) 1(T1) 2(T2) ( ) CK1 43 (A 44.2 ) CK2 66 (A 48.5 ) T1 40 (

142 B iotechnology B u lletin DNA DNA, DNA DNA [ 15 ] APS2, DNA, AFM [ 16 ] DNA, 3 DNA, DNA AFM,, [ 17 ] AFM DNA,, DNA [ 18 ] DNA, DNA, (

,,.,, : 1),,,,, 2),,,,, 3),,,,,,,,,, [6].,,, ( ),, [9], : 1), 2),,,,, 3),,, 2.,, [10].,,,,,,,,, [11]. 2.1,, [12],, ;, ; Fig. 1 1 Granular hier

标题

私募基金合同

Abtract I th paper, referece to the Europea food afety evaluato ytem o the ba of combed wth Cha' atoal codto, put forward the overall deg cheme of a e

~ ~

GeologicalScienceandTechnologyInformation Vol.36 No.4 Jul doi: /j.cnki.dzkq ,,. [J].,2017,36(4): , 2 2, (1.

《红楼梦》中茗烟与李贵的对比分析

双 语 教 学 之 中 综 上 所 述, 科 大 讯 飞 畅 言 交 互 式 多 媒 体 教 学 系 统, 围 绕 语 音 核 心 技 术 的 研 究 与 创 新, 取 得 了 一 系 列 自 主 产 权 并 达 到 国 际 领 先 水 平 的 技 术 成 果, 同 时 获 得 发 明 专 利 3

上海地区进出口饲料和饲料添加剂经营单位备案名单

專題報告交版.doc

cm /s c d 1 /40 1 /4 1 / / / /m /Hz /kn / kn m ~

填 表 说 明 1. 本 表 用 钢 笔 填 写, 也 可 直 接 打 印, 不 要 以 剪 贴 代 填 字 迹 要 求 清 楚 工 整 2. 本 表 所 填 内 容 必 须 真 实 可 靠, 如 发 现 虚 假 信 息, 将 取 消 所 在 学 院 参 评 资 格 3. 本 表 涉 及 的 项 目

京都大学防災研究所年報 第56号(平成24年度)

壹:教育文化公益慈善機關或團體免納所得稅適用標準

中文核心期刊目录

34 www. cjig. cn wavelet transform 1 2 JPEG LIVE E s o = 1 T Σ log 2 C s o + 1 E T C s o Lu Wen contourlet C 0 7 N

论文集10.12.doc

Vol. 36 ( 2016 ) No. 6 J. of Math. (PRC) HS, (, ) :. HS,. HS. : ; HS ; ; Nesterov MR(2010) : 90C05; 65K05 : O221.1 : A : (2016)

,.,,.. :,, ,:, ( 1 ). Π,.,.,,,.,.,. 1 : Π Π,. 212,. : 1)..,. 2). :, ;,,,;,. 3

untitled

2011年上海市高校精品课程申报表(本科)

1 GIS 95 Y = F y + (1 F) (1) 0 0 Y0 kg/hm 2 /day F y 0 y c kg/hm 2 /day [12] y m 20 kg/hm 2 /hour Y = cl cn ch G [ F( y ) T m yo + (2) (1 F)(

59 1 CSpace 2 CSpace CSpace URL CSpace 1 CSpace URL 2 Lucene 3 ID 4 ID Web 1. 2 CSpace LireSolr 3 LireSolr 3 Web LireSolr ID

MHz 10 MHz Mbps 1 C 2(a) 4 GHz MHz 56 Msps 70 MHz 70 MHz 23 MHz 14 MHz 23 MHz 2(b)

376 36, Kalman,.,,.,. 2,,,,. 2)., ( 2).. Mean shft. ( ) ( ),.,,,,.,,,,,,,.,,.,,.,,,,.,. Elgammal [16], ( ),,,. Cucchara [10]. Belezna [11] Mean shft,

國家圖書館典藏電子全文

Mechanical Science and Technology for Aerospace Engineering October Vol No. 10 Web SaaS B /S Web2. 0 Web2. 0 TP315 A


标题

Microsoft Word 張嘉玲-_76-83_

由社會發展趨勢探討國人睡眠品質

北 京 大 学

第 2 期 王 向 东 等 : 一 种 运 动 轨 迹 引 导 下 的 举 重 视 频 关 键 姿 态 提 取 方 法 257 竞 技 体 育 比 赛 越 来 越 激 烈, 为 了 提 高 体 育 训 练 的 效 率, 有 必 要 在 体 育 训 练 中 引 入 科 学 定 量 的 方 法 许 多

JOURNAL OF EARTHQUAKE ENGINEERING AND ENGINEERING VIBRATION Vol. 31 No. 6 Dec

~ 10 2 P Y i t = my i t W Y i t 1000 PY i t Y t i W Y i t t i m Y i t t i 15 ~ 49 1 Y Y Y 15 ~ j j t j t = j P i t i = 15 P n i t n Y

1 SIGMA Lab Sydney IntelliGent MultimediA Laboratory Electrical and Information Engineering department EIE Ph.D. M.Phil. 1.QS (Associate Profess

[1] Liu Hongwei,2013, Study on Comprehensive Evaluation of Iron and Steel Enterprises Production System s Basic Capacities, International Asia Confere

% % 34

Transcription:

39 8 Vol.39 No.8 2017 8 Infrared Technology August 2017 1,2,3 1,3 1,3 1. 2000832. 100049 3. 200083 4 1 TP391.41 A 1001-8891(2017)08-0728-06 Infrared Scene Understandng Algorthm Based on Deep Convolutonal Neural Network WANG Chen 1,2,3 TANG Xny 1,3 GAO Sl 1,3 (1. Shangha Insttute of Techncal Physcs, Shangha 200083, Chna; 2. Unversty of Chnese Academy of Scences, Bejng 100049, Chna; 3. Key Laboratory of Infrared System Detecton and Imagng Technology, Chnese Academy of Scences, Shangha 200083, Chna) AbstractWe adopt a deep learnng method to mplement a semantc nfrared mage scene understandng. Frst, we buld an nfrared mage dataset for the semantc segmentaton research, consstng of four foreground object classes and one background class. Second, we buld an end-to-end nfrared semantc segmentaton framework based on a deep convolutonal neural network connected to a condtonal random feld refned model. Then, we tran the model. Fnally, we evaluate and analyze the outputs of the algorthm framework from both the vsble and nfrared datasets. Qualtatvely, t s feasble to adopt a deep learnng method to classfy nfrared mages on a pxel level, and the predcted accuracy s satsfactory. We can obtan the features, classes, and postons of the objects n an nfrared mage to understand the nfrared scene semantcally. Key wordsnfrared magesnfrared scenesemantc segmentatonconvolutonal neural network 0 Jonathan Long CVPR 2015 FCN [1] S. Zheng ICCV2015 CRFasRNN [2] condtonal random feldcrf PASCAL VOC ICLR2015 Lang-Cheh Chen FCN Deeplab [3] CRF 2016-10-062016-10-31. 1989-E-mallkame@sna.com 2011xcwzk042014216 728

39 8 2017 8 Vol.39 No. 8 August 2017 Hyeonwoo Noh [4] boundng box PASCALV VOC PASCAL VOC Ctyscapes 1 4 4 4 14 1 0 1 1..1 14 bt 8 bt 1 14 bt 20 10 10 20 [I mn, I max ] 2[0,255] I mn f In Imn In Imn Io 255 f Imn In Imax (1) Imax I mn Imax f In Imax 3 CLAHE [5] 8 bt 2 1.2 10000 640512 14 bt.mat8 bt.jpg.png.png (a) (a) Infrared mage 1 (b) (b) Ground truth Fg.1 Sample of nfrared mage datasetss 729

39 8 Vol.39 No.8 2017 8 Infrared Technology August 2017 (a) (b) (a) Compresson algorthm based on global hstogram (b) Our algorthm 2 Fg.2 Comparson of compresson results 2 2.1 Softmax 3 2.2 VGG-16 VGG-16 [6] ImageNet ILSVRC-2014 16 1 Imagenet AlexNet GoogleNet 2.3 VGG Hole FCN [3] 2.3.1 Hole FCN VGG-16 32 8 Hole 4 0 3 Fg.3 Semantc segmentaton algorthm flow 1 VGG-16 Table 1 VGG-16 framework VGG-16 conv3-64 conv3-64 conv3-128 conv3-128 conv3-256 conv3-256 conv3-256 fc-4096 fc-4096 fc-1000 soft-max 730

39 8 Vol.39 No. 8 2017 8 August 2017 4 hole Fg.4 Illustraton of the hole algorthm 2.3.2 77 4096 44 33 23 1024 2.4 CRF [7] (2) E( x) ( x ) ( x, x ) j j j x (x )lgp(x ) P(x ) DCNN (, ) (, ) (, ) (3) x x K m j j x x k f f j m 1 m j x x j (x, x j )1 0 k m j m 2 2 2 p p I I p p exp( ) exp( ) 1 j j j 2 2 2 2 2 2 2 (4) CRF 3 3.1 Ctyscapes [8] Ctyscapes 2975 500 20481024 30 8 2973 8 4 1024512 1000 800 200 3.2 VGG-16 Ctyscapes 54 mn-batch 5 0.001 2000 0.1 0.9 0.0005 8000 1 1 4000 0.1 8000 16000 230.33 ms/frame Ubuntu14.04 Caffe CUDA GPU NVDIA GM200 12 G 3.3 4 IUn j jn cl t j n j [1] n / t (5) (1/ n ) n / t cl IU (1/ n ) n /( t n n ) IU cl 5 5 4 1 731 j j (6) (7) (8) 1 ( tk) tn /( t nj n) k j

39 8 2017 8 Infrared Technology Vol.39 No.8 August 2017 5 2 3 3.4 5 2 Table 2 Comparson of predcton accuracy IU IU 1 fc ctyscapes 0.9111 0.791 0.670 0.846 1crf ctyscapes 0.903 0.716 0.632 0.831 2 fc 0.7666 0.640 0.531 0.673 2crf 0.776 0.628 0.529 0.681 3 fc 0.887 0.797 0.719 0.824 3 crf 0.895 0.778 0.715 0.831 3 IU Table 3 IU results of each class on IR dataset IU IU IU 3 fc 0.603 0.753 0.778 0.732 0.637 0..713 0.887 0.797 0.824 3crf 0.556 0.749 0.6900 0.778 0.650 0..711 0.890 0.775 0.828 (a) (b) (a) Orgnal mage (b) Labels mage background person 5 (c) (c) Coarse predcton results (d) CRF (d) CRF refne resultss vehcle buldng tree Fg.5 Semantc segmentaton results 732

39 8 Vol.39 No. 8 2017 8 August 2017 8000 12mean IU 0.670 0.531 2 16000 mean IU 0.719 2 CRF CRF Ctyscapes SegModel mean IU 0.777 IU 0.556 3 IU CRF CRF 4 Caffe [1] Long J, Shelhamer E, Darrell T. Fully convolutonal networks for semantc segmentaton[c]//ieee Conference on Computer Vson and Pattern Recognton, 2015: 1337-1342. [2] Zheng S, Jayasumana S, Romeraparedes B, et al. Condtonal random felds as recurrent neural networks[c]//ieee Conference on Computer Vson and Pattern Recognton, 2015:1529-1537. [3] Chen L C, Papandreou G, Kokknos I, et al. Semantc mage segmentaton wth deep convolutonal nets and fully connected CRFs[J]. Computer Scence, 2014(4):357-361. [4] Noh H, Hong S, Han B. Learnng deconvoluton network for semantc segmentaton[c]//proceedngs of the IEEE Internatonal Conference on Computer Vson, 2015: 1520-1528. [5] Pzer S M, Amburn E P, Austn J D, et al. Adaptve Hstogram equalzaton and ts varatons[j]. Computer Vson, Graphcs, and Image Processng, 1987, 39(3): 355-368. [6] Smonyan K, Zsserman A. Very deep convolutonal networks for large-scale mage recognton[2014] [DB/OL]. arxv preprnt arxv: 1409.1556. [7] Krähenbühl P, Koltun V. Effcent Inference n fully connected CRFs wth Gaussan edge potentals[c]//advances n Neural Informaton Processng Systems, 2012:109-117. [8] Cordts M, Omran M, Ramos S, et al. The ctyscapes dataset for semantc urban scene understandng[c]//proceedngs of the IEEE Conference on Computer Vson and Pattern Recognton, 2016: 3213-3223. 733