RPN 2 DeepParts 22 part pool 2 3 HOG 12 LBP 13 Harr - like 15 DPM 16 Deformable Parts Model VGG16 X. Wang 14 VGG Convolutiona

Similar documents
第 2 期 王 向 东 等 : 一 种 运 动 轨 迹 引 导 下 的 举 重 视 频 关 键 姿 态 提 取 方 法 257 竞 技 体 育 比 赛 越 来 越 激 烈, 为 了 提 高 体 育 训 练 的 效 率, 有 必 要 在 体 育 训 练 中 引 入 科 学 定 量 的 方 法 许 多

1 引言

Vol.39 No. 8 August 2017 Hyeonwoo Noh [4] boundng box PASCALV VOC PASCAL VOC Ctyscapes bt 8 bt 1 14 bt

报 告 1: 郑 斌 教 授, 美 国 俄 克 拉 荷 马 大 学 医 学 图 像 特 征 分 析 与 癌 症 风 险 评 估 方 法 摘 要 : 准 确 的 评 估 癌 症 近 期 发 病 风 险 和 预 后 或 者 治 疗 效 果 是 发 展 和 建 立 精 准 医 学 的 一 个 重 要 前

untitled

untitled

[1] [4] Chetverikov Lerch[8,12] LeaVis CAD Limas-Serafim[6,7] (multi-resolution pyramids) 2 n 2 n 2 2 (texture) (calf leather) (veins)

填 写 要 求 一 以 word 文 档 格 式 如 实 填 写 各 项 二 表 格 文 本 中 外 文 名 词 第 一 次 出 现 时, 要 写 清 全 称 和 缩 写, 再 次 出 现 时 可 以 使 用 缩 写 三 涉 密 内 容 不 填 写, 有 可 能 涉 密 和 不 宜 大 范 围 公

/MPa / kg m - 3 /MPa /MPa 2. 1E ~ 56 ANSYS 6 Hz (a) 一阶垂向弯曲 (b) 一阶侧向弯曲 (c) 一阶扭转 (d) 二阶侧向弯曲 (e) 二阶垂向弯曲 (f) 弯扭组合 2 6 Hz

Vol. 22 No. 4 JOURNAL OF HARBIN UNIVERSITY OF SCIENCE AND TECHNOLOGY Aug GPS,,, : km, 2. 51, , ; ; ; ; DOI: 10.

SVM OA 1 SVM MLP Tab 1 1 Drug feature data quantization table

2 3. 1,,,.,., CAD,,,. : 1) :, 1,,. ; 2) :,, ; 3) :,; 4) : Fig. 1 Flowchart of generation and application of 3D2digital2building 2 :.. 3 : 1) :,

COCO18-DensePose-BUPT-PRIV

* CUSUM EWMA PCA TS79 A DOI /j. issn X Incipient Fault Detection in Papermaking Wa

Microsoft Word 定版

标题

(Pattern Recognition) 1 1. CCD

( ) [11 13 ] 2 211,,, : (1),, 1990 ( ) ( ),, ; OD, ( ) ( ) ; , ( ), (2) 50 %,, 1999 ( ) ( ) ; (3),,

标题

标题

by industrial structure evolution from 1952 to 2007 and its influence effect was first acceleration and then deceleration second the effects of indust


Scoones World Bank DFID Sussex IDS UNDP CARE DFID DFID DFID 1997 IDS

JOURNAL OF EARTHQUAKE ENGINEERING AND ENGINEERING VIBRATION Vol. 31 No. 6 Dec

~ ~ ~

untitled

rights and interests of doctors and patients. But it is insufficient jurisprudential basis and legitimacy crisis of legal forms through the form of mi

Microsoft Word - chnInfoPaper6

SWAN min TITAN Thunder Identification Tracking Analysis SWAN TITAN and Nowcasting 19 TREC Tracking Radar Echo by Correlaction T

~ 10 2 P Y i t = my i t W Y i t 1000 PY i t Y t i W Y i t t i m Y i t t i 15 ~ 49 1 Y Y Y 15 ~ j j t j t = j P i t i = 15 P n i t n Y

m m m ~ mm

soturon.dvi

2015 年 第 24 卷 第 11 期 计 算 机 系 统 应 用 历 的 主 体 部 分 多 以 非 结 构 化 的 文 本 形 式 存 储, 很 多 研 究 只 能 基 于 有 限 的 结 构 化 数 据 进 行 [4,5], 无 法 满 足 临

标题

698 39,., [6].,,,, : 1) ; 2) ,, 14,, [7].,,,,, : 1) :,. 2) :,,, 3) :,,,., [8].,. 1.,,,, ,,,. : 1) :,, 2) :,, 200, s, ) :,.

Microsoft Word tb 赵宏宇s-高校教改纵横.doc

F4

~ ~

2014 年 11 月 总 第 251 期 主 办 单 位 : 中 国 科 学 院 自 动 化 研 究 所 CONTENTS 中 国 科 学 院 自 动 化 研 究 所 所 刊 卷 首 语 赠 人 一 片 云 1 科 研 动 态 与 学 术 交 流 自 动 化 所 人 脸 识 别 技 术 在 首 届

IP TCP/IP PC OS µclinux MPEG4 Blackfin DSP MPEG4 IP UDP Winsock I/O DirectShow Filter DirectShow MPEG4 µclinux TCP/IP IP COM, DirectShow I

y 1 = 槡 P 1 1h T 1 1f 1 s 1 + 槡 P 1 2g T 1 2 interference 2f 2 s y 2 = 槡 P 2 2h T 2 2f 2 s 2 + 槡 P 2 1g T 2 1 interference 1f 1 s + n n

Dan Buettner / /

标题

第 30 卷 53 贾熟村 太平天国时期的左宗棠集团 之浮收中饱 有不遵守之州县 欲求阻挠之吏绅 即予撤革 于是 咸丰元 二 三 四等年之民 间积欠 率皆踊跃输将 使国课不至虚悬 军储 不至束手 州县办公亦不至拮据 收到了很好的 [2] 效果 农民亦欢欣鼓舞 咸丰六年正月 道员王錱陷湖南江华 升平

Microsoft Word - A _ doc

#4 ~ #5 12 m m m 1. 5 m # m mm m Z4 Z5

Microsoft Word doc

Vol. 22 No. 2 JOURNAL OF HARBIN UNIVERSITY OF SCIENCE AND TECHNOLOGY Apr ,,,,, Apriori,,,,,,,,

标题

1

RESEARCH ON HIGHER EDUCATION Number 4, 2013(General Serial No.78) CONTENTS Colleges and Universities Forum Three-Year Blueprint of Undergraduate Cours

标题

,,, () 20 80,,,,, ;,, ;,, ;,,,,,,,,, [1 ], :,,,,2 2,,, () (),,,,:,,,,:,,,, :, [2 ] :,,,,,,, : AN NA,,,,,, ( ),:,,: ( F) = (A1 + A2 + A3 + An -

be invested on the desilting of water sources and to paved canals with cement mortar while drinking water project can focus on the improvement of wate

P(x,y) P(x-1,y) P(x,y-1) P(x,y+1) P(x+1,y) Sobel LaplacePrewittRoberts Sobel [2] Sobel [6] 0 1 1: P(x,y) t (4-connectivity) 2: P(x,y) t 3:

35期

STEAM STEAM STEAM ( ) STEAM STEAM ( ) 1977 [13] [10] STEM STEM 2. [11] [14] ( )STEAM [15] [16] STEAM [12] ( ) STEAM STEAM [17] STEAM STEAM STEA

4 115,,. : p { ( x ( t), y ( t) ) x R m, y R n, t = 1,2,, p} (1),, x ( t), y ( t),,: F : R m R n.,m, n, u.,, Sigmoid. :,f Sigmoid,f ( x) = ^y k ( t) =

[1] Nielsen [2]. Richardson [3] Baldock [4] 0.22 mm 0.32 mm Richardson Zaki. [5-6] mm [7] 1 mm. [8] [9] 5 mm 50 mm [10] [11] [12] -- 40% 50%

2 ( 自 然 科 学 版 ) 第 20 卷 波 ). 这 种 压 缩 波 空 气 必 然 有 一 部 分 要 绕 流 到 车 身 两 端 的 环 状 空 间 中, 形 成 与 列 车 运 行 方 向 相 反 的 空 气 流 动. 在 列 车 尾 部, 会 产 生 低 于 大 气 压 的 空 气 流

59 1 CSpace 2 CSpace CSpace URL CSpace 1 CSpace URL 2 Lucene 3 ID 4 ID Web 1. 2 CSpace LireSolr 3 LireSolr 3 Web LireSolr ID

Microsoft Word - 1--齐继峰_new_.doc

物理学报 Acta Phys. Sin. Vol. 62, No. 14 (2013) 叠 [4]. PET 设备最重要的部件就是探测器环, 探测 备重建图像具有减少数据插值的优势. 器环的性能直接影响 PET 的成像能力. 探头与探头 之间得到的符合直线叫做投影线. 所有的投影线在

θ 1 = φ n -n 2 2 n AR n φ i = 0 1 = a t - θ θ m a t-m 3 3 m MA m 1. 2 ρ k = R k /R 0 5 Akaike ρ k 1 AIC = n ln δ 2

PowerPoint 演示文稿

Microsoft Word - 专论综述1.doc

92 湖 南 工 业 大 学 学 报 2014 年 基 于 特 征 的 方 法 是 现 今 图 像 匹 配 的 主 要 研 究 与 发 展 方 向 这 种 匹 配 方 法 的 原 理 是, 寻 找 待 处 理 图 像 某 区 域 中 的 特 征 点 或 者 关 键 点, 在 计 算 特 征 点 周

Machine Learning for Computer Vision

IPCC CO (IPCC2006) 1 : = ( 1) 1 (kj/kg) (kgc/gj) (tc/t)

240 生 异 性 相 吸 的 异 性 效 应 [6] 虽 然, 心 理 学 基 础 研 [7-8] 究 已 经 证 实 存 在 异 性 相 吸 异 性 相 吸 是 否 存 在 于 名 字 认 知 识 别 尚 无 报 道 本 实 验 选 取 不 同 性 别 的 名 字 作 为 刺 激 材 料, 通

双 语 教 学 之 中 综 上 所 述, 科 大 讯 飞 畅 言 交 互 式 多 媒 体 教 学 系 统, 围 绕 语 音 核 心 技 术 的 研 究 与 创 新, 取 得 了 一 系 列 自 主 产 权 并 达 到 国 际 领 先 水 平 的 技 术 成 果, 同 时 获 得 发 明 专 利 3

,,.,, : 1),,,,, 2),,,,, 3),,,,,,,,,, [6].,,, ( ),, [9], : 1), 2),,,,, 3),,, 2.,, [10].,,,,,,,,, [11]. 2.1,, [12],, ;, ; Fig. 1 1 Granular hier

20世纪50_60年代西藏墨脱县珞巴族老照片与民风民俗_冀文正;李跃平


Microsoft Word - 专论综述1.doc

标题

:,; ;, ( ) 25,, 80 90, 90,,,,,,, ( ), ( ), %,, , ,, ( ),,, ;,,,,,,,,,, ( ) , , 3395,3400, 20 % 30 %,

untitled

Adobe Photoshop Photoshop 1 C D Alt 1 A 1 B Fig. 1 1 Showing the toolbars and images to edit dirties of images A. B. C. D. A. original S

85% NCEP CFS 10 CFS CFS BP BP BP ~ 15 d CFS BP r - 1 r CFS 2. 1 CFS 10% 50% 3 d CFS Cli

标题

untitled

, [3 ] Petri, 25 7, 500, [4,5 ], 3, (2), 2003, [ 6 ],,, ,, [7 ], 569, 26, ( ) : 2 ; 3 ; 4, ; 5, : (a) ( ) :,,

11 25 stable state. These conclusions were basically consistent with the analysis results of the multi - stage landslide in loess area with the Monte

Technical Acoustics Vol.27, No.4 Aug., 2008,,, (, ) :,,,,,, : ; ; : TB535;U : A : (2008) Noise and vibr

Microsoft Word - A _ doc

Your Paper's Title Starts Here: Please Center

Journal of Northwestern Polytechnical University Apr. Vol No. 2 ICM ICM ICM ICM ICM ICM TP A

豐佳燕.PDF

14 17.,., Fig. 1 Bougeur gravity map of research region 2 Fig. 2 Magnetic map of research region

198 天 津 体 育 学 院 学 报 谁 来 教, 怎 么 教 的 问 题 长 时 间 悬 而 未 决, 或 泛 泛 而 谈, 或 知 行 不 一, 以 至 于 使 中 小 学 武 术 教 育 积 重 难 返, 停 滞 不 前 因 此, 切 实 推 进 中 小 学 武 术 教 育 的 发 展 要

标题


月32期

MAXQ BA ( ) / 20

United Nations ~ ~ % 2010

[1-3] (Smile) [4] 808 nm (CW) W 1 50% 1 W 1 W Fig.1 Thermal design of semiconductor laser vertical stack ; Ansys 20 bar ; bar 2 25 Fig

Microsoft Word - 口試本封面.doc

IT 36% Computer Science Teachers Association, CSTA K K-12 CSTA K-12 K-12 K-6 K6-9 K STEM STEM STEM

,, [1 ], [223 ] :, 1) :, 2) :,,, 3) :,, ( ),, [ 6 ],,, [ 3,728 ], ; [9222 ], ;,,() ;, : (1) ; (2),,,,, [23224 ] ; 2,, x y,,, x y R, ( ),,, :

Transcription:

2017 22 2 CHINESE JOURNAL OF STEREOLOGY AND IMAGE ANALYSIS Vol. 22 No. 2 June 2017 209 1007-1482 2017 02-0209 -0215 DOI 10. 13505 /j. 1007-1482. 2017. 22. 02. 014 RPN 1 2 3 3 1 1 2 3 1. 100090 2. 100090 3. 100090 RPN RPN RPN TP37 A End - to - end monitoring scene pedestrian detection based on improved RPN YANG Dongming 1 2 XU Shibiao 3 MENG Weiliang 3 GE Shuiying 1 YANG Zhen 1 2 ZHANG Xiaopeng 3 1. National Science Library of CAS Beijing 100090 China 2. University of Chinese Academy of Sciences Beijing 100049 China 3. Institute of Automation of CAS Beijing 100090 China Abstract Compared to other scenes pedestrian detection in monitoring scenes gets larger flow of people and higher degree of occlusion. This paper presents an end - to - end detection scheme based on region proposal network RPN. On the one hand we improved RPN by combining with a deep convolution network designed by ourselves to obtain a new deep neural network for pedestrian detection. On the other hand we introduced head - shoulders model to improved detection performance for pedestrian detection at monitoring scenes which improves the detection speed. Eventually we achieved end - to - end detection. The experimental results show that the method effectively improved the detection performance by reducing the missing rate and speeding up the detection. Key words monitor pedestrian detection deep learning RPN network 2017-03 - 30 No. 2012BAH42F02 61332017 61671451 61571046 1993 - E - mail shuiying. ge@ rcsc. cas. cn

210 2017 22 2 0 1 RPN 2 DeepParts 22 part pool 2 3 HOG 12 LBP 13 Harr - like 15 DPM 16 Deformable Parts Model VGG16 X. Wang 14 VGG16 2012 Convolutional neural R - CNN Region of CNN 18 CNNs selective search region proposals SPP - net 19 1 3 Fast - RCNN 20 SPP spatial pyramid pooling ROI region of interest pooling Girshick R Faster R - CNN 20 RPN Region Proposal Network RPN proposal ROI pooling Faster R - CNN RPN 5 RPN anchors R 3. 1 Benenson 7 S Zhang 8 state of art VGG16 23 Oxford Net Andrew Zisserman 2014 ILSVRC localization and classification networks CNNs 17 RPN 6 9-11 CNNs Deep ConvNet RPN Classifier Deep JointDeep 9 ConvNet RPN R - CNN 1

2017 22 2 RPN 211 1 Deep ConvNet RPN Classifier 1 5 ground - truth IoU Intersection - over - 4 Max pooling union 0. 7 0. 7 IoU 3 3 1 ground - truth Relu IoU 0. 3 rpn_bbox_ 512 pred 2 RPN 4 t i t xi t yi t wi t hi K anchor anchor 4K anchor 2 b 3 3 300 512 3 3 L( { p }{ i t }) = 1 i N cls p i p * i + 1 i N reg p * i i L reg t i t * i 2 i i anchor p * i = 3 1 0 t * i ground - true box 1 1 anchor box 1 1. 5 1 2 2 a 128 256 512 K anchor = 3 3 3 RoI pooling RoI pooling N anchor = W Conv5 H Conv5 K anchor 1 ROIs region of interest W Conv5 H Conv5 rpn_cls_score rpn_bbox_pred rpn_cls_score resize P i 0 or 1 crop /wrap K anchor anchor 2K

212 2017 22 2 2 a b RPN 3 3 K anchor anchors 2 K anchor 4 K anchor 3. 2 27% 63% 98% 3 a Chen Q 23 SED - PD 3 a 3 b 4 3 a b CPU Intel R Xeon VOC2007 25 INRIA Person dataset 26 ImageNet R CPU E5-2620 v3 @ 2. 40GHz GPU 12G 0. 001 momentum 0. 9 weight decay TITAN X Pascal Caffe 0. 0005 40 K train_loss /auc - iteatation RPN 4 train_loss - iteatation auc - iteatation 4. 1 0. 352 s /iter INRIA Person dataset 74. 02%

2017 22 2 RPN 213 0. 109 s 9. 17 Faster 1 INRIA Person dataset R - CNN VOC2007 + VOC2012 200 VOC2007 73. 2% 457 5 / 2 INRIA Person dataset 4 4. 2 INRIA Person dataset 1826 3 4. 1 4. 2. 2 5 a 3 a 0. 093 s 10. 75 INRIA Person dataset 4. 2. 1 5 b 5 a 1 a conv5_2_relu5_2 rpn_cls_score rpn_bbox_pred rpn_output b

214 2017 22 2 4. 4. 3 J. 2015 35 6 111-116. DOI 10. 14132 /j. cnki. 1673-5439. 2015. 06. 017. Zeng Min Zhou Yilong. Simulation of pedestrian detection based on deep learning model J. Journal of Nanjing Uni- of Posts and Telccommunications 2015 35 6 1 versity RPN 111-116. DOI 10. 14132/j. cnki. 1673-5439. 2015. 06. 017. 1 1 1 1. 5 1 2 5. J. 2012 40 4 814-820. DOI 10. 3969 /j. issn. 0372-2112. 2012. 04. 031. Su Songzhi Li Shaozi Chen Shuyuan et al. A Survey on 2 pedestrian detection J. Acta Electronica Sinica 2012 VGG16 40 4 814-820. DOI 10. 3969 /j. issn. 0372-2112. RPN 2012. 04. 031. 6 Zeng Xingyu Ouyang Wanli Wang Xiaogang. Multi - stage contextual deep learning for pedestrian detection 5 7 Benenson R Omran M Hosang J et al. Ten years of pe- destrian detection what have we learned C / /ECCV RPN 2014 Workshops 2014 8926 613-627. 8 Zhang S Benenson R Omran M et al. How far are we from solving pedestrian detection C / / in CVPR 2016 1259-1267. 9 Ouyang Wanli Wang Xiaogang. Joint deep learning for pedestrian detection C / / IEEE International Conference on Computer Vision 2013 2056-2063. 10 Luo Ping Tian Yonglong Wang Xiaogang et al. Switchable deep network for pedestrian detection C / /IEEE Conference on Computer Vision and Pattern Recognition 2014 899-906. References 1. D. 2015. 12 Dalal N Triggs B. Histograms of oriented gradients for Wang Bin. Pedestrian detection based on Deep Learning human detection C / /IEEE Computer Society Conference D. Beijing Jiaotong University 2015. on Computer Vision & Pattern Recognition. IEEE Comput- 2. er Society 2005 886-893. D. 2013. Liu Xiaohui. Pedestrian Detection and Tracking in Complex Visual Scenes D. Tianjin University 2013. 13 Ojala T Pietikainen M Maenpaa T. Multiresolution gray - scale and rotation invariant texture classification with local binary patterns C / /PAMI 2002 24 7 971-987. 3. HOG 14 Wang X Han T X Yan S. An HOG - LBP human detector D. 2014. Zhou Kejia. Research on pedestrian detection and tracking with partial occlusion handling C / /IEEE International Conference on Computer Vision. IEEE 2010 32-39. based on HOG and template matching D. Jilin University 2014. C / / IEEE International Conference on Computer Vision 2013 121-128. 11 J. Hosang M Omran R Benenson et al. Taking a deeper look at pedestrians C / /in CVPR 2015 4073-4082. 15 Zhang S Bauckhage C Cremers A B. Informed Haar - Like Features Improve Pedestrian Detection C / /Comput-

2017 22 2 RPN 215 er Vision and Pattern Recognition. 954. IEEE 2014 947-16 Felzenszwalb P Mcallester D Ramanan D. A discriminatively trained multiscale deformable part model C / / IEEE Computer Society Conference on Computer Vision and Pattern Recognition. DBLP 2008 1-8. 17 Krizhevsky A Sutskever I Hinton G E. Imagenet classification with deep convolutional neural networks C / /Advances in Neural Information Processing Systems 2012 1097-1105. 18 Girshick R Donahue J Darrell T et al. Rich feature hierarchies for accurate object detection and semantic segmentation C / /Computer Vision and Pattern Recognition CVPR 2014 IEEE Conference on. IEEE 2014 580-587. 19 He K Zhang X Ren S et al. Spatial pyramid pooling in deep convolutional networics for visual recognition J. ArXiv Preprint ArXiv 1406. 4729 2014. 20 Girshick R. Fast R - CNN C / /IEEE International Conference on Computer Vision IEEE Computer Society 2015 1440-1448. 21 Ren S He K Girshick R et al. Faster R - CNN Towards real - time object detection with region proposal networks J. IEEE Transactions on Pattern Analysis & Machine Intelligence 2016 1-1. 22 Tian Y Luo P Wang X et al. Deep learning strong parts for pedestrian detection C / / IEEE International Conference on Computer Vision IEEE 2015 1904-1912. 23 Simonyan K Zisserman A. Very deep convolutional networks for large - scale image recognition J. In ICLR 2015. 24 Chen Q Jiang W Zhao Y et al. Part - based deep network for pedestrian detection in surveillance videos C / / IEEE 2015 1-4. 25 Everingham M Gool L Williams C K et al. The Pascal visual object classes VOC challenge J. International Journal of Computer Vision 2010 88 2 303-338. 26 Dalal N Triggs B. Histograms of oriented gradients for human detection C / /CVRR 2015 France 2005 1 12 886-893.