Microsoft Word - 14-戴伟聪_oee180350_xeyz.doc

Similar documents
报 告 1: 郑 斌 教 授, 美 国 俄 克 拉 荷 马 大 学 医 学 图 像 特 征 分 析 与 癌 症 风 险 评 估 方 法 摘 要 : 准 确 的 评 估 癌 症 近 期 发 病 风 险 和 预 后 或 者 治 疗 效 果 是 发 展 和 建 立 精 准 医 学 的 一 个 重 要 前

1 引言

SVM OA 1 SVM MLP Tab 1 1 Drug feature data quantization table

[1-3] (Smile) [4] 808 nm (CW) W 1 50% 1 W 1 W Fig.1 Thermal design of semiconductor laser vertical stack ; Ansys 20 bar ; bar 2 25 Fig

RPN 2 DeepParts 22 part pool 2 3 HOG 12 LBP 13 Harr - like 15 DPM 16 Deformable Parts Model VGG16 X. Wang 14 VGG Convolutiona

United Nations ~ ~ % 2010

2 137 [5]. [6].. [7]. [8-9].. (PCA) PCA HIS C1C2C3.. RGB Hotelling. [1-11]. R G B 3. RGB 1) RGB M N 3 x = [x R x G x B ] T. RGB 3 3 C x (1)

untitled

STEAM STEAM STEAM ( ) STEAM STEAM ( ) 1977 [13] [10] STEM STEM 2. [11] [14] ( )STEAM [15] [16] STEAM [12] ( ) STEAM STEAM [17] STEAM STEAM STEA

Microsoft Word 定版

PCA+LDA 14 1 PEN mL mL mL 16 DJX-AB DJ X AB DJ2 -YS % PEN

COCO18-DensePose-BUPT-PRIV

一 课 程 负 责 人 情 况 姓 名 吴 翊 性 别 男 出 生 年 月 基 本 信 息 学 位 硕 士 职 称 教 授 职 务 所 在 院 系 理 学 院 数 学 与 系 统 科 学 系 电 话 研 究 方 向 数 据 处 理 近 三 年 来

59-81

~ 10 2 P Y i t = my i t W Y i t 1000 PY i t Y t i W Y i t t i m Y i t t i 15 ~ 49 1 Y Y Y 15 ~ j j t j t = j P i t i = 15 P n i t n Y

~ ~

Vol. 22 No. 2 JOURNAL OF HARBIN UNIVERSITY OF SCIENCE AND TECHNOLOGY Apr ,,,,, Apriori,,,,,,,,

(Pattern Recognition) 1 1. CCD

一般社団法人電子情報通信学会 信学技報 THE INSTITUTE OF ELECTRONICS, IEICE Technical Report INFORMATION THE INSTITUTE OF AND ELECTRONICS, COMMUNICATION ENGINEERS IEICE L

2015 年 第 24 卷 第 11 期 计 算 机 系 统 应 用 历 的 主 体 部 分 多 以 非 结 构 化 的 文 本 形 式 存 储, 很 多 研 究 只 能 基 于 有 限 的 结 构 化 数 据 进 行 [4,5], 无 法 满 足 临

穨423.PDF

Vol. 22 No. 4 JOURNAL OF HARBIN UNIVERSITY OF SCIENCE AND TECHNOLOGY Aug GPS,,, : km, 2. 51, , ; ; ; ; DOI: 10.

标题

%

标题

第 2 期 王 向 东 等 : 一 种 运 动 轨 迹 引 导 下 的 举 重 视 频 关 键 姿 态 提 取 方 法 257 竞 技 体 育 比 赛 越 来 越 激 烈, 为 了 提 高 体 育 训 练 的 效 率, 有 必 要 在 体 育 训 练 中 引 入 科 学 定 量 的 方 法 许 多

~ a 3 h NCEP ~ 24 3 ~ ~ 8 9 ~ km m ~ 500 m 500 ~ 800 m 800 ~ m a 200

Microsoft Word - 专论综述1.doc

~ ~ ~

the southern city was higher than that in the northern city. In rural areas the proportion of the nuclear family in the northern region was higher tha

Microsoft Word - chnInfoPaper6

13-4-Cover-1

Fig. 1 Frame calculation model 1 mm Table 1 Joints displacement mm

untitled

Microsoft Word tb 赵宏宇s-高校教改纵横.doc

Dan Buettner / /

cm /s c d 1 /40 1 /4 1 / / / /m /Hz /kn / kn m ~

2 ( 自 然 科 学 版 ) 第 20 卷 波 ). 这 种 压 缩 波 空 气 必 然 有 一 部 分 要 绕 流 到 车 身 两 端 的 环 状 空 间 中, 形 成 与 列 车 运 行 方 向 相 反 的 空 气 流 动. 在 列 车 尾 部, 会 产 生 低 于 大 气 压 的 空 气 流

荨荨 % [3] [4] 86%( [6] 27 ) Excel [7] 27 [8] 2 [9] K2 [2] ; Google group+ 5 Gmail [2] 2 fxljwcy 3E [22] 2 2 fxljzrh 2D [23] 3 2 fxzphjf 3D 35

untitled

1 GIS 95 Y = F y + (1 F) (1) 0 0 Y0 kg/hm 2 /day F y 0 y c kg/hm 2 /day [12] y m 20 kg/hm 2 /hour Y = cl cn ch G [ F( y ) T m yo + (2) (1 F)(

Microsoft Word 張嘉玲-_76-83_

% GIS / / Fig. 1 Characteristics of flood disaster variation in suburbs of Shang

1 科 学 谋 划, 有 序 促 进 扶 贫 工 作 的 持 续 发 展 1.1 科 学 定 位, 精 准 发 现 地 方 的 需 求 按 照 国 家 生 态 功 能 区 的 划 分, 库 伦 旗 属 重 点 生 态 保 护 开 发 区 这 里 生 态 环 境 优 良 特 色 作 物 资 源 优 势

http / /yxxy. cbpt. cnki. net / % % %

<A448A4E5AAC0B77CBEC7B3F8B2C43132A8F7B2C434B4C15F E706466>

UDC Empirical Researches on Pricing of Corporate Bonds with Macro Factors 厦门大学博硕士论文摘要库

[1] Nielsen [2]. Richardson [3] Baldock [4] 0.22 mm 0.32 mm Richardson Zaki. [5-6] mm [7] 1 mm. [8] [9] 5 mm 50 mm [10] [11] [12] -- 40% 50%

Microsoft Word - KSAE06-S0262.doc

度 身 體 活 動 量 ; 芬 蘭 幼 兒 呈 現 中 度 身 體 活 動 量 之 比 例 高 於 臺 灣 幼 兒 (5) 幼 兒 在 投 入 度 方 面 亦 達 顯 著 差 異 (χ²=185.35, p <.001), 芬 蘭 與 臺 灣 幼 兒 多 半 表 現 出 中 度 投 入 與 高 度

國立中山大學學位論文典藏.PDF

JOURNAL OF EARTHQUAKE ENGINEERING AND ENGINEERING VIBRATION Vol. 31 No. 6 Dec

Microsoft Word - 口試本封面.doc

[1] Liu Hongwei,2013, Study on Comprehensive Evaluation of Iron and Steel Enterprises Production System s Basic Capacities, International Asia Confere

T K mm mm Q345B 600 mm 200 mm 50 mm 600 mm 300 mm 50 mm 2 K ~ 0. 3 mm 13 ~ 15 mm Q345B 25

1556 地 理 科 学 进 展 30 卷 他 关 于 农 村 住 房 结 构 与 抗 震 性 能 的 研 究, 则 多 是 从 工 程 抗 灾 的 角 度, 研 究 某 种 构 造 类 型 的 房 屋, 力 图 找 到 传 统 房 屋 的 结 构 失 误 和 新 建 房 屋 中 存 在 的 问 [

Microsoft Word (du)(改2)

: (2012) Control Theory & Applications Vol. 29 No. 1 Jan Dezert-Smarandache 1,2, 2,3, 2 (1., ; 2., ;

Microsoft Word - 33-p skyd8.doc

填 写 要 求 一 以 word 文 档 格 式 如 实 填 写 各 项 二 表 格 文 本 中 外 文 名 词 第 一 次 出 现 时, 要 写 清 全 称 和 缩 写, 再 次 出 现 时 可 以 使 用 缩 写 三 涉 密 内 容 不 填 写, 有 可 能 涉 密 和 不 宜 大 范 围 公


IP TCP/IP PC OS µclinux MPEG4 Blackfin DSP MPEG4 IP UDP Winsock I/O DirectShow Filter DirectShow MPEG4 µclinux TCP/IP IP COM, DirectShow I

Microsoft Word - 01李惠玲ok.doc

Journal of Northwestern Polytechnical University Apr. Vol No. 2 ICM ICM ICM ICM ICM ICM TP A

Improved Preimage Attacks on AES-like Hash Functions: Applications to Whirlpool and Grøstl

University of Science and Technology of China A dissertation for master s degree Research of e-learning style for public servants under the context of

Fig. 1 1 The sketch for forced lead shear damper mm 45 mm 4 mm 200 mm 25 mm 2 mm mm Table 2 The energy dissip

壹 緒 論 由 於 作 者 任 教 於 大 專 軍 事 校 院, 依 校 規 規 定 學 生 於 第 八 學 期 必 須 通 過 3000 公 尺 跑 步 測 驗 限 定 14 分 鐘 的 及 格 標 準 始 得 畢 業 ; 因 此 探 討 提 升 中 長 距 離 與 長 距 離 跑 步 能 力 的

2006中國文學研究範本檔

JOURNAL OF EARTHQUAKE ENGINEERING AND ENGINEERING VIBRATION Vol. 31 No. 5 Oct /35 TU3521 P315.

34 www. cjig. cn wavelet transform 1 2 JPEG LIVE E s o = 1 T Σ log 2 C s o + 1 E T C s o Lu Wen contourlet C 0 7 N

南華大學數位論文

Z-I A b Z-I A b Z Z-I A A b Z-I Miller [5] Z i I i Z-I [6] Z-I Z-I Z-I Z-I Z I Wilson [7] 1970 [8] [9] 20.32% Sasaki [10] Nino- miya [11] [12]

,.,,.. :,, ,:, ( 1 ). Π,.,.,,,.,.,. 1 : Π Π,. 212,. : 1)..,. 2). :, ;,,,;,. 3

Construction of Chinese pediatric standard database A Dissertation Submitted for the Master s Degree Candidate:linan Adviser:Prof. Han Xinmin Nanjing

为 止, 以 集 中 式 光 伏 发 电 系 统 为 主, 其 主 要 原 因 是 我 国 政 策 推 动 方 面 以 国 家 主 导 为 主, 这 种 自 上 而 下 的 政 策 和 运 行 方 式, 更 容 易 迅 速 推 动 集 中 式 光 伏 系 统 的 建 设 集 中 式 光 伏 发 电

科 研 信 息 化 技 术 与 应 用,2015, 6 (1) of identity and the framework of identity management, this paper analyses the development trend of Identity Management

Microsoft PowerPoint - Aqua-Sim.pptx

Technical Acoustics Vol.27, No.4 Aug., 2008,,, (, ) :,,,,,, : ; ; : TB535;U : A : (2008) Noise and vibr

闲 旅 游 现 已 成 为 城 市 居 民 日 常 生 活 的 重 要 部 分 袁 它 的 出 现 标 志 着 现 代 社 会 文 明 的 进 步 遥 据 国 外 学 者 预 测 袁 2015 年 左 右 袁 发 达 国 家 将 陆 续 进 入 野 休 闲 时 代 冶 袁 发 展 中 国 家 也 将

Liao Mei-Yu Professor, Department of Chinese Literature, National Cheng Kung University Abstract Yao Ying was a government official in Taiwan for more

Microsoft Word - 刘 慧 板.doc

ph ph ph Langmuir mg /g Al 2 O 3 ph 7. 0 ~ 9. 0 ph HCO - 3 CO 2-3 PO mg /L 5 p

/3 CAD JPG GIS CAD GIS GIS 1 a CAD CAD CAD GIS GIS ArcGIS 9. x 10 1 b 1112 CAD GIS 1 c R2VArcscan CAD MapGIS CAD 1 d CAD U


1

LaDefense Arch Petronas Towers 2009 CCTV MOMA Newmark Hahn Liu 8 Heredia - Zavoni Barranco 9 Heredia - Zavoni Leyva

66 臺 中 教 育 大 學 學 報 : 人 文 藝 術 類 Abstract This study aimed to analyze the implementing outcomes of ability grouping practice for freshman English at a u

5月15期

2 3. 1,,,.,., CAD,,,. : 1) :, 1,,. ; 2) :,, ; 3) :,; 4) : Fig. 1 Flowchart of generation and application of 3D2digital2building 2 :.. 3 : 1) :,

4 115,,. : p { ( x ( t), y ( t) ) x R m, y R n, t = 1,2,, p} (1),, x ( t), y ( t),,: F : R m R n.,m, n, u.,, Sigmoid. :,f Sigmoid,f ( x) = ^y k ( t) =

Microsoft Word 聂雪梅.doc

θ 1 = φ n -n 2 2 n AR n φ i = 0 1 = a t - θ θ m a t-m 3 3 m MA m 1. 2 ρ k = R k /R 0 5 Akaike ρ k 1 AIC = n ln δ 2

32 戲劇學刊 A Study of Beijing Opera s Jing Actors and Their Vocal Accents in the Early Twentieth Century Using Two Operas, Muhuguan and Yuguoyuan, as Exa

Microsoft Word - 11-秦华伟.doc

< F63756D656E D2D796E2D31C6DABFAF2D31D6D0D2BDD2A9CFD6B4FABBAF2D C4EA2DB5DA35C6DA2D30322DD7A8C0FBD0C5CFA2D7CAD4B4D1D0BEBF35C6DA2E6D6469>

<453A5CCAB3C6B7BFC6D1A73131C4EA3134C6DA5C3134C6DA5C3032B7D6CEF6>

在 应 用 实 践 上 指 导 性 建 议 ( 黄 白,2008) 近 几 年 来, 国 家 政 府 在 教 育 方 面 高 度 重 视 教 育 信 息 化 工 作, 相 继 出 台 一 系 列 政 策 文 件 和 规 范 来 促 进 和 推 动 信 息 技 术 在 教 育 教 学 领 域 的 广

Mechanical Science and Technology for Aerospace Engineering October Vol No. 10 Web SaaS B /S Web2. 0 Web2. 0 TP315 A

( ) [11 13 ] 2 211,,, : (1),, 1990 ( ) ( ),, ; OD, ( ) ( ) ; , ( ), (2) 50 %,, 1999 ( ) ( ) ; (3),,

Transcription:

Opto-Electronic Engineering 光电工程 Article 2018 年, 第 45 卷, 第 12 期 遥感图像中飞机的改进 YOLOv3 实时检测算法 戴伟聪 1,2*, 金龙旭 1, 李国宁 1, 郑志强 3 1 130033 2 100049 3 130022 摘要 : 针对遥感图像中的飞机目标, 本文提出一种遥感图像飞机的改进 YOLOv3 实时检测算法 首先, 针对单一的遥感图像飞机目标, 提出一种有 49 个卷积层的卷积神经网络 其次, 在提出的卷积神经网络上应用密集相连模块进行改进, 并提出使用最大池化加强密集连接模块间的特征传递 最后, 针对遥感图像中飞机多为小目标的现实, 提出将 YOLOv3 的 3 个尺度检测增加至 4 个并以密集相连融合不同尺度模块特征层的信息 在本文设计的遥感飞机测试集上进行训练和测试, 实验表明, 该算法的检测精度达到 96.26% 召回率达到 93.81% 关键词 : 遥感图像 ; 飞机目标 ; 实时检测 ; 卷积神经网络中图分类号 :TP751;O436.3 文献标志码 :A 引用格式 : 戴伟聪, 金龙旭, 李国宁, 等. 遥感图像中飞机的改进 YOLOv3 实时检测算法 [J]. 光电工程,2018,45(12): 180350 Real-time airplane detection algorithm in remote-sensing images based on improved YOLOv3 Dai Weicong 1,2*, Jin Longxu 1, Li Guoning 1, Zheng Zhiqiang 3 1 Changchun Institute of Optics, Fine Mechanics and Physics, Chinese Academy of Sciences, Changchun, Jilin 130033, China; 2 University of Chinese Academy of Sciences, Beijing 100049, China; 3 Changchun University of Science and Technology, Changchun, Jilin 130022, China Abstract: Focusing on the airplanes in remote-sensing images, a real-time algorithm based on improved YOLOv3 is proposed to detect airplanes in remote-sensing images. Firstly, a convolutional neural network that consists of 49 convolutional layers is proposed to detect airplanes in remote-sensing images specifically. Secondly, dense connection is employed on proposed convolutional neural network, and maxpool is employed to enhance the feature transmit between dense blocks. Finally, to deal with the fact that airplanes in remote-sensing images are small targets mainly, we propose to increase the scale detection from 3 to 4 and employ dense connection to merge feature map among different scales. The algorithm is trained and tested on the designed airplane dataset. The experiment results show that our algorithm obtain 96.26% on precision and 93.81% on recall. 收稿日期 :2018-06-28; 收到修改稿日期 :2018-08-22 基金项目 : 863 (863-2-5-1-13B) 作者简介 : (1994-) E-mail daiweicong16@mails.ucas.ac.cn 180350-1

Keywords: remote-sensing image; airplane target; real-time detection; convolutional neural network Citation: Dai W C, Jin L X, Li G N, et al. Real-time airplane detection algorithm in remote-sensing images based on improved YOLOv3[J]. Opto-Electronic Engineering, 2018, 45(12): 180350 1 引言 RCNN [1] Fast RCNN [2] Faster RCNN [3] Mask RCNN [4] YOLO [5] SSD [6] YOLOv2 [7] YOLOv3 [8] [9] YOLOv2-tiny [10] LeNet5 [11] 8 5 [12] YOLO RCNN YOLOv3 YOLOv3 1) YOLOv3-tiny YOLOv3 2) 3) YOLOv3 3 4 4 YOLOv3 4) 2 YOLOv3 YOLOv3 YOLOv2 Darknet53 YOLO YOLOv3 YOLOv3 41616 FPN S S 13 13 26 26 52 52 2 3 (anchor box) 图 1 YOLOv3 在 13 13 的单元格中的预测边 界框示意图 Fig. 1 An illustration of predicted bounding boxes on 13x13 grids of YOLOv3 180350-2

3 1 4 (x,y) w h t x t y t w t h ( c x c y ) p w p h b = σ ( t ) + c, x x x b = σ ( t ) + c, y y y b w = p, e t w w b e t h = ph h (1) ˆt * ˆt * t * YOLOv3 1 0.5 YOLOv3 YOLOv3 YOLOv3 3 基于 YOLOv3 的改进 YOLOv3 3.1 网络结构改进 YOLOv3 Redmon ResNet Darknet53 Darknet53 1 1 3 3 2 Darknet53 Darknet53 Darknet49 1 1 1 表 1 Darknet49 的网络结构 Table 1 The network structure of Darknet49 Type Output Filters Size Conv 208 208 16 3 3 conv stride=2 Residual block(1) 16 1 1 conv stride=1 208 208 32 3 3 conv stride=1 16 1 1 conv stride=1 Transition module 104 104 32 3 3 conv stride=2 Residual block(2) 32 1 1 conv stride=1 104 104 64 3 3 conv stride=1 32 1 1 conv stride=1 Transition module 52 52 64 3 3 conv stride=2 Residual block(3) 64 1 1 conv stride=1 52 52 128 3 3 conv stride=1 64 1 1 conv stride=1 Transition module 26 26 128 3 3 conv stride=2 Residual block(4) 128 1 1 conv stride=1 26 26 256 3 3 conv stride=1 128 1 1 conv stride=1 Transition module 13 13 256 3 3 conv stride=2 Residual block(5) 128 1 1 conv stride=1 13 13 256 3 3 conv stride=1 3.2 密集相连 Huang [13] DenseNet DenseNet Darknet49 Darknet49 Darknet49-Dense Darknet49-Dense 5 4 2 2 2 180350-3

Maxpool s=2 Transition module Dense block Concatenation Dense block Conv 1 1 s=1 Conv 3 3 s=2 图 2 过渡模块的图解 Fig. 2 An illustration of transition module l l -1 x = H ([ x1, x2,, x 1]), (2) l l l H l 3.3 多尺度检测改进 YOLOv3 FPN [14] YOLOv3 3 4 (IOU R IOU ) K-means K-means d( B, C) = 1 RIOU ( B, C), (3) B C R ( B, C) IOU ( 3) 12 (12, 16) (16, 24) (21, 32) (24, 41) (24, 51) (33, 51) (28, 62) (39, 64) (35, 74) (44, 87) (53, 105) (64, 135) 3 3 Densenet 4 2 2 4 4 8 8 41616 Darknet49-Dense YOLOv3 14.525 BFLOPS Darknet49 YOLOv3 9.695 BFLOPS Darknet53 YOLOv3 65.86 BFLOPS 90 85 80 Average IOU/% 75 70 65 60 55 50 0 2 4 6 8 10 12 14 16 18 20 Anchor box 图 3 锚点框数量与平均交并比的关系 Fig. 3 The relationship between the number of anchor boxes and average IOU 180350-4

Type Filters Size/stride Output size Conv 16 3 3/2 208 208 Conv 16 1 1/1 208 208 4 Conv 32 3 3/1 208 208 Transition block 104 104 Conv 32 1 1/1 104 104 4 Conv 64 3 3/1 104 104 Transition block 52 52 Conv 64 1 1/1 52 52 4 Conv 128 3 3/1 52 52 2 4 8 32 1 1 64 3 3 18 1 1 YOLO Transition block 26 26 Conv 128 1 1/1 26 26 4 Conv 256 3 3/1 26 26 2 4 64 1 1 128 3 3 18 1 1 YOLO Transition block 13 13 Conv 128 1 1/1 13 13 4 Conv 256 3 3/1 13 13 图 4 密集相连的多尺度检测 Fig. 4 Multi-scale detection with dense connection 2 256 1 1 512 3 3 18 1 1 YOLO 128 1 1 256 3 3 18 1 1 YOLO 4 实验结果与分析 Darknet I7-8700 CPU 16G RAM 1070Ti Windows 10 F 1 IOU AP P TP = F + T F 1 P T P R P = F F P + N 2P R F1 = P+ R T P F P F N AP A P VOC2007 PR R (0, 0.1, 0.2,, 0.9, 1) 11 A P 1 AP = Pinterp( R), 11 R {0,0.1,...,1} P ( R) = max p( R ), (4) interp RR, R P interp ( R) R R R N (f/s) t=1/n ms 30 f/s 180350-5

4.1 数据集 990 ( 5) LableImg 850 140 1372 941 ( 5(a)) ( 5(b)) ( 5(c)) 4.2 训练方法 0.9 η lr = 0.001 0.005 1000 2 ηlearning_rate = ηlr ( Nbatch /1000) N batch 10-3 10 320 320 608 608 32 4.3 检测结果定量评估 YOLOv3-air YOLOv3 YOLOv3-tiny YOLOv2 41616 1 AP F 1 140 96.26% 93.81% 89.31% YOLOv3-tiny 6% 13% 13% YOLOv3-air YOLOv3-tiny 4 YOLOv3 AP YOLOv3-air YOLOv3-tiny YOLOv3 33.2 f/s YOLOv3-tiny 215.2 f/s YOLOv3-air 58.3 f/s YOLOv3-air IOU YOLOv3 YOLOv3-tiny 4% YOLOv2 YOLOv2-tiny YOLOv2 YOLOv3 4.4 定性评估与误差分析 6(a) 6(b) 6(c) YOLOv3-air YOLOv3-tiny YOLOv3 7(b) 7(d) 6(d) 6(e) 6(f) YOLOv3 YOLOv3-tiny YOLOv3-air (a) (b) (c) 图 5 飞机数据集实例 Fig. 5 Three samples of airplane dataset 表 1 5 种算法的性能对比 Table 1 Performance comparison of 5 algorithms P/% R/% F 1 /% A P /% R IOU /% /(f/s) /ms YOLOv3 93.56 78.9 85.61 78.97 68.80 33.2 30.1 YOLOv3-tiny 90.82 83.05 86.76 78.99 67.05 215.2 4.6 YOLOv3-air 96.26 93.81 95.02 89.31 72.46 58.3 17.2 YOLOv2 87.11 62.27 72.62 60.92 60.28 47.5 21.1 YOLOv2-tiny 67.44 54.41 60.23 46.87 45.83 207.5 4.8 180350-6

光电工程 的差距 无法处理外表剧烈变化的飞机目标 分析可 与泛化性上表现优异 并且通过密集连接复用特征减 知 简单的卷积神经网络模型具有更好的泛化性 尤 少了训练数据不足的影响 其是在数据集较小 数据复杂多变的情况下 YOLOv3 为了进一步探讨训练集大小与算法性能的关系 参数数量过大 导致 YOLOv3 过拟合 本文提出的 表 2 中给出了在训练集只有 300 张遥感图像与只有 500 YOLOv3-air 通过减少参数量和增加多尺度检测上结 张遥感图像时 在相同测试集下 YOLOv3-air 的性能 合了 YOLOv3-tiny 和 YOLOv3 的优点 在小目标检测 在表 2 中 YOLOv3-air-500 表示训练集中只有 500 张 YOLOv3-air YOLOv3-tiny YOLOv3 (a) (b) (c) (d) (e) (f) 图 6 从左到右分别是 YOLOv3-air YOLOv3-tiny YOLOv3 的检测结果 (a) P883 (b) P902 (c) P903 (d) P909 (e) P866 (f) P867 Fig. 6 The detection results of YOLOv3-air YOLOv3-tiny YOLOv3 in order. (a) P883; (b) P902; (c) P903; (d) P909; (e) P866; (f) P867 180350-7

表 2 在不同大小的训练集中,YOLOv3-air 的性能对比 Table 2 Performance comparison of YOLOv3-air with different number images in training set P/% R/% F 1 /% A P /% R IOU /% YOLOv3-air 96.26 93.81 95.02 89.31 72.46 YOLOv3-air-500 93.47 87.25 90.25 86.53 70.74 YOLOv3-air-300 92.62 74.49 82.57 78.12 67.15 YOLOv3-air YOLOv3-air-300 300 YOLOv3-air 2 300 YOLOv3 YOLOv3-tiny 5 结论 YOLOv3 YOLOv3-air 58.34 f/s 96.26% 93.81% 89.31% YOLOv3 参考文献 [1] Girshick R, Donahue J, Darrell T, et al. Rich feature hierarchies for accurate object detection and semantic segmentation[c]// Proceedings of 2014 IEEE Conference on Computer Vision and Pattern Recognition, Columbus, OH, USA, 2014: 580 587. [2] Girshick R. Fast R-CNN[C]//IEEE International Conference on Computer Vision. IEEE, 2015:1440 1448. [3] Ren S Q, He K M, Girshick R, et al. Faster R-CNN: towards real-time object detection with region proposal networks[c]// Proceedings of the 28th International Conference on Neural Information Processing Systems, Montreal, Canada, 2015: 91 99. [4] He K, Gkioxari G, Dollár P, et al. Mask R-CNN[C]//IEEE International Conference on Computer Vision. IEEE, 2017: 2980 2988. [5] Redmon J, Divvala S, Girshick R, et al. You Only Look Once: Unified, Real-Time Object Detection[C]//Computer Vision and Pattern Recognition. IEEE, 2016: 779 788. [6] Liu W, Anguelov D, Erhan D, et al. SSD: Single Shot MultiBox Detector[C]//European Conference on Computer Vision. Springer International Publishing, 2016: 21 37. [7] Redmon J, Farhadi A. YOLO9000: Better, Faster, Stronger[C]// IEEE Conference on Computer Vision and Pattern Recognition. IEEE, 2017: 6517 6525. [8] Redmon J, Farhadi A. YOLOv3: An Incremental Improvement[J]. arxiv preprint arxiv:1804.02767, 2018. [9] Xue Y J, Huang N, Tu S Q, et al. Immature mango detection based on improved YOLOv2[J]. Transactions of the Chinese Society of Agricultural Engineering, 2018, 34(7): 173 179. 薛月菊, 黄宁, 涂淑琴, 等. 未成熟芒果的改进 YOLOv2 识别方法 [J]. 农业工程学报, 2018, 34(7): 173 179. [10] Wang S Y, Gao X, Sun H, et al. An aircraft detection method based on convolutional neural networks in high-resolution SAR images[j]. Journal of Radars, 2017, 6(2): 195 203. 王思雨, 高鑫, 孙皓, 等. 基于卷积神经网络的高分辨率 SAR 图像飞机目标检测方法 [J]. 雷达学报, 2017, 6(2): 195 203. [11] Zhou M, Shi Z W, Ding H P. Aircraft classification in remote-sensing images using convolutional neural networks[j]. Journal of Image and Graphics, 2017, 22(5): 702 708. 周敏, 史振威, 丁火平. 遥感图像飞机目标分类的卷积神经网络方法 [J]. 中国图象图形学报, 2017, 22(5): 702 708. [12] Gu Y, Xu Y. Fast SAR target recognition based on random convolution features and ensemble extreme learning machines[j]. Opto-Electronic Engineering, 2018, 45(1): 170432. 谷雨, 徐英. 基于随机卷积特征和集成超限学习机的快速 SAR 目标识别 [J]. 光电工程, 2018, 45(1): 170432. [13] Huang G, Liu Z, Maaten L V D, et al. Densely Connected Convolutional Networks[C]//IEEE Conference on Computer Vision and Pattern Recognition. IEEE Computer Society, 2017: 2261 2269. [14] Lin T Y, Dollar P, Girshick R, et al. Feature Pyramid Networks for Object Detection[C]//IEEE Conference on Computer Vision and Pattern Recognition. IEEE Computer Society, 2017: 936 944. 180350-8

Real-time airplane detection algorithm in remote-sensing images based on improved YOLOv3 Dai Weicong 1,2*, Jin Longxu 1, Li Guoning 1, Zheng Zhiqiang 3 1 Changchun Institute of Optics, Fine Mechanics and Physics, Chinese Academy of Sciences, Changchun, Jilin 130033, China; 2 University of Chinese Academy of Sciences, Beijing 100049, China; 3 Changchun University of Science and Technology, Changchun, Jilin 130022, China An illustration of predicted bounding boxes on 13x13 grids of YOLOv3 Overview: The detection of airplanes in remote-sensing images has many important applications in many domains. However, limited to the performance of traditional machine learning methods, the airplanes in remote-sensing images are difficult to be detected. Recently, deep convolutional neural networks are employed to solve object detection problem and reach excellent accuracy. YOLO is one of the most famous real-time object detection algorithms based on regression. Compared with other algorithms, YOLO is more generalized when applied to many domains. Focusing on the airplanes in remote-sensing images, a real-time algorithm based on improved YOLOv3 is proposed to detect airplanes in remote-sensing images. Firstly, a convolutional neural network that consists of 49 convolutional layers is proposed to detect airplanes in remote-sensing images specifically. In the transition blocks of proposed convolutional neural network, we employ 1 1 convolution kernels to further reduce the parameters. Secondly, dense connection is employed on proposed convolutional neural network, and the maxpool is employed to enhance the feature transmit between two dense blocks. In this way, the feature transmit between two dense blocks is reconnected after a undersampling convolutional layer. The dense connection in proposed convolutional neural network enable the network to avoid over-fitting and reach high accuracy although the network is trained by relative few training data. Finally, to deal with the fact that airplanes in remote-sensing images are small targets mainly, we propose to increase the scale detections from 3 to 4 and employ dense connection to merge feature map among different scales. The anchor boxes in our work are obtained by running k-means clustering on the training set bounding boxes. The algorithm is trained and tested on the designed airplane dataset, which have 990 remote-sensing images. The qualitative experiment results show that our algorithm has stronger robustness than other existing algorithms, and our algorithm also shows especially high recall on small targets. The quantitative experiment results show that our algorithm obtains 96.26% on precision, 93.81% on recall and 89.31% on AP. Our algorithm reaches a relative improvement of 13.1% with respect to the YOLOv3 on AP. The detector proposed in this study is proven to perform real-time speed of more than 58.3 frames per second on a 1070Ti GPU. This study demonstrates the high effectiveness and accuracy of deep convolutional neural network in detecting airplanes on remote-sensing images. Meanwhile, the research also shows the fact that the performance of convolutional neural networks is decided by their structure and the number of training data. Citation: Dai W C, Jin L X, Li G N, et al. Real-time airplane detection algorithm in remote-sensing images based on improved YOLOv3[J]. Opto-Electronic Engineering, 2018, 45(12): 180350 Supported by National High Technology Research and Development Program ("863"Program) of China (863-2-5-1-13B) *E-mail: daiweicong16@mails.ucas.ac.cn 180350-9