第卷第期林封笑陈华杰姚勤炜等基于混合结构卷积神经网络的目标快速检测算法议生成模块不完全占用参数规模与计算开销分类模块能通过压缩方法进行有效压缩如采用奇异值分解策略采用卷积神经网络作为特征提取网络对检测算法的检测性能具有显著影响通常采用的卷积神经网络有 ' (( ( 5* 等

第卷第期计算机工程年月! 人工智能及识别技术文章编号文献标志码中图分类号基于混合结构卷积神经网络的目标快速检测算法林封笑陈华杰姚勤炜张杰豪杭州电子科技大学自动化学院杭州摘要为提高基于卷积神经网络目标检测算法的检测速度提出一种基于混合结构的目标快速检测算法采用基于的 '$*5# 目标检测框架对其进行优化基于多层感知器结构提出 5# 卷积层结构在网络浅层采用 5 策略同时结合 5# 层结构和 5 策略合理设计层参数构成卷积神经网络将该卷积神经网络融合到 '$*5# 检测框架中实现目标快速检测实验结果表明在检测精度的适当影响范围内该算法能够减少网络模型参数并降低网络模型的内存消耗提高网络的实时性关键词目标快速检测 '$*5# 框架卷积神经网络特征提取混合结构低通道中文引用格式林封笑陈华杰姚勤炜等基于混合结构卷积神经网络的目标快速检测算法计算机工程 # 英文引用格式 '$ $ 7& 82 $%$.$*, $0!$*, 01!, * $$2 # 4"(;$(#"("-(%!4%( &$"%! '0(-("9%!5% (%! 8" 8"(1% '$ $7& 82( 0$ $, *$+0 $+*1$+0 0$ $(-(, 0, *,.0$$2 $, $0$$.$*, $0!$*, 01!, * **, *+,!1 #!$*, '$*5# $,.$2-$*, 0$1 * $5# $ $1* **,%05 *$1 *$,, 0*0$2 $1.02$, 05# $1* $, 05 *$1 $!,,* 0$1$$*$*$!1. *, 0'$*5#,.$2 $0$, $,$***02 0$ $, 20 0'$*5#'$00$0 $, 02,$$*, 0 1 *.02,$, 0$#.$.02 /"0 1%$ $.$*,'$*5#.$2$$2.$$ 01!, * 2 0$ # 4**# 概述目标检测与识别是通过分析目标的几何或统计特征在未知图像中能够准确地检测并识别出目标目前目标检测算法比较复杂耗时且缺乏鲁棒性卷积神经网络 $$2 已成为目标检测与识别领域的研究热点 # # 卷积神经网络是深度学习模型的一种能从大量数据中自动学习目标特征文献提出 5# 目标检测框架实现的目标检测算法文献提出 '$*5# 目标检测框架减少在 5# 检测框架中存在的冗余计算文献提出 '$*5# 目标检测框架降低检测框架中候选区域算法的复杂度文献提出基于 7&& 的目标检测框架该框架提高了检测速度但消耗较多的检测精度基于的目标检测算法在应用中性能稳定但模型规模较为庞大存在大量的参数带来沉重的计算开销影响网络的检测速度基于的目标检测算法的基本流程为特征提取网络区域建议生成感兴趣区域分类其中区域建作者简介林封笑男硕士研究生主研方向为模式识别机器学习陈华杰教授博士姚勤炜张杰豪硕士研究生收稿日期 ## 修回日期 ##0+%.

第卷第期林封笑陈华杰姚勤炜等基于混合结构卷积神经网络的目标快速检测算法议生成模块不完全占用参数规模与计算开销分类模块能通过压缩方法进行有效压缩如采用奇异值分解策略采用卷积神经网络作为特征提取网络对检测算法的检测性能具有显著影响通常采用的卷积神经网络有 ' (( ( 5* 等这一系列网络通过逐步加深网络提高性能然而深度的增加会带来大规模的参数数量因此研究人员进行了针对小型卷积神经网络的设计增加网络宽度的 /+ 简化卷积计算结构的 "! 增强单层卷积特征提取的小型卷积神经网络实现网络参数规模的缩减具有较好的特征提取性能但其仍存在网络深度或计算开销的制约影响网络的速度针对上述研究存在的不足本文提出一种基于混合结构卷积神经网络的目标快速检测算法将 '$*5# 目标检测框架特征提取的卷积神经网络进行替换采用混合结构卷积神经网络并利用小型卷积神经网络设计卷积层结构在保持较浅网络深度的情况下减少网络参数的同时降低计算开销目标快速检测网络框架本文目标快速检测网络框架基于 '$*5# 目标检测算法如图所示该框架将区域建议网络 5 *$25 和目标识别网络 '$* 5# 相拼接个网络均采用卷积神经网络进行特征提取因此将共有的卷积特征提取部分参数共享使个网络结合得到一个端到端的检测网络 '$*5# 网络用于对候选区域分类和边框回归获得目标检测结果以输入图像以及通过 5 网络得到的区域候选窗作为输入通过卷积神经网络提取到最后一层输出的特征图然后对区域候选窗在特征图上进行映射并采用 5 池化操作将映射区域池化到同一大小通过全连接层得到特征向量利用特征向量实现边框回归以及目标分类卷积神经网络作为 5 网络和 '$*5# 网络的共享部分作用是对输入图像进行特征提取典型卷积神经网络通常由输入层卷积层池化层全连接层输出层组成其中卷积层是核心部件且网络采用多层卷积层串联的结构组合方式构成深层网络每一层卷积层中的不同卷积核能够学习不同的目标特征多层卷积层实现对输入信息的分层特征提取与融合低层卷积层主要提取低级特征如边缘角落颜色组合等高层卷积层主要对低级特征的抽象获取更高级的特征如形状或目标的显著变化特征提取网络设计混合结构卷积神经网络卷积神经网络中的参数源于每层卷积层的卷积核数量卷积层结构示意图如图所示其中单层卷积层的结构如图 $ 所示图 ;$("2988 目标检测网络 5 网络用于生成区域候选窗口利用卷积神经网络进行特征提取在最后一层特征图上采用一个滑动窗口平移遍历每次移动滑窗后以滑窗位置中心为基准通过尺度与宽高比生成候选区域窗口对产生的所有候选区域窗口采用非极大值抑制算法存在的冗余窗口进行剔除并选取前个候选区域作为最终生成的候选区域窗口用于 '$*5# 网络的训练图卷积层结构示意图

计算机工程年月日一幅通道数为 4 的特征图经过卷积层时与每个卷积核分别进行卷积操作通过激活函数 - 形成对应输出特征图中的一个通道信息多个卷积核使输出特征图仍保持多通道为获得完备的特征信息需要网络采用更深的层次每层拥有更多的卷积核数目导致网络具有庞大的计算开销影响其提取速度因此本文对卷积神经网络优化改进的设计方向是当网络层数较浅时仍具有良好的特征提取性能此外根据参数来源分析层之间的通道数对参数数量以及计算开销有直接影响降低卷积层之间的通道数通过低通道数来减少参数规模降低计算开销本文采用全卷积结构利用层卷积层进行串联减少池化层造成的信息丢失及全连接层过多的参数规模为减少网络的参数规模根据结构优化的主要设计原则 5# 0$5, "$1 $ 卷积层结构替换原有卷积层并采用 5 策略协同作用混合卷积神经网络结构如表所示第层为标准的卷积层其余层采用 5# 卷积层结构同时在网络的前层中采用 5 策略第层为 5# 结构和 5 策略的混合表混合卷积神经网络结构层名层类型通道数卷积参数 *+4*,4$,, 输出特征图尺寸,$$,$$$1 " " 5 4##4#4 " 4 4 " " 55# ### " 4 4 " " 55# ### " 4 4 " " 5# ### " 4 4 " " 5# ### " 4 4 " " 5# ### " 4 4 " " $.$ " " 92,-%!5 卷积层结构根据卷积层结构与整体网络结构的设计原则本文提出 5# 卷积层结构其网络结构如图所示其中图! & 图, 采取单卷积核描述结构应用于网络中网络结构形式如图! 所示通过在每个卷积核中添加微型多层感知器网络对每个局部感受器的神经元进行非线性抽象增强该层特征的表达采用结构能够使整体卷积神经网络在网络深度与特征提取性能之间取得较好的平衡即不需要很深的网络结构仍具有较好的特征提取性能 5# 结构采用文献提出的点卷积预先降低通道数将上层得到的输出特征图输入到结构点卷积由卷积核大小为 " 的多个卷积核组成其个数是点卷积的通道数决定了点卷积在通道数上的变化尺度为实现低通道操作点卷积通道数小于输入特征图以及卷积层的通道数卷积层的通道数与参数数量呈现正相关关系 5# 结构在保持其特征提取性能的基础上能有效减少卷积层的卷积参数规模降低由参数数量带来复杂的计算开销 92". 策略本文采用级联修正线性单元 $$, 5., $*5 策略应用在卷积神经网络的浅层结构中对卷积层参数通过降低通道数进行缩减卷积神经网络的浅层网络中其卷积层的卷积核存在一定程度上的相位成对现象且相位相反即存在一个卷积核的激活则存在与之相位相反的另一个激活卷积核导致在学习过程中得到的浅层卷积核存在冗余根据冗余卷积核的相位成对现象 5 策略在网络中加入相位的先验信息消除卷积核中的冗余在结构上 5 策略将卷积层的输出取反操作将其与输出进行通道上的连接合并得到输出特征图如图所示因此在剔除冗余卷积核的同时为得到与网络结构相同的特征图输出将结构中的卷积层通道数设置为原有结构通道数的一半图 92". 策略结构示意图

第卷第期林封笑陈华杰姚勤炜等基于混合结构卷积神经网络的目标快速检测算法定量分析在卷积神经网络中第层卷积层如图 $ 所示其输入特征图尺寸为, 4 4 "4 其中 4 为输入图像通道数经卷积操作后输出特征图尺寸为, " 其中为输出通道数则该卷积层由个卷积核组成假设每个卷积核的尺寸为, ", "4 则有,, 4, 6 其中表示边缘填充的宽度 6 表示卷积核的滑动步长设典型卷积神经网络的输入长宽均相等且不带偏置项则第层卷积层的参数数量与计算开销 % 分别为 4 " % 4 " 由式可以看出通道数与参数数量计算开销成正相关关系表明降低通道数能够减少网络模型的参数规模在 5# 结构中点卷积通道数的选择准则为输入通道数 4 与输出通道数分别是的倍 & 倍则第层卷积层的参数数量变为 4 " " " " 计算开销变为 % ", 与卷积结构相比有 % % 4 根据的选择采用 5# 层结构能够减少约 & 的参数数量及计算开销 5 策略的第层卷积层通道数为 $ 则其需要的滤波器参数数量为, " 4 " 计算开销为 % 与卷积结构相比参数数量和计算开销均减少一半 % % 假设典型卷积神经网络为层网络则该网络的总参数数量与总计算开销为 % 若网络采用混合 5# 卷积层结构和 5 策略的结构设计则层网络拥有总参数数量与总计算开销分别为 ' %' 其中 %' ' 和 ' 4 " " " " 分别表示第层的计算开销与参数数量若假定选择 $$4, 则与层典型卷积神经网络相比该网络能减少约的参数数量及计算开销实验与结果分析本文实验环境如下操作系统为! ( 型号为 %$ ) 开发框架采用 $. 深度学习框架实验采用 ( 加速卷积神经网络的训练训练卷积神经网络需大量的数据集防止出现过拟合采用预训练网络对目标分类或目标检测网络微调保证网络性能较好本文目标快速检测网络的训练采用次训练策略通过大数据集训练得到特征提取部分的预训练网络采用预训练网络对目标快速检测网络训练其中预训练网络通过实现分类任务对网络进行性能评价预训练网络采用已有的网络数据集作为训练数据集如 $ 数据集该数据集含有近多万张图像涵盖万多个类别图像在输入网络前剪裁至 " 并把图像顺序随机打乱预训练网络中层的待学习参数用均值为标准差为的高斯分布随机采样进行初始化预训练网络的初始学习率 "5%* 设置为学习率策略为 1 策略其函数形式为 *"5%*" % # 5* 其中表示当前迭代次数 % 表示最大迭代次数 5* 为超参数本文取 % 5*$ 检测网络采用带有边框信息的数据集作为训练数据集如 $*$& 数据集该数据集含有类检测目标共张图像且每张图像含有多目标或多类目标检测网络将输入图像缩放使图像最短边长设置为检测网络的特征提取层参数利用预训练网络得到的参数初始化待学习参数以均值为标准差为的高斯分布随机采样初始化检测网络的初始学习率 "5%* 设置为并且在第次迭代时将学习率调整为最大迭代次数设置为次单一结构对网络性能的影响本节通过多组模型的对比实验验证单一结构对卷积神经网络的性能影响实验采用已有的网络模型作为基准在基准网络模型上重新设计每一种基本构建单元的网络模型具体如下模型采用文献提出的典型层 ' 网络模型采用文献提出的层 (( 网络模型采用文献提出的层网络模型卷积层采用 5# 卷积层结构替换整体网络的层数与层参数与模型相同模型基于模型在网络前层采用 5 策略通过实现分类任务对每一个网络进行性能评价每一个网络的训练策略采用节中预训练网络的训练策略对类目标分类训练数据集源

计算机工程年月日于 5 数据集共含有张图像实验结果如表所示表单一结构对网络的性能影响卷积层准确率 4 模型参数数量计算开销 % % ' 6 (- (( " (- 6 (- 5# 6 "- 5# 5 6 "- 从表可以看出采用结构构成深度较浅的卷积神经网络其分类准确率分别达到了和与模型相比分别提高和与模型保持相近的准确率网络具有较好的性能其参数数量及计算开销与浅层模型相近但相较于深层模型有显著降低在保持网络性能的同时采用 5# 层结构的网络参数数量减少计算开销降低采用 5 策略的网络其参数数量减少计算开销降低结合 5# 层结构和 5 策略的网络项降幅分别为和综上分析本文提出的结构设计在网络较浅时能保持其特征提取性能并且能有效减少网络的参数数量降低计算开销基于混合结构 988 的目标快速检测网络本文对类常见目标进行目标检测任务该类分别为飞机船只轿车火车人其中预训练网络通过类目标的分类任务训练得到预训练网络训练数据集来源 5 数据集含有张图像目标检测网络的训练集与测试集数据来源于 & 数据集训练集含有张图像本文采用相同的数据集以及训练模式对文献提供的种常用网络模型训练将得到的网络模型与本文目标快速检测网络模型对比结果如表所示表检测网络性能对比实验结果共享卷积层运行时间运行内存模型参数数量计算 4.$ 4"- 4 开销 * 平均正确率均值 4 目标快速检测网络算法 "- 4 '$*5# ((# (- 4 '$*5# ' (- 4 从表可以看出目标快速检测网络算法的检测性能为与其余个模型的检测性能相比差值为和但在参数数量与计算开销方面目标快速检测网络算法优势较为明显能够分别减少和的参数数量同时也分别降低和的计算开销较少的参数数量降低网络的资源消耗提升了网络的检测速度目标快速检测网络在测试时占用的运行内存为 "- 与其余个模型相比分别减少和在对网络检测速度测试时目标快速检测网络算法对单幅图像测试时间为 * 比其他个模型分别提升倍和倍因此本文算法能够有效地减少网络的参数规模提高目标检测网络的检测速度同时有效地减少检测网络的资源消耗结束语本文提出混合结构卷积神经网络的目标快速检测算法该算法利用 5# 结构降低通道数网络浅层应用 5 策略通过级联两者得到结构优化的混合结构卷积神经网络实验结果表明本文算法能够减小网络模型的参数规模提高网络的实时性降低网络模型的内存消耗如何进一步降低模型规模和提高检测性能是下一步的研究方向参考文献 %("7 7( " 5%& " $.$ * 0$ 0$#.$.$.$# 44,*.. * $, $ 5:$*0 *# 姚相坤万里红霍宏等基于多结构卷积神经网络的高分遥感影像飞机目标检测计算机工程 # 易生梁华刚茹锋基于多列深度卷积神经网络的手势识别计算机工程 # 7-(&7%&( $ $ # 王兆凯李亚星冯旭鹏等基于深度信念网络的个性化信息计算机工程 # (565&55%$50.$ 0$0*. $ $!, $, *$ *$ 44,*.. * $, $ 5:$*0 *# (565'$*5# 44,*.# $$. *:$*0 *#

第卷第期林封笑陈华杰姚勤炜等基于混合结构卷积神经网络的目标快速检测算法 5 6 (56 5 $'$*5# 2$,*$#!, 20 *$ 2* %$*$* $ $1**$, "$0 # 5"& (56 5 $7 1.,$#!, 44,*.. * $, $ 5:$*0 (7 : 7 $(,20 * 44,*.. * $, $ 5:$*0 *# 6( )5 $ *,$$. $ 44,*.. * $, $ 5:$*0 *# **# '&55% &( "%%: : " $ %& 5"- : -5 $ /+ $# $ $1 20.2 $* 20 $2*.. $$ 44,*.$$. $.$ * 1**$!"% *# 6567 %65 %& ( $ $**.$ 20, $$ 2* 44,*.$$. $.$ ** 1**2 7 "# 5" '5( 5*$+ $,,*$, $$*$, "-,*+ -4& # # 0 * 44$ 4,.4,. &:5 ( " - $"!*. $$2*.!* $$* -4& ## 0 * 44$ 4,.4,. " 87 2 2-4& ## 0 * 44$ 4,.4,. (:&6"$,*$, $, $ 2* 44,*. $ $$2* $ $$,. *-($1 # "&765" 1, $ 2*.$#*$ $ -4& ##0 *44$ 4$!*4., $* -4& ## 0 * 44 $ 4,.4,. 李传朋秦品乐张晋京基于浓度卷识神经网络的图像去噪研究计算机工程 # 编辑赵辉上接第页谢智歌王岳青窦勇等基于卷积 # 自动编码机的三维形状特征学习计算机辅助设计与图形学学报 # 5(5(&7 &((5 & $, *$*$00 ** 44#,*. *. * $, $ 5:$*0 *# :( 7 (& 7 ) $&# # & %((5 & $2*,*.$ */ *.$ #2 44,*.. * $, $ 5:$*0 *# 董水龙李海生祝晓斌等利用特征和 -:* 的三维模型检索算法广西大学学报自然科学版 # 855"$$, #2!$*, $ $ 2*. *0$ *.!$*.$,$$ 44,*. $$1** " %$*$* ($0*. * $, $ 5 :$*0 *# - - & $$, $$ *$.# *0$ $ " 6 " $%0 *0$! 0$ 44,*.. * * # 0$ $*:$*0 " 6&(56 $"#2 *# $$2*., *0$ # ( 5'*! $*.$ 44,*.$$. *,$$*$* *:$*0 编辑金胡考 **#