[发明专利]基于多尺度融合轻量化深度学习卷积网络的目标检测方法在审
申请号: | 202111068517.0 | 申请日: | 2021-09-13 |
公开(公告)号: | CN113902971A | 公开(公告)日: | 2022-01-07 |
发明(设计)人: | 曾大治;梁若飞;章菲菲;刘英杰 | 申请(专利权)人: | 北京理工雷科电子信息技术有限公司 |
主分类号: | G06V20/10 | 分类号: | G06V20/10;G06V10/82;G06V30/18;G06N3/04;G06N3/08 |
代理公司: | 北京理工大学专利中心 11120 | 代理人: | 田亚琪 |
地址: | 100081 北京市海淀区中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 尺度 融合 量化 深度 学习 卷积 网络 目标 检测 方法 | ||
本发明公开了基于多尺度融合轻量化深度学习卷积网络的目标检测方法,设计骨干网络由两个模块组成:主干特征提取模块和多尺度融合定位特征模块;主干特征提取模块遵循了DenseNet网络沿通道维度串联的结构特点,使得每一层与它的所有后续层直接连接,特征可重复利用,不需要学习冗余的特征,从而降低参数量,保持网络精简高效;并且在其基础上增加了双路卷积通道方式,从而得到不同尺度的感受野;多尺度特征模块沿用了SSD多尺度锚点框检测机制,并在其基础上加入3‑way残差模块,把多尺度特征进行融合,增强特征的表达能力,从而检测多尺度飞机目标。
技术领域
本发明属于机器学习及深度学习的技术领域,具体涉及一种基于多尺度融合的轻量化深度学习卷积网络的目标检测方法。
背景技术
通常,深度神经网络的参数数目可以达到千万甚至亿级,随着网络的深度和广度的增加,网络模型存在着大量的冗余参数,这是导致深度学习模型计算量大、内存消耗严重的主要原因。实际上,在网络传播过程中,只需要保留重要程度较高的神经元或者以更为优化和简单的方式组织表示神经元就可以提供足够的特征信息给神经网络的输出层进行结果预测。针对这个现象,很多关于模型压缩和模型运算加速的方法被提出,总结为,深度神经网络模型加速和优化的策略研究主要可以归结为三个层面:精简权重的表示方式、减少网络连接和神经元冗余、网络结构的优化。
(1)精简网络权重的表示
常用的神经网络模型参数的表示形式都是浮点型(单精度)数或者双精度数,即一个参数需要占用4个字节(32位)或者8个字节(64位)。为了降低深层神经网络模型的存储空间和内存消耗从而达到压缩和加速深度模型的目的,很多相关研究学者企图通过利用更少的比特位来近似表示深度神经网络模型的实数权重值。
(2)降低网络权重的冗余
深度神经网络模型在参数学习的过程中其实大部分的参数对输入对象的特征抽取影响微乎其微或者用少量的神经元即可以达到分类器对特征抽取的要求。因此,对深度神经网络模型网络层与层之间连接和神经元冗余问题的相关研究进展也是降低深度神经网络模型对内存大小和计算量需求的另一个切入点。
(3)优化网络结构
不同的神经网络结构对模型性能的影响非常显著,更好的网络结构可以减少每一层的神经元和权重的数量,从而可以在保证不会出现梯度消失等问题的同时设计更深层的神经网络模型。此外,更优化的网络结构还可以让网络更加容易训练,减少网络模型的运算量和学习参数,达到加速神经网络训练和推断过程的目的。
不难发现,深度神经网络模型如果具有更小和更少的神经元往往意味着更低的计算量需求。因此探索更合适的神经网络结构也可以显著地加速网络的训练和推断过程。以2014年ImageNet竞赛为例子,获得优胜的VGG模型和GoogLeNet模型在图片分类任务中取得了相近的成绩,但是GoogLeNet不仅运行速度明显快于VGG,而且模型参数的数量也远远小于VGG。出现这种情况的主要原因是GoogLeNet使用了更多的小尺寸卷积核和池化操作,即在两种网络的神经元个数相同的情况下,GoogLeNet的权重矩阵和卷积操作的计算量也明显小于VGG。在过去几年中,不少相关研究提出新的神经网络结构单元,企图通过利用更小或者更简单的神经单元构造网络,以此来减少训练参数的数量。2015年,Srivastava等人受到长短期记忆循环网络结构的启发,设计出了公路神经网络。相比在此之前提出的教师网络,具有更深网络结构的公路网络不仅克服梯度消失的问题,而且它仅仅用了1.25M的参数就在CIFAR-10和CIFAR-100数据集上取得了更好的表现。同年,Kaiming He等人设计了一种新的结构单元来构建深层神经网络,称为残差块。他们提出的ResNets网络最终获得了2015年ImageNet比赛的优胜。与公路网络相比,ResNets网络仅仅使用1/3的学习参数就获得了更好的性能表现。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工雷科电子信息技术有限公司,未经北京理工雷科电子信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111068517.0/2.html,转载请声明来源钻瓜专利网。