[发明专利]多路感受野引导的特征金字塔小目标检测网络及检测方法有效
申请号: | 202110148501.4 | 申请日: | 2021-02-03 |
公开(公告)号: | CN112801117B | 公开(公告)日: | 2022-07-12 |
发明(设计)人: | 张宝;张婧;卓亮;魏东梅;胡伟;李小霞;韩翔雨;张东;何林洋 | 申请(专利权)人: | 四川中烟工业有限责任公司;西南科技大学 |
主分类号: | G06V10/44 | 分类号: | G06V10/44;G06V10/764;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 四川省成都市天策商标专利事务所(有限合伙) 51213 | 代理人: | 龚海月 |
地址: | 610000 四川省成都市龙泉*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 感受 引导 特征 金字塔 目标 检测 网络 方法 | ||
1.一种多路感受野引导的特征金字塔小目标检测方法,其特征在于,包括特征金字塔小目标检测网络,所述的特征金字塔小目标检测网络包括依次连接的获取目标图片特征的骨干网络、融合扩大感受野模块的特征金字塔网络以及具有两个分支的检测头网络,所述的检测方法包括:
首先选取残差网络作为骨干网络,骨干网络用于提取不同层次的特征信息;
其次设计由n-1条空洞卷积支路和原图直连组成的n路扩大感受野模块,可在不继续下采样的情况下扩大特征图的感受野;
然后将扩大感受野模块加入骨干网络和特征金字塔之间,融合扩大感受野模块的特征金字塔网络用于将不同层次的特征信息经过扩大感受野模块后再进行特征融合,以引导网络获得不同层次感受野下的上下文信息,同时获取足够的语义信息和丰富的细节信息;
最后将经过扩大感受野模块获得的特征图与骨干网络对应层特征图相加后形成输出特征图,可同时获取足够的语义信息和丰富的细节信息;两个分支的检测头网络用于得到目标的预测框以及分类置信度。
2.根据权利要求1所述的多路感受野引导的特征金字塔小目标检测方法,其特征在于,所述骨干网络为Resnet50网络。
3.根据权利要求1所述的多路感受野引导的特征金字塔小目标检测方法,其特征在于,所述扩大感受野模块包括n条并行支路,设置其中的n-1条并行支路对输入特征图进行空洞卷积,得到n-1个不同大小感受野的特征图并进行融合,然后使用1*1的卷积降低通道数,再利用剩余的一条并行支路与输入特征图融合,最后获得的输出特征图既保留了原有感受野下的细节信息,又获得了更大感受野下的语义信息。
4.根据权利要求3所述的多路感受野引导的特征金字塔小目标检测方法,其特征在于,所述扩大感受野模块的计算公式为:O=Add(I,M),其中:O为扩大感受野模块后最终的输出特征图,I为输入特征图,M为对输入特征图进行空洞卷积后的n-1张特征图的连接特征图,Add表示将I和M进行特征图相加。
5.根据权利要求4所述的多路感受野引导的特征金字塔小目标检测方法,其特征在于,对输入特征图进行空洞卷积后的n-1张特征图的连接特征图M的计算公式为:M=Conv[Concat(y1,y2,……,yn-1)],其中:y1、y2、……、yn-1为输入特征图进行空洞卷积后的特征图,Concat表示将y1、y2、……、yn-1通道连接起来。
6.根据权利要求5所述的多路感受野引导的特征金字塔小目标检测方法,其特征在于,输入特征图进行空洞卷积后的特征图y1、y2、……、yn-1的计算公式为:yi=DConv(I,U,V),其中:i=1、2、……、n-1,DConv表示对特征图进行空洞卷积,U表示空洞率,V表示卷积核大小。
7.根据权利要求1所述的多路感受野引导的特征金字塔小目标检测方法,其特征在于,所述扩大感受野模块融合在特征金字塔网络的第四层特征图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川中烟工业有限责任公司;西南科技大学,未经四川中烟工业有限责任公司;西南科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110148501.4/1.html,转载请声明来源钻瓜专利网。