[发明专利]一种特征复用的多知识学习目标检测方法有效
| 申请号: | 202110285310.2 | 申请日: | 2021-03-17 |
| 公开(公告)号: | CN113011492B | 公开(公告)日: | 2022-12-09 |
| 发明(设计)人: | 杨小宝;王军;王文涛;马素刚 | 申请(专利权)人: | 西安邮电大学 |
| 主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/80;G06V10/776;G06V10/82 |
| 代理公司: | 西安创知专利事务所 61213 | 代理人: | 马凤云 |
| 地址: | 710121 陕西省西*** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 特征 知识 学习 目标 检测 方法 | ||
本发明公开了一种特征复用的多知识学习目标检测方法,包括步骤:一、建立目标检测图像数据库;二、构建特征复用的特征融合网络;三、训练特征复用的特征融合网络;四、测试特征复用的特征融合网络;五、特征复用的多知识学习目标检测。本发明通过对自上向下及自底向上融合通路中不同层之间都做了直接连接,即每一层的输出特征都作为其后每层的输入特征,改善单阶段目标检测中特征融合网络的结构,提升目标检测过程中特征融合的信息丰富度、高效性;并通过在分类网络中并行设置属性监督网络增加正样本的数量,以此来提高网络的学习能力,从而提高检测目标的精度和召回率,提供更多样本给检测模型,以达到最终提升目标检测性能的目的。
技术领域
本发明属于特征复用的多知识学习目标检测技术领域,具体涉及一种特征复用的多知识学习目标检测方法。
背景技术
近年来,深度学习模型逐渐取代传统机器视觉方法而成为目标检测领域的主流算法,这在很大程度上得益于卷积神经网络(Convolutional Neural Networks,CNN)的发展。目前,目标检测技术在图像搜索、商品推荐、用户行为分析以及人脸识别等互联网应用产品中,同时在智能机器人、无人自动驾驶和无人机等高新科技产业具有广阔的应用前景。目标检测任务主要由三部分构成,第一,输入图像给主干网络提取图像特征,主干网络指各种深度神经网络,例如VGG Net、GoogLeNet、ResNet等;第二,要识别图像中感兴趣目标的类别,即分类任务,分类任务基于主干网络输出的特征上进行;第三,要在图像中用矩形框标注出感兴趣目标的位置,即回归任务,回归任务同样基于主干网络输出的特征上进行。一般将分类和回归任务统称为模型的检测头。
目标检测任务又分为两种模型:单阶段检测器和双阶段检测器。对于双阶段检测器,主干网络输出的特征会进入到RPN(Region Proposal Network)网络,即“候选区域网络”,RPN将主干网络的输出特征图作为输入,使用卷积网络构建与类别无关的候选区域,目的是预测矩形边界框是否包含目标,随后将RPN网络的输出送入到检测头中进行最终预测及输出。实质上RPN网络对不包含目标的矩形边界框做了过滤,这在很大程度上提升了模型的检测精度,但同时也牺牲了一定的检测速度,Faster RCNN即为典型的双阶段检测器之一。相比之下,单阶段检测器不包含RPN网络,但随着近些年Focal Loss损失函数、FPN特征融合网络的提出使得单阶段检测器同样能够达到不错的检测精度,RetinaNet即为典型的单阶段检测器之一。针对单阶段检测器,主干网络提供的特征越丰富,则分类和回归会越准确,检测的效果越好。一般情况下仅仅靠主干网络的输出特征所具有的信息进行分类和回归任务得到的检测结果是不理想的,在用主干网络进行特征提取的过程中,低层特征具有更高的分辨率信息,包含更多位置、细节信息,但是由于经过的卷积更少,其语义性更低,噪声更多;高层特征具有更强的语义信息,但是分辨率很低,对细节的感知能力较差。对于目标检测而言,融合不同尺度的特征(丰富主干网络的输出特征)是提高检测性能的一个重要手段,如何将两者高效融合,取其长处,弃之糟泊,是改善模型的关键。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安邮电大学,未经西安邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110285310.2/2.html,转载请声明来源钻瓜专利网。





