[发明专利]一种基于把目标视为点改进的目标检测方法在审

专利信息
申请号: 202110092920.0 申请日: 2021-01-25
公开(公告)号: CN112801971A 公开(公告)日: 2021-05-14
发明(设计)人: 杨新武;彭雪峰;斯迪文 申请(专利权)人: 北京工业大学
主分类号: G06T7/00 分类号: G06T7/00;G06K9/32;G06K9/62;G06N3/04;G06N3/08
代理公司: 北京思海天达知识产权代理有限公司 11203 代理人: 沈波
地址: 100124 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 目标 视为 改进 检测 方法
【说明书】:

发明公开了一种基于把目标视为点改进的目标检测方法,该方法直接将任意尺度多目标的图像作为网络的输入,使用损失函数计算训练的损失值,通过优化损失值,反向传播更新模型参数,训练网络模型直至该模型收敛。在训练过程中选取预测的中心点热度图中的前N个点,计算对应包围框与真值包围框之间的相似度,来完成权重计算,赋予网络特征图对应的权重,告诉网络应该注意哪些点。通过在公开的数据集PascalVOC2007和2012上进行测试,体现了该网络模型具有较强的目标检测能力,证明了本发明能在保证在提高网络精度的同时,缓解中心点发散,减少冗余检测框,不影响网络的推理速度,不花费额外的计算量的情况下完成检测任务。

技术领域

本发明涉及深度学习、计算机视觉和医学图像领域,特别涉及一种基于把目标视为点改进的目标检测方法。

背景技术

目在计算机视觉领域内,有图像分类、目标检测、实例分割以及语义分割四大基本任务。其中,目标检测驱动着实例分割、姿态估计和行为识别等任务。目前基于深度学习的目标检测方法很受欢迎,它们有着简洁、高效和端到端等优点。这些方法大体上可分为二阶段检测器和一阶段检测器。其中一阶段检测器又可以分为anchor-based和anchor-free两类,前者在检测中使用了anchor,而后者则没有使用。

大多数的二阶段检测器都使用轴对齐的紧紧包围物体的包围框来表示物体。因此,目标检测任务转化成了一个对潜在包含物体的包围框进行分类的问题,同时计算每个包围框对应的偏移量。除此以外,二阶段检测器也会使用非极大值抑制算法来消除冗余的边界框,这进一步增加了检测时间。

二阶段检测器把检测过程分为了两个阶段:第一个阶段用来产生建议区域;第二个阶段用来对建议区域进行预测。在第一个阶段,检测器会尝试寻找可能包含物体的区域作为建议区域;第二个阶段深度学习网络会对这些区域进行分类并且进行适当的调整。

一阶段检测器直接对特征图上每个位置进行类别预测,而不用产生包围框和分类这种级联的步骤。一阶段检测器通常是在图像上滑动一系列复杂的且可能包围物体的框,这些框就称作anchor,然后做一次框的回归和分类任务。

总体来说,二阶段检测器有着更好的效果,但是一阶段检测器有更快的检测速度。

近来,研究者开始使用一个或多个关键点来表示物体,这种方法使用关键点来预测物体位置和物体的尺寸,其中最有代表性的就是把目标视为点方法,它是一种端到端的一阶段的检测器,在计算量比二阶段减少很多的情况下,可以取得State-of-the-art效果。

本发明的创新点与现有技术的区别

目标检测是计算机视觉中的基础任务之一。基于深度学习技术的目标检测技术从两阶段发展到一阶段,大大提升了检测速度,再从anchor-based发展到anchor-free,使得检测过程更加简洁高效。目前最具代表性的一阶段检测方法是把目标视为点,其使用中心点去预测物体位置和大小,有着不输于二阶段检测器的准确率且速度却远高于二阶段检测器。但是这种方法中一个目标往往有多个预测出的中心点,造成预测中心点的发散,进而导致一个目标存在多个冗余的包围框;并且在训练阶段,该方法对于中心点和包围框的尺寸分别训练,而在预测时需要将二者联合,这就造成了训练与预测不一致的情况。为了解决这些问题,本文提出一种基于把目标视为点方法的一阶段检测器的包围框注意力单元。本方法在网络训练的过程中通过加入对中心点以及对应的包围框的比较,对对应的中心点施加包围框注意力权重,让网络更关注于预测过程中的中心点以及对应包围框都更准确的部分,以此来提高中心点预测的准确程度。本方法缓解了中心点预测发散的问题,减少了冗余的包围框。同时本方法保持了原有方法的简洁高效的特点,在提升网络效果的同时,没有增加额外的计算量。在PascalVOC数据集上进行了对比实验,本发明的mAP在原方法上提升了1.2%。

发明内容

为了解决当前把目标视为点方法中训练与测试两个阶段不一致,以及最终预测结果中心点发散,并且有很多冗余框的情况。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110092920.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top