[发明专利]一种基于双梯度的弱监督目标定位方法及装置在审
申请号: | 202110367847.3 | 申请日: | 2021-04-06 |
公开(公告)号: | CN113128487A | 公开(公告)日: | 2021-07-16 |
发明(设计)人: | 薛松;罗情平;侯飞;师帅;王曙;徐磊;孟彤;李乾 | 申请(专利权)人: | 中车青岛四方车辆研究所有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京慧诚智道知识产权代理事务所(特殊普通合伙) 11539 | 代理人: | 白洁 |
地址: | 266031 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 梯度 监督 目标 定位 方法 装置 | ||
本发明提供了一种基于双梯度的弱监督目标定位方法,包括:将图像数据集作为训练集,训练原始深度学习分类模型,得到深度学习模型;图像数据集包括多个图像数据和标注向量,深度学习模型输出卷积特征图、多个类别和每个类别的概率向量;根据类别、概率向量和每个类别的标注向量,计算概率向量与标注向量的交叉熵损失;计算交叉熵损失关于卷积特征图的第一梯度;根据第一梯度对卷积特征图进行信息增强,得到类别信息增强图;计算概率向量关于卷积特征图的第二梯度;根据类别信息增强图和第二梯度,计算定位图;根据定位图和预设的阈值,确定蒙版;根据预设的函数,确定蒙版中的多个连通域;连通域具有边界线;根据边界线,确定目标定位边框。
技术领域
本发明涉及深度学习和计算机视觉技术领域,尤其涉及一种基于双梯度的弱监督目标定位方法及装置。
背景技术
视觉是人类获取信息的重要来源,研究表明,人类通过视觉渠道获取80%以上的外界信息。图像是多媒体中的重要信息形式,形象、生动直观地承载着大量的信息,因此研究如何用计算机系统解释图像,实现类似人类视觉系统理解外部世界具有重要意义。其中,目标检测是计算机视觉中的一个基本且重要的问题,目标检测的目的是,给定一张图片,通过计算机系统准确找到目标的位置以及判别目标的类别。目标检测在很多领域都有应用需求,被广为研究的有人脸检测,行人检测,车辆检测等检测任务。
近年来,深度学习技术迅猛发展,在目标检测领域得到越来越多的关注,克服了很多基于特征的传统目标检测方法。目前基于深度学习的全监督目标检测算法有两大类:基于回归的一级目标(one-stage)检测算法,以及基于候选框的二级目标(two-stage)检测算法。基于候选框的two-stage检测算法分为提取候选框模块和分类模块,具有代表性的算法有区域卷积神经网络(R-CNN,Region Convolutional Neural Network),快速区域卷积神经网络(Faster-RCNN)等方法。基于回归的one-stage检测算法直接通过回归来学习目标的位置及类别,代表的算法有YOLO、(Single Shot MultiBox Detector,SSD)等算法,由于相对于基于候选框的目标检测算法而言基于回归的目标检测算法只有一步,所以大大加快了目标检测的速度。然而上述中的全监督目标检测需要大量且昂贵的边界框标注信息。有标注的数据虽然提升了基于深度学习的目标检测算法的性能,但是也耗费了大量的时间成本和人力成本。现实世界中有巨量的未标注过的数据,无法训练全监督目标检测算法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中车青岛四方车辆研究所有限公司,未经中车青岛四方车辆研究所有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110367847.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:摄像装置模块以及移动设备
- 下一篇:摄像装置模块以及移动设备