[发明专利]一种基于双梯度的弱监督目标定位方法及装置在审
申请号: | 202110367847.3 | 申请日: | 2021-04-06 |
公开(公告)号: | CN113128487A | 公开(公告)日: | 2021-07-16 |
发明(设计)人: | 薛松;罗情平;侯飞;师帅;王曙;徐磊;孟彤;李乾 | 申请(专利权)人: | 中车青岛四方车辆研究所有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京慧诚智道知识产权代理事务所(特殊普通合伙) 11539 | 代理人: | 白洁 |
地址: | 266031 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 梯度 监督 目标 定位 方法 装置 | ||
1.一种基于双梯度的弱监督目标定位方法,其特征在于,所述方法包括:
将图像数据集作为训练集,训练原始深度学习分类模型,得到深度学习模型;所述图像数据集包括多个图像数据和每个图像数据的标注向量,所述深度学习模型输出卷积特征图、多个类别和每个类别的概率向量;
根据所述类别、概率向量和每个类别的标注向量,计算概率向量与标注向量的交叉熵损失;
计算所述交叉熵损失关于所述卷积特征图的第一梯度;
根据第一梯度对所述卷积特征图进行信息增强,得到类别信息增强图;
计算概率向量关于卷积特征图的第二梯度;
根据所述类别信息增强图和所述第二梯度,计算定位图;
根据所述定位图和预设的阈值,确定蒙版;
根据预设的函数,确定蒙版中的多个连通域;所述连通域具有边界线;
根据所述边界线,确定目标定位边框。
2.根据权利要求1所述的方法,其特征在于,所述根据所述类别、概率向量和每个类别的标注向量,计算概率向量与标注向量的交叉熵损失具体包括:
根据公式计算交叉熵损失函数;其中,L(p,yc)表示概率向量与标注向量的交叉熵损失函数,d为类别总数,p为概率向量,yc为第c类别的标注向量,表示标注向量yc的第k个元素,pk表示概率向量p的第k个元素。
3.根据权利要求1所述的方法,其特征在于,计算所述交叉熵损失关于所述卷积特征图的第一梯度具体包括:
根据公式计算交叉熵损失关于所述卷积特征图的第一梯度;其中,G1为第一梯度,α为增强系数,L(p,α*yc)为概率向量p与标注向量yc乘以增强系数α的交叉熵损失函数,S为卷积特征图。
4.根据权利要求1所述的方法,其特征在于,所述根据第一梯度对所述卷积特征图进行信息增强,得到类别信息增强图具体包括:
根据公式E=l2(S)-l2(G1)确定类别增强信息图;
其中,E为类别增强信息图,l2为l2归一化函数,l2(S)为对卷积特征图S进行归一化,l2(G1)为对第一梯度进行归一化。
5.根据权利要求1所述的方法,其特征在于,所述计算概率向量关于卷积特征图的第二梯度具体包括:
根据公式计算第二梯度;其中,G2为第二梯度,pc为第c类别的概率向量,S为卷积特征图。
6.根据权利要求1所述的方法,其特征在于,所述根据所述类别信息增强图和所述第二梯度,计算定位图具体包括:
根据A=∑E·G2计算定位图;其中,A为定位图,E为类别增强信息图,G2为第二梯度。
7.根据权利要求1所述的方法,其特征在于,所述根据所述定位图和预设的阈值,确定蒙版具体包括:
根据mask=abs(sign(A-th))确定蒙版;其中,A为定位图,th为预设阈值,mask为蒙版。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中车青岛四方车辆研究所有限公司,未经中车青岛四方车辆研究所有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110367847.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:摄像装置模块以及移动设备
- 下一篇:摄像装置模块以及移动设备