[发明专利]基于像素特征匹配的目标检测损失优化方法有效
申请号: | 202210818058.1 | 申请日: | 2022-07-13 |
公开(公告)号: | CN114998701B | 公开(公告)日: | 2022-11-18 |
发明(设计)人: | 李忠涛;袁朕鑫;肖鑫;赵帅;杨磊;戈川;陆莹莹;程文轩;刘圣勇;赵光龙;李雅其 | 申请(专利权)人: | 山东智驱力人工智能科技有限公司 |
主分类号: | G06V10/80 | 分类号: | G06V10/80;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 邓建国 |
地址: | 250013 山东省济南市历下区山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 像素 特征 匹配 目标 检测 损失 优化 方法 | ||
本发明提供了一种基于像素特征匹配的目标检测损失优化方法,涉及图像识别目标检测领域。本发明根据特征提取和融合过程中下采样操作对图像像素特征的损失,从像素特征角度入手,对模型特征提取和融合后的特征图上采样融合,评估预测框和真实框在特征图上的映射区域的Dice距离,通过细化预测框和真实框的特征差异进而优化模型参数,采用巴氏距离计算预测框和真实框直方图分布相似度,增强模型对像素级别差异的感知,更直观的评估模型泛化效果,进而提高模型预测框预测的准确度。本发明中,提出基于像素特征匹配损失弥补目标检测网络中直接框回归损失计算的不足,在不增加模型参数量的基础上提高了模型的鲁棒性。
技术领域
本发明涉及图像识别目标检测技术领域,尤其涉及基于像素特征匹配的目标检测损失优化方法。
背景技术
目标检测是计算机视觉中十分重要的任务,主要解决检测在数字图像中某一类别的实例,通过图像特征的提取,学习图像中类别实例的特征进而达到最终识别和定位的目的。近年来,随着智能化、信息化与现实环境需求的结合,目标检测也不断深入生活的各个方面并取得了广泛的应用,包括安全生产、工业缺陷检测、自动驾驶和智慧城市等领域。 但目标检测中的问题也随之而来,随着目标检测识别的类别增多,以及特殊场景下对目标框的定位的精度要求之高,这给目标检测模型带来了很大的挑战,现有目标检测网络中,通过评估回归预测框位置与真实框位置差异来训练模型参数,而缺少对预测框和真实框像素特征的差异性评估,模型参数无法学习像素级别的差异,影响了最终预测框的准确度。
发明内容
本发明的目的在于提供一种基于像素特征匹配的目标检测损失优化方法,为实现上述目的,本发明提供如下技术方案:基于像素特征匹配的目标检测损失优化方法,包括以下步骤:
S1、将N×N的图像I输入特征提取模块提取特征,通过特征融合模块输出三个尺寸分别为N/8的特征图一、N/16的特征图二和N/32的特征图三,其中,所述N×N为以像素为单位的图像分辨率,所述特征提取模块为卷积神经网络,所述特征融合模块为对卷积神经网络浅层和深层特征进行融合的模块;
S2、将N/16和N/32尺寸的特征图分别经过上采样计算将特征图放大为N/8的尺寸,并与特征图一相加得到特征图E,其中,所述上采样计算为反卷积操作;
S3、通过对特征图E输入回归预测模块得到预测框的位置信息,并根据预测框和真实框的位置信息映射至特征图E上对应预测框和真实框的特征区域M和N,采用Dice距离评估M和N特征的差异D,其中,所述回归预测模块为由卷积构成用于预测目标的分类和框的位置信息;
S4、在图像I上分别提取预测框和真实框区域的直方图分布向量A和B,采用巴氏距离评估A和B的分布差异α;
S5、将α作为D的放缩系数完成目标检测模型训练过程中像素特征匹配损失的计算。
优选的,所述将N/16和N/32特征图分别经过上采样计算将特征图放大为N/8的尺寸,并与特征图一相加得到特征图E,包括:
反卷积操作时通过卷积核带权重计算,通过调整步长实现特征图的放大,相比上采样直接计算放大特征图的方式,具有参数可学习和降低特征信息损失的作用;
将N/16尺寸的特征图通过反卷积上采样2倍至N/8尺寸的特征图,N/32尺寸的特征图通过反卷积上采样4倍至N/8尺寸的特征图,一方面有利于特征图对齐和不同层次的特征图进行融合,另一方面上采样后的N/8尺寸的特征图具有更多的信息;
将N/16和N/32尺寸的特征图上采样计算后,通过与N/8尺寸的特征图对应元素相加操作实现特征融合得到特征图E,采用对应元素相加的操作实现特征图相加,通道数不变,使得特征图E描述图像特征的信息量增多,相比三个特征图直接拼接的融合方法具有更低的计算量。
优选的,所述根据预测框和真实框的位置信息映射至特征图E上对应预测框和真实框的特征区域M和N,采用Dice距离评估M和N特征的差异D,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东智驱力人工智能科技有限公司,未经山东智驱力人工智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210818058.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种加热管检测装置
- 下一篇:一种微型回转式谐振结构的高精度加工系统和方法