[发明专利]基于卷积神经网络的目标检测模型训练方法、设备和介质在审
申请号: | 201911279230.5 | 申请日: | 2019-12-13 |
公开(公告)号: | CN111079638A | 公开(公告)日: | 2020-04-28 |
发明(设计)人: | 王奇锋;童亨成;王杰;仵浩;王胜;刘明月;靳朋伟;章星星;何良语 | 申请(专利权)人: | 河北爱尔工业互联网科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04 |
代理公司: | 北京志霖恒远知识产权代理事务所(普通合伙) 11435 | 代理人: | 韩亚伟 |
地址: | 050000 河北省石家庄市鹿泉经济开发区*** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 卷积 神经网络 目标 检测 模型 训练 方法 设备 介质 | ||
本申请公开了基于卷积神经网络的目标检测模型训练方法、设备和介质,其中方法包括以下步骤:将训练集中的图像逐个输入目标检测模型;训练集中的图像均具有含有检测目标及检测目标ID的目标框,及一组不同尺度不同位置的预选框;计算每个预选框与目标框的交并比;提取交并比大于等于设定阀值的预选框的标签特征数据作为正样本,提取交并比小于设定阀值的预选框的标签特征数据作为负样本;标签特征数据包括预选框的检测目标ID、对点坐标数值和中心坐标数值;用正样本和负样本训练目标检测模型。本申请通过增加中心标签特征数据,并相应地增加中心损失函数,提高了目标检测模型的训练精度,从而提高了目标检测模型的检测精度。
技术领域
本公开一般涉及目标检测技术领域,具体涉及基于卷积神经网络的目标检测模型训练方法、设备和介质。
背景技术
图像分类,检测及分割是计算机视觉领域的三大任务。图像分类模型是将图像划分为单个类别,通常对应于图像中最突出的物体。但是现实世界的很多图片通常包含不只一个物体,此时如果使用图像分类模型为图像分配一个单一标签其实是非常粗糙的,并不准确。对于这样的情况,就需要目标检测模型,目标检测模型可以识别一张图片的多个物体,并可以定位出不同物体(给出边界框)。目标检测在很多场景有用,如无人驾驶和安防系统。
现有的基于卷积神经网络的目标检测模型训练方法由于诸多原因,还存在识别精度不高和误识别的问题。
发明内容
鉴于现有技术中的上述缺陷或不足,期望提供一种检测精度高的基于卷积神经网络的目标检测模型训练方法、设备和介质。
第一方面本申请提供一种基于卷积神经网络的目标检测模型训练方法,所述方法包括以下步骤:
将训练集中的图像逐个输入目标检测模型;所述训练集中的图像均具有含有检测目标及检测目标ID的目标框,及一组不同尺度不同位置的预选框;
计算每个所述预选框与所述目标框的交并比;
提取交并比大于等于设定阀值的预选框的标签特征数据作为正样本,提取交并比小于设定阀值的预选框的标签特征数据作为负样本;所述标签特征数据包括所述预选框的检测目标ID、对点坐标数值和中心坐标数值;
用所述正样本和负样本训练所述目标检测模型。
根据本申请实施例提供的技术方案,
所述中心坐标数值通过以下公式计算得到:
bx=δ(tx)+cx
by=δ(ty)+cy
这里的δ表示以下函数:
其中(bx,by)为中心坐标数值,bw为中心坐标宽度,bh为中心坐标高度;(tx,ty)为预测标签特征数据中的右下点坐标数值,tw为预测标签特征数据中的右下点宽度,th为右下点高度。
根据权利要求1所述的基于卷积神经网络的目标检测模型训练方法,其特征在于,所述目标检测模型包括以下损失函数:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河北爱尔工业互联网科技有限公司,未经河北爱尔工业互联网科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911279230.5/2.html,转载请声明来源钻瓜专利网。