[发明专利]目标检测模型训练方法、目标检测方法、装置、电子设备有效
申请号: | 202210839698.0 | 申请日: | 2022-07-18 |
公开(公告)号: | CN115082740B | 公开(公告)日: | 2023-09-01 |
发明(设计)人: | 林相如;张伟;谭啸 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/82;G06N3/045;G06N3/08 |
代理公司: | 北京市汉坤律师事务所 11602 | 代理人: | 姜浩然;吴丽丽 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标 检测 模型 训练 方法 装置 电子设备 | ||
1.一种目标检测模型的训练方法,所述目标检测模型包括第一子网络和与所述第一子网络连接的第二子网络,其特征在于,所述方法包括:
从第一样本图像集中获得第一样本图像,其中,所述第一样本图像集中的每个样本图像被对应标记一个类别,所述一个类别属于包括N个类别的类别集合,N为正整数;
获得所述第一样本图像的真实类别;
构建由N个类组成的N维正交类度量空间,所述N个类对应于所述N个类别,所述N个类包括所述真实类别,在所述正交类度量空间中,每个类被表示为唯一的one-hot向量;
基于所述第一样本图像,通过所述第一子网络获得所述第一样本图像的图像特征;
通过所述目标检测模型的第三子网络,基于所述第一样本图像生成至少一个候选框;
确定所述第一样本图像的第一图像特征,所述第一图像特征包括所述至少一个候选框中的属于前景的候选部分;
确定所述第一样本图像的第二图像特征,所述第二图像特征包括所述至少一个候选框中的全部特征;
基于所述正交类度量空间获得所述真实类别的第一向量表示,其中,所述真实类别的所述第一向量表示是所述真实类别在所述正交类度量空间中的相应one-hot向量;
基于所述第一图像特征和所述真实类别的所述第一向量表示确定第一损失值;
基于所述第二图像特征,通过所述第二子网络,获得所述第一样本图像的预测类别;
基于所述预测类别和所述真实类别的第二向量表示确定第二损失值;以及
基于所述第一损失值和所述第二损失值调整所述目标检测模型的参数;
获得第二样本图像集,所述第二样本图像集包括第二样本图像,所述第二样本图像被标记有第二类别,所述第二类别不属于所述N个类别;以及
将所述N维正交类度量空间更新为(N+1)维正交类度量空间,使得经更新的正交类度量空间包括所述N个类别与所述第二类别。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
将所述第一向量表示更新为(N+1)维向量,使得经更新的第一向量表示指示所述真实类别对应所述经更新的类别集合中的一个类别;以及
使用所述第一样本图像再次对所述目标检测模型进行训练。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
通过将所述第二样本图像输入到所述第一子网络,获得所述第二样本图像的图像特征;
通过将所述第二样本图像的图像特征输入到所述第二子网络,获得所述第二样本图像的预测类别;
基于所述第二样本图像的图像特征和第二类别的第三向量表示确定第三损失值,其中,所述第三向量表示是指示所述第二类别对应所述经更新的类别集合中的一个类别的(N+1)维向量;
基于所述第二样本图像的预测类别和所述第二类别的第四向量表示确定第四损失值;以及
基于所述第三损失值和所述第四损失值调整所述目标检测模型的参数。
4.根据权利要求1所述的方法,其特征在于,所述真实类别的第二向量表示与所述真实类别的第一向量表示相同。
5.根据权利要求1所述的方法,其特征在于,所述真实类别的第二向量表示是所述真实类别的类别名称的向量映射表示。
6.根据权利要求1所述的方法,其特征在于,基于所述第一损失值和所述第二损失值调整所述目标检测模型的参数包括调整所述第一子网络和所述第二子网络的参数。
7.一种目标检测方法,包括:
基于待检测图像和目标检测模型,获得所述样本图像的预测类别,
其特征在于,所述目标检测模型是根据权利要求1-6中任一项所述的训练方法获得的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210839698.0/1.html,转载请声明来源钻瓜专利网。