[发明专利]目标检测模型训练方法、装置、设备及可读存储介质在审
申请号: | 202210819858.5 | 申请日: | 2022-07-13 |
公开(公告)号: | CN115115922A | 公开(公告)日: | 2022-09-27 |
发明(设计)人: | 贾若然;张友国;谭昶;刘江;冯祥;韩辉;李亚玲;张慧萍;宋薇薇 | 申请(专利权)人: | 讯飞智元信息科技有限公司;科大讯飞股份有限公司 |
主分类号: | G06V10/82 | 分类号: | G06V10/82;G06V10/25;G06V10/764;G06N3/04;G06N3/08 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 侯珊 |
地址: | 230088 安徽省合肥市高*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标 检测 模型 训练 方法 装置 设备 可读 存储 介质 | ||
1.一种目标检测模型训练方法,其特征在于,所述方法包括:
获取第一训练数据集、第二训练数据集和目标检测模型,所述第一训练数据集中的训练数据的标签为人工标注的标签,所述标签包括目标框标签及目标类别标签;所述第二训练数据集中的训练数据是无标签数据;
基于训练好的目标检测教师模型预测得到所述第二训练数据集中的训练数据的标签;
利用所述第一训练数据集、所述第一训练数据集中的训练数据的标签、所述第二训练数据集以及所述第二训练数据集中的训练数据的标签对所述目标检测模型进行训练,得到训练好的目标检测模型。
2.根据权利要求1所述的方法,其特征在于,所述目标检测模型包括主干网络、回归分支网络和分类分支网络,所述利用所述第一训练数据集、所述第一训练数据集中的训练数据的标签、所述第二训练数据集以及所述第二训练数据集中的训练数据的标签对所述目标检测模型进行训练,得到训练好的目标检测模型,包括:
利用所述第一训练数据集和所述第一训练数据集中的训练数据的标签,采用第一学习率对所述目标检测模型进行第一次训练,得到第一次训练后的目标检测模型;
将所述第一次训练后的目标检测模型的回归分支网络固定,利用所述第二训练数据集和所述第二训练数据集中的训练数据的标签,采用第二学习率对所述第一次训练后的目标检测模型的主干网络和分类分支网络进行第二次训练,得到训练好的目标检测模型,所述第二学习率小于所述第一学习率。
3.根据权利要求2所述的方法,其特征在于,所述利用所述第一训练数据集和所述第一训练数据集中的训练数据的标签,采用第一学习率对所述目标检测模型进行第一次训练,得到第一次训练后的目标检测模型,包括:
以所述第一训练数据集中各训练数据为训练样本,以所述分类分支的输出趋近于所述第一训练数据集中各训练数据的目标类别标签,且所述回归分支的输出趋近于所述第一训练数据集中各训练数据的目标框标签为训练目标,采用第一学习率对所述目标检测模型进行第一次训练,得到第一次训练后的目标检测模型。
4.根据权利要求3所述的方法,其特征在于,所述将所述第一次训练后的目标检测模型的回归分支网络固定,利用所述第二训练数据集和所述第二训练数据集中的训练数据的标签,采用第二学习率对所述第一次训练后的目标检测模型的主干网络和分类分支网络进行第二次训练,得到训练好的目标检测模型,包括:
对所述第二训练数据集中各训练数据的目标类别标签进行标签平滑处理,得到所述第二训练数据集中各训练数据的经过标签平滑处理后的目标类别标签;
将所述第一次训练后的目标检测模型的回归分支网络固定,利用所述第二训练数据集、所述第二训练数据集中的训练数据的经过平滑处理后的目标类别标签和所述第二训练数据集中的训练数据的目标框标签,采用第二学习率对所述第一次训练后的目标检测模型的主干网络和分类分支网络进行第二次训练,得到训练好的目标检测模型。
5.根据权利要求4所述的方法,其特征在于,所述将所述第一次训练后的目标检测模型的回归分支网络固定,利用所述第二训练数据集、所述第二训练数据集中的训练数据的经过平滑处理后的目标类别标签和所述第二训练数据集中的训练数据的目标框标签,采用第二学习率对所述第一次训练后的目标检测模型的主干网络和分类分支网络进行第二次训练,得到训练好的目标检测模型,包括:
对所述第二训练数据集中各训练数据进行增强处理,得到所述第二训练数据集中各训练数据对应的增强数据;
以所述第二训练数据集中各训练数据对应的增强数据为训练样本,以所述第一次训练后的目标检测模型分类分支网络的输出趋近于所述第二训练数据集中各训练数据的经过标签平滑处理后的目标类别标签,且,所述第一次训练后的目标检测模型回归分支网络的输出趋近于所述第二训练数据集中各训练数据的目标框标签为训练目标,采用第二学习率对所述第一次训练后的目标检测模型的主干网络和分类分支网络进行第二次训练,得到训练好的目标检测模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于讯飞智元信息科技有限公司;科大讯飞股份有限公司,未经讯飞智元信息科技有限公司;科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210819858.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于电力铁塔的防腐涂料及其制备方法
- 下一篇:档案窗口存取机构