[发明专利]目标检测模型的训练方法、目标检测的方法及相关产品有效
申请号: | 202211310926.1 | 申请日: | 2022-10-25 |
公开(公告)号: | CN115439699B | 公开(公告)日: | 2023-06-30 |
发明(设计)人: | 贺婉佶;史晓宇 | 申请(专利权)人: | 北京鹰瞳科技发展股份有限公司 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/774;G06V10/82;G06N3/0464;G06N3/09 |
代理公司: | 北京维昊知识产权代理事务所(普通合伙) 11804 | 代理人: | 王颖慧;孙新国 |
地址: | 100081 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标 检测 模型 训练 方法 相关 产品 | ||
本申请公开了一种目标检测模型的训练方法、目标检测的方法及相关产品。根据本申请实施例所述的目标检测模型包括主干网络和与主干网络连接的检测框分类分支,所述检测框分类分支包括至少一个检测类别输出;所述训练方法包括:获取包含检测类别目标和/或假阳类别目标的样本图像形成的样本训练集;为每个检测类别目标和每个假阳类别目标分别赋予两层标签,所述两层标签中的第一层标签用于标识每个目标的检测类别,所述两层标签中的第二层标签用于标识每个目标的真实类别;以及使用带所述两层标签的样本训练集对所述目标检测模型进行训练。根据本申请实施例的训练方法,有利于提高目标检测模型对假阳类别目标的分辨识别能力。
技术领域
本申请一般涉及图像处理技术领域。更具体地,本申请涉及一种目标检测模型的训练方法、目标检测的方法、设备及计算机可读存储介质。
背景技术
随着人工智能技术的不断发展,目标检测模型在图像识别中的应用已经十分广泛,例如监控场景中对于监控视频中人体或者目标物体的识别和检测、人脸识别场景中对于人脸图像中五官的识别和检测、医学图像中对于病灶的识别和检测、显微图像中对于感兴趣细胞或者微生物的识别和检测等。
对于目前常用的目标检测模型,虽然不同的模型检测框架可能具有不同的金标准框(或称真实框)与锚(或检测框)之间的匹配原则,但是这些匹配原则通常有一个共同点,即只会将金标准框附近的锚和该金标准框进行匹配,对于那些并不在任何金标准框附近的锚,则会被匹配为背景。
由于这些被匹配为背景的锚对应的目标无法被输入到目标检测模型的检测框分类分支中进行学习,使得目标检测模型的检测框分类分支只能学习到感兴趣类别的检测框的样子,而学不到可能存在的与感兴趣类别类似但却属于背景的目标的样子。从分类学习的角度而言,检测框分类分支只见过“什么是正样本”,从未见过“什么不是正样本”,这是不利于模型学习的。
有鉴于此,亟需提供一种更有利于模型学习的训练方式。
发明内容
为了至少解决如上所提到的一个或多个技术问题,本申请在多个方面中提出了一种目标检测模型的训练方法、目标检测的方法、设备及计算机可读存储介质。
在第一方面中,本申请提供一种目标检测模型的训练方法,所述目标检测模型包括主干网络和与主干网络连接的检测框分类分支,所述检测框分类分支包括至少一个检测类别输出;所述训练方法包括:获取包含检测类别目标和/或假阳类别目标的样本图像形成的样本训练集;为每个检测类别目标和每个假阳类别目标分别赋予两层标签,所述两层标签中的第一层标签用于标识每个目标的检测类别,所述两层标签中的第二层标签用于标识每个目标的真实类别;以及使用带所述两层标签的样本训练集对所述目标检测模型进行训练。
在一些实施例中,在使用所述样本训练集对所述目标检测模型进行训练之前,所述训练方法还包括:获取带样本标注的样本图像形成的预训练集,其中所述样本标注用于标识所述样本图像中的检测类别目标;使用所述预训练集对所述目标检测模型进行预训练。
在另一些实施例中,所述训练方法还包括:基于所述预训练集,生成包含两层标签的样本训练集。
在又一些实施例中,生成包含两层标签的样本训练集包括:使用预训练后的目标检测模型对所述预训练集中的样本图像进行目标检测,以得到多个检测结果;将所述多个检测结果与所述样本标注进行比较,以在所述多个检测结果中确定在预训练集中对应背景的假阳类别目标及其所属的检测类别;以及根据所述预训练集中每个检测类别目标和每个假阳类别目标各自所属的检测类别和真实类别,生成包含两层标签的所述样本训练集。
在一些实施例中,训练方法还包括:基于所述两层标签,计算所述目标检测模型的损失函数,其中所述损失函数包括针对第一层标签的第一损失函数和针对第二层标签的第二损失函数。
在另一些实施例中,所述第一损失函数包括交叉熵损失函数,所述第二损失函数包括对比学习损失函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京鹰瞳科技发展股份有限公司,未经北京鹰瞳科技发展股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211310926.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:全自动智能化船用补水变频供水装置
- 下一篇:一种智能语音处理方法及系统