[发明专利]半监督模型训练方法和装置在审
| 申请号: | 202211215544.0 | 申请日: | 2022-09-30 |
| 公开(公告)号: | CN115577768A | 公开(公告)日: | 2023-01-06 |
| 发明(设计)人: | 高彬;金欢;赵越;江立辉;张洪波 | 申请(专利权)人: | 华为技术有限公司 |
| 主分类号: | G06N3/08 | 分类号: | G06N3/08;G06V10/764;G06V10/82;G06V20/70;G06V10/774 |
| 代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 万欣慰 |
| 地址: | 518129 广东*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 监督 模型 训练 方法 装置 | ||
本申请提供了一种半监督模型训练方法和装置,应用于计算机视觉和数字图像处理技术领域,该方法包括,基于标注数据以及经不同的数据增强方法处理的无标注数据,采用同结构的第一模型和第二模型进行交叉互训,根据第一模型和第二模型对于不同增强方法处理的无标注损失的预测结果的一致性确定非监督损失,可以实现噪声加权和过滤,能够抑制半监督模型训练过程中伪标签带来的噪声影响,提升模型的预测精度和泛化性。
技术领域
本申请涉及人工智能领域,尤其涉及一种半监督模型训练方法和装置。
背景技术
半监督(Semi-supervised)学习指的是使用有标签样本和无标签样本对深度学习网络模型(本申请也简称为“模型”)进行训练的方法,通过半监督学习,可以有效减少有标签样本数量,降低模型训练的成本。
半监督学习,通常先用较小规模的标注数据训练一个Teacher模型,再用这个Teacher模型对较大规模的无标注数据预测出伪标注,最后,根据伪标签数据和标注数据混合作为Student模型的训练数据,对Student模型进行迭代训练。
由于伪标签数据包含大量噪声,若模型过拟合到噪声上,将导致模型的错误预测,训练得到的模型性能较差。
发明内容
本申请提供了一种半监督模型训练方法和装置,用于提升模型性能,包括预测精度和泛化性。
本申请第一方面提供了一种半监督模型训练方法,包括:将第一增强数据输入第一模型获取所述第一增强数据的第一预测结果,以及,将所述第一增强数据输入第二模型获取所述第一增强数据的第二预测结果,所述第一增强数据根据第一数据增强方法处理第一无标注数据得到,所述第二模型与所述第一模型具有相同的结构和不同的初始化参数;将第二增强数据输入所述第一模型获取所述第二增强数据的第三预测结果,以及,将所述第二增强数据输入所述第二模型获取所述第二增强数据的第四预测结果,所述第二增强数据根据第二数据增强方法处理所述第一无标注数据得到,所述第一数据增强方法与所述第二数据增强方法不同;根据所述第一预测结果和所述第四预测结果的一致性确定第一非监督损失;根据所述第二预测结果和所述第三预测结果的一致性确定第二非监督损失;将第一标注数据输入所述第一模型,获取所述第一标注数据的第五预测结果;根据所述第五预测结果和所述第一标注数据的标签确定第一监督损失;基于所述第一非监督损失、所述第二非监督损失和所述第一监督损失更新所述第一模型的参数。
本申请提供的半监督模型训练方法,允许网络同时输入标注数据与无标注数据,通过不同的数据增强方法对无标注数据进行混合增强,并采用同结构的第一模型和第二模型进行交叉互训,并根据两个模型预测结果的一致性确定非监督损失,可以实现噪声加权和过滤,能够抑制半监督模型训练过程中伪标签带来的噪声影响,提升模型的泛化性。
在第一方面一种可能的实现方式中,所述第一模型包括图像的语义分割模型;所述第一数据增强方法为非色彩域增强方法,所述非色彩域增强包括翻转变换、镜像变换、平移变换或尺度变换;所述第二数据增强方法为色彩域增强方法,所述色彩域增强方法包括明暗度变换、对比度变换或图像高斯噪声增强。
本申请提供的半监督模型训练方法,对于语义分割模型的训练,对无标注数据可以采用两种不同的数据增强方法,包括非色彩域增强方法和色彩域增强方法,基于不同的数据增强方法处理的数据进行模型训练,可以增加模型的泛化性能,提高模型的鲁棒性。
在另一种可能的实现方式中,第一模型为图像识别模型,所述第一数据增强方法为非色彩域增强方法,所述非色彩域增强包括翻转变换、镜像变换、平移变换或尺度变换;所述第二数据增强方法为色彩域增强方法,所述色彩域增强方法包括明暗度变换、对比度变换或图像高斯噪声增强。
在第一方面一种可能的实现方式中,所述第一模型包括图像的语义分割模型;所述第二增强数据根据第二数据增强方法处理所述第一无标注数据得到,包括:所述第二增强数据根据所述第一无标注数据和所述第一标注数据进行复制粘贴增强获取。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211215544.0/2.html,转载请声明来源钻瓜专利网。





