[发明专利]深度模型训练方法及装置、电子设备及存储介质有效
申请号: | 201811646736.0 | 申请日: | 2018-12-29 |
公开(公告)号: | CN109740668B | 公开(公告)日: | 2021-03-30 |
发明(设计)人: | 李嘉辉 | 申请(专利权)人: | 北京市商汤科技开发有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 蒋雅洁;张颖玲 |
地址: | 100084 北京市海淀区中*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 深度 模型 训练 方法 装置 电子设备 存储 介质 | ||
本发明实施例公开了一种深度模型训练方法及装置、电子设备及存储介质。所述深度学习模型训练方法,包括:获取第一模型输出的第n+1第一标注信息,所述第一模型已经过n轮训练;以及,获取第二模型输出的第n+1第二标注信息,所述第二模型已经过n轮训练;n为大于1的整数;基于所述训练数据及所述第n+1第一标注信息,生成第二模型的第n+1训练集,并基于所述训练数据及所述第n+1第二标注信息,生成所述第一模型的第n+1训练集;将所述第二模型的第n+1训练集输入至所述第二模型,对所述第二模型进行第n+1轮训练;将所述第一模型的第n+1训练集输入至所述第一模型,对所述第一模型进行第n+1轮训练。
技术领域
本发明涉及信息技术领域,尤其涉及一种深度模型训练方法及装置、电子设备及存储介质。
背景技术
深度学习模型可以通过训练集的训练之后,具有一定的分类或识别能力。所述训练集通常包括:训练数据及训练数据的标注数据。但是一般情况下,标注数据都需要人工进行手动标注。一方面纯手动标注所有的训练数据,工作量大、效率低,且标注过程中存在人工错误;另一方面,若需要实现高精度的标注,例如以图像领域的标注为例,需要实现像素级分割,纯人工标注要达到像素级分割,难度非常大且标注精度也难以保证。
故基于纯人工标注的训练数据进行深度学习模型的训练,会存在训练效率低、训练得到的模型因为训练数据自身精度低导致模型的分类或识别能力精度达不到预期。
发明内容
有鉴于此,本发明实施例期望提供一种深度模型训练方法及装置、电子设备及存储介质。
本发明的技术方案是这样实现的:
一种深度学习模型训练方法,包括:
获取第一模型输出的第n+1第一标注信息,所述第一模型经过n轮训练;以及,获取第二模型输出的第n+1第二标注信息,所述第二模型已经过n轮训练;n为大于1的整数;
基于所述训练数据及所述第n+1第一标注信息,生成第二模型的第n+1训练集,并基于所述训练数据及所述第n+1第二标注信息,生成所述第一模型的第n+1训练集;
将所述第一模型的第n+1训练集输入至所述第二模型,对所述第二模型进行第n+1轮训练;将所述第二模型的第n+1训练集输入至所述第一模型,对所述第一模型进行第n+1轮训练。
基于上述方案,所述方法包括:
确定n是否小于N,N为最大训练轮数;
所述获取第一模型输出的第n+1第一标注信息,以及,获取第二模型输出的第n+1第二标注信息;包括:
若n小于N,获取第一模型输出的第n+1第一标注信息,以及,获取第二模型输出的第n+1第二标注信息。
基于上述方案,所述获取所述训练数据及所述训练数据的初始标注信息,包括:
获取包含有多个分割目标的训练图像及所述分割目标的外接框;
所述基于所述初始标注信息,生成所述第一模型的第一训练集和所述第二模型的第一训练集,包括:
基于所述外接框,在所述外接框内绘制与所述分割目标形状一致的标注轮廓;
基于所述训练数据及所述标注轮廓,生成所述第一模型的第一训练集及所述第二模型的第一训练集。
基于上述方案,所述基于所述初始标注信息,生成所述第一模型的第一训练集和所述第二模型的第一训练集,还包括:
基于所述外接框,生成具有重叠部分的两个所述分割目标的分割边界;
基于所述训练数据及所述分割边界,生成所述第一模型的第一训练集和所述第二模型的第一训练集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京市商汤科技开发有限公司,未经北京市商汤科技开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811646736.0/2.html,转载请声明来源钻瓜专利网。