[发明专利]一种模型训练方法及装置、电子设备和存储介质有效
申请号: | 202210226361.2 | 申请日: | 2022-03-09 |
公开(公告)号: | CN115099293B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 陈亦新;王焱;陈晓天;任艺柯;张培芳;吴振洲 | 申请(专利权)人: | 北京安德医智科技有限公司 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06N3/08;G06T7/73;G06V10/82 |
代理公司: | 北京林达刘知识产权代理事务所(普通合伙) 11277 | 代理人: | 刘新宇 |
地址: | 100310 北京市顺义区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 模型 训练 方法 装置 电子设备 存储 介质 | ||
本公开涉及一种模型训练方法及装置、电子设备和存储介质。所述方法包括:获取目标域数据和源域数据,目标域数据和源域数据中包含的目标对象相同,源域数据中包含的目标对象具有标签,目标域数据和源域数据包括影像数据;根据目标域数据和源域数据,得到拟合数据,拟合数据包含目标域数据的风格特征和源域数据的结构特征,结构特征为目标对象的空间位置及布局的信息;根据拟合数据和标签,训练初始模型,得到中间模型;根据目标域数据,对中间模型进行自监督训练,得到目标模型,目标模型用于识别目标域数据中包含的目标对象。通过上述过程,有效提高了模型对跨域的无标注数据的识别能力,从而提升了模型在不同数据集之间的泛化能力。
技术领域
本公开涉及计算机视觉技术领域,尤其涉及一种模型训练方法及装置、电子设备和存储介质。
背景技术
深度学习模型在跨域的不同数据集上的性能可能会出现大幅度的下降。例如:在核磁共振成像(MRI)数据上训练的分割模型只能引用在核磁共振成像数据上,拿到电子计算机断层扫描(CT)数据上就会表现的很糟糕。在仅标注了MRI数据的情况下,我们无法用常规的训练方法,使得模型在没有CT数据的标注信息的情况下,很好的应对CT数据。
发明内容
有鉴于此,本公开提出了一种模型训练技术方案。
根据本公开的一方面,提供了一种模型训练方法,包括:获取目标域数据和源域数据,所述目标域数据和所述源域数据中包含的目标对象相同,所述源域数据中包含的目标对象具有标签,所述目标域数据和所述源域数据包括影像数据;根据所述目标域数据和所述源域数据,得到拟合数据,所述拟合数据包含所述目标域数据的风格特征和所述源域数据的结构特征,所述结构特征为所述目标对象的空间位置及布局的信息;根据所述拟合数据和所述标签,训练初始模型,得到中间模型;根据所述目标域数据,对所述中间模型进行自监督训练,得到目标模型,所述目标模型用于识别所述目标域数据中包含的目标对象。
在一种可能的实现方式中,所述根据所述目标域数据和所述源域数据,得到拟合数据,包括:将所述目标域数据和所述源域数据输入对抗生成网络,所述对抗生成网络包括提取网络和生成网络;根据所述提取网络,提取所述目标域数据的风格特征和所述源域数据的结构特征;根据所述生成网络,生成包含所述源域数据的风格特征和所述目标域数据的结构特征的拟合数据;其中,所述对抗生成网络通过所述目标域数据和所述源域数据进行对抗训练得到。
在一种可能的实现方式中,所述对抗生成网络通过所述目标域数据和所述源域数据进行对抗训练得到,包括:根据所述提取网络,提取所述目标域数据的第一风格特征和第一结构特征、所述源域数据的第二结构特征和第二风格特征;根据所述生成网络,生成第一重建数据、第一转换数据、第二转换数据和第二重建数据,所述第一重建数据包含第一风格特征和第一结构特征,所述第一转换数据包含第一风格特征和第二结构特征,所述第二转换数据包含所述第一结构特征和第二风格特征,所述第二重建数据包含第二结构特征和第二风格特征;根据所述判别网络,判别所述第一重建数据、所述第一转换数据、所述第二转换数据和所述第二重建数据的真假,得到判别结果;根据所述判别结果,对所述对抗生成网络的参数进行调整。
在一种可能的实现方式中,根据所述判别结果,对所述对抗生成网络的参数进行调整,包括:根据所述目标域数据和所述第一重建数据之间的差异,生成第一重建损失;根据所述源域数据和所述第二重建数据之间的差异,生成第二重建损失;根据所述判别网络输出的对所述第一重建数据的判别结果,生成第一判别损失;根据所述判别网络输出的对所述第一转换数据的判别结果,生成第二判别损失;根据所述判别网络输出的对所述第二转换数据的判别结果,生成第三判别损失;根据所述判别网络输出的对所述第二重建数据的判别结果,生成第四判别损失;根据所述第一重建损失、所述第二重建损失、所述第一判别损失、所述第二判别损失、所述第三判别损失和所述第四判别损失,对所述生成网络和所述判别网络进行对抗训练,获得训练后的神经网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京安德医智科技有限公司,未经北京安德医智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210226361.2/2.html,转载请声明来源钻瓜专利网。