[发明专利]图像分割模型的训练方法及相关设备在审
申请号: | 202211244124.5 | 申请日: | 2022-10-11 |
公开(公告)号: | CN115496777A | 公开(公告)日: | 2022-12-20 |
发明(设计)人: | 王伟农;戴宇荣;陶鑫 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
主分类号: | G06T7/194 | 分类号: | G06T7/194;G06T7/11;G06N3/04;G06N3/08 |
代理公司: | 北京律智知识产权代理有限公司 11438 | 代理人: | 孙宝海 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 分割 模型 训练 方法 相关 设备 | ||
本公开实施例提供一种图像分割模型的训练方法及相关设备。该方法包括:获取待分割图像和交互式表征图像;基于随机选择方式在前景分割模式和交互式分割模式中确定当前分割模式,前景分割模式用于使用待分割图像对图像分割模型进行阶段训练,交互式分割模式用于使用待分割图像和交互式表征图像对所述图像分割模型进行阶段训练;使用当前分割模式对图像分割模型进行阶段训练;在阶段训练完成时,基于随机选择方式更新当前分割模式,以使用更新后的当前分割模式对所述图像分割模型进行训练,直至满足训练结束条件。该方法可以节省内存空间,避免训练获得的图像分割模型在应用时容易造成卡顿的问题;同时可以提升两个任务的泛化性和鲁棒性。
技术领域
本公开涉及计算机技术领域,具体而言,涉及一种图像分割模型的训练方法、图像分割方法、图像分割模型的训练装置、图像分割装置、电子设备及计算机可读存储介质。
背景技术
随着计算机视觉技术的快速发展,图像目标分割技术作为一项重要的计算机视觉任务,在图像检索、图片编辑和影视制作中有诸多应用。
相关技术中,单独使用前景分割或者单独使用交互式分割进行图像目标分割,前景分割和交互式分割是作为两个独立的任务各自进行测试和部署,这种方式忽略了两个任务之间的共性,在业务部署中,需要分别部署各自的模型文件,两个任务需要占用大量的内存空间,容易造成卡顿,或者内存爆炸等问题,影响实际产品体验。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开实施例提供一种图像分割模型的训练方法、图像分割方法、图像分割模型的训练装置、图像分割装置、电子设备及计算机可读存储介质,该方法可以节省内存空间,避免训练获得的图像分割模型在应用时容易造成卡顿的问题;同时可以提升两个任务的泛化性和鲁棒性。
本公开实施例提供一种图像分割模型的训练方法,该方法包括:获取待分割图像和交互式表征图像;基于随机选择方式在前景分割模式和交互式分割模式中确定当前分割模式,所述前景分割模式用于使用所述待分割图像对图像分割模型进行阶段训练,所述交互式分割模式用于使用所述待分割图像和所述交互式表征图像对所述图像分割模型进行阶段训练;使用所述当前分割模式对所述图像分割模型进行阶段训练;在所述阶段训练完成时,基于所述随机选择方式更新所述当前分割模式,以使用更新后的当前分割模式对所述图像分割模型进行训练,直至满足训练结束条件。
在本公开的一些示例性实施例中,在所述当前分割模式为所述前景分割模式时,所述使用所述当前分割模式对所述图像分割模型进行阶段训练,包括:获取预设掩膜图像、预设正交互表征图像和预设负交互表征图像,其中,所述预设掩膜图像、所述预设正交互表征图像和所述预设负交互表征图像的像素值均为指定像素值;将所述待分割图像、所述预设掩膜图像、所述预设正交互表征图像和所述预设负交互表征图像进行合并,获得第一输入图像;将所述第一输入图像输入至所述图像分割模型中,对所述图像分割模型进行阶段训练。
在本公开的一些示例性实施例中,所述图像分割模型包括编码层和解码层;所述将所述第一输入图像输入至所述图像分割模型中,对所述图像分割模型进行阶段训练,包括:将所述第一输入图像输入至所述编码层进行编码处理,获得第一特征向量;将所述第一特征向量输入至所述解码层进行解码处理,获得第一预测掩膜图像;根据所述第一预测掩膜图像对所述图像分割模型进行阶段训练。
在本公开的一些示例性实施例中,在所述当前分割模式为所述交互式分割模式时,所述交互式表征图像包括第一掩膜图像、第一正交互表征图像和第一负交互表征图像;所述使用所述当前分割模式对所述图像分割模型进行阶段训练,包括:将所述待分割图像、所述第一掩膜图像、所述第一正交互表征图像和所述第一负交互表征图像进行合并,获得第二输入图像;将所述第二输入图像输入至所述图像分割模型中,对所述图像分割模型进行阶段训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211244124.5/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序