[发明专利]图像矫正模型的训练方法、图像矫正方法、装置及介质在审
申请号: | 202310318509.X | 申请日: | 2023-03-28 |
公开(公告)号: | CN116503686A | 公开(公告)日: | 2023-07-28 |
发明(设计)人: | 李星;谢群义;钦夏孟;姚锟 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06T5/00 |
代理公司: | 北京易光知识产权代理有限公司 11596 | 代理人: | 王英;金爱静 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 矫正 模型 训练 方法 装置 介质 | ||
1.一种图像矫正模型的训练方法,包括:
将扭曲图输入图像矫正模型,得到所述图像矫正模型输出的偏移图;所述偏移图用于表示所述扭曲图和所述扭曲图的矫正图之间的映射关系;
基于所述偏移图矫正所述扭曲图的前背景分割图,得到已矫正分割图;
基于所述偏移图和标准偏移图之间的第一损失,以及所述已矫正分割图和标准分割图之间的第二损失,确定目标损失;
基于所述目标损失调整所述图像矫正模型的参数。
2.根据权利要求1所述的方法,所述图像矫正模型,包括下采样模块、编码器、解码器和上采样模块,其中,所述将扭曲图输入图像矫正模型,得到所述图像矫正模型输出的偏移图,包括:
基于所述下采样模块对所述扭曲图进行下采样,得到下采样特征;
将所述下采样特征输入所述编码器,得到所述编码器输出的编码特征;
将所述编码特征输入所述解码器,得到所述解码器输出的解码特征;
基于所述上采样模块对所述解码特征进行上采样,得到所述偏移图,所述偏移图的尺寸与所述扭曲图的尺寸相同。
3.根据权利要求2所述的方法,所述编码器包括串联设置的多个子编码器,其中,所述将所述下采样特征输入所述编码器,得到所述编码器输出的编码特征,包括:
将所述下采样特征输入所述多个子编码器中的第一个子编码器,得到所述第一个子编码器的输出特征;
针对所述多个子编码器中的除所述第一个子编码器之外的任意一个子编码器,将所述任意一个子编码器的输入特征输入所述任意一个子编码器,得到所述任意一个子编码器的输出特征;
其中,所述任意一个子编码器的输入特征包括所述任意一个子编码器的上一个子编码器的输出特征;最后一个子编码器的输出特征为所述编码特征。
4.根据权利要求3所述的方法,其中,所述多个子编码器中至少一个第一目标子编码器中包括依序串联设置的第一自注意力模块、第一残差和标准化层、第一前向反馈网络以及第二残差和标准化层;
采用所述第一目标子编码器处理所述第一目标子编码器的输入特征得到所述第一目标子编码器的输出特征,包括:
将所述第一目标子编码器的输入特征作为所述第一自注意力模块的查询向量、值向量和键向量,输入所述第一自注意力模块,得到所述第一自注意力模块输出的第一自注意力特征;
将所述第一自注意力特征以及所述第一目标子编码器的输入特征输入所述第一残差和标准化层,得到第一中间特征;
将所述第一中间特征输入所述第一前向反馈网络,得到第一前向特征;
将所述第一前向特征和所述第一中间特征输入所述第二残差和标准化层,得到所述第一目标子编码器的输出特征。
5.根据权利要求3所述的方法,所述多个子编码器中至少一个第二目标子编码器中包括依序串联设置的第一标准化层、第二自注意力模块、第一残差层、第二标准化层、第二前向反馈网络、以及第二残差层;
采用所述第二目标子编码器处理所述第二目标子编码器的输入特征得到所述第二目标子编码器的输出特征,包括:
将所述第二目标子编码器的输入特征输入所述第一标准化层,得到第一标准化特征;
将所述第一标准化特征作为所述第二自注意力模块的查询向量、值向量和键向量,输入所述第二自注意力模块,得到所述第二自注意力模块输出的第二自注意力特征;
将所述第二自注意力特征以及所述第一标准化特征输入所述第一残差层,得到第一残差特征;
将所述第一残差特征输入所述第二标准化层,得到第二标准化特征;
将所述第二标准化特征输入所述第二前向反馈网络,得到第二前向特征;
将所述第二前向特征和所述第二标准化特征输入所述第二残差层,得到所述第二目标子编码器的输出特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310318509.X/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序