[发明专利]基于扩散模型的图像增强方法、装置、设备及存储介质在审
申请号: | 202310922672.7 | 申请日: | 2023-07-26 |
公开(公告)号: | CN116664450A | 公开(公告)日: | 2023-08-29 |
发明(设计)人: | 王红凯;徐昱;毛冬;戴波;陈祖歌;黄建平;李钟煦;郑怡;饶涵宇;李高磊 | 申请(专利权)人: | 国网浙江省电力有限公司信息通信分公司;国网信息通信产业集团有限公司;国网浙江省电力有限公司磐安县供电公司 |
主分类号: | G06T5/00 | 分类号: | G06T5/00;G06V10/44;G06T9/00 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 薛梦 |
地址: | 310000 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 扩散 模型 图像 增强 方法 装置 设备 存储 介质 | ||
1.基于扩散模型的图像增强方法,其特征在于,所述方法包括:
获取待增强的目标图像,并通过编码器对所述目标图像进行编码,得到编码特征图;
获取图像增强指令,通过文本编辑器对所述图像增强指令进行编码,得到文本编码;所述图像增强指令包括需要增强的图像的特征和位置;
将所述编码特征图和所述文本编码输入到预先训练好的目标图像增强网络中;
按照预设噪声添加规则和预设步数,逐步向所述编码特征图中添加高斯噪声,得到服从高斯分布的目标噪声图像,并确定每一步添加高斯噪声后的结果图像中的预测噪声;
基于交叉注意力机制,对所述目标噪声图像中与所述文本编码对应的区域进行图像增强,得到加噪增强图像;
按照预设噪声去除规则和所述预设步数,逐步从所述加噪增强图像中去除每一步的所述预测噪声,得到去噪后图像;
通过解码器对所述去噪后图像进行解码,得到增强后图像。
2.根据权利要求1所述的图像增强方法,其特征在于,所述预设噪声添加规则是基于去噪扩散概率模型的扩散过程确定的;所述按照预设噪声添加规则和预设步数,逐步向所述编码特征图中添加高斯噪声,得到服从高斯分布的目标噪声图像,具体包括:
按照所述去噪扩散概率模型的扩散过程,在所述扩散过程的每一步,向所述编码特征图中添加高斯噪声;添加的所述高斯噪声的参数值基于预设噪声时间表确定;
根据所述编码特征图和所述噪声时间表,计算所述扩散过程的每一步添加所述高斯噪声后的结果图像,并将所述预设步数对应的结果图像作为目标噪声图像输出。
3.根据权利要求2所述的图像增强方法,其特征在于,所述根据所述编码特征图和所述噪声时间表,计算所述扩散过程的每一步添加所述高斯噪声后的结果图像,具体为:
根据如下公式计算所述扩散过程的每一步添加所述高斯噪声后的结果图像:
,
其中,为添加高斯噪声前的编码特征图,为加噪至第t时刻对应的加噪结果;
,;
为预设噪声时间表,包括,表示所述扩散过程的每一步添加高斯噪声的参数值,且。
4.根据权利要求1所述的图像增强方法,其特征在于,所述目标噪声图像包括多个图像通道,所述交叉注意力机制包括通道注意力机制和空间注意力机制;所述基于交叉注意力机制,对所述目标噪声图像中与所述文本编码对应的区域进行图像增强,得到加噪增强图像,具体包括:
通过所述通道注意力机制,对所述目标噪声图像中与所述文本编码对应的区域的每个所述图像通道对应的特征图进行不同图像通道的针对性增强,得到通道注意力特征图;
通过所述空间注意力机制,对所述通道注意力特征图进行不同空间位置的针对性增强,得到加噪增强图像。
5.根据权利要求4所述的图像增强方法,其特征在于,所述通过所述通道注意力机制,对所述目标噪声图像中与所述文本编码对应的区域的每个所述图像通道对应的特征图进行不同图像通道的针对性增强,得到通道注意力特征图,具体包括:
对于所述目标噪声图像中与所述文本编码对应的区域的每个图像通道的特征图,根据最大池化和平均池化的方法对所述特征图进行降维处理,得到所述图像通道对应的特征图的全局特征;
通过多层感知器对所述全局特征进行处理,得到所述图像通道的权重系数;
通过所述权重系数对所述图像通道对应的特征图进行加权处理,得到加权后特征图;
对所述加权后特征图与所述目标噪声图像的所述图像通道做乘法处理,得到通道注意力特征图。
6.根据权利要求5所述的图像增强方法,其特征在于,通过所述空间注意力机制,对所述通道注意力特征图进行不同空间位置的针对性增强,得到加噪增强图像,具体包括:
根据最大池化和平均池化的方法对所述通道注意力特征图进行处理,得到处理结果;
将所述处理结果基于对应的图像通道进行连接操作,得到连接后特征图;
通过卷积降维处理的方法将所述连接后特征图降维成单通道,得到空间特征图;
对所述空间特征图和所述目标噪声图像做乘法处理,得到加噪增强图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网浙江省电力有限公司信息通信分公司;国网信息通信产业集团有限公司;国网浙江省电力有限公司磐安县供电公司,未经国网浙江省电力有限公司信息通信分公司;国网信息通信产业集团有限公司;国网浙江省电力有限公司磐安县供电公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310922672.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种商品库存管理方法
- 下一篇:人脸识别模型训练方法、人脸识别方法及装置
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序