[发明专利]基于无监督学习的单张图片本征图像分解方法、系统及介质有效
申请号: | 202110395059.5 | 申请日: | 2021-04-13 |
公开(公告)号: | CN113077451B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 周锦;张青;孙伟;郑伟诗;席杨 | 申请(专利权)人: | 中山大学 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06N3/0464;G06N3/084 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 李斌 |
地址: | 510275 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 监督 学习 单张 图片 图像 分解 方法 系统 介质 | ||
1.基于无监督学习的单张图片本征图像分解方法,其特征在于,包括下述步骤:
构建本征图像分解模型,所述本征图像分解模型包括两个分支,一支为反射率生成网络,另一支为光照生成网络;设置随机噪声参数并经过训练后得到两个与原图尺度相同的随机噪声;
将生成的两个随机噪声分别作为反射率网络和光照网络的输入,在损失函数的约束下,不断利用反向传播算法更新反射率网络和光照网络的参数;
所述在损失函数的约束下,不断利用反向传播算法更新反射率网络和光照网络的参数,具体为:
重构误差,所述反射率生成网络和光照生成网络分别输出反射率和光照,根据Retinex理论,图像模型表示为:
I=r·s,(1)
其中,r表示反射率,s表示光照,I表示原图,要满足Retinex理论,即网络的两个输出需要满足(1)等式的约束,因此重构误差表示为:
其中,R表示网络输出的反射率,S表示本方法网络输出的光照,为了将网络的两个分支解耦,使其学习过程相对独立,把原Retinex理论转化到了log域,表达式从乘积式子变成和式;
互斥误差,在梯度域设置一个损失项以区分开反射率和光照,在多种尺度上计算互斥损失项,具体为:
其中,θ表示网络的参数;n表示下采样的系数;fS,fR分别表示输出光照的网络分支和输出反射率的网络分支,fS,fR使用双线性插值法下采样2n-1;||·||F表示Frobenius范数;⊙表示点乘;
本征图像分解模型训练,以生成的两个随机噪声为输入,在训练M1次循环之后在两个初始随机噪声的基础上分别添加扰动,然后分别作为反射率生成网络和光照生成网络最终的网络输入;训练本征图像分解模型使用的目标函数为重构误差和互斥误差;使用Adam优化器更新反射率生成网络和光照生成网络的参数;各分支网络的初始化均采用泽维尔初始化;当更新反射率网络和光照网络的参数多次后,在历史输出中选取重构图与原图峰值信噪比PSNR值最小的那组结果作为本征图像分解的最终结果。
2.根据权利要求1所述基于无监督学习的单张图片本征图像分解方法,其特征在于,所述反射率网络和光照网络结构相同,具体为:
前五层是Encoder部分,每层卷积层的频道数相比前一层增加一倍,第一层的频道数设置为8,每层卷积层的卷积核大小都是3*3,步长设置为2;
后五层是decoder部分,每层卷积层的频道数相比前一层减少一半,第六层的频道数设置为128;每层卷积层的卷积核大小都是3*3,步长设置为2;第七层和第八层分别与第三层和第四层连接,用于保存浅层的信息。
3.根据权利要求1所述基于无监督学习的单张图片本征图像分解方法,其特征在于,所述设置随机噪声参数并经过训练后得到两个与原图尺度相同的随机噪声,具体为:
设置噪声为取值在[-0.5,0.5]之间的满足均匀分布的随机变量,随机噪声生成后就固定为反射率生成网络或者光照生成网络的输入了,在网络训练至M0个循环之后,每个循环的网络输入开始加扰动,以改善网络模型的稳定性;扰动为服从均值为0,方差为1的正态分布的随机变量,扰动乘上系数0.001之后加上原始网络输入构成最终的网络输入。
4.根据权利要求3所述基于无监督学习的单张图片本征图像分解方法,其特征在于,所述M0为1000。
5.根据权利要求1所述基于无监督学习的单张图片本征图像分解方法,其特征在于,在互斥误差的步骤中,设置N=3,
6.根据权利要求1所述基于无监督学习的单张图片本征图像分解方法,其特征在于,所述M1取值为10000。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110395059.5/1.html,转载请声明来源钻瓜专利网。