[发明专利]一种基于卷积神经网络和邻域上下文的光源估计方法有效
申请号: | 201810236107.4 | 申请日: | 2018-03-21 |
公开(公告)号: | CN108388905B | 公开(公告)日: | 2019-07-19 |
发明(设计)人: | 张骏;郑彤;刘亚美;王程;郑顺源;张旭东;高隽 | 申请(专利权)人: | 合肥工业大学 |
主分类号: | G06K9/46 | 分类号: | G06K9/46;G06N3/04;G06T7/90 |
代理公司: | 安徽省合肥新安专利代理有限责任公司 34101 | 代理人: | 陆丽莉;何梅生 |
地址: | 230009 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于卷积神经网络和邻域上下文的光源估计方法,其步骤包括:1确定待处理的彩色图像中的亮像素与暗像素;2从待处理的彩色图像中提取同时包含亮像素和暗像素的图像块;3从待处理的彩色图像中提取与图像块中心相同且范围更大的邻域块,以提供给模型更多的上下文信息;4以VGG‑16模型参数为基础,搭建结合图像块和邻域块上下文的光源估计模型,并利用Gehler‑Shi彩色图像数据集训练;5利用训练好的光源估计模型对所述待处理彩色图像I进行光源估计。本发明能估计彩色图像场景中的真实光源值,从而能有效的对彩色图像进行色彩校正,使图像色彩恢复到标准光源下。 | ||
搜索关键词: | 彩色图像 光源估计 图像块 卷积神经网络 暗像素 亮像素 邻域块 邻域 彩色图像数据 上下文信息 标准光源 模型参数 色彩校正 图像色彩 真实光源 场景 恢复 | ||
【主权项】:
1.一种基于卷积神经网络和邻域上下文的光源估计方法,其特征是按如下步骤进行:步骤1、从高度与宽度分别为H和W的待处理彩色图像I中提取包含亮像素与暗像素的图像块集合P={P1,P2,…,Pn…,PN};其中,Pn表示第n个包含亮像素与暗像素的图像块,1≤n≤N,N为从所述待处理彩色图像I中提取的图像块的总数量;步骤1.1、计算所述待处理彩色图像I中所有像素点的RGB均值,并得到RGB均值向量
步骤1.2、以第i行第j列的像素点P(i,j)为向量Li,j=(Ri,j,Gi,j,Bi,j)向所述RGB均值向量
投影,得到第i行第j列像素点的投影|M|(i,j),从而得到所有像素点的投影集合|M|={|M|(1,1),|M|(1,2),…,|M|(i,j),…,|M|(H,W)},1≤i≤H,1≤j≤W;步骤1.3、将所述投影集合|M|进行降序排序,选取所述待处理彩色图像I像素点总数的前x%个投影所对应的像素作为亮像素,选取所述待处理彩色图像I像素点总数的后x%个投影所对应的像素作为暗像素;步骤1.4、定义图像块的大小为m×m,从所述待处理彩色图像I中随机选取同时包含所述亮像素与暗像素的图像块,从而得到N个图像块;步骤2、在所述待处理彩色图像I中,以所述第n个图像块Pn的中心为相应邻域块的中心,取大小为k×k的邻域块,再对所述邻域块缩放到m×m大小,从而得到第n个邻域块Zn,进而得到邻域块集合Z={Z1,Z2,…,Zn,…,ZN},1<m<k;步骤3、构建图像块和邻域块的光源估计模型;步骤3.1、获取含有彩色图像和场景真实光源RGB值的数据集D,并将所述数据集D随机平均分为3个子集,记为D={Dtrain,Dval,Dtest};Dtrain表示训练数据集,并包含有dtrain张彩色图像;Dval表示验证数据集,并包含有dval张彩色图像;Dtest表示测试数据集,并包含有dtest张彩色图像;步骤3.2、按照步骤1和步骤2对所述训练数据集Dtrain进行处理,得到所述训练数据集Dtrain所有训练图像的图像块集合
和邻域块集合
步骤3.3、对所述训练图像的图像块集合Ptrain和邻域块集合Ztrain进行数据增强,得到增强后的图像块集合P′train和邻域块集合Z′train;步骤3.4、对所述增强后的图像块集合P′train和邻域块集合Z′train进行Gamma矫正,得到矫正后的图像块集合P″train和邻域块集合Z″train,其中Gamma值为G′;步骤3.5、对所述训练数据集Dtrain中所有训练图像的场景真实光源RGB值进行L2范数归一化处理,得到归一化后的RGB值;步骤3.6、将VGG‑16卷积神经网络的第J层的输出设定为b个;步骤3.7、以所述矫正后的图像块集合P″train作为所述VGG‑16卷积神经网络的输入,以归一化后的图像标签作为标签,以欧式距离作为损失函数,利用梯度下降算法对所述VGG‑16卷积神经网络进行训练,得到图像块的光源估计模型P‑Model;步骤3.8、以所述矫正后的邻域块集合Z″train作为所述VGG‑16卷积神经网络的输入,以所述归一化后的图像标签作为标签,以欧式距离作为损失函数,利用梯度下降算法对所述VGG‑16卷积神经网络进行训练,得到邻域块的光源估计模型Z‑Model;步骤3.9、构建维度分别为w1、w2、w3的h层全连接层作为决策层;步骤3.10、利用所述图像块的光源估计模型P‑Model的前t层结构和邻域块的光源估计模型Z‑Model的前t层结构分别对所述矫正后的图像块集合P″train和邻域块集合Z″train进行特征提取,得到特征提取层的特征图F和F′;步骤3.11、将所述特征图F和F′相加后的结果作为所述决策层的输入,以所述归一化后的图像标签作为标签,以欧式距离作为损失函数,利用梯度下降算法对所述决策层进行训练,得到光源估计模型E‑Model;步骤4、对所述待处理彩色图像I进行光源估计:步骤4.1、利用所述图像块的光源估计模型P‑Model的前t层结构和邻域块的光源估计模型Z‑Model的前t层结构分别对所述第n个图像块Pn和第n个邻域块Zn进行特征提取,得到特征提取层的特征图Fn和F′n;步骤4.2、将所述特征图Fn和F′n相加后的结果作为所述光源估计模型E‑Model的输入,得到第n个图像块Pn的场景光源RGB值;步骤4.3、重复步骤4.1‑步骤4.2,从而得到所述N个图像块与邻域块的场景光源RGB值;步骤4.4、对所述N个图像块与邻域块的场景光源RGB值求均值与中值,从而得到所述待处理彩色图像I的光源RGB值并作为光源估计的结果;步骤4.5、使用估计的光源RGB值对所述待处理彩色图像I进行颜色校正。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥工业大学,未经合肥工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810236107.4/,转载请声明来源钻瓜专利网。