[发明专利]一种基于卷积神经网络的面色舌色图像颜色校正方法有效

专利信息
申请号: 201710406983.2 申请日: 2017-06-02
公开(公告)号: CN107507250B 公开(公告)日: 2020-08-21
发明(设计)人: 李晓光;卢运西;卓力;张菁;张辉 申请(专利权)人: 北京工业大学
主分类号: G06T7/90 分类号: G06T7/90;G06N3/08
代理公司: 北京思海天达知识产权代理有限公司 11203 代理人: 刘萍
地址: 100124 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 卷积 神经网络 面色 图像 颜色 校正 方法
【权利要求书】:

1.一种基于卷积神经网络的面色舌色图像颜色校正方法,包括离线部分和在线部分,其特征在于:离线部分由训练数据采集、颜色校正卷积神经网络网络框架搭建和训练组成,在线部分包括图像颜色校正;

所述的离线部分,具体内容如下:

(1)训练数据采集

采用在暗箱条件下人工光源来模拟自然光,有效的保证光源条件的稳定性;

对拍摄得到的图像进行处理,裁剪截取每个色块,每个色块需要设置固定大小格式作为训练样本,利用色卡的标准值生成RGB图像做训练数据的标签,训练样本和标签一一对应;

(2)颜色校正卷积神经网络网络框架搭建和训练

颜色校正卷积神经网络框架设计为浅层的深度神经网络,网络层数为5层;分别是输入层、非线性变换层、输出层;输入层是由一个卷积层和修正线性单元ReLU组成;非线性变换层由3层网络组成,每层由一个卷积层和ReLU激活函数组成,在卷积层和激活函数中间有一个批归一化;输出层是由一个卷积层组成;

在训练中,利用带mini-batch的随机梯度下降算法来迭代和更新卷积核状态W和偏置B,每次进行微批数据集运算,并采用随机梯度下降算法寻找全局最优解;

在CNN的图像处理过程中,卷积层之间需要通过卷积滤波器联系,卷积滤波器的定义表示为W×H×C×D,其中,C代表被滤波图像的通道数;W、H分别代表滤波范围的宽、高;D代表卷积滤波器的数量;

网络的输入层含有一个卷积层和ReLU激活函数;输入层特征提取公式表示如下:

F1(X1)=max(0,W1*X1+B1) (1)

式中,X1为进入输入层的特征图,W1和B1分别表示输入层的卷积滤波器和偏置,W1的尺寸是3×3×3×64,它表示64种不同的卷积滤波器,每个卷积的核尺寸3×3×3,F1(X1)是输入层得到的特征图;

输入图像为40×40×3的特征图,表示特征图宽w和高h均为40,3个通道的彩色图;经过卷积层输出特征图的宽w1和高h1计算公式如公式(2)和公式(3)所示,kernel为卷积的核的长或宽;stride为卷积核的步长,当取值为1时,提取重叠的图像块,效果较好;pad为边缘补零像素个数;在本发明中设定kernel的值为3,stride的值为1,pad的值为1;因此,输入图像经过输入层64个3×3×3大小的卷积核W1之后会产生40×40×64的特征图;然后,特征图经过修正线性单元ReLU;ReLu的表示为max(0,X),提取有用的特征图;最后输出结果仍为40×40×64的特征图;

在非线性变换层的非线性映射过程中,卷积层、批归一化和ReLU函数位于第二层、第三层和第四层;非线性变换层各阶段的公式表示如下:

Fi(Xi)=max(0,Wi*Fi-1(Xi-1)+Bi){i=2,3,4} (4)

式中,i表示第i层,Xi为第i-1层的输出,即Fi-1(xi-1);Wi和Bi分别表示非线性变换阶段的卷积滤波器和偏置,其中,卷积滤波器W1的尺寸是3×3×3×64,第2,3,4层卷积层Wi的尺寸是3×3×64×64;输入层输出的40×40×64的特征图,输入到第二个卷积层中,会产生40×40×64的特征图;然后,40×40×64的特征图进入批归一化;批归一化在卷积层和ReLU激活函数中间,解决了神经网络训练时的收敛速度慢和梯度爆炸等无法训练的情况;同时,批归一化加快了网络的训练速度,提高了模型精度;最后,特征图经过修正线性单元,提高了特征的非线性;第二层网络输出40×40×64的特征图之后经过与第二层有相同的结构的第三、四层,最终得到40×40×64的特征图;

在输出层的输出重建过程中,特征图输入到只含有一个卷积层的输出层;输出重建的公式表示如下:

F5(X5)=W5*F4(X4)+B5 (5)

式中,X5为第4层的输出;W5和B5分别表示特征重建层的卷积滤波器和偏置,W5的尺寸是3×3×64×3,特征重建层有3个卷积滤波器,等同于均值滤波器的作用,每个卷积的核尺寸是3×3×64,能够实现平均特征图的作用,F4(X4)是非线性变换层产生的特征图,即X5;非线性变换层输出的特征图经过3个卷积核3×3×64之后会产生40×40×3的特征图;

采集得到的数据集对该网络进行训练,迭代50次以上后得到训练后的网络,将网络参数最终保存到文件中;

所述的在线部分,具体内容如下:

利用训练得到的网络参数对颜色失真图像进行颜色校正,得到校正后的图像;暗室中拍摄色卡、人脸和舌图像,得到的照片与实际颜色相比较存在失真,使用基于卷积神经网络颜色校正方法对失真图像进行颜色校正;首先读取待校正图像像素点保存为图像矩阵,然后读取训练得到的MAT格式文件得到颜色校正网络参数;将图像矩阵输入到颜色校正卷积神经网络当中,分别在R、G、B三个通道对图像进行颜色校正,输出校正后的图像。

2.根据权利要求1所述的方法,其特征在于:

使用ColorChecker Digital SG作为颜色校正的色卡;在封闭式环境条件下,对ColorChecker Digital SG标准色卡进行拍照;通过包括改变色卡的拍摄角度,调整色卡与光源距离,调整色卡和相机的距离方式拍摄得到色卡图像,利用这些图像生成颜色校正卷积神经网络的网络参数的训练数据。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710406983.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top