[发明专利]基于深度神经网络与级联回归的图像美感增强方法有效
申请号: | 201710587701.3 | 申请日: | 2017-07-18 |
公开(公告)号: | CN107392244B | 公开(公告)日: | 2020-08-28 |
发明(设计)人: | 王菡子;郭冠军;刘祎;严严 | 申请(专利权)人: | 厦门大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/46;G06T5/00 |
代理公司: | 厦门智慧呈睿知识产权代理事务所(普通合伙) 35222 | 代理人: | 魏思凡;郭福利 |
地址: | 361005 福建省厦门市思*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 神经网络 级联 回归 图像 美感 增强 方法 | ||
1.基于深度神经网络与级联回归的图像美感增强方法,其特征在于,所述图像美感增强方法包括以下步骤:
S1,提供尺寸为C0的原始图像,通过级联回归算法进行求解获得最小化目标为:
其中,代表一个矩形区域,C为裁剪后图像的尺寸,为数据集提供的图像裁剪尺寸;
S2,通过AVA数据集与CHUKPQ数据集提供的预训练图像数据,训练深度卷积神经网络的提取图像特征功能;
S3,通过深度卷积神经网络提取原始图像的深度特征xt,并通过深度卷积神经网络的空间金字塔池化层将尺寸为C0原始图像变转化为特征向量;
S4,将提取的深度特征xt应用于随机蕨回归器中,并采用梯度下降方法学习获得基元回归器,通过级联回归器来输出候选结果Cj,其中,1≤j≤4;其中,所述候选结果Cj是通过累加前j-1次基元回归器的回归值并加上图像初始尺寸值得到,被称为基元回归器,不断迭代直到误差不再减小,获得基元回归器的最小化目标函数;其中,t的取值范围为1,2,3,4....,T;
S5,将步骤S4中获得的基元回归器与深度特征xt按照迭代的方式进行T次循环,通过多级循环剪切获得最终裁剪图像。
2.根据权利要求1所述的基于深度神经网络与级联回归的图像美感增强方法,其特征在于,步骤S3中,通过深度卷积神经网络的空间金字塔池化层将尺寸为C0原始图像变转化为特征向量,特征向量表示为(2*2+3*3+4*4)*32。
3.根据权利要求2所述的基于深度神经网络与级联回归的图像美感增强方法,其特征在于,步骤S4中,通过级联回归器输出的候选结果Cj是通过累加前j-1次基元回归器的回归值并加上图像初始尺寸值得到:
其中,基元回归器的最小化目标函数表示为:
其中,Yij被称为目标标注,每一个特征向量对应了一个目标标注。
4.根据权利要求3所述的基于深度神经网络与级联回归的图像美感增强方法,其特征在于,步骤S5中,将步骤S4中获得的基元回归器与深度特征xt按照迭代的方式进行T次循环,通过多级循环剪切获得最终裁剪图像表示为:
其中,λ为收缩率。
5.根据权利要求1所述的基于深度神经网络与级联回归的图像美感增强方法,其特征在于,所述步骤S2中,具体包括以下步骤:
S21,当原始图像尺寸不是C0时,对原始图像缩放或扩大为C0;
S22,将AVA数据集与CHUKPQ数据集提供的预训练图像分为低质量与高质量,每个图像分别用于训练深度卷积神经网络。
6.根据权利要求5所述的基于深度神经网络与级联回归的图像美感增强方法,其特征在于,深度卷积神经网络拥有五个卷积层和五个池化层,五个池化层分别为四个最大池化层和一个金字塔池化层;深度卷积神经网络的最大池化层使用2*2的区域。
7.根据权利要求6所述的基于深度神经网络与级联回归的图像美感增强方法,其特征在于,深度卷积神经网络的第一个卷积层拥有32个5*5*3的卷积核,用于输出32个原始图像的特征图;之后采用修正线性单元激活函数以及最大池化层,每个卷积层均输出32个特征图;在最后一层使用空间金字塔池化层。
8.根据权利要求1所述的基于深度神经网络与级联回归的图像美感增强方法,其特征在于,所述步骤S4中,基元回归器通过在一组随机蕨回归器中利用梯度下降方法学习得到。
9.根据权利要求1所述的基于深度神经网络与级联回归的图像美感增强方法,其特征在于,所述步骤S5中,循环次数T大于30次。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门大学,未经厦门大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710587701.3/1.html,转载请声明来源钻瓜专利网。