[发明专利]基于多颜色空间卷积神经网络及随机森林的计算机生成图片检测方法有效
| 申请号: | 201910200371.7 | 申请日: | 2019-03-16 |
| 公开(公告)号: | CN109948692B | 公开(公告)日: | 2020-12-15 |
| 发明(设计)人: | 何沛松;王宏霞;刘嘉勇 | 申请(专利权)人: | 四川大学 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06T5/00;G06T7/00;G06T7/90 |
| 代理公司: | 成都盈信专利代理事务所(普通合伙) 51245 | 代理人: | 张澎 |
| 地址: | 610065 四*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 颜色 空间 卷积 神经网络 随机 森林 计算机 生成 图片 检测 方法 | ||
1.一种基于多颜色空间卷积神经网络及随机森林的计算机生成图片检测方法,其特征在于,包括如下步骤:
步骤1:将输入图像进行重采样操作,然后划分为不交叠的图像块;
步骤2:对图像块进行不同的颜色空间变换,保留对应的颜色分量;
步骤3:将从不同颜色空间提取的颜色分量输入到完成训练的三通道卷积神经网络中,将卷积神经网络第一个全连接层的输出作为高维特征表达;
步骤4:将高维特征表达输入完成训练的随机森林分类器,得到每个图像块的分类结果;
步骤5:将输入图像所有图像块的分类结果使用多数投票法,判断输入图像是否为计算机生成图像;
所述步骤1包括如下步骤:
步骤1.1:对输入彩色图片I={Ir,Ig,Ib}在RGB颜色空间中对每一个颜色通道进行重采样,空间尺寸重采样为N×N,重采样结果记为重采样方法可采用双线性插值算法;
步骤1.2:将重采样后的图像划分为不交叠的图像块,每个图像块Bv的空间尺寸为b×b,一共获得个图像块;其中v是图像块序号,取值范围是v={1,2,...,V};
所述步骤2包括如下步骤:
步骤2.1:将每个图像块Bv进行不同的颜色空间变换,包括RGB空间到HSV空间,RGB空间到YCbCr空间,以及RGB空间到La*b*空间;
步骤2.2:图像块Bv经过HSV颜色空间变换,YCbCr颜色空间变换和La*b*颜色空间变换后分别得到:保留其色度分量保留其色度分量和保留其色度分量
所述步骤3包括如下步骤:
步骤3.1:构造三通道卷积神经网络,该网络包含三个输入通道,分别对应HSV,YCbCr和La*b*的颜色分量;每个通道的网络结构相同,均由dL个卷积模块级联构成;每个卷积模块中依次连接一个卷积层,一个非线性激活层和一个池化层;三个输入通道的输出向量进行拼接后输入全连接层;在卷积模块之后,该网络级联dF个全连接层;全连接层之间均包含非线性激活层,采用Rectified Linear Unit函数,简称ReLU函数,其形式为f(x)=max(x,0);在最后一个全连接层之后级联一个softmax层,其形式为其中i'∈{1,2};[x1,x2]表示最后一个全连接层的输出向量;softmax层用于将最后一个全连接层输出的二维向量归一化到[0,1]之间,分别作为输入样本属于计算机生成图片和自然图片的概率;
步骤3.2:将步骤2.2中图像块Bv提取的颜色分量和输入完成训练的三通道卷积神经网络中;将卷积神经网络第一个全连接层的dz维输出向量z作为图像块Bv的特征表达;
所述步骤4包括如下步骤:
步骤4.1:对三通道卷积神经网络的输出特征表达构造随机森林Random Forest,简称RF分类器;RF分类器将CART决策树作为基础分类器;训练集样本为Dori={(z1,y1),(z2,y2),...,(zM,yM)},其中zi表示第i个图像块通过三通道卷积神经网络的输出特征表达,yi表示第i个图像块对应的分类标签,取值为1或0;M表示训练集样本数量;基础分类器数量设置为K;具体的,RF分类器的生成过程如下:
步骤4.1.1:对训练集Dori进行随机采样,在采样过程中,使用有放回的采样方式,直到采集M次,最后,可以得到一个包含M个样本的数据集D;
步骤4.1.2:用数据集D训练CART决策树模型F(x),具体的,CART决策树的生成过程如下:
步骤4.1.2.1:使用数据集D,随机选择特征表达z中的d个属性构成子集zsub(d<dz),其中特征表达z的每一个维度表示一个属性;
步骤4.1.2.2:对于zsub中的每个元素,将数据集D中该元素所有可能的取值组成集合A,对集合A中所有取值进行从大到小的排序,排序后相邻两个取值at和at+1的平均值作为划分值根据大于和小于等于将集合D划分为和依次计算每个划分值的Gini_index系数,Gini_index系数的定义如下:
其中|·|表示计算集合中元素的个数,pn表示在数据集D中第n类样本所占的比例,Nc表示样本类别的总数;
步骤4.1.2.3:在属性集合zsub中,选择使划分后Gini_index系数最小的属性作为最优划分属性zsub,*,若数据集D第一次进行划分,则将zsub,*作为CART决策树模型F(x)的根节点,并得到划分后的样本集合;
步骤4.1.2.4:对步骤4.1.2.3获得划分后的样本集合,重复步骤4.1.2.1到4.1.2.3继续划分分支节点,直到满足下列条件则不再划分并令当前分支节点为叶子节点:(1)当前分支节点的样本属于同一类别;(2)当前分支点的属性集为空或所有样本在所有属性上取值相同;(3)当前分支节点包含的样本集为空;如果节点层数达到预设值L,则该节点不再划分并设为叶子结点;
步骤4.1.3:重复步骤4.1.1和步骤4.1.2,直到基础分类器数目达到预设最大值K;
步骤4.2:得到由K个决策树构成的随机森林分类器fr(x),随机森林分类器的分类结果由基础分类器通过多数投票确定;
所述步骤5包括如下步骤:
步骤5.1:将输入图像的所有图像分块对应的特征表达输入随机森林分类器fr(x)得到分类结果的集合C={c1,...,cV},如果分类器判断输入图像分块是由计算机生成,则分类结果取值为1,反之为0;
步骤5.2:对C采用多数投票的决策方法检测输入图片是计算机生成图片还是自然图片;投票分数如果大于阈值则判断输入图片为计算机生成图片,反之为自然图片;阈值设置为
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学,未经四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910200371.7/1.html,转载请声明来源钻瓜专利网。





