[发明专利]一种敏感图像识别方法及系统有效

专利信息
申请号: 201310301729.8 申请日: 2013-07-15
公开(公告)号: CN103679132A 公开(公告)日: 2014-03-26
发明(设计)人: 刘毅;肖创柏;段娟;卞春晓 申请(专利权)人: 北京工业大学
主分类号: G06K9/00 分类号: G06K9/00;G06K9/46;G06K9/66
代理公司: 北京思海天达知识产权代理有限公司 11203 代理人: 楼艮基
地址: 100124 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 公开了一种敏感图像识别方法及系统,属于图像识别技术领域,其特征在于,包括:步骤1.融合肤色检测的网格划分提取特征,并采用词袋模型得到图像的原始词袋表示向量;步骤2.图像特征优化,利用随机森林得到降维的优化图像向量表示;步骤3.识别模型训练,利用一类支撑向量机,在优化向量空间中训练一类分类器;步骤4.图像识别,图像在步骤1所述的预处理阶段中如果完全不含肤色像素,则直接被判别为正常图像,否则经过处理得到优化特征表示并进入训练得到的一类分类模型,最终得到图像的识别结果。本发明首次利用一类分类算法解决敏感图像识别问题,在处理过程中融合了多种技术,并实施特征优化处理,提高了敏感图像识别的准确率和效率。
搜索关键词: 一种 敏感 图像 识别 方法 系统
【主权项】:
1.一种敏感图像识别方法,其特征在于,是在计算机中依次按以下步骤实现的: 步骤(1).向所述计算机输入如下图像: 包含m1幅敏感图像的第一敏感图像子集PornSet1,所述敏感图像是指能令人们感兴趣的图像,下同, 包含m2幅敏感图像的第二敏感图像子集PornSet2, 包含m3幅正常图像的正常图像子集NormalSet, 上述m1,m2,m3均为有限正整数; 步骤(2).把所述第一敏感图像子集PornSet1的每幅敏感图像划分为M×N个网格,其中M,N均为有限正整数,每个网格大小为16×16像素;在每个网格中按以下步骤进行肤色检测操作: 步骤(2.1).若所述第一敏感图像子集PornSet1中的图像中的像素在RGB颜色空间中的像素值r,g,b满足以下条件,则认为所述网格中的该像素为肤色像素;下述的r,g,b值的取值区间为[0,255], r>90&g>38&b>18&|r-g|>12, {max{r,g,b}-min{r,g,b}}>12&r>g&r>b, 步骤(2.2).若在所述各网格中所述肤色像素占全部像素的比例大于或等于阈值sg=0.3,则确定该网格为疑似敏感子区域; 步骤(3).对所述第一敏感图像子集PornSet1中的每幅图像中的每个判定为所述疑似敏感子区域,在中心点周围16×16像素的网格中采用尺度不变特征转换SIFT特征描述子生成128维的特征向量,第一敏感图像子集PornSet1的每幅图像的所有疑似敏感子区域经过所述特征提取操作之后,得到包含R个特征向量的集合F={F1,F2,Fr,…,FR};第一敏感图像子集PornSet1中的全部图像所有疑似敏感子区域的特征向量集合PornFeatureSet1,以下简称PornFeatureSet1; 步骤(4).按以下步骤计算所述第一敏感图像子集PornSet1的每幅图像的原始词袋特征向量表示, 步骤(4.1).对所述第一敏感图像子集PornSet1的特征向量集合PornFeatureSet1,按以下步骤执行K均值聚类算法,得到能反映第一敏感图像子集PornSet1中共同特征的一类视觉词典: 步骤(4.1.1).设定: n,所述第一敏感图像子集PornSet1的特征向量集合PornFeatureSet1中的特征向量总数, C,聚类数目,为设定量,C值为200, c,聚类类别的序号,c=1,2,…,c,…,C, 为序号为c的聚类Sc中的第vc个特征向量,聚类Sc中包含Vc个特征向量,μc,为序号为c的聚类Sc的聚类中心,即Sc中的所有向量的平均值, 聚类准则函数为:步骤(4.1.2).改变每次的聚类类别,重新计算μc,一直到等于或小于设定的收敛阈值T为止,0<T<1,设定T=1×10-4,完毕之后,共得到C个聚类中心,所有聚类中心组成一类视觉词典;一类视觉词典的特征向量集合表示为D={D1,D2,…,Dc,…,DC},共包含C个聚类中心的特征向量;步骤(4.2).图像词袋模型最终形成的图像的特征表示向量用B表示,反映了D中的向量在F中出现的频率,称为原始词袋特征向量表示,即分布直方图,表示为B={B1,B2,…,Bc,…,BC},则按如下方式确定B中各分量Bc的值: 步骤(4.3).F中每个特征向量Fr与所述一类视觉词典D中的每个特征向量的欧氏距离d(Fr,Dc),用x表示Fr,用y表示Dc, 其中P即特征向量的维数,为128维,计算前,B中的各分量的初始值为0;计算后,若D中与Fr欧氏距离最近的特征向量为Dc,则原始词袋特征向量表示B中的变量Bc的值增加为B'c,B'c=Bc+1,即分量B'c表示词典D中的视觉单词Dc在F中出现的频次; 上述过程称为最小距离映射,如此循环处理完F中所有R个特征之后,即得到每幅图像的C维的原始词袋向量表示中的各分量的值,即计算出了每幅图像的原始词袋向量表示B;第一敏感图像子集PornSet1中每幅图像通过步骤(4.2)处理,得到所有图像的原始词袋特征向量表示集合PornBowFeatureSet1; 步骤(5).按步骤(2)-步骤(3)所述方法,对正常图像子集NormalSet提取局部特征,得到其特征向量集合,用NormalFeatureSet表示,并按步骤(4.2)所述方法,利用步骤4.4中所述方法对所述NormalSet中的每幅图像的特征集合与步骤(4.1.2)中得到的一类视觉词典D进行最小距离映射,得到正常图像子集的所有图像的词袋特征向量表示集合NormalBowFeatureSet, 步骤(6).利用随机森林算法对步骤(5)中得到的PornBowFeatureSet1和NormalBowFeatureSet进行分类测试,以确定一类视觉词典D中的视觉单词Dc对应的原始词袋特征向量B中的各分量Bc对分类效果的贡献大小,步骤如下: 步骤(6.1).利用下述方法生成随机森林的训练集: 步骤(6.1.1).从PornBowFeatureSet1和NormalBowFeatureSet分别有放回地随机抽取50%的样本共同形成一个训练集TrainSet,TrainSet中的特征向量用BT表示,BT即TrainSet中的图像的原始词袋特征向量表示,以此生成一棵分类树,任意选取一个向量作为每棵分类树的根节点,分类树是一个二叉分类树;分类树的叶子节点即BT中的某个分量Bt称为叶子结点的属性值, 步骤(6.1.2).重复上述随机抽取过程ntree次,ntree是一个有限正整数,其值设为500;在每次抽取中,未抽中的样本称为袋外数据,用表示,在每次随机抽取中,均生成一颗分类树,用τ表示,τ=(1,2,…,τ,…,ntree),所有的分类树组成了随机森林,步骤(6.2).利用下述方法进行变量重要性评估: 步骤(6.2.1).按步骤(6.1.2)所述,每次随机生成trainset后,对分类树的叶子结点按下述方式进行分裂: 对C维的原始词袋特征向量表示BT,指定一个正整数mtry<C,mtry是一个有限正整数,其值设为64;在每个叶子结点上,从C个属性值中随机抽取mtry个作为候选特征,在叶子节点的每次分裂中,计算如下基尼不纯度指数: 其中,fl是TrainSet中的所有向量Bt在ntree次抽取中被分类为l的概率,分类树的分类结果可能取值为{1,2},1和2分别用以表示敏感图像和正常图像, 在分类树分裂过程中,选择具有最小基尼不纯度指数G(f)的属性为叶子节点在分裂以后的属性值; 按上述方法得到随机森林中每棵分类树的最终分类结果, 步骤(6.2.2)随机森林的分类结果采用多数投票法确定: 随机森林中的每棵分类树均得出一个分类结果,其值为{1,2}中的任一个,ntree个分类结果值中计数最多的值即为随机森林的分类结果; 步骤(6.3).按下述步骤计算图像原始词袋特征向量B中各分量的重要性: 步骤(6.3.1).设定: 袋外数据中样本u的实际类别标签,即u对应的图像的真实类别,分类树τ预测的该样本的类别结果,步骤(6.3.2).随机抽取第τ次袋外数据的与Bt相对应的属性值并按下述方式进行置换,对置换后的样本B'进行分类树分类,得到新的类别标签为所述属性置换方式如下: 在袋外数据中随机抽取得到向量X=(X1,X2,…,Xc,…,XC),将BT中的同一维的属性Bt的值置换为Xc,得到置换后的样本B';步骤(6.3.3).按下式计算样本B'中C维原始词袋特征向量Bt中的第c维的变量在决策树τ中的重要性VI(τ)(Bt): 在上式中,表示置换前分类树预测结果相等的情况,表示置换后分类树预测结果相等的情况;步骤(6.3.4).变量Bt的重要性定义为VI(τ)(Bt)在随机森林中的所有分类树上的平均值,计算公式如下: 按上述公式计算得到的VI(Bt)的值即图像原始词袋向量表示B中的第t维的变量的重要性值; 步骤(7).按步骤(6)所述方法,利用随机森林对图像原始词袋特征表示向量B进行变量重要性评估,得到所有C个分量的重要性值,对变量重要性值排序并记录下前K个最重要的变量,即一类视觉词典中对分类贡献最大的K个视觉单词,K是一个有限正整数,K<C,K取值为80;重要变量索引的集合记为P={p1,p2,…pk…,pK}; 步骤(8).得到优化的图像向量表示,操作方式如下: 第二敏感图像子集中一幅图像通过步骤(4)得到原始词袋特征向量表示后,则仅保留该向量中下标在索引集合P中出现的变量,并保持其原有的顺序关系,这样就得到一个新的K维的优化图像表示向量O,步骤(9).将敏感图像识别视为一种一类分类应用场景:将第二敏感图像子集PornSet2用于训练一类分类器; 步骤(9.1).在一类分类方法的选择上,采用一类支撑向量机,设定一类支撑向量机的决策函数如下: 其中,αi为拉格朗日系数,ρ决定了分类面相对原点的距离,为得到决策函数,输入数据为所述的第二敏感图像子集PornSet2的优化图像表示向量,参数αi,ρ均是利用开源工具包libsvm在训练过程中计算所得,在分类模型确定后,参数值不再改变;Θ为核函数,Θ(Oi,Oj)为内积运算;两个向量Oi和Oj之间的核函数计算公式如下: 其中,γ的取值为8; 在计算出决策函数f(O)的各项参数后,即得到完整的可用决策函数,该决策函数是一系列向量和参数的数据集合体,直接用于后续计算, 步骤(10).对于一幅待识别图像I,按如下步骤得到该图像的类别: 步骤(10.1).按步骤(2)所述方法,对图像I执行特征检测操作,如果在步骤(2)中发现该图像完全不含疑似肤色区域,则直接判别该图像为正常图像,不再进入后续处理步骤;否则,执行以下处理步骤: 步骤(10.2).提取图像I的的局部特征后,得到图像I的特征集合FeatureSet_I,FeatureSet_I 中的所有向量逐一与步骤(4.1.2)中得到的一类词典进行最小距离映射,得到原始的图像词袋表示向量B; 步骤(10.3).得到原始的图像词袋表示向量之B后,按步骤(8)所述方法进行优化处理,并得到优化图像表示向量O; 步骤(10.4).利用f(O)判别待识别图像I的测试数据x的类别,x为待识别图像的优化特征向量,将其代入f(O)中,计算出f(O)的值,若f(O)≥0,则判别测试数据x对应的待识别图像为敏感图像;若f(O)<0,则判别测试数据x对应的待识别图像为正常图像。 
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201310301729.8/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top