[发明专利]一种基于图像语义分析的移动终端色情过滤方法有效
申请号: | 201310013947.1 | 申请日: | 2013-01-15 |
公开(公告)号: | CN103093236A | 公开(公告)日: | 2013-05-08 |
发明(设计)人: | 段立娟;谷继力;吴春鹏;杨震;苗军;李健;马伟;乔海涛;张祺 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 张慧 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种在移动设备上基于图像语义分析的敏感区域检测方法,实现了在训练分类器的预处理阶段加入自顶向下的视觉注意机制来增强分类器训练的性能和效果,用训练好的分类器对图像进行分类。包括:输入训练图像;提取输入训练图像的特征;将提取的特征训练多个弱分类器,并级联形成最终需要的强分类器;输入测试图像,对测试图像进行预处理,通过视觉注意机制对图像中敏感区域可能的位置进行标定;进行敏感图像检测;输出敏感图像检测结果。在敏感图像检测前进行自顶向下注意机制的显著图提取,可以提高运算效率,缩短运算时间,显著提高检测速度;也使正检率明显提高,误检率明显降低。 | ||
搜索关键词: | 一种 基于 图像 语义 分析 移动 终端 色情 过滤 方法 | ||
【主权项】:
1.一种基于图像语义分析的敏感区域检测方法,其特征在于包括以下步骤:步骤1,输入训练图像:将敏感图像作为正例样本,正常图像作为负例样本;训练样本的采集遵循以下原则:正例样本清晰,扭曲度小,并且在数量上达到一定的量;负例样本的量要超过正例样本,并且包含不同形态的事物,包括自然景色,以及行人等图像,以尽可能地减小误判;对正例样本,确定敏感区域(胸部、下体部位)作为自顶向下认定标准,提取注意引导图;步骤2,提取输入训练图像的特征,方法如下:①将输入图像切分成不重叠的图像块,并将每个图像块向量化;首先,把宽和高分别为W、H的图像I按照从左至右、从上至下的顺序切分成不重叠的图像块pi(i=1,2,...,L),每个图像块是一个方块,宽和高都是k(k<W,k<H),图像I可以切分出的图像块总数为:L = ( W k ) * ( H k ) ]]> 当图像的宽和高不是k的整数倍时,先对图像进行缩放,保证图像的宽和高是k的整数倍,这里假定尺寸变化后图像的宽和高仍分别用W、H表示;将每个图像块pi向量化为列向量fi,fi的长度等于彩色图像的通道数a乘k2,即ak2;②计算每个图像块与其他所有图像块的不相似度,得到显著图。对①所得到的所有向量通过主成分分析进行降维,挑选最大的d个特征值所对应的特征向量X1,X2,...,Xd构成矩阵U,矩阵U是一个d*L的矩阵,其第i列对应图像块pi降维后的向量,图像块pi和pj之间的不相似度
的计算公式为:φ ij = Σ s = 1 d | μ si - μ sj | ]]> 其中,umn表示矩阵U第m行第n列的元素每个图像块pi的视觉显著性程度的计算公式为:
其中,ωij表示图像块pi和pj之间的距离,计算公式为:ω ij = ( x pi - x pj ) 2 + ( y pi - y pj ) 2 ]]> 式中,(xpi,ypi)、(xpj,ypj)分别代表图像块pi和pj的中心点在原图像I上的坐标;![]()
把所有图像块的视觉显著性程度取值按照原图像I上各图像块之间的位置关系组成二维形式,构成显著图SalMap,这是一个J行N列的灰度图,J=H/k,N=W/k,显著图SalMap上第i行第j列的元素对应原图像I上切分出的图像块p(i-1)N+j(i=1,...,J,j=1,...,N)的显著程度取值,具体取值为:SalMap(i,j)=Sal(i-1)N+j(i=1,...,J,j=1,...,N)③根据输入图像中每个图像块与预定义的敏感部位的相关性,建立敏感部位相关图;④将显著图与敏感部位相关图加权点乘,得到注意引导图;⑤根据注意引导图将敏感部位作为当前的显著区域;在训练的过程中,仅选取图像中击最显著的显著点进行训练;⑥对⑤确定的显著点进行敏感区域识别,判定显著点是否为敏感区域,依据注意引导图所选择的最显著的显著点被标记为敏感区域,其他区域均被标记为非敏感区域;⑦根据⑥所标记的敏感区域,提取对应于敏感区域的Harr特征;步骤3,将步骤2提取的特征,训练多个弱分类器,并级联形成最终需要的强分类器,训练方法如下:①输入N个训练实例:<(x1,y1),……,(xn,yn)>,其中xi是输入的训练样本,yi∈{0,1}分别表示正例样本和负例样本,其中正例样本数为1,负例样本数为m,n=m+1;初始化N个训练样本的权值向量D,训练弱分类器;T指迭代次数,对于i=1,...,N,初始化权值向量:wi1=D(i),其中i代表第i个样本,上标代表迭代次数,此处表示第1次迭代;②按下式归一化权值:p t = ω t Σ i = 1 N ω i t ]]> 其中,p为归一化权值,t为迭代次数,t=1,2,3,…,T;③对每个特征f,训练一个弱分类器hj;按下式计算所有特征对应的弱分类器的加权错误率:ϵ t = Σ i = 1 N p i t | h t ( x i ) - y i | ]]> 其中,εt为错误率;④选择错误率最小的分类器为最佳弱分类器ht;⑤设置新的权值向量:
其中,βt=εt/1-ε)⑥循环执行②~⑤,最终输出强分类器:h f ( x ) = 1 , Σ t = 1 T ( log 1 / β t ) h t ( x ) ≥ 1 2 Σ t = 1 T log 1 / β t 0 , Σ t = 1 T ( log 1 / β t ) h t ( x ) < 1 2 Σ t = 1 T log 1 / β t ]]> 步骤4,输入用户使用移动终端上网时浏览到的图像,该图像同样分为正例图像和负例图像;步骤5,对步骤4得到的测试图像进行预处理,通过视觉注意机制对图像中敏感区域可能的位置进行标定;步骤6,检测敏感图像:使用步骤3得到的分类器对步骤5处理过的图像进行分类,判断该图像是不是敏感图像:当步骤5处理过的图像块与强分类器中的敏感部位图像块差异小于域值T时,则认为该图像为敏感图像;否则,认为是正常图像;步骤7,根据步骤6的检测结果,标注图像属于敏感图像还是正常图像,并进行正检率、误报率的统计。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310013947.1/,转载请声明来源钻瓜专利网。
- 上一篇:一种具备分流能力的多功能组合阀
- 下一篇:带双角度喷管的无叶风扇
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序