[发明专利]一种基于图像语义分析的移动终端色情过滤方法有效

申请号：	201310013947.1	申请日：	2013-01-15
公开（公告）号：	CN103093236A	公开（公告）日：	2013-05-08
发明（设计）人：	段立娟;谷继力;吴春鹏;杨震;苗军;李健;马伟;乔海涛;张祺	申请（专利权）人：	北京工业大学
主分类号：	G06K9/62	分类号：	G06K9/62
代理公司：	北京思海天达知识产权代理有限公司 11203	代理人：	张慧
地址：	100124 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种在移动设备上基于图像语义分析的敏感区域检测方法，实现了在训练分类器的预处理阶段加入自顶向下的视觉注意机制来增强分类器训练的性能和效果，用训练好的分类器对图像进行分类。包括：输入训练图像；提取输入训练图像的特征；将提取的特征训练多个弱分类器，并级联形成最终需要的强分类器；输入测试图像，对测试图像进行预处理，通过视觉注意机制对图像中敏感区域可能的位置进行标定；进行敏感图像检测；输出敏感图像检测结果。在敏感图像检测前进行自顶向下注意机制的显著图提取，可以提高运算效率，缩短运算时间，显著提高检测速度；也使正检率明显提高，误检率明显降低。
搜索关键词：	一种基于图像语义分析移动终端色情过滤方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于图像语义分析的敏感区域检测方法，其特征在于包括以下步骤:步骤1，输入训练图像：将敏感图像作为正例样本，正常图像作为负例样本；训练样本的采集遵循以下原则：正例样本清晰，扭曲度小，并且在数量上达到一定的量；负例样本的量要超过正例样本，并且包含不同形态的事物，包括自然景色，以及行人等图像，以尽可能地减小误判；对正例样本，确定敏感区域（胸部、下体部位）作为自顶向下认定标准，提取注意引导图；步骤2，提取输入训练图像的特征，方法如下：①将输入图像切分成不重叠的图像块，并将每个图像块向量化；首先，把宽和高分别为W、H的图像I按照从左至右、从上至下的顺序切分成不重叠的图像块p_i(i＝1,2,...,L)，每个图像块是一个方块，宽和高都是k(k＜W,k＜H)，图像I可以切分出的图像块总数为：L=(Wk)*(Hk)]]>当图像的宽和高不是k的整数倍时，先对图像进行缩放，保证图像的宽和高是k的整数倍，这里假定尺寸变化后图像的宽和高仍分别用W、H表示；将每个图像块p_i向量化为列向量f_i，f_i的长度等于彩色图像的通道数a乘k²，即ak²；②计算每个图像块与其他所有图像块的不相似度，得到显著图。对①所得到的所有向量通过主成分分析进行降维，挑选最大的d个特征值所对应的特征向量X₁,X₂,...,X_d构成矩阵U，矩阵U是一个d*L的矩阵，其第i列对应图像块p_i降维后的向量，图像块p_i和p_j之间的不相似度的计算公式为：φij=Σs=1d|μsi-μsj|]]>其中，u_mn表示矩阵U第m行第n列的元素每个图像块p_i的视觉显著性程度的计算公式为：其中，ω_ij表示图像块p_i和p_j之间的距离，计算公式为：ωij=(xpi-xpj)2+(ypi-ypj)2]]>式中，(x_pi，y_pi)、(x_pj,y_pj)分别代表图像块p_i和p_j的中心点在原图像I上的坐标；把所有图像块的视觉显著性程度取值按照原图像I上各图像块之间的位置关系组成二维形式，构成显著图SalMap，这是一个J行N列的灰度图，J=H/k，N=W/k，显著图SalMap上第i行第j列的元素对应原图像I上切分出的图像块p_(i-1)N+j(i＝1,...,J,j＝1,...,N)的显著程度取值，具体取值为：SalMap(i,j)＝Sal_(i-1)N+j(i＝1,...,J,j＝1,...,N)③根据输入图像中每个图像块与预定义的敏感部位的相关性，建立敏感部位相关图；④将显著图与敏感部位相关图加权点乘，得到注意引导图；⑤根据注意引导图将敏感部位作为当前的显著区域；在训练的过程中，仅选取图像中击最显著的显著点进行训练；⑥对⑤确定的显著点进行敏感区域识别，判定显著点是否为敏感区域，依据注意引导图所选择的最显著的显著点被标记为敏感区域，其他区域均被标记为非敏感区域；⑦根据⑥所标记的敏感区域，提取对应于敏感区域的Harr特征；步骤3，将步骤2提取的特征，训练多个弱分类器，并级联形成最终需要的强分类器，训练方法如下：①输入N个训练实例：<(x₁，y₁)，……，(x_n，y_n)＞，其中x_i是输入的训练样本，y_i∈{0,1}分别表示正例样本和负例样本，其中正例样本数为1，负例样本数为m，n=m+1；初始化N个训练样本的权值向量D，训练弱分类器；T指迭代次数，对于i=1，...，N，初始化权值向量：w_i¹=D(i)，其中i代表第i个样本，上标代表迭代次数，此处表示第1次迭代；②按下式归一化权值：pt=ωtΣi=1Nωit]]>其中，p为归一化权值，t为迭代次数，t=1，2，3，…，T；③对每个特征f,训练一个弱分类器h_j；按下式计算所有特征对应的弱分类器的加权错误率：ϵt=Σi=1Npit|ht(xi)-yi|]]>其中，ε_t为错误率；④选择错误率最小的分类器为最佳弱分类器h_t；⑤设置新的权值向量：其中，β_t＝ε_t/1-ε)⑥循环执行②~⑤，最终输出强分类器：hf(x)=1,Σt=1T(log1/βt)ht(x)≥12Σt=1Tlog1/βt0,Σt=1T(log1/βt)ht(x)<12Σt=1Tlog1/βt]]>步骤4，输入用户使用移动终端上网时浏览到的图像，该图像同样分为正例图像和负例图像；步骤5，对步骤4得到的测试图像进行预处理，通过视觉注意机制对图像中敏感区域可能的位置进行标定；步骤6，检测敏感图像：使用步骤3得到的分类器对步骤5处理过的图像进行分类，判断该图像是不是敏感图像：当步骤5处理过的图像块与强分类器中的敏感部位图像块差异小于域值T时，则认为该图像为敏感图像；否则，认为是正常图像；步骤7，根据步骤6的检测结果，标注图像属于敏感图像还是正常图像，并进行正检率、误报率的统计。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京工业大学，未经北京工业大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201310013947.1/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于图像语义分析的移动终端色情过滤方法有效

专利文献下载