[发明专利]一种微博图片敏感信息检测方法有效

专利信息
申请号: 201210490923.0 申请日: 2012-11-27
公开(公告)号: CN103020651A 公开(公告)日: 2013-04-03
发明(设计)人: 白翔;姚聪;陈瑞军;申辰;刘文予 申请(专利权)人: 华中科技大学
主分类号: G06K9/64 分类号: G06K9/64
代理公司: 华中科技大学专利中心 42201 代理人: 朱仁玲
地址: 430074 湖北*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 图片 敏感 信息 检测 方法
【说明书】:

技术领域

发明属于计算机视觉技术领域,更具体地,涉及一种微博图片敏感信息检测方法。 

背景技术

微博是一种通过关注机制分享简短实时信息的广播式的社交网络平台,在这个信息时代里,无论是微博用户数量还是微博图片数量都增长到十分惊人的程度。然而,微博图片良莠不齐,对于印有敏感信息的微博图片,由于缺乏有效的检测技术,只能通过人力来进行肉眼判别筛选,这对于呈指数级增长的微博图片来说是不现实的。随着近年计算机视觉技术的飞速发展,利用计算机提取或挖掘出图像中包含信息的应用功能也越来越强大,在各个领域得到了广泛的使用。在计算机视觉领域中,文本检测是应用前景很广的一块,传统的文本检测方法,是基于检测式的思路,需要大量的训练集,对噪声抗性不佳,而且容易漏检错检,并且可扩展性较差,在转化成应用方面遇到了很大的困难,无法适用于微博图片敏感信息检测。 

发明内容

针对现有技术的不足,本发明的目的在于提出一种微博图片敏感信息检测方法,其能利用计算机自动匹配和识别出微博图片中的敏感文字信息,且可扩展性强,能抵抗噪声等干扰,并且检测准确率高。 

为实现上述目的,本发明提供了一种微博图片敏感信息检测方法,包括以下步骤: 

(1)建立敏感词库、字体库和颜色库; 

(2)接收N张待检测微博图片; 

(3)创建一个空的敏感信息列表,用于存储所有微博图片所含敏感信息的检测结果; 

(4)设置微博图片计数器i=1,即从第一张微博图片开始敏感信息检测。 

(5)判断条件i≤N是否满足,如果满足,则继续进行步骤(6),当不满足时跳到步骤(12); 

(6)以第i张微博图片大小为准,并根据敏感词库、字体库和颜色库生成对应于该微博图片的敏感信息图片库,敏感信息图片库包括M个敏感信息图片; 

(7)设置敏感信息图片计数器j为1; 

(8)判断条件j≤M是否满足,如果满足,则继续进行步骤(9),当不满足时跳到步骤(11); 

(9)从第i张微博图片的所有可能位置上提取出与第j个敏感信息图片等大小的多个图像块,遍历计算每个图像块与第j个敏感信息图片的匹配度,并根据计算得到的所有匹配度中的最大值确定与第j个敏感信息图片最相近的图像块匹配度,根据匹配度判定是否存在敏感信息,若存在则将相关匹配信息存入敏感信息列表中; 

(10)设置计数器j=j+1,返回步骤(8); 

(11)设置计数器i=i+1,返回步骤(5); 

(12)输出敏感信息列表。 

步骤(1)具体为:根据用户的实际要求,建立敏感词库、字体库和颜色库,其中,敏感词库、字体库和颜色库由用户指定,均衡考虑检测的速度和准确率,字体库包括宋体、楷体、仿宋、黑体,颜色库包括白底黑、红、黄、绿、蓝字,黑底白、红、黄、绿、蓝字、红底黑、白字,黄底黑、 白字,绿底黑、白字,蓝底黑、白字。 

步骤(6)具体为:第i张微博图片的高为Hi个像素点,宽为Wi个像素点,对于敏感词库中的每一个敏感词、字体库中的每一种字体和颜色库中的每一种颜色这三者产生的所有组合而言,为每种组合生成一张包含敏感词、敏感词字体、敏感词颜色和文字背景色的敏感信息图片,其高度为第i张微博图片宽度的x倍,其中x为0.08至0.12,敏感信息图片的宽度为当高为xWi时此种字体下敏感词文字对应的默认宽度。 

步骤(9)包括以下子步骤: 

(9-1)设置行计数器p=1,即从微博图片的第一行开始匹配; 

(9-2)判断条件p≤Hi-xWi+1是否满足,即所选图像块不能超出该微博图片高的范围,如果满足,则继续进行步骤(9-3),当不满足时跳到步骤(9-8); 

(9-3)设置列计数器q=1,即从微博图片的第一列开始匹配; 

(9-4)判断条件q≤Wi-Bj+1是否满足,其中Bj是第j张敏感信息图片的宽度,如果满足,则继续进行步骤(9-5),当不满足时跳到步骤(9-8); 

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210490923.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top