[发明专利]图片审核方法和系统在审
申请号: | 201310058758.6 | 申请日: | 2013-02-25 |
公开(公告)号: | CN103116752A | 公开(公告)日: | 2013-05-22 |
发明(设计)人: | 郝双 | 申请(专利权)人: | 新浪网技术(中国)有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/54 |
代理公司: | 北京市京大律师事务所 11321 | 代理人: | 黄启行;方晓明 |
地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图片 审核 方法 系统 | ||
1.一种图片审核方法,其特征在于,包括:
对文本图片进行光学字符识别OCR处理,提取该文本图片中的文本信息;
对提取的文本信息进行关键字/词的匹配,判断其中是否包含要过滤的关键字/词;若是,则对该文本图片进行过滤处理。
2.如权利要求1所述的方法,其特征在于,在所述对文本图片进行OCR处理,提取该文本图片中的文本信息之前,还包括:
对所述文本图片进行二值化处理。
3.如权利要求2所述的方法,其特征在于,在所述对所述文本图片进行二值化处理之前,还包括:
对所述文本图片进行灰度化处理。
4.如权利要求3所述的方法,其特征在于,在所述对文本图片进行OCR处理,提取该文本图片中的文本信息之前,还包括:对所述文本图片进行去除噪声处理。
5.如权利要求1-4任一所述的方法,其特征在于,所述对文本图片进行OCR处理,提取该文本图片中的文本信息具体包括:
对所述文本图片的图像进行字符切割;
对所述文字图片中切割出的字符,按照设定单位进行划分;并对每个设定单位内的字符进行识别:
对所述设定单位内的每个字符进行特征提取和特征匹配后,确定每个字符的候选字;
针对所述设定单位内的每个字符,确定该字符的每个候选字的相似度、以及该字符的每个候选字与该字符相邻的字符的候选字之间的转移概率;
根据确定出的相似度和转移概率,确定出所述设定单位内的字符的识别结果;
根据每个设定单位内的字符的识别结果,确定该文本图片中的文本信息。
6.如权利要求5所述的方法,其特征在于,所述根据确定出的相似度和转移概率,确定出所述设定单位内的字符的识别结果具体包括:
确定该设定单位内的第1个字符的候选字的维特比概率为该候选字的相似度;
从该设定单位内的第2个字符起,对于当前字符的每个候选字,根据该候选字的相似度、以及该候选字与该当前字符相邻的字符中的在前字符的候选字之间的转移概率,确定出所述当前字符的每个候选字与所述在前字符的各候选字之间的维特比概率;
在确定出当前候选字与各在前候选字之间的维特比概率后,比较各维特比概率,从中选择最大的维特比概率作为当前候选字的维特比概率;其中,所述当前候选字为所述当前字符的候选字之一,所述在前候选字为所述在前字符的候选字之一;
以所述当前候选字作为当前节点,选择与该当前候选字之间的维特比概率最大的在前候选字作为与该当前候选字相邻的在前节点;
确定候选路径;其中,所述候选路径中的每个节点为分别针对所述设定单位内的每个字符选择出的候选字,同一候选路径中的相邻节点是根据每个候选字的在前节点确定的;
比较各候选路径的最后节点的维特比概率,以最后节点的维特比概率最大的候选路径作为所述识别结果。
7.如权利要求6所述的方法,其特征在于,所述根据该候选字的相似度、以及该候选字与该当前字符相邻的字符中的在前字符的候选字之间的转移概率,确定出所述当前字符的每个候选字与所述在前字符的各候选字之间的维特比概率,具体根据如下公式5或4:
Pv=P2×R×Pv' (公式5)
logPv=b×logP2+c×logR+d×logPv' (公式4)
其中,Pv为所述当前候选字与所述在前候选字之间的维特比概率;P1为所述当前候选字的出现概率,P2为所述在前候选字与所述当前候选字之间的转移概率;R为所述当前候选字的相似度;Pv'为所述在前候选字的维特比概率;logPv、logP1、logP2、logR、logPv'分别为对Pv、P1、P2、R、Pv'取对数后得到的值;b、c、d分别为设置的权重值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新浪网技术(中国)有限公司,未经新浪网技术(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310058758.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种插拔型端子排接线式电子产品外壳
- 下一篇:一种PCB薄板显影引渡桥