[发明专利]通过用字符的形状特征来比较字符而检测文档变化的方法在审
申请号: | 201210075911.1 | 申请日: | 2012-03-21 |
公开(公告)号: | CN102722729A | 公开(公告)日: | 2012-10-10 |
发明(设计)人: | 俞颂阳;明伟 | 申请(专利权)人: | 柯尼卡美能达美国研究所有限公司 |
主分类号: | G06K9/64 | 分类号: | G06K9/64;G06T7/00 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 陈炜;李德山 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 公开了一种通过用字符的形状特征来比较字符而检测文档变化的方法。文档变化检测方法通过在不真正地识别字符的情况下比较字符形状特征而将目标图像和原始图像进行比较。针对两个图像产生字符的边框,每个边框包围一个字符的一个或多个连接的像素组。原始图像和目标图像中的边框被匹配成对。如果一个图像中的边框在另一图像中没有匹配边框,则检测到文本的添加和删除。对每对边框进行处理,以比较这些边框的形状特征。形状特征包括字符的欧拉数、边框的高宽比、边框的像素密度以及两个字符之间的豪斯多夫距离。基于形状特征比较来确定两个字符是相同的或不同的。 | ||
搜索关键词: | 通过 用字 形状 特征 比较 字符 检测 文档 变化 方法 | ||
【主权项】:
一种在数据处理设备中实现的用于检测原始图像和目标图像之间的变化的方法,所述原始图像和所述目标图像是二进制位图图像,所述方法包括以下步骤:(a)在所述原始图像和所述目标图像中定义多个边框,每个边框包围一个字符的一个或多个连接的像素组;(b)在所述原始图像和所述目标图像中识别多对匹配边框,其中,每对匹配边框在所述原始图像和所述目标图像中分别具有基本上相同的位置;(c)针对每对匹配边框:(c1)计算多个形状特征,所述多个形状特征包括:(1)该对边框所包围的一对字符中的每一个字符的欧拉数,以及(2)该对字符之间的豪斯多夫距离;以及(c2)通过评估(1)该对字符的欧拉数是否相等以及(2)该对字符之间的豪斯多夫距离是否小于第一预定阈值,确定该对边框所包围的该对字符是相同字符还是不同字符。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于柯尼卡美能达美国研究所有限公司,未经柯尼卡美能达美国研究所有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210075911.1/,转载请声明来源钻瓜专利网。