[发明专利]用于切分具有不同字符宽度的文本行中的字符的方法和系统有效

专利信息
申请号: 201110352060.6 申请日: 2011-11-09
公开(公告)号: CN103106406A 公开(公告)日: 2013-05-15
发明(设计)人: 罗兆海;李献 申请(专利权)人: 佳能株式会社
主分类号: G06K9/34 分类号: G06K9/34
代理公司: 中国国际贸易促进委员会专利商标事务所 11038 代理人: 付建军
地址: 日本*** 国省代码: 日本;JP
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用于 切分 具有 不同 字符 宽度 文本 中的 方法 系统
【说明书】:

技术领域

本发明涉及光学字符识别,更具体地说,涉及一种用于切分具有不同字符宽度的文本行中的字符的方法和系统。

背景技术

在光学字符识别(Optical Character Recognition,OCR)系统中,通常,如图3中的流程图所示执行OCR处理。首先,输入通过扫描仪或照相机或者通过其它装置获取的文档图像。该包括多个文本行的文档图像然后被分割成文本行图像。对于每个文本行图像,对该文本行中的字符执行字符切分。之后,基于字符切分的结果,执行字符识别以产生识别结果。

通常,在字符切分步骤中,首先基于黑像素投影把文本行图像切分成字符。根据字符宽度、字符高度和行高度等的统计信息,计算平均字符宽度(average character width,ACW)。可选地,此时,可以执行根据连通域方法的字符切分。当切出字符的宽度大于平均字符宽度时,将根据平均字符宽度或者根据如在日本专利申请公报JP05-128307中公开的边界跟踪方法对其进行强制切分(force-split)。然后,通过根据平均字符宽度创建不同的切分模式(路径),把字符的片段(fragments)进行组合。最后,识别所有模式下的字符,并将不同切分模式下的最佳切分结果选择作为字符切分的结果。

在该流程中,平均字符宽度是判断一个字符区域是包括一些实际字符还是只包括一个字符的部分或者多个字符的部分的非常重要的标准。在切分字符或者创建合理的切分模式的过程中,平均字符宽度也是重要的判断条件。

然而,本发明的发明人发现,当文档图像中的文本行由具有彼此不同的宽度的字符构成时,看起来有时候一个均一的平均字符宽度无法适合于该文本行中的所有字符。如果平均字符宽度适合于“宽”字符,则一些连通的字符可能不会被正确切分,或者一些字符会被错误地组合为一个字符。“宽”的平均字符宽度还会导致更多的可能的切分模式,这涉及了更多的计算时间或复杂性。如果平均字符宽度仅仅适合于“窄”字符,则一些“宽”字符将被错误地切分成片段。这两种情况都将降低OCR精度。

图4A和图4B中例示了说明现有技术中存在的缺陷的一些例子。

在图4A中,文本行同时包括一些全宽字符和一些半宽字符(例如,字母、数字或者全宽字符的左或右偏旁)。当使用均一的平均字符宽度来切分字符时,在图4A中示出了字符切分的结果。在该现有技术的例子中,发生了一些字符切分错误,例如,日本汉字“特開”被错误地切分为片段。

在图4B中,示出了使用现有技术的字符切分结果。即使对于相同的字体和字号,以日语作为例子,一些假名的宽度也不同于其它假名和/或日本汉字的宽度。例如,具有不同宽度的假名“れる”(在图4B的第二行中)被错误地切分。

另外,由于在文本行中存在一些连通的字符,所以难以仅仅基于平均字符宽度找到最佳切分结果。例如,图4B中的假名“バイ”(在第一行中)和“た。”(在第三行中)是连通字符的例子,从而根据现有技术被错误地切分。

因此,需要一种能够切分包括全宽字符和半宽字符或者包括具有不同字符宽度的假名和日本汉字的文本行中的字符从而提高OCR精度的技术。还需要一种能够切分具有连通域的字符的技术。

发明内容

考虑到前述的现有技术中存在的多个技术问题,提供了一种用于切分具有不同字符宽度的文本行中的字符的新的方法和系统。

根据本发明的一个方面,提供了一种用于切分具有不同字符宽度的文本行中的字符的方法,包括以下步骤:

第一切分步骤,根据基于投影的方法将所述文本行切分为第一字符集合;

计算步骤,基于所述第一字符集合计算平均字符宽度;

强制切分步骤,基于计算的平均字符宽度,对所述第一字符集合中的宽字符进行强制切分,以获得第二字符集合;

设置步骤,针对所述第二字符集合中的不同字符设置不同的平均字符宽度;以及

组合步骤,通过根据所设置的不同的平均字符宽度创建不同的切分模式并且选择最佳切分模式,对所述第二字符集合中的字符进行组合。

根据本发明的另一方面,提供了一种用于切分具有不同字符宽度的文本行中的字符的系统,包括:

第一切分单元,被配置为根据基于投影的方法将所述文本行切分为第一字符集合;

计算单元,被配置为基于所述第一字符集合计算平均字符宽度;

强制切分单元,被配置为基于计算的平均字符宽度,对所述第一字符集合中的宽字符进行强制切分,以获得第二字符集合;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于佳能株式会社,未经佳能株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201110352060.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top