[发明专利]辅助光学字符识别的方法和装置有效
申请号: | 201010532572.6 | 申请日: | 2010-11-01 |
公开(公告)号: | CN102467664A | 公开(公告)日: | 2012-05-23 |
发明(设计)人: | 陈江宁;甘景全;李健;谢宇;马雁 | 申请(专利权)人: | 航天信息股份有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/34 |
代理公司: | 北京科龙寰宇知识产权代理有限责任公司 11139 | 代理人: | 孙皓晨;许淑芳 |
地址: | 100097 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 辅助 光学 字符 识别 方法 装置 | ||
技术领域
本发明涉及光学字符识别(Optical Character Recognition,OCR)领域,具体而言,涉及一种辅助光学字符识别的方法和装置。
背景技术
现在的光学字符识别系统,是通过行切分及列切分,逐一将待识别字符串图像切分成单个字符单元图像块后进行识别,对于识别包括若干粘连字符、中英文混排字符等情况,需要在切分时找到图像块的特征数据再进行处理切分,或依赖于字符识别反馈机制,来提高识别率。
目前的实现方法可以参考如下:
如专利申请CN200810101591.6公开了一种利用汉字偏旁部首切分的方法,通过对文本图像进行行切分和列切分,获得若干个字符单元图像块,识别包含粘连字符的字符单元图像块,并继续切分所述包含粘连字符的字符单元图像块,识别汉字字符单元图像块区域和英文字符单元图像块区域,并在所述汉字字符单元图像块区域中识别由汉字字符偏旁部首占用的字符单元图像块,将相邻的汉字字符的偏旁部首占用的字符单元图像块合并为一个字符单元图像块。
如专利申请CN200910159089.5公开了一种利用标准字符长度切分的方法,包括:在字符串图像中,针对多个字符取得对字符串方向的字符长度进行测定而得的测定字符长度;通过临时匹配处理对测定字符长度内的字符进行临时识别;根据能够临时识别的字符的测定字符长度来确定标准字符长度;根据标准字符长度,从字符串图像中截取作为识别对象的全部字符;以及通过正式匹配处理对截取出的字符进行正式识别。
专利申请CN200810080950.4公开了一种利用分隔符切分的方法,其输入包含字符串的字符串图像,由该字符串图像识别出所述字符串,其中该字符串被分隔符划分为两个以上的字段。
专利申请CN200510090878.X公开了一种字符识别后自动纠错的方法,对初始识别之后的错误内容进行自动纠正处理。首先,识别文档中的字符,并获取文档中字符的候选字符及候选字符的相似度;而后,将候选字符相似度与预定阈值相比较确定被误识的字符;对于误识字符的候选字符,形成至少包含所述候选字符的搜索词,用所述搜索词在已知的文本数据库中搜索,从而获得搜索词的至少一种测量值;最后,用所获得的测量值来计算误识字符搜索词的权值,比较误识字符所有搜索词的权值从而确定用来纠正所述误识字符的正确字符。
现有技术中的光学字符识别方法不能保证字符切分结果的准确性,导致字符的识别率较低。
发明内容
本发明提供一种辅助光学字符识别的方法和装置,用以提高光学字符识别中字符切分结果的准确性,提高字符的识别率。
为达到上述目的,本发明提供了一种辅助光学字符识别的方法,该方法包括以下步骤:生成用于表示待打印字符串的字符类型的格式信息串;保存该格式信息串;获取该待打印字符串对应的待识别字符串图像,并获取该格式信息串;根据格式信息串对待识别字符串图像进行切分,对切分后的待识别字符串图像进行光学字符识别。
本发明还提供了一种辅助光学字符识别的装置,包括:格式信息串模块,用于生成用于表示待打印字符串的字符类型的格式信息串;保存模块,用于保存该格式信息串;获取模块,用于获取该待打印字符串对应的待识别字符串图像,并获取该格式信息串;切分模块,用于根据格式信息串对待识别字符串图像进行切分,并将切分后的待识别字符串图像输出到光学字符识别装置进行光学字符识别。
上述实施例在生成待打印字符串时生成相应的格式信息串,从而按照每个待识别字符串的字符类型准确地进行切分字符图像,有效地避免了粘连字符、中英文混排字符等情况造成的切分错误,保证了字符切分结果的正确性,提高了光学字符识别的识别率,克服了现有技术中存在的问题。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明一个实施例的辅助光学字符识别的方法流程图;
图2是根据本发明一个实施例的生成格式信息串的流程图;
图3是根据本发明一个实施例的辅助光学字符识别的装置示意图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于航天信息股份有限公司,未经航天信息股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010532572.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:车辆座椅靠背结构
- 下一篇:用于锂离子蓄电池的电极