[发明专利]识别图像中的字符串的方法和装置在审
申请号: | 201210062124.3 | 申请日: | 2012-03-09 |
公开(公告)号: | CN103310209A | 公开(公告)日: | 2013-09-18 |
发明(设计)人: | 潘屹峰;陈思源;孙俊;何源 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/46 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 朱胜;王娜丽 |
地址: | 日本神*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 识别 图像 中的 字符串 方法 装置 | ||
技术领域
本发明涉及字符识别领域,具体涉及识别图像中的字符串的方法和装置。
背景技术
随着数字图像采集设备(如手机、照相机等)的大范围普及,基于文本信息的图像检索系统得到了广泛的关注。其中,自然场景图像中的文本识别,作为整个系统的主要组成部分,对系统的性能具有重要影响。然而,受到文本大小、字体和图像质量退化等因素的影响,达到高精度的识别结果仍具有极大的挑战性。同时,考虑到自然场景图像通常包含多种语言类别,这就更加大了准确识别的难度。
因此,期望提出一种能够解决上述问题的技术。
发明内容
在下文中给出关于本发明的简要概述,以便提供关于本发明的某些方面的基本理解。应当理解,这个概述并不是关于本发明的穷举性概述。它并不是意图确定本发明的关键或重要部分,也不是意图限定本发明的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前序。
本发明的一个主要目的在于,提供识别图像中的字符串的方法和装置。
根据本发明的一个方面,提供了一种识别图像中的字符串的方法,包括:提取图像中的字符串区域;对字符串区域进行过分割;以及基于语言类别上下文特征和字符占位宽度上下文特征中的至少一个特征利用路径搜索策略来识别字符串区域中包含的字符串。
根据本发明的另一个方面,提供了一种识别图像中的字符串的装置,包括:提取单元,被配置用于提取图像中的字符串区域;分割单元,被配置用于对字符串区域进行过分割;以及识别单元,被配置用于基于语言类别上下文特征和字符占位宽度上下文特征中的至少一个特征利用路径搜索策略来识别字符串区域中包含的字符串。
另外,本发明的实施例还提供了用于实现上述方法的计算机程序。
此外,本发明的实施例还提供了至少计算机可读介质形式的计算机程序产品,其上记录有用于实现上述方法的计算机程序代码。
通过以下结合附图对本发明的最佳实施例的详细说明,本发明的这些以及其他优点将更加明显。
附图说明
参照下面结合附图对本发明实施例的说明,会更加容易地理解本发明的以上和其它目的、特点和优点。附图中的部件只是为了示出本发明的原理。在附图中,相同的或类似的技术特征或部件将采用相同或类似的附图标记来表示。
图1是示出根据本发明的实施例的识别图像中的字符串的方法的流程图;
图2A是示出根据本发明的示例的字符串区域的示意图;
图2B是示出根据本发明的示例的经预处理的字符串区域的示意图;
图2C是示出根据本发明的示例的过分割后的字符串区域的图像的示意图;
图3是示出根据本发明的示例的最优路径搜索的示意图;
图4是示出根据本发明的实施例的根据相邻字符来确定语言类别上下文特征的流程图;
图5是示出根据本发明的另一实施例的根据相邻字符来确定语言类别上下文特征的流程图;
图6A是示出根据本发明的示例的字符串区域的示意图;
图6B是示出根据本发明的示例的未引入语言类别上下文特征时得到的识别结果的示意图;
图6C是示出根据本发明的示例的引入语言类别上下文特征时得到的识别结果的示意图;
图7是示出根据本发明的实施例的基于占位宽度与加权平均占位宽度之间的差异来确定占位宽度上下文特征的流程图;
图8A是示出根据本发明的示例的字符串区域的示意图;
图8B是示出根据本发明的示例的未引入占位宽度上下文特征时的字符串识别结果的示意图;
图8C是示出根据本发明的示例的引入占位宽度上下文特征时的字符串识别结果的示意图;
图9是示出根据本发明的示例的识别图像中的字符串的流程图;
图10是示出根据本发明的实施例的识别图像中的字符串的装置的框图;
图11是示出根据本发明的另一实施例的识别图像中的字符串的装置的框图;
图12是示出根据本发明的又一实施例的识别图像中的字符串的装置的框图;以及
图13是示出可以用于实施本发明的识别图像中的字符串的方法和装置的计算设备的示意性结构图。
具体实施方式
下面参照附图来说明本发明的实施例。在本发明的一个附图或一种实施方式中描述的元素和特征可以与一个或更多个其它附图或实施方式中示出的元素和特征相结合。应当注意,为了清楚的目的,附图和说明中省略了与本发明无关的、本领域普通技术人员已知的部件和处理的表示和描述。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210062124.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:图像处理方法和设备
- 下一篇:一种设备防摔的方法和设备
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序