[发明专利]字符串的识别方法和系统有效
申请号: | 201610091505.2 | 申请日: | 2016-02-18 |
公开(公告)号: | CN107092902B | 公开(公告)日: | 2021-04-06 |
发明(设计)人: | 王淞;范伟;孙俊 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/62 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 康建峰;李春晖 |
地址: | 日本神*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 字符串 识别 方法 系统 | ||
本公开内容提供一种字符串的识别方法和系统。根据本公开内容的一种实施方式的识别方法包括:将字符串图像过切分为多个连通区域;使用二类分类器对每个连通区域与邻近的预定数量的连通区域的组合进行分类,给出每个组合为字符的概率;对多个连通区域的各种组合形成的所有路径进行路径搜索,选择其中所有组合均为字符的概率最高的路径;以及使用全类分类器对所选出的路径中的组合进行字符识别。与现有技术相比,本公开内容提出的方法和系统对手写汉字字符串的识别率更高。
技术领域
本公开内容涉及字符串识别领域,具体地,涉及字符串的识别方法和系统。
背景技术
与英文字符相比,汉字种类繁多且结构复杂。在传统的字符串的识别方法中,第一步是将字符串图像进行过切分,然后,利用分类器、规则等对过切分后的图像进行字符识别。然而,传统方法对汉字字符串的识别率并不能满足需求。
因此,需要提供一种识别率更高的字符串识别方法和系统。
发明内容
在下文中给出了关于本公开内容的简要概述,以便提供关于本公开内容的某些方面的基本理解。应当理解,这个概述并不是关于本公开内容的穷举性概述。它并不是意图确定本公开内容的关键或重要部分,也不是意图限定本公开内容的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前序。
为解决上述问题,本公开内容提供一种字符串的识别方法和系统。
根据本公开内容的一个方面,提供一种字符串的识别方法,所述识别方法包括:将字符串图像过切分为多个连通区域;使用二类分类器对每个连通区域与邻近的预定数量的连通区域的组合进行分类,给出每个组合为字符的概率;对多个连通区域的各种组合形成的所有路径进行路径搜索,选择其中所有组合均为字符的概率最高的路径;以及使用全类分类器对所选出的路径中的组合进行字符识别。
根据本公开内容的另一个方面,提供一种字符串的识别系统,所述识别系统包括:过切分装置,用于将字符串图像过切分为多个连通区域;二类分类器,用于对每个连通区域与邻近的预定数量的连通区域的组合进行分类,给出每个组合为字符的概率;路径搜索装置,用于对多个连通区域的各种组合形成的所有路径进行路径搜索,选择其中所有组合均为字符的概率最高的路径;以及全类分类器,用于对所选出的路径中的组合进行字符识别。
与现有技术相比,本公开内容提出的方法和系统对字符串,尤其是手写汉字字符串的识别率更高。
通过以下结合附图对本公开内容的优选实施例的详细说明,本公开内容的上述以及其他优点将更加明显。
附图说明
为了进一步阐述本公开内容的以上和其他优点和特征,下面结合附图对本公开内容的具体实施方式作进一步详细的说明。所述附图连同下面的详细说明一起包含在本说明书中并且形成本说明书的一部分。具有相同的功能和结构的元件用相同的参考标号表示。应当理解,这些附图仅描述本公开内容的典型示例,而不应看作是对本公开内容的范围的限定。在附图中:
图1是根据本公开内容的一实施方式的字符串的识别方法的流程图;
图2是根据本公开内容的一实施方式的字符串的识别方法的示意图;
图3是在图2所示的方法中的由多个连通区域的组合形成的多种路径的示图;
图4是根据本公开内容的另一实施方式的字符串的识别方法的流程图;
图5是根据本公开内容的一实施方式的字符串的识别系统的示图;
图6是根据本公开内容的另一实施方式的字符串的识别系统的示图;
图7是根据本公开内容的变化实施方式的字符串的识别系统的示图;
图8是根据本公开内容的一实施方式的训练用于字符分类的二类分类器的方法的流程图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610091505.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种铸件自动化去毛刺机构
- 下一篇:一种能够模式切换的管件自动截断装置