[发明专利]字符串的识别方法和系统有效
申请号: | 201610091505.2 | 申请日: | 2016-02-18 |
公开(公告)号: | CN107092902B | 公开(公告)日: | 2021-04-06 |
发明(设计)人: | 王淞;范伟;孙俊 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/62 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 康建峰;李春晖 |
地址: | 日本神*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 字符串 识别 方法 系统 | ||
1.一种字符串的识别方法,所述识别方法包括:
将字符串图像过切分为多个连通区域;
使用二类分类器对每个连通区域与邻近的预定数量的连通区域的组合进行分类,给出每个组合为字符的概率;
对多个连通区域的各种组合形成的所有路径进行路径搜索,选择其中所有组合均为字符的概率最高的路径;以及
使用全类分类器对所选出的路径中的组合进行字符识别,
其中,利用字符串中的字符间空白和字符笔画特征来将所述字符串过切分为所述多个连通区域,并且一个路径中所有组合均为字符的概率为该路径中的各个组合为字符的概率的平均概率。
2.如权利要求1所述的识别方法,其中,所述平均概率通过如下公式计算:
其中,表示所述平均概率,Pi表示每个组合为字符的概率,Mi表示针对每个组合的预设加权参数,N表示组合的数量。
3.如权利要求2所述的识别方法,其中,Mi包括以下内容中的任一项:
每个组合的长度;
每个组合中的黑色像素的个数;以及
固定常数。
4.如权利要求1所述的识别方法,其中,每个组合包括不多于四个连通区域。
5.如权利要求1-4中的任一项所述的识别方法,其中,所述二类分类器包括二分类SVM分类器或二分类CNN分类器,并且所述全类分类器包括全分类SVM分类器或全分类CNN分类器。
6.如权利要求1-4中的任一项所述的识别方法,其中,所述路径搜索包括动态规划或束搜索。
7.如权利要求1-4中的任一项所述的识别方法,其中,所述识别方法还包括利用语言模型在路径搜索的同时进行优化或者利用语言模型对识别的结果进行优化。
8.如权利要求7所述的识别方法,其中,所述语言模型包括一元语言模型或二元语言模型。
9.一种字符串的识别系统,所述识别系统包括:
过切分装置,用于将字符串图像过切分为多个连通区域;
二类分类器,用于对每个连通区域与邻近的预定数量的连通区域的组合进行分类,给出每个组合为字符的概率;
路径搜索装置,用于对多个连通区域的各种组合形成的所有路径进行路径搜索,选择其中所有组合均为字符的概率最高的路径;以及
全类分类器,用于对所选出的路径中的组合进行字符识别,
其中,利用字符串中的字符间空白和字符笔画特征来将所述字符串过切分为所述多个连通区域,并且一个路径中所有组合均为字符的概率为该路径中的各个组合为字符的概率的平均概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610091505.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种铸件自动化去毛刺机构
- 下一篇:一种能够模式切换的管件自动截断装置