[发明专利]识别图像块中文字的方向的方法和装置有效
申请号: | 201110209832.0 | 申请日: | 2011-07-20 |
公开(公告)号: | CN102890783A | 公开(公告)日: | 2013-01-23 |
发明(设计)人: | 孙俊;直井聪 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/32 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 杜诚;陈炜 |
地址: | 日本神*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 识别 图像 文字 方向 方法 装置 | ||
1.一种识别图像块中文字的方向的方法,包括:
分别以不同的方向作为假设文字方向对所述图像块进行光学字符识别处理,以得到在各个所述假设文字方向上的子图像块、子图像块对应的识别字符及其正确性度量;
判断图像块中文字所属的语言组;
调整各个所述假设文字方向上不属于所判断的语言组的识别字符所对应的子图像块对应的正确性度量;
基于调整后的正确性度量计算各个所述假设文字方向上的累积正确性度量;以及
根据所述累积正确性度量识别图像块中文字的方向。
2.根据权利要求1所述的方法,其中
所述正确性度量包括置信度和识别距离;
所述调整各个所述假设文字方向上不属于所判断的语言组的识别字符所对应的子图像块对应的正确性度量包括减小该子图像块对应的置信度或增大该子图像块对应的识别距离。
3.根据权利要求1所述的方法,其中
所述正确性度量包括置信度和识别距离;
所述调整各个所述假设文字方向上不属于所判断的语言组的识别字符所对应的子图像块对应的正确性度量包括将该子图像块对应的置信度或识别距离调整为该子图像块所对应的在该假设文字方向上属于所判断的语言组的所有候选字符所对应的置信度中的最大置信度或所对应的识别距离中的最小识别距离;并且当该子图像块所对应的在该假设文字方向上的所有候选字符均不属于所判断的语言组时,将该子图像块所对应的在该假设文字方向上的所有候选字符所对应的置信度中的最小置信度或所对应的识别距离中的最大识别距离作为该子图像块对应的置信度或识别距离。
4.根据权利要求1所述的方法,其中所述判断图像块中文字所属的语言组包括:
分别在各个假设文字方向上,计算属于各个语言组的识别字符所对应的子图像块个数占该假设文字方向上的所有子图像块个数的比例;
当属于某个语言组的识别字符所对应的子图像块个数占该假设文字方向上的所有子图像块个数的比例大于第一阈值时,将该语言组判断为图像块中文字所属的语言组。
5.根据权利要求1所述的方法,其中所述判断图像块中文字所属的语言组包括:
分别在各个假设文字方向上,计算属于各个语言组的识别字符所对应的子图像块个数占该假设文字方向上的所有子图像块个数的比例;
当属于某个语言组的识别字符所对应的子图像块个数占该假设文字方向上的所有子图像块个数的比例大于第一阈值且属于该语言组的核心字符集的识别字符所对应的子图像块个数占该假设文字方向上的所有子图像块个数的比例大于第二阈值时,将该语言组判断为图像块中文字所属的语言组。
6.根据权利要求4所述的方法,其中所述语言组包括拉丁语言组;
所述拉丁语言组包括拉丁字母、阿拉伯数字和非文字符号;
所述第一阈值的取值范围为(0.65,0.85)。
7.根据权利要求5所述的方法,其中所述语言组包括韩文语言组、中文/日文语言组;
所述韩文语言组包括韩文字母、拉丁字母、阿拉伯数字和非文字符号,所述韩文语言组的核心字符集包括韩文字母;
所述中文/日文语言组包括简体汉字、繁体汉字、日文汉字、日文平假名、日文片假名、拉丁字母、阿拉伯数字和非文字符号,所述中文/日文语言组的核心字符集包括简体汉字、繁体汉字、日文汉字、日文平假名、日文片假名;
所述第一阈值的取值范围为(0.65,0.85),所述第二阈值的取值范围为(0.45,0.65)。
8.一种识别图像块中文字的方向的装置,包括:
光学字符识别处理单元,配置为分别以不同的方向作为假设文字方向对所述图像块进行光学字符识别处理,以得到在各个所述假设文字方向上的子图像块、子图像块对应的识别字符及其正确性度量;
语言组判断单元,配置为判断图像块中文字所属的语言组;
子图像块调整单元,配置为调整各个所述假设文字方向上不属于所判断的语言组的识别字符所对应的子图像块对应的正确性度量;
累积正确性度量计算单元,配置为基于调整后的正确性度量计算各个所述假设文字方向上的累积正确性度量;以及
文字方向识别单元,配置为根据所述累积正确性度量识别图像块中文字的方向。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110209832.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种铝硅基锂离子电池负极材料的制备方法
- 下一篇:一种太阳能热水器
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序