[发明专利]用于切分具有不同字符宽度的文本行中的字符的方法和系统有效
申请号: | 201110352060.6 | 申请日: | 2011-11-09 |
公开(公告)号: | CN103106406A | 公开(公告)日: | 2013-05-15 |
发明(设计)人: | 罗兆海;李献 | 申请(专利权)人: | 佳能株式会社 |
主分类号: | G06K9/34 | 分类号: | G06K9/34 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 11038 | 代理人: | 付建军 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 切分 具有 不同 字符 宽度 文本 中的 方法 系统 | ||
1.一种用于切分具有不同字符宽度的文本行中的字符的方法,包括以下步骤:
第一切分步骤,根据基于投影的方法将所述文本行切分为第一字符集合;
计算步骤,基于所述第一字符集合计算平均字符宽度;
强制切分步骤,基于计算的平均字符宽度,对所述第一字符集合中的宽字符进行强制切分,以获得第二字符集合;
设置步骤,针对所述第二字符集合中的不同字符设置不同的平均字符宽度;以及
组合步骤,通过根据所设置的不同的平均字符宽度创建不同的切分模式并且选择最佳切分模式,对所述第二字符集合中的字符进行组合。
2.根据权利要求1所述的方法,其中,所述强制切分步骤包括以下步骤:
对于宽度大于阈值的每个宽字符,产生多个由所述宽字符或所述宽字符和相邻字符的组合构成的切分组,并基于所述平均字符宽度在每个切分组中搜索可能的切分点并获得每个切分点的分数;
基于切分组中的每个切分点的分数计算每个切分组的分数;以及
从所有组中选择具有最小分数的切分组作为强制切分结果。
3.根据权利要求2所述的方法,其中,所述强制切分步骤还包括以下步骤:
如果所选择的切分组的分数大于阈值,则根据基于投影的方法在当前宽字符的中间添加新切分点。
4.根据权利要求2或3所述的方法,其中,在每个切分组中搜索可能的切分点并获得每个切分点的分数包括以下步骤:
根据所述平均字符宽度在切分组中设置一个或多个搜索位置;
对于每个搜索位置,根据所述平均字符宽度的倍数与该搜索位置所处于的切分组的宽度之间的差,动态地判定以该搜索位置为中心的切分点搜索范围;
在每个搜索范围中,在所述文本行为水平的情况下针对每个像素列计算切分分数,并且选择具有最小切分分数的像素列作为该搜索范围中的切分点,并且在所述文本行为垂直的情况下针对每个像素行计算切分分数,并且选择具有最小切分分数的像素行作为该搜索范围中的切分点;
对于每个搜索范围,选择具有最小切分分数的像素列或像素行作为其切分点;以及
对于每个切分组,获得其切分点以及这些切分点的分数。
5.根据权利要求1所述的方法,其中,所述设置步骤包括以下步骤:
计算所述第一字符集合中的字符之间的平均间隔;
根据所述第一字符集合和所述第二字符集合中的字符的数目和所述平均间隔,判断所述文本行是否包括大量的具有不同宽度的字符;
如果判断结果是肯定的,则针对被强制切分所切分的宽字符设置另一平均字符宽度。
6.根据权利要求1所述的方法,其中,所述设置步骤包括以下步骤:
搜索仅被强制切分所切分的相邻字符的目标组,所述目标组中的最后一个字符与其下一个字符之间的间隔大于一阈值;
如果找到了所述目标组,则计算该目标组的宽高比;以及
如果该目标组的宽高比小于一阈值,则针对该目标组中的第一个字符设置另一平均字符宽度。
7.根据权利要求5所述的方法,其中,针对被强制切分所切分的宽字符设置另一平均字符宽度包括以下步骤:
搜索高度与当前文本行相似的相邻文本行,作为相似行;
如果找到相似行,则使用该相似行的平均字符宽度来设置所述另一平均字符宽度;以及
如果没有找到相似行,则把在所述计算步骤中计算的平均字符宽度直接乘以一参数,以设置所述另一平均字符宽度。
8.根据权利要求1所述的方法,其中,所述切分模式指示所述第二字符集合中的相邻字符的组合。
9.根据权利要求1或2所述的方法,其中,在所述计算步骤中,按下述方式之一计算所述平均字符宽度:
计算所述第一字符集合的平均字符宽度;
计算从所述第一字符集合中选择的宽高比在预定范围内的字符的平均字符宽度;
根据前一文本行或下一文本行的平均字符宽度计算所述平均字符宽度;或者
通过将所述文本行的高度乘以一个值来计算所述平均字符宽度。
10.根据权利要求1-9中任一项所述的方法,还包括第二切分步骤,该第二切分步骤使用连通域方法对所述第一字符集合中的宽字符进行切分以获得第三字符集合,并且在此情况下,在所述强制切分步骤中代替所述第一字符集合对所述第三字符集合进行处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于佳能株式会社,未经佳能株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110352060.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:电力系统负荷恢复辅助决策系统及其决策生成方法
- 下一篇:混凝土骨料预湿设备