[发明专利]一种脱机手写体文本识别的字符重心定位方法有效

专利信息
申请号: 201710606575.1 申请日: 2017-07-24
公开(公告)号: CN107437084B 公开(公告)日: 2020-12-08
发明(设计)人: 王寅同;郑豪;刘维周;王小正;王晓波 申请(专利权)人: 南京晓庄学院
主分类号: G06K9/20 分类号: G06K9/20;G06K9/32
代理公司: 常州佰业腾飞专利代理事务所(普通合伙) 32231 代理人: 滕诣迪
地址: 211171 江苏*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 脱机 手写体 文本 识别 字符 重心 定位 方法
【说明书】:

发明公开了一种脱机手写体文本识别的字符重心定位方法,属于文字识别技术领域,包括如下步骤:对待识别的脱机手写体文本图像进行预处理;运用连通域分析法进行字符高度估计;运用信息量传播方式构造脱机手写体文本的信息量矩阵;运用信息量矩阵的局部峰值分析以完成字符重心定位。本发明既可以准确地得到单个字符在文本图像中的位置,又可以由字符重心来区分不同字符;对于倾斜文本行、不规则文本片段以及粘连字符的脱机手写体文本,字符重心定位方法能够快速准确地区分不同字符,进而为后续单字符或多字符识别以及非显著切分式脱机手写体文本识别提供有力的支持。

技术领域

本发明涉及一种字符重心定位方法,特别涉及一种脱机手写体文本识别的字符重心定位方法,属于文字识别技术领域。

背景技术

脱机手写体文本识别是目前文字识别领域的最困难问题之一,与联机手写识别相比,缺少必要的字符位置和轨迹信息,其中,后者可以根据字符位置和书写经验来近似获得,因此字符位置的判定对脱机手写体文本识别效率的影响甚大,由于手写体字符书写随意性导致相邻字符之间的位置关系复杂,造成脱机手写体文本中的字符位置定位要比印刷体字符定位难很多,尤其是行倾斜、不规则行片段以及粘连字符的文本中的字符位置判定。

目前,对脱机手写体文本的字符位置判定主要是由字符切分来实现,常用的切分技术有基于统计的切分方法、基于字型结构切分和基于识别的汉字统计切分方法等,其中,基于统计的切分方法是根据字符的总体统计分布特征,确定字符之间的界线,判别时以字符的平均宽度作辅助判别,统计分布特征的代表性和稳定性对切分的正确性及收敛性起很重要作用,如投影法和连通域法,该方法适合汉字字符间距较宽,无粘连字符的切分,算法效率高,该方法无法用于粘连或交叉字符串的切分,基于笔划结构切分是一种很有潜力的切分方法,可以从另一个角度解决笔画粘连问题。

常见的笔画分割方法有笔画连接盒的动态算法和黑游程跟踪提取笔画算法两种,有学者提出采用先提取笔画再合并的方法,但该方法对汉字切分的好坏很大程度上依赖于笔画提取的好坏,如何有效地提取笔划信息仍有待进一步研究,此外,笔画先提取后合并使算法过于复杂,即该方法的主要应用障碍在于准确提取笔划难度较大,基于识别的字符统计切分方法是将字符切分和识别视为整体,切分后的字符送入相应分类器并获得一个分类结果,再由分类结果反作用于字符切分,从而获得更有的字符切分效果,这一过程不断地迭代,直至满足某一终止条件,该方法结合了前两类方法的优点,能获得更好的字符切分效果,但对于有限的时间和空间资源下获得字符切分结果的情况却是不适用,时间复杂度和空间复杂度远超过前两类方法。

一般意义上,重心是在重力场中物体处于任何方位时所有各组成质点的重力的合力都通过的那一点,在脱机手写体文本识别中,字符重心可以理解为字符中所有像素点合力作用下的点,字形对称的字符重心是其所在区域的中心位置。反之,字形不对称的字符重心将偏向于像素点密集的一侧,与真实物体重心性质不同,真实物体的重心不一定在物体上,如一根弯曲的竹子重心往往偏向于内弧侧,而单个字符重心则一定处于字符所占区域,该区域是由字符的最左、最右、最上和最下四个极值位置的像素点共同确定的。因此,脱机手写体文本识别的字符重心也就可以定位该字符在文本图像的位置。

发明内容

本发明的主要目的是为了提供一种脱机手写体文本识别的字符重心定位方法,引入汉字笔迹像素点的信息量传播方式实现信息量聚集,以形成字符重心的局部峰值,而相邻字符之间产生信息量低谷,进而准确地完成字符重心定位。

本发明的目的可以通过采用如下技术方案达到:

一种脱机手写体文本识别的字符重心定位方法,包括如下步骤:

步骤1:对待识别的脱机手写体文本图像进行预处理,预处理包括对图像进行灰度化、背景色移除和图像二值化;

步骤2:运用连通域分析法进行字符高度估计,多个离散位置的像素点进行连通域分析以获得对应文字或部首的连通区域,避免单个像素点所产生的连通区域导致高度估值偏差;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京晓庄学院,未经南京晓庄学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710606575.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top