[发明专利]一种脱机手写体文本的字符切分方法在审
申请号: | 201810126424.0 | 申请日: | 2018-02-08 |
公开(公告)号: | CN108460384A | 公开(公告)日: | 2018-08-28 |
发明(设计)人: | 王寅同 | 申请(专利权)人: | 南京晓庄学院 |
主分类号: | G06K9/34 | 分类号: | G06K9/34 |
代理公司: | 南京苏创专利代理事务所(普通合伙) 32273 | 代理人: | 何薇 |
地址: | 211171 江苏省南京市江宁*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种脱机手写体文本的字符切分方法,包括字符高度估计、字符的粗略切分和字符的精细切分;所述字符高度估计运用连通域分析法进行字符高度估计,文字高度h作为一个自适应变量,它与文本图像的字符大小直接关联;该脱机手写体文本的行结构分析方法,即在“一种脱机手写体文本识别的字符重心定位方法”和“一种脱机手写体文本识别的行结构分析方法”两个专利的基础上,结合字符重心和行结构实现有效的字符切分以实现由文本图像到单个字符的转换,从而大大降低了粘连字符会导致错误的字符切分,得到错误的识别结果的问题,同时也提高了字符识别系统的识别精度;实用性强,易于推广使用。 | ||
搜索关键词: | 手写体文本 脱机 行结构 文本图像 重心 字符识别系统 连通域分析 单个字符 粘连字符 自适应 分析 精细 关联 转换 | ||
【主权项】:
1.一种脱机手写体文本的字符切分方法,其特征在于,包括字符高度估计、字符的粗略切分和字符的精细切分;所述字符高度估计运用连通域分析法进行字符高度估计,文字高度h作为一个自适应变量,它与文本图像的字符大小直接关联;首先明确相邻像素点概念,即每个像素点含有相邻像素点的数目为八(除边缘位置),它们分别处于该像素点的左、右、上、下、左上、右上、左下和右下八个位置;接着,笔迹像素点的连通域概念,即每个连通域是由若干个笔迹(有效)像素点组成的序列,该连通域的高度是最上方笔迹像素点位置与最下方笔迹像素点位置之差;所述字符的粗略切分基于像素空白区域完成单字符切分、粘连多字符切分以及标记;所述字符的精细切分对于标记粘连多字符的切分需要找到字符与字符之间的真正切分点,这一切分点能准确地将他们切分;为此,粘连多字符大体上分为重叠非粘连、粘连两类;前者是指某一字符与其他字符存在垂直映射上的粘连,但是该字符笔迹像素点仍然可以通过连通域分析法得到其所有的连通域而与其他字符笔迹像素点不发生连通关系;后者是指某一字符与其他字符存在连通关系,换言之,该字符的笔迹像素点与其他字符的笔迹像素点存在重合,重合点的数量等于或大于1。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京晓庄学院,未经南京晓庄学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810126424.0/,转载请声明来源钻瓜专利网。