[发明专利]脱机手写汉字的笔画还原方法及装置有效
申请号: | 201410291358.4 | 申请日: | 2014-06-25 |
公开(公告)号: | CN104063723B | 公开(公告)日: | 2017-06-06 |
发明(设计)人: | 荀恩东;吕晓晨;孙燕南 | 申请(专利权)人: | 北京语言大学 |
主分类号: | G06K9/68 | 分类号: | G06K9/68 |
代理公司: | 北京三友知识产权代理有限公司11127 | 代理人: | 王天尧 |
地址: | 100083*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 脱机 手写 汉字 笔画 还原 方法 装置 | ||
1.一种脱机手写汉字的笔画还原方法,其特征在于,包括:
获取脱机手写汉字的各个笔段和预设模板汉字的各个笔段,其中,所述笔段是将汉字分割成的线段;
将脱机手写汉字的各个笔段与预设模板汉字的各个笔段的有序序列进行匹配,生成脱机手写汉字的各个笔段的笔段序列,其中,笔段序列以书写脱机手写汉字的笔段时序为顺序,预设模板汉字的各个笔段的有序序列以书写所述预设模板汉字时预设模板汉字的各个笔段的时序为顺序;
根据生成的笔段序列进行所述脱机手写汉字的笔画还原;
在将所述脱机手写汉字的各个笔段与预设模板汉字的各个笔段的有序序列进行匹配之前,还包括:
建立预设模板汉字库,所述预设模板汉字库存储预设模板汉字的结构、笔画和笔段,其中,存储预设模板汉字的结构、笔画和笔段的顺序分别为书写预设模板汉字时结构、笔画和笔段的时序;
将所述脱机手写汉字的各个笔段与预设模板汉字的各个笔段的有序序列进行匹配,生成所述笔段序列,包括:
从所述预设模板汉字库中确定出与所述脱机手写汉字相对应的预设模板汉字;
对所述脱机手写汉字的各个笔段任意合并和排序,生成多个笔段序列;
计算多个笔段序列中每个笔段序列与确定出的预设模板汉字的各个笔段的有序序列之间的相似度;
确定多个笔段序列中相似度最高的序列为所述笔段序列;
计算多个笔段序列中每个笔段序列与确定出的预设模板汉字的各个笔段的有序序列之间的相似度,包括:
针对有序序列中的每个笔段,计算每个笔段序列中每个笔段与该笔段的相似度,并将每个笔段序列中相似度小于预设阈值的笔段加入该笔段的笔段候选集合,该笔段的笔段候选集合中包括所述每个笔段序列中的笔段或所述每个笔段序列中笔段的组合;
根据有序序列中各个笔段的顺序,将每个笔段的笔段候选集合中的笔段或笔段组合组成笔段序列,并通过估算函数计算组成的笔段序列的估算函数值,其中,估算函数值的大小与相似度成比例。
2.如权利要求1所述脱机手写汉字的笔画还原方法,其特征在于,脱机手写汉字的各个笔段是以笔画的起始点、终点、拐点以及笔画间的交叉点为分割点,将汉字分割成的线段;和/或,
预设模板汉字的各个笔段是以笔画的起始点、终点以及拐点为分割点,将预设模板汉字分割成的线段。
3.如权利要求1所述脱机手写汉字的笔画还原方法,其特征在于,获取脱机手写汉字的各个笔段,包括:
获取所述脱机手写汉字的静态图像;
从所述静态图像中获取所述脱机手写汉字的各个笔段。
4.如权利要求3所述脱机手写汉字的笔画还原方法,其特征在于,从所述静态图像中获取所述脱机手写汉字的各个笔段,包括:
去除所述静态图像中的噪声信息和对所述脱机手写汉字的边缘进行平滑;
从去除噪声信息和对所述脱机手写汉字的边缘进行平滑后的静态图像中,获取表示所述脱机手写汉字的拓扑结构的字形骨架;
从所述字形骨架中获取所述脱机手写汉字的各个笔段。
5.如权利要求4所述脱机手写汉字的笔画还原方法,其特征在于,在从所述字形骨架中获取所述脱机手写汉字的各个笔段之前,还包括:
根据预设消岐规则,消除所述字形骨架中相对于所述脱机手写汉字的拓扑结构存在的歧义变形。
6.如权利要求5所述脱机手写汉字的笔画还原方法,其特征在于,所述预设消岐规则包括以下信息:关键点在所述脱机手写汉字的字形骨架中的位置信息和状态信息、衍生点在字形骨架中的位置信息、歧义变形的类型以及对出现的歧义变形的消除方式,其中,所述关键点必然存在于所述字形骨架中,所述衍生点是所述字形骨架中预计会出现歧义变形的点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京语言大学,未经北京语言大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410291358.4/1.html,转载请声明来源钻瓜专利网。