[发明专利]基于数字手写设备的汉字书写正误自动评测方法和装置有效
申请号: | 201110435962.6 | 申请日: | 2011-12-22 |
公开(公告)号: | CN102542264A | 公开(公告)日: | 2012-07-04 |
发明(设计)人: | 安维华;李超;荀恩东 | 申请(专利权)人: | 北京语言大学 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/62;G09B11/00 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 戴云霓 |
地址: | 100083*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 数字 手写 设备 汉字 书写 正误 自动 评测 方法 装置 | ||
1.一种基于数字手写设备的汉字书写正误自动评测方法,其特征在于,所述方法包括:
建立模板汉字,所述模板汉字包括书写信息和结构信息,所述书写信息是包括笔画和笔段的二级索引结构,所述结构信息是各个笔段之间的相对位置关系;
采集手写汉字;
计算所述手写汉字的书写信息和结构信息;
根据手写汉字的书写信息、结构信息和模板汉字的书写信息、结构信息,将所述手写汉字与所述模板汉字进行匹配,以生成包含手写汉字和模板汉字的笔段映射关系集合的匹配结果;
根据所述匹配结果识别所述手写汉字的错误信息。
2.根据权利要求1所述的方法,其特征在于,所述笔画是汉字书写时不间断地一次连续写成的包含0个或至少一个拐点的线条,所述笔段是不包含拐点的连续平滑的线段。
3.根据权利要求1所述的方法,其特征在于,所述采集手写汉字包括:通过数字手写交互设备采集手写汉字,通过所述数字手写交互设备采集到的信息是所采集汉字的多个笔画,所述多个笔画中的任一个笔画包括落笔和提笔之间笔迹上的多个采样点。
4.根据权利要求1所述的方法,其特征在于,所述计算所述手写汉字的书写信息和结构信息包括:
对所述手写汉字中每个笔画进行均匀的重采样,使得相邻采样点间的距离相同;
计算所述手写汉字中每个笔画中的拐点位置,根据拐点位置将每个笔画分解为多个笔段;
根据任意两个笔段的中心点在水平方向和竖直方向上的坐标值,计算所述任意两个笔段在水平方向和竖直方向上的相对位置关系。
5.根据权利要求1或4所述的方法,其特征在于,在计算所述手写汉字的书写信息和结构信息之后,所述方法还包括:
识别并删除所述手写汉字在书写过程中的冗余信息,所述冗余信息包括抖笔和/或描笔。
6.根据权利要求5所述的方法,其特征在于,识别并删除所述手写汉字在书写过程中抖笔包括:
确定所述手写汉字中包含一个以上笔段的笔画;
将所述包含一个以上笔段的笔画的起始笔段和末尾笔段的长度分别与预设的第一阈值进行比较,并删除长度小于所述第一阈值的笔段。
7.根据权利要求5所述的方法,其特征在于,识别并删除所述手写汉字在书写过程中描笔包括:
将所述手写汉字中任意两个笔画s和t均匀地重采样为H个采样点;
根据关系式计算所述任意两个笔画s和t之间的路径距离d(s,t);
如果所述路径距离d(s,t)小于预设的第二阈值,则删除笔画s和t中的任意一个笔画;其中,Ps[i]为笔画s上的第i个采样点,Pt[i]为笔画t上的第i个采样点,i、H为正整数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京语言大学,未经北京语言大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110435962.6/1.html,转载请声明来源钻瓜专利网。