[发明专利]手写汉字结构评测方法、装置、设备及存储介质在审
申请号: | 202310363283.5 | 申请日: | 2023-03-31 |
公开(公告)号: | CN116386065A | 公开(公告)日: | 2023-07-04 |
发明(设计)人: | 庄建明;施明勇 | 申请(专利权)人: | 深圳市泓宇星科技有限公司 |
主分类号: | G06V30/244 | 分类号: | G06V30/244;G06V30/18;G06V30/19 |
代理公司: | 深圳市中科创为专利代理有限公司 44384 | 代理人: | 何路;杨石 |
地址: | 518000 广东省深圳市龙华区民治*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 手写 汉字 结构 评测 方法 装置 设备 存储 介质 | ||
本发明公开一种手写汉字结构评测方法、装置、设备及存储介质,评测方法包括:创建汉字对应的第一表意文字描述序列,第一表意文字描述序列包括部件信息和用于描述部件信息的组成结构的结构信息;基于收集的汉字的手写笔迹数据,提取手写笔迹数据中每个部件的特征,并将每个部件的特征组成整个汉字的结构特征,以及将对应的结构信息作为结构特征的样本标签;基于结构特征和样本标签,训练得到结构识别模型;将待评测的手写汉字输入至结构识别模型中进行评测,得到评测结果。本发明在对所书写汉字进行了部件层次的正确性判定的基础上,进一步的汉字结构判定,能提供更高的准确率,从而更适用于有着不同书写风格与书写习惯的用户。
技术领域
本发明涉及计算机技术领域,尤其涉及一种手写汉字结构评测方法、装置、设备及存储介质。
背景技术
自动汉字书写评价系统可以快速反馈用户书写的不规范所在,从而帮助用户掌握正确的汉字书写规范。现有的自动汉字书写评价系统通常会从笔画书写是否正确,即笔画类型书写是否正确、笔画数量是否正确、笔顺是否正确等角度进行评价;以及从部件书写是否正确角度进行评价,即部件类型是否正确、部件数量是否正确等。但是,不同的汉字的笔顺与部件组成是有可能完全一致的。如对于汉字“另”和汉字“叻”来说,其笔顺以及部件组成是完全一致的。因此,仅凭笔画和部件书写正确就断言汉字书写正确是不够充分的。
发明内容
鉴于以上技术问题,本发明提供了一种手写汉字结构评测方法、装置、设备及存储介质,该方法可以在对所书写汉字的笔画及部件进行相应验证后,进一步从汉字结构角度对汉字书写的正确性进行验证,从而使用户能够掌握更为细致且完整的汉字书写规范。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
根据本发明的一方面,提出了一种手写汉字结构评测方法,所述评测方法包括:
创建汉字对应的第一表意文字描述序列,所述第一表意文字描述序列包括部件信息和用于描述所述部件信息的组成结构的结构信息;
基于收集的汉字的手写笔迹数据,提取所述手写笔迹数据中每个部件的特征,并将每个部件的特征组成整个汉字的结构特征,以及将对应的所述结构信息作为所述结构特征的样本标签;
基于所述结构特征和所述样本标签,训练得到结构识别模型;
将待评测的手写汉字输入至所述结构识别模型中进行评测,得到评测结果。
进一步的,在创建汉字对应的所述第一表意文字描述序列时,还包括:
创建所有待评测汉字对应的所述第一表意文字描述序列,构建得到所有的所述第一表意文字描述序列的查询表;
在将对应的所述结构信息作为所述结构特征的所述样本标签时,具体包括;
提取所述查询表中对应的所述第一表意文字描述序列中的所述结构信息,将提取的所述结构信息作为所述结构特征的所述样本标签。
进一步的,所述结构信息包括以下的一种或多种:
左右结构;上下结构;左中右结构;上中下结构;上包围结构;下包围结构;左包围结构;全包围结构;镶嵌结构。
进一步的,所述提取所述手写笔迹数据中每个部件的特征,并将每个部件的特征组成整个汉字的结构特征,包括:
将汉字的所述手写笔迹数据中每条笔画的轨迹点序列按照笔画与部件的归属关系划分至对应的部件中;
提取每个部件的坐标特征、标记特征,将所述坐标特征和所述标记特征进行拼接,得到分别与每个部件对应的特征向量;
基于所有部件的所述特征向量,组成整个汉字的所述结构特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市泓宇星科技有限公司,未经深圳市泓宇星科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310363283.5/2.html,转载请声明来源钻瓜专利网。