[发明专利]一种手写汉字的识别、评分、纠错方法及系统在审
申请号: | 202110545810.5 | 申请日: | 2021-05-19 |
公开(公告)号: | CN113191309A | 公开(公告)日: | 2021-07-30 |
发明(设计)人: | 朱亮亮;熊杰 | 申请(专利权)人: | 杭州点望科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06K9/40 |
代理公司: | 北京慕达星云知识产权代理事务所(特殊普通合伙) 11465 | 代理人: | 符继超 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 手写 汉字 识别 评分 纠错 方法 系统 | ||
1.一种手写汉字的识别、评分、纠错方法,其特征在于,包括以下步骤:
获取手写汉字的原始图片,将原始图片中汉字之外的部分作为噪声并删除,得到只保留手写汉字的图片;
采用预先构建的psenet模型对只保留手写汉字的图片进行角度矫正,并提取单个手写汉字所在区域的外接矩形框;
采用预先构建的mobilev3网络模型确定手写汉字的走向为水平方向或竖直方向;
根据各所述外接矩形框的大小和排列关系,分析书写整体上的整齐程度;
采用预先构建的基于神经网络的识别评分模型识别每个手写汉字的书写方式和字体,并对单个手写汉字的书写情况和整体书写情况进行评分;
在手写汉字的字体为楷体时,采用预先构建的基于神经网络的纠错模型,对手写汉字的文本内容进行OCR识别,并定位和标记存在书写错误的汉字及出错部位。
2.根据权利要求1所述的一种手写汉字的识别、评分、纠错方法,其特征在于,所述采用OCR方法对手写汉字的文本内容进行识别,并定位和标记存在书写错误的文字及出错部位,包括:
逐一提取单个手写汉字,将其与预先构建的汉字字模数据库中的字模进行比对;
对当前提取的单个手写汉字和字模进行连通域分析,并比对二者的连通域个数、连通域外接矩形框的大小、以及连通域相互之间的位置是否一致;若判定为不一致,则当前提取的手写汉字存在书写错误;
若判定为一致,则进行笔划分析;将当前提取的手写汉字与字模的对应连通域进行Haar-like特征提取,构成5个特征矩阵;计算特征矩阵在多个平移间隔下的互相关性值,进行相关性匹配;若有至少一个互相关值达到给定相关性阈值,则判定该部分连通域的笔画正确;若均达不到,则判定为存在笔划书写错误,并定位和标注该手写汉字中错误笔划的位置;
若当前提取的手写汉字存在多个字模,当当前提取的手写汉字与其中一个字模对照分析为正确,则判定当前提取的手写汉字书写正确;当当前提取的手写汉字与所有字模的对照分析均为错误时,则判定当前提取的手写汉字书写错误。
3.根据权利要求2所述的一种手写汉字的识别、评分、纠错方法,其特征在于,所述笔划分析的过程为:
将当前提取的手写汉字和字模对应连通域按其外接矩形框依次进行提取,并缩放到相同的大小尺寸,得到多个对应矩形区域;
分别对当前提取的手写汉字和字模所提取的对应矩形区域进行5个Haar-like特征矩阵计算;若提取的部分为N*M,将提取部分的上下左右四个方向分别添加两行或两列,得到填充图像;将填充图像依次与5个Haar-like特征矩阵进行二维卷积计算,每次向水平或垂直方向位移一位,最终获得5个N*M的特征矩阵;
利用下式计算当前提取的手写汉字和字模所提取的对应矩形区域的36个二维位移量下的互相关值:
上式中,Φ表示5个Haar-like特征矩阵的集合{A,B,C,D,E},p,q∈{0,1,2,3,4,5},||·||表示Haar-like特征矩阵内各元素的均方根计算公式;Xi表示当前提取的手写汉字中所提取的对应矩形区域计算得到的5个N*M的特征矩阵,Yi表示字模中所提取的对应矩形区域计算得到的5个N*M的特征矩阵,i=A,B,C,D,E;
若36个特征矩阵互相关值中,存在至少一个达到给定阈值,则判定该提取的对应矩形区域的笔划正确;否则,判定为存在笔划书写错误;
逐个分析所有连通域提取出的对应矩形区域,全都正确,则判定为当前提取的手写汉字书写正确。
4.根据权利要求2所述的一种手写汉字的识别、评分、纠错方法,其特征在于,所述汉字字模数据库的构建过程为:
采集150*150分辨率的不同字体的标准汉字二值图;
采用图形形态学对标准汉字二值图进行骨骼提取和膨胀操作,将笔划统一为4个像素粗细的标准汉字模型;
将各个标准汉字模型进行存储,得到所述汉字字模数据库。
5.根据权利要求2所述的一种手写汉字的识别、评分、纠错方法,其特征在于,在将提取的单个手写汉字与字模进行比对之前还包括:将提取的单个手写汉字缩放到和字模相同的大小,并采用相同的二值化处理、骨骼提取和膨胀操作,使笔划粗细和字模一致。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州点望科技有限公司,未经杭州点望科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110545810.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于抗体的纯化装置及其工作方法
- 下一篇:协同车辆编队方法、装置及终端设备