[发明专利]基于笔迹坐标序列的手写识别方法在审
申请号: | 201610180051.6 | 申请日: | 2016-03-25 |
公开(公告)号: | CN106407874A | 公开(公告)日: | 2017-02-15 |
发明(设计)人: | 秦阳;邓睿;莫凌飞;孙磊;杜喆宁;姚昕羽;齐恒 | 申请(专利权)人: | 东南大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04;G06N3/08 |
代理公司: | 南京苏高专利商标事务所(普通合伙)32204 | 代理人: | 柏尚春 |
地址: | 210096*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种基于笔迹坐标序列的文字识别方法。本发明先采集大量手写笔迹序列的数据,获得具有普适性的识别模型,之后,在实际使用中通过递归神经网络对用户的手写笔迹坐标序列进行训练,形成适应用户手写习惯的识别模型。由于记录了用户书写笔迹的时间特征,训练后可以形成适应用户手写习惯的识别模型,因而识别精度更高。本发明可以通过改变手写输入设备的采样频率,改变笔迹坐标序列的数据量,针对不同用户的手写速度调整训练模型计算速度,而且可以在手写过程中进行识别,识别效率更高。 | ||
搜索关键词: | 基于 笔迹 坐标 序列 手写 识别 方法 | ||
【主权项】:
一种基于笔迹坐标序列的文字识别方法,其特征在于,按照如下步骤进行识别:第1步,初始化,根据待识别文字范围选择相应的文字编码方式,根据手写输入设备的分辨率设置笔迹坐标范围,同时设定手写输入设备的采样频率;第2步,监督训练过程,监督训练过程按照步骤201‑205依次进行;步骤201,选定待训练字符,然后通过手写输入设备进行输入,并对输入的笔迹按照采样频率进行采样,采样后得到待训练字符的笔迹坐标序列;步骤202,对笔迹坐标序列进行归一化处理,归一化处理后将归一化的笔迹坐标序列输入至递归神经网络进行训练;步骤203,递归神经网络根据笔迹坐标序列的顺序对其中的坐标进行递归计算,并将计算结果与待训练字符的编码值比较,根据损失函数计算出编码间误差;步骤204,将编码间误差反馈回递归神经网络中,通过梯度下降函数调节下一个坐标进行递归计算时的计算参数,并根据步骤203继续对下一个坐标进行递归计算,直至笔迹坐标序列中的最后一个坐标完成递归计算,得到对应的待训练字符的编码值,本次训练结束;步骤205,依次重复步骤201至步骤204,直至完成所选文字编码方式中字符的监督训练;第3步,实际使用阶段按照步骤301至步骤307进行文字识别:步骤301,对手写输入设备输入的待识别字符的笔迹按照采样频率进行采样,采样后得到待训练字符的笔迹坐标序列;步骤302,对笔迹坐标序列进行归一化处理,归一化处理后将归一化的笔迹坐标序列输入至递归神经网络进行训练;步骤303,递归神经网络根据对笔迹坐标序列的顺序对其中的每一个坐标进行递归计算,直至完成笔迹坐标序列中的最后一个坐标的递归计算,最后一个坐标进行递归计算的结果即本次识别得到的待识别字符的字符编码;步骤304,显示本次识别得到的字符编码所对应的字符,对比本次识别得到的字符编码所对应的字符与实际输入的待识别字符,若不同,则表示本次识别结果错误,先保存本次识别错误的笔迹坐标序列,再重新输入待识别字符,回到步骤301重新进行文字识别;若相同,则查询之前是否存储了识别错误的笔迹坐标序列,若存储了识别错误的笔迹坐标序列,则依次进行步骤305至步骤306的计算,若没有存储识别错误的笔迹坐标序列,则进入步骤307;步骤305,递归神经网络根据存储的识别错误的笔迹坐标序列的顺序对其中的坐标进行递归计算,并将计算结果与步骤304中正确的识别结果比较,根据损失函数计算出编码间误差;步骤306,将编码间误差反馈回递归神经网络中,通过梯度下降函数调节下一个坐标进行递归计算时的计算参数,并根据步骤305继续对下一个坐标进行递归计算,直至存储的笔迹坐标序列中的最后一个坐标完成递归计算,即得到待识别字符的编码值,本次计算结束;步骤307,清空之前存储的笔迹坐标序列,输出本次识别结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610180051.6/,转载请声明来源钻瓜专利网。
- 上一篇:安全文件共享方法与系统
- 下一篇:目标特征提取方法及装置