[发明专利]字符识别方法、设备及字符识别芯片有效
申请号: | 202010191338.5 | 申请日: | 2020-03-18 |
公开(公告)号: | CN113496263B | 公开(公告)日: | 2022-05-17 |
发明(设计)人: | 兴百桥;李明 | 申请(专利权)人: | 北京易真学思教育科技有限公司 |
主分类号: | G06V30/244 | 分类号: | G06V30/244;G06N3/04 |
代理公司: | 北京合智同创知识产权代理有限公司 11545 | 代理人: | 李杰 |
地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 字符 识别 方法 设备 芯片 | ||
本申请实施例提供一种字符识别方法、设备及字符识别芯片,包括:获取待识别字符的轨迹数据,轨迹数据用于指示待识别字符的撰写轨迹;根据轨迹数据,获取待识别字符的字符特征矩阵;将字符特征矩阵输入卷积神经网络,并根据卷积神经网络的输出获取字符识别结果,其中卷积神经网络包括至少一个卷积层,卷积层中的卷积核用于与输入卷积层的特征矩阵中的对应区域进行梯度和计算。上述方案可以从字符特征矩阵中提取较为丰富的特征,使该卷积神经网络的泛化能力更强,使该上述方案对新鲜样本的适应能力更好,从而提高识别的准确率,改善了用户体验。
技术领域
本申请实施例涉及字符识别技术领域,尤其涉及一种字符识别方法、设备及字符识别芯片。
背景技术
字符识别是计算机视觉中的一个重要领域,相关技术中,可以通过训练神经网络,并由训练好的神经网络对手写文字中的字符进行识别。
在上述方案中,虽然可以对手写文字中字符进行识别,但由于手写文字往往包含了大量的信息,训练好的神经网络在进行识别时从手写文字中所提取的信息较少,降低了其对文字识别的识别准确度,损害了用户体验。
发明内容
有鉴于此,本发明实施例提供一种字符识别方法、设备及字符识别芯片,用以克服现有技术中对手写文字中个字符进行识别时,从手写文字中所提取的信息较少,对文字识别的识别准确度较低的缺陷。
本申请实施例提供了一种字符识别方法,其包括:
获取待识别字符的轨迹数据,轨迹数据用于指示待识别字符的撰写轨迹;
根据轨迹数据,获取待识别字符的字符特征矩阵;
将字符特征矩阵输入卷积神经网络,并根据卷积神经网络的输出获取字符识别结果,其中卷积神经网络包括至少一个卷积层,卷积层中的卷积核用于与输入卷积层的特征矩阵中的对应区域进行梯度和计算。
可选地,在本申请的一种实施例中,卷积核中指定点的权值为最大权值,卷积核中其他点的权值与该点至指定点的距离负相关。
可选地,在本申请的一种实施例中,卷积层中的卷积核用于与输入卷积层的特征矩阵中的对应区域进行指定方向的梯度和计算,指定方向包括垂直梯度、水平梯度、右上梯度、左上梯度。
可选地,在本申请的一种实施例中,方法还包括:
根据轨迹数据在撰写轨迹上选取多个采样点;
获取每个采样点与相邻采样点之间的方向向量;
生成方向特征矩阵,方向特征矩阵包括多个采样点的方向向量在多个方向上的方向向量和,或方向特征矩阵包括多个采样点的方向向量的方向类型数量和;
将字符特征矩阵输入卷积神经网络,并根据卷积神经网络的输出获取字符识别结果,包括:
将字符特征矩阵输入卷积神经网络,并使卷积神经网络中全连接层的输入包括方向特征矩阵,根据卷积神经网络的输出获取字符识别结果。
可选地,在本申请的一种实施例中,方法还包括:
根据轨迹数据获取撰写轨迹的轮廓特征矩阵,轮廓特征矩阵包括撰写轨迹与图像上边界之间的面积、撰写轨迹与图像下边界之间的面积、撰写轨迹与图像左边界之间的面积、撰写轨迹与图像右边界之间的面积;
将字符特征矩阵输入卷积神经网络,并根据卷积神经网络的输出获取字符识别结果,包括:
将字符特征矩阵输入卷积神经网络,并使卷积神经网络中全连接层的输入包括轮廓特征矩阵,根据卷积神经网络的输出获取字符识别结果。
可选地,在本申请的一种实施例中,方法还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京易真学思教育科技有限公司,未经北京易真学思教育科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010191338.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:图像匹配方法和系统
- 下一篇:可作为免疫调节剂的化合物、其制备方法和应用