[发明专利]基于二分类的深度学习手写中文字符识别方法及系统有效
| 申请号: | 202010526123.4 | 申请日: | 2020-06-09 |
| 公开(公告)号: | CN111652332B | 公开(公告)日: | 2021-05-11 |
| 发明(设计)人: | 许信顺;张雨柔;罗昕 | 申请(专利权)人: | 山东大学 |
| 主分类号: | G06K9/68 | 分类号: | G06K9/68;G06K9/62 |
| 代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 黄海丽 |
| 地址: | 250101 山东*** | 国省代码: | 山东;37 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 分类 深度 学习 手写 中文 字符 识别 方法 系统 | ||
1.基于二分类的深度学习手写中文字符识别方法,其特征是,包括:
识别步骤:将待识别图像输入到预训练好的基于二分类的深度学习手写中文字符识别模型中,其中,预训练好的基于二分类的深度学习手写中文字符识别模型,包括:主体识别网络模型和汉字标点二分类模型,主体识别网络模型和汉字标点二分类模型的输出端均与乘法器连接;主体识别网络模型对待识别图像进行字符识别,汉字标点二分类模型对待识别图像进行汉字标点二分类识别;乘法器将字符识别概率和二分类识别概率进行相乘后,输出最终的待识别图像的识别结果;
所述主体识别网络模型包括:在个别卷积层的后面分别设置池化层,采用最大池化操作,对数据特征进行降维运算,最后连接两个全连接层,对卷积层提取的图像特征进行全局处理,每个全连接层添加dropout,最后一层进行softmax操作计算类别概率分布,其最大概率值所对应的类别即输入图像中字符所属的真实类别;
将训练好的主体识别网络模型与训练好的汉字标点二分类模型的输出端均与乘法器连接,将乘法器与softmax层连接,得到构建好的基于二分类的深度学习手写中文字符识别模型。
2.如权利要求1所述的方法,其特征是,所述识别步骤之前,还包括:预处理步骤:获取待识别的图像;对待识别的图像进行预处理。
3.如权利要求1所述的方法,其特征是,所述主体识别网络模型,工作原理包括:
主体识别网络的卷积层用于逐步地从图像中提取高层次的语义特征,全连接层基于卷积层的特征进行分类处理,获得最终的分类概率;主体识别网络结合汉字标点二分类模型的二分类概率进一步提升字符识别准确率。
4.如权利要求1所述的方法,其特征是,所述汉字标点二分类模型,工作原理包括:
对字符图像,提取字符图像的背景面积、字符长、宽、面积、字符占整个图像的比例特征;
对提取的特征进行特征归一化处理;
将特征归一化处理后的特征,输入到二分类器,输出当前字符图像属于标点符号或中文字符的识别概率得分。
5.如权利要求1所述的方法,其特征是,所述预训练好的基于二分类的深度学习手写中文字符识别模型的训练步骤还包括:
对汉字标点二分类模型进行训练,得到训练好的汉字标点二分类模型;
对主体识别网络模型进行训练,得到训练好的主体识别网络模型。
6.如权利要求5所述的方法,其特征是,所述对主体识别网络模型进行训练,得到训练好的主体识别网络模型;具体步骤包括:
构建主体识别网络模型;
构建第一训练集;所述第一训练集,包括:已知字符识别结果的手写字符图像;
将第一训练集输入到主体识别网络模型中,对主体识别网络模型进行训练,得到训练好的主体识别网络模型。
7.如权利要求5所述的方法,其特征是,所述对汉字标点二分类模型进行训练,得到训练好的汉字标点二分类模型;具体步骤包括:
构建汉字标点二分类模型;
构建第二训练集;所述第二训练集,包括:已知汉字标点分类结果的字符图像;
将第二训练集输入到汉字标点二分类模型中,对汉字标点二分类模型进行训练,得到训练好的汉字标点二分类模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010526123.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种定位导正式电机极靴压入装置
- 下一篇:用于酒驾查处的数据处理方法





