[发明专利]基于二分类的深度学习手写中文字符识别方法及系统有效

申请号：	202010526123.4	申请日：	2020-06-09
公开（公告）号：	CN111652332B	公开（公告）日：	2021-05-11
发明（设计）人：	许信顺;张雨柔;罗昕	申请（专利权）人：	山东大学
主分类号：	G06K9/68	分类号：	G06K9/68;G06K9/62
代理公司：	济南圣达知识产权代理有限公司 37221	代理人：	黄海丽
地址：	250101 山东***	国省代码：	山东;37
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于分类深度学习手写中文字符识别方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.基于二分类的深度学习手写中文字符识别方法，其特征是，包括：

识别步骤：将待识别图像输入到预训练好的基于二分类的深度学习手写中文字符识别模型中，其中，预训练好的基于二分类的深度学习手写中文字符识别模型，包括：主体识别网络模型和汉字标点二分类模型，主体识别网络模型和汉字标点二分类模型的输出端均与乘法器连接；主体识别网络模型对待识别图像进行字符识别，汉字标点二分类模型对待识别图像进行汉字标点二分类识别；乘法器将字符识别概率和二分类识别概率进行相乘后，输出最终的待识别图像的识别结果；

所述主体识别网络模型包括：在个别卷积层的后面分别设置池化层，采用最大池化操作，对数据特征进行降维运算，最后连接两个全连接层，对卷积层提取的图像特征进行全局处理，每个全连接层添加dropout，最后一层进行softmax操作计算类别概率分布，其最大概率值所对应的类别即输入图像中字符所属的真实类别；

将训练好的主体识别网络模型与训练好的汉字标点二分类模型的输出端均与乘法器连接，将乘法器与softmax层连接，得到构建好的基于二分类的深度学习手写中文字符识别模型。

2.如权利要求1所述的方法，其特征是，所述识别步骤之前，还包括：预处理步骤：获取待识别的图像；对待识别的图像进行预处理。

3.如权利要求1所述的方法，其特征是，所述主体识别网络模型，工作原理包括：

主体识别网络的卷积层用于逐步地从图像中提取高层次的语义特征，全连接层基于卷积层的特征进行分类处理，获得最终的分类概率；主体识别网络结合汉字标点二分类模型的二分类概率进一步提升字符识别准确率。

4.如权利要求1所述的方法，其特征是，所述汉字标点二分类模型，工作原理包括：

对字符图像，提取字符图像的背景面积、字符长、宽、面积、字符占整个图像的比例特征；

对提取的特征进行特征归一化处理；

将特征归一化处理后的特征，输入到二分类器，输出当前字符图像属于标点符号或中文字符的识别概率得分。

5.如权利要求1所述的方法，其特征是，所述预训练好的基于二分类的深度学习手写中文字符识别模型的训练步骤还包括：

对汉字标点二分类模型进行训练，得到训练好的汉字标点二分类模型；

对主体识别网络模型进行训练，得到训练好的主体识别网络模型。