[发明专利]构建字符识别模型与识别字符的方法和装置有效
申请号: | 201910477704.0 | 申请日: | 2019-06-03 |
公开(公告)号: | CN110222693B | 公开(公告)日: | 2022-03-08 |
发明(设计)人: | 韩景涛;曾华荣;韩锋 | 申请(专利权)人: | 第四范式(北京)技术有限公司 |
主分类号: | G06V30/148 | 分类号: | G06V30/148;G06N3/04;G06N3/08 |
代理公司: | 北京展翼知识产权代理事务所(特殊普通合伙) 11452 | 代理人: | 王明远 |
地址: | 100085 北京市海淀区上*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 构建 字符 识别 模型 方法 装置 | ||
1.一种基于字符识别模型识别图片中字符的方法,其中,所述字符识别模型包括特征提取模块和识别模块,所述方法包括:
将预测图片输入特征提取模块,得到所述特征提取模块输出的特征矩阵;其中,所述特征提取模块包括第一特征提取网络结构或者第二特征提取网络结构;所述第一特征提取网络结构包括至少一层第一特征提取单元,所述第一特征提取单元由依次连接的第一卷积层、第一激活函数层、第二卷积层、第一批标准化层、第二激活函数层以及第一池化层组成;所述第二特征提取网络结构包括至少一层第二特征提取单元,所述第二特征提取单元由依次连接的第三卷积层、第三激活函数层、第四卷积层、第四激活函数层、第二批标准化层以及第二池化层组成,所述第一特征提取网络结构适用于字符解空间大于第一预定阈值的场景,所述第二特征提取网络结构适用于字符解空间小于第二预定阈值的场景,所述第一预定阈值大于或等于所述第二预定阈值,所述字符解空间是指需要识别的字符的集合;
将所述特征矩阵输入所述识别模块,得到所述识别模块输出的字符识别结果,所述识别模块包括概率生成单元和解码单元,所述将所述特征矩阵输入所述识别模块,得到所述识别模块输出的字符识别结果的步骤包括:将所述特征矩阵输入所述概率生成单元,以得到概率矩阵,其中,所述概率矩阵中的每个列向量用于表征所述预测图片中的一块区域所包含的字符的概率分布,所述列向量中的每个元素对应于一个字符,元素的取值用于表征该区域包含的字符是该元素所对应的字符的概率,所述概率矩阵中列向量的维度与字符解空间的大小相当;将所述概率矩阵输入所述解码单元,得到所述解码单元生成的所述预测图片包含的字符的识别结果。
2.根据权利要求1所述的方法,其中,
在所述第一特征提取网络结构包括至少两层第一特征提取单元的情况下,在后的第一特征提取单元中卷积层中的卷积核的个数是在前的第一特征提取单元中卷积层中的卷积核的个数的M倍,其中M≥2,并且/或者
在所述第二特征提取网络结构包括至少两层第二特征提取单元的情况下,在后的第二特征提取单元中卷积层中的卷积核的个数是在前的第二特征提取单元中卷积层中的卷积核的个数的N倍,其中N≥2。
3.根据权利要求1所述的方法,其中,所述将所述特征矩阵输入所述概率生成单元,以得到概率矩阵的步骤包括:
所述概率生成单元为循环神经网络结构,将所述特征矩阵中的列向量依次输入循环神经网络结构,以得到由所述循环神经网络结构输出的概率矩阵。
4.根据权利要求3所述的方法,其中,
所述循环神经网络结构的隐藏层中神经元的个数是根据所述字符解空间的大小设定的,并且/或者
所述循环神经网络结构的输出层中神经元的个数与所述字符解空间的大小之间的差值的绝对值小于第三预定阈值。
5.根据权利要求4所述的方法,其中,
所述循环神经网络结构的隐藏层中神经元的个数与所述字符解空间的大小正相关。
6.根据权利要求4所述的方法,其中,
在所述循环神经网络结构的输出层中神经元的个数与所述循环神经网络结构的隐藏层中神经元的个数之间的数量差异大于第四预定阈值的情况下,在所述隐藏层和所述输出层之间设置一层全连接层,所述全连接层中神经元的个数与所述字符解空间的大小之间的差值的绝对值小于第五预定阈值。
7.根据权利要求3所述的方法,其中,
所述循环神经网络结构由两层双向循环神经网络构成。
8.根据权利要求1所述的方法,其中,所述将所述概率矩阵输入所述解码单元,得到所述解码单元生成的所述预测图片包含的字符的识别结果步骤包括:
所述解码单元计算所述概率矩阵所有可能的解码路径的概率之和;
选取概率之和最大的解码路径,作为所述预测图片所包含的字符的识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于第四范式(北京)技术有限公司,未经第四范式(北京)技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910477704.0/1.html,转载请声明来源钻瓜专利网。