[发明专利]一种基于神经网络的文字识别方法在审
申请号: | 202010222642.1 | 申请日: | 2020-03-26 |
公开(公告)号: | CN111428715A | 公开(公告)日: | 2020-07-17 |
发明(设计)人: | 陈豪奋 | 申请(专利权)人: | 广州市南方人力资源评价中心有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 510000 广东省广州市番禺区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 神经网络 文字 识别 方法 | ||
1.一种基于神经网络的文字识别方法,采用如下步骤:
S1:采用待识别文本图像,且转换为灰度图像,形成训练样本图片;
S2:对S1中的训练样本图片,输入至cnn卷积神经网络,通过对卷积层的输出通道、卷积核和步长的参数设定,以及层归一化处理,然后提取特征,输出特征矩阵;
S3:基于lstm神经网络的cell组成的双向rnn的语言模型;
S4:将S2中的得到的特征矩阵,输入至S3中的双向rnn的语言模型中,通过对多层卷积的输出通道、卷积核和步长的参数设定,进行提取特征,输出特征矩阵,以及多次对训练数据进行归一化处理,激活、以及最大池化处理,得到对S1中训练样本图片中的文字序列的识别结果。
2.根据权利要求1所述的一种基于神经网络的文字识别方法,其特征在于:S2中的利用cnn卷积神经网络,对S1中的训练样本图片,进行特征提取,采用如下步骤:
S201:对S1中的训练样本图片,进行卷积运算,进行特征提取,形成特征矩阵;上述卷积运算的参数如下:输出:64,卷积核:3,步长:1;上述最大池化的参数如下:卷积核:2,步长:2;
S202:对S201中的特征矩阵;进行卷积运算,进行特征提取;上述卷积运算的参数如下:输出:128,卷积核:3,步长:1;上述最大池化的参数如下:卷积核:2,步长:2;
S203:对S202中的特征矩阵;进行卷积运算,进行特征提取;上述卷积运算的参数如下:输出:256,卷积核:3,步长:1;
S204:对上述训练数据,进行卷积神经网络的归一化操作;
S205:然后再使用卷积神经网络的激活函数,进行激活处理,将激活信息向后传入下一层的神经网络;
S206:通过卷积运算,进行特征提取,形成特征矩阵,其参数如下:输出:256,卷积核:3,步长:1;
S207:对上述的训练数据,进行层归一化运算;S208:再使用卷积神经网络的激活函数,进行激活处理;
S209:然后通过卷积神经网络,进行最大池化操作,抽取其最大值,形成特征矩阵;其参数如下:池化窗口大小:2;池化步长:宽为2,高为2;padding:valid;
S210:进行卷积运算,其参数如下:输出:512,卷积核:3,步长:1,进行特征提取,形成特征矩阵;
S211:对S210中的特征矩阵,进行卷积神经网络的归一化操作;
S212:然后再使用卷积神经网络的激活函数,进行激活处理;
S213:再进行卷积运算操作,进行特征提取,形成特征矩阵,其参数如下:输出:512,卷积核:3,步长:1;
S214:对上述产生的训练数据,进行层归一化操作;
S215:再使用卷积神经网络的激活函数,进行激活处理;
S216:然后,再次对上述产生的训练数据,再进行最大池化操作,其参数如下:卷积核大小:高为2,宽为1;步长大小:高为2,宽为1;
S217:再次进行卷积运算,进行特征提取,形成特征矩阵;其参数如下:输出:512;卷积核:2;卷积核步长:高为2,宽为1;
S218:再进行层归一化操作;
S219:然后再使用卷积神经网络的激活函数,进行激活处理。
3.根据权利要求1所述的一种基于神经网络的文字识别方法,其特征在于:对S3中的基于lstm神经网络的cell组成的双向rnn的语言模型,进行特征提取,采用如下步骤:
S301:对S2中经cnn卷积神经网络提取的特征矩阵,利用双向rnn的语言模型,再次进行卷积运算处理;其参数如下:输出:64,卷积核:3,padding:vali;
S302:进行卷积运算,进行特征提取,形成特征矩阵,其参数如下:输出:64,卷积核:3,padding:same;
S303:对上述训练数据,进行层归一化运算处理;
S304:使用卷积神经网络的激活函数,进行激活处理;
S305:然后再进行池化层最大池化操作,其参数如下:池化窗口大小:2,池化步长:宽为2,高为2;padding:valid;
S306:进行卷积运算操作,进行特征提取,其参数如下:输出:128,卷积核:3,padding:same;
S307:对上述产生的训练数据,采用归一化运算处理;
S308:使用卷积神经网络的激活函数,进行激活处理;
S309:进行卷积运算,进行特征提取,形成特征矩阵,其参数如下:输出:128,卷积核:3,padding:same;
S310:对上述的训练数据,进行层归一化运算处理;
S311:使用卷积神经网络的激活函数,进行激活处理;
S312:然后再进行池化层最大池化操作,其参数如下:池化窗口大小:2;池化步长:宽为2,高为1;padding:valid;
S313:进行卷积运算,进行特征提取,形成特征矩阵,其参数如下:输出:256,卷积核:3,padding:same;
S314:对上述训练数据,进行层归一化运算处理;
S315:使用卷积神经网络的激活函数,进行激活处理;
S316:进行卷积运算,进行特征提取,形成特征矩阵,其参数如下:输出:256,卷积核:3,padding:same;
S317:对上述训练数据,进行层归一化运算处理;
S318:使用卷积神经网络的激活函数,进行激活处理;
S319:再进行池化层最大池化操作,提取其特大值,形成特征矩阵,其参数如下:池化窗口大小:2;池化步长:宽为2,高为1;padding:valid;
S320:进行卷积运算,进行特征提取,形成特征矩阵,其参数如下:输出:512,卷积核:3,padding:same;
S321:对上述训练数据,进行层归一化运算处理;
S322:使用卷积神经网络的激活函数,进行激活处理;
S323:进行卷积运算,进行特征提取,形成特征矩阵,其参数如下:输出:512,卷积核:3,padding:same;
S324:对上述训练数据,进行层归一化运算处理;
S325:使用卷积神经网络的激活函数,进行激活处理;
S326:再进行池化层最大池化操作,提取其特大值,其参数如下:池化窗口大小:宽为3,高为1;池化步长:宽为3,高为1;Padding:valid。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州市南方人力资源评价中心有限公司,未经广州市南方人力资源评价中心有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010222642.1/1.html,转载请声明来源钻瓜专利网。