[发明专利]一种基于神经网络的图像识别方法在审
申请号: | 201610810458.2 | 申请日: | 2016-09-08 |
公开(公告)号: | CN106997473A | 公开(公告)日: | 2017-08-01 |
发明(设计)人: | 汪润春;谭黎敏 | 申请(专利权)人: | 汪润春 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/06 |
代理公司: | 上海隆天律师事务所31282 | 代理人: | 臧云霄,钟宗 |
地址: | 澳大利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 神经网络 图像 识别 方法 | ||
技术领域
本发明涉及神经网络领域,尤其是一种基于神经网络的图像识别方法。
背景技术
随着计算机与信息技术的不断演进,机器学习以及模式识别已成为近几年来最炙手可热的领域之一。在一些以往需要人执行的图像识别任务正在逐渐被机器替代,例如车牌识别,人脸识别以及指纹识别等。虽然这些领域已经有相对成熟的解决方案,但是其方案应用的领域非常有限,往往只能在特定条件的环境下才能达到预期的识别效果;除此之外,传统的图像识别技术往往只能提取图片的局部信息,而无法对待测试图片中的所有信息作识别以及分类,应用范围广泛,识别准确度高。
发明内容
本发明的目的在于提供一种基于神经网络的图像识别方法,克服了现有技术的困难,能够在各种条件下对待测试图片中的所有信息作识别以及分类,应用范围广泛,识别准确度高。
根据本发明的一个方面,提供一种基于神经网络的图像识别方法,包括以下步骤:
S101、多类神经网络学习图片样本:所述多类神经网络包括大量的神经元,将多个带有字符的图片样本以及背景图片样本分别提供给所述神经元进行学习,所述多类神经网络针对所述图片样本生成若N类标签,所述标签至少包括一个代表背景的标签、若干代表阿拉伯数字的标签和/或若干代表英文字母的标签,每个所述图片样本对应所述标签中的一类;
S102、训练所述多类神经网络辨识图片样本:将多个带有字符的图片样本以及背景图片样本分别提供给所述神经网络进行训练,根据所述多类神经网络汇总对于所有训练样本的权值,并将所述权值作为所述神经网络的匹配参数;
S103、通过不同卷积窗的尺寸针对待测试图片进行多尺度卷积测试:在同一尺寸的卷积窗卷积测试中,将每一次的卷积窗内对应的局部所述待测试图片输入到所述图像识别神经网络,通过神经网络运算得到一个N*1的一维输出矩阵,将所述一维输出矩阵中的最大值作为代表每个所述卷积窗的置信度,所述最大值所对应的标签作为所述卷积窗的标签,随着卷积窗会逐步位移,依次扫描整张待测试图片,以此将每个所述卷积窗映射到代表该卷积窗在待测试图片中位置的二维矩阵中得到一个最大值矩阵和一个标签矩阵;
S104、将多种卷积窗尺寸下的标签矩阵进行结合:将多种不同卷积窗尺寸通过所述卷积测试得到的最大值标签矩阵投影到同一个平面矩阵,然后将所述平面矩阵中所有代表相同字符且位置相近的点的集合认为其预测的是同一个字符,作为一簇,并且不断地将簇之间距离小于卷积窗的长度或是宽度的一半的点归为该簇,将簇之间距离大于卷积窗的长度或是宽度的一半的点归为新的一簇,从而计算出所有簇的中心坐标;以及
S105、将所述簇中累计权重最高的标签或是将置信度最高的标签输出作为唯一的标签。
优选地,所述步骤S101中,在N类标签中,将每个带有字符的图片样本的标签设为大于0的不同整数数值,而所述背景图片样本的标签设为-1。
优选地,带有单个阿拉伯数字字符的所述图片样本的标签是0至9中的一个;带有单个英文字母字符的所述图片样本的标签是11至36中的一个。
优选地,所述标签还包括若干代表中文字符的标签、若干日文字符的标签、若干韩文字符的标签、若干法文字符的标签以及若干俄文字符的标签。
优选地,所述步骤S102中所述背景图片样本的总数量大于等于所述带有字符的图片样本的总数量。
优选地,基于已有的所述图片样本进行仿射变换以及背景替换来合成新的所述图片样本,来增加该类所述图片样本的数量。
优选地,所述步骤S103中,所述卷积窗在所述二维矩阵的X轴代表该卷积窗在所述待测试图片中的横向位置,Y轴代表该卷积窗在所述待测试图片中的纵向的位置。
优选地,在同一尺寸的卷积窗卷积测试中通过将每个所述卷积窗的最大值映射到代表该卷积窗在待测试图片中位置的二维矩阵中得到一个对应待测试图片的最大值矩阵;
并且,还通过将每个所述卷积窗的标签映射到代表该卷积窗在待测试图片中位置的二维矩阵中得到一个对应待测试图片的标签矩阵。
优选地,所述步骤S103中,分别通过20*20、24*24、以及28*28三个卷积窗的尺寸分别进行三次卷积测试。
优选地,所述步骤S103中,分别通过24*24、28*28、以及32*32三个卷积窗的尺寸分别进行三次卷积测试。
优选地,所述步骤S103中,分别通过20*20、24*24、28*28、32*32以及36*36五个卷积窗的尺寸分别进行五次卷积测试。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于汪润春,未经汪润春许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610810458.2/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序