[发明专利]一种基于神经网络的图像识别方法在审
申请号: | 201610810458.2 | 申请日: | 2016-09-08 |
公开(公告)号: | CN106997473A | 公开(公告)日: | 2017-08-01 |
发明(设计)人: | 汪润春;谭黎敏 | 申请(专利权)人: | 汪润春 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/06 |
代理公司: | 上海隆天律师事务所31282 | 代理人: | 臧云霄,钟宗 |
地址: | 澳大利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种基于神经网络的图像识别方法,包括了以下步骤S101、多类神经网络学习图片样本;S102、训练所述多类神经网络辨识图片样本;S103、针对待测试图片进行多尺度卷积测试;S104、将多次卷积的结果进行结合;S105、将累计权重最高或是置信度最高的标签输出作为唯一的标签,本发明能够在各种条件下对待测试图片中的所有信息作识别以及分类,应用范围广泛,识别准确度高。 | ||
搜索关键词: | 一种 基于 神经网络 图像 识别 方法 | ||
【主权项】:
一种基于神经网络的图像识别方法,其特征在于,包括以下步骤:S101、多类神经网络学习图片样本:所述多类神经网络包括大量的神经元,将多个带有字符的图片样本以及背景图片样本分别提供给所述神经元进行学习,所述多类神经网络针对所述图片样本生成若N类标签,所述标签至少包括一个代表背景的标签、若干代表阿拉伯数字的标签和/或若干代表英文字母的标签,每个所述图片样本对应所述标签中的一类;S102、训练所述多类神经网络辨识图片样本:将多个带有字符的图片样本以及背景图片样本分别提供给所述神经网络进行训练,根据所述多类神经网络汇总对于所有训练样本的权值,并将所述权值作为所述神经网络的匹配参数;S103、通过不同卷积窗的尺寸针对待测试图片进行多尺度卷积测试:在同一尺寸的卷积窗卷积测试中,将每一次的卷积窗内对应的局部所述待测试图片输入到所述图像识别神经网络,通过神经网络运算得到一个N*1的一维输出矩阵,将所述一维输出矩阵中的最大值作为代表每个所述卷积窗的置信度,所述最大值所对应的标签作为所述卷积窗的标签,随着卷积窗会逐步位移,依次扫描整张待测试图片,以此将每个所述卷积窗映射到代表该卷积窗在待测试图片中位置的二维矩阵中得到一个最大值矩阵和一个标签矩阵;S104、将多种卷积窗尺寸下的标签矩阵进行结合:将多种不同卷积窗尺寸通过所述卷积测试得到的最大值标签矩阵投影到同一个平面矩阵,然后将所述平面矩阵中所有代表相同字符且位置相近的点的集合认为其预测的是同一个字符,作为一簇,并且不断地将簇之间距离小于卷积窗的长度或是宽度的一半的点归为该簇,将簇之间距离大于卷积窗的长度或是宽度的一半的点归为新的一簇,从而计算出所有簇的中心坐标;以及S105、将所述簇中累计权重最高的标签或是将置信度最高的标签输出作为唯一的标签。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于汪润春,未经汪润春许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610810458.2/,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序