[发明专利]卷积神经网络适用于识别多种尺寸图片的方法有效
申请号: | 201510966515.1 | 申请日: | 2015-12-21 |
公开(公告)号: | CN105389596B | 公开(公告)日: | 2018-05-29 |
发明(设计)人: | 袁家劼 | 申请(专利权)人: | 长沙网动网络科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京市盛峰律师事务所 11337 | 代理人: | 席小东 |
地址: | 410013 湖南省长沙市高新开发区*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 样本 卷积神经网络 分类识别 模型架构 整数倍 模型拓展 缩放处理 图片分割 图形识别 智能识别 连接层 小像素 构建 图片 | ||
本发明提供一种卷积神经网络适用于识别多种尺寸图片的方法,包括以下步骤:对待分类识别样本的长和宽分别进行缩放处理,以损失最小像素为代价,将待分类识别样本的原始长度缩放到样本C1长度的整数倍,将待分类识别样本的原始宽度缩放到样本C1宽度的整数倍;对样本C2进行图片分割处理,并建立全连接层;构建新的卷积神经网络模型架构。优点为:从而将一套已知模型架构参数的卷积神经网络模型拓展到不同尺寸的图形识别中,实现了快速有效的对任意尺寸样本进行智能识别的目的。
技术领域
本发明属于人工智能和模式识别技术领域,具体涉及一种卷积神经网络适用于识别多种尺寸图片的方法。
背景技术
卷积神经网络(Convolutional Neural Network,CNN)是一种前馈神经网络,与传统的BP神经网络相比,具有识别效率高、旋转缩放不变性好等优点,已在数字及人脸识别等各个领域得到了广泛的应用。
传统卷积神经网络模型的应用原理为:
首先,根据待输入图像的属性设计卷积神经网络模型架构,所设计的卷积神经网络模型架构为多层结构,包括1个输入层,在输入层之后,按各种顺序排布有若干个卷积层和若干个降采样层,最后为输出层。其中,输入层用于接收原始图像;每个卷积层包括多个相同尺寸的特征图,并且,每个特征图的像素,对应于前一层指定的若干特征图相应窗口位置的像素集合;每个降采样层包括多个相同尺寸的特征图,并且,降采样层的每张特征图,对应于前一层卷积层的一张特征图,降采样层的特征图像素对应于前一层相应特征图的采样区域。某一层节点与前一层节点和后一层节点之间通过边相互连接。
在搭建得到上述具有特定网络架构的卷积神经网络模型后,当需要识别某一图片时,需要对上述的卷积神经网络模型进行训练,训练过程为:初始化卷积神经网络模型的参数为随机值,包括:边的权重值以及卷积核的值等;然后,将训练样本输入卷积神经网络模型,对卷积神经网络模型反复“刺激”,不断调整边的权重值以及卷积核的值等,直到训练得到可识别该图片的卷积神经网络模型。在后续应用中,只需要将待分析图片或其他样本输入到训练好的卷积神经网络模型中,即可达到分类和智能识别的目的。
由此可见,卷积神经网络模型的应用主要包括两大步骤:第1个步骤为卷积神经网络模型架构的搭建过程;第2个步骤为:对所搭建的卷积神经网络模型架构进行训练的过程。
在采用卷积神经网络模型进行分类和智能识别中,卷积神经网络模型架构的搭建过程为基础过程,如果卷积神经网络模型架构搭建不成功,会导致后续训练过程无法收敛,因此,必需搭建得到一种可收敛可训练的卷积神经网络模型架构。
由于每一种卷积神经网络模型架构都是用于对特定尺寸样本的识别,因此,当用户需要对所需尺寸样本进行识别时,就必须搭建适合所需尺寸样本的卷积神经网络模型架构。但是,由于卷积神经网络模型架构通常较复杂,包括多种模型架构参数,例如:网络架构的总层数、卷积层数量、降采样层数量、卷积层和降采样层的排列顺序、卷积核尺寸和降采样比例等。并且,由于卷积神经网络模型架构参数无法通过现有的公式推导。因此,用户只能通过大量的实验和经验确定卷积神经网络模型架构参数,该方法不仅耗费用户大量的时间,并且,经过大量时间尝试后,所搭建得到的卷积神经网络模型架构还可能是不可训练和不可收敛的,无法达到对所需尺寸样本进行智能识别的目的。
此外,还有一种解决方法为:
由于现有技术已公开发表几种用于识别特定尺寸样本的卷积神经网络模型架构,例如,用于识别28*28尺寸图片;因此,如果用户需要识别的样本尺寸与28*28尺寸图片不符,例如,为64*128尺寸图片,此时,用户还可采用的方法为:将64*128尺寸图片缩小到28*28尺寸图片,然后,再采用已发表的卷积神经网络模型架构进行训练和识别。该种方法存在的主要问题为:虽然能够解决对待识别图片的分类识别目的,但是,由于需要对待识别图片进行缩放,会降低待识别图片的像素,增加后续模型训练的难度,也降低了图片识别的精度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长沙网动网络科技有限公司,未经长沙网动网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510966515.1/2.html,转载请声明来源钻瓜专利网。