[发明专利]基于梯度维持的图像分类方法、存储介质及电子设备在审
申请号: | 202011377685.3 | 申请日: | 2020-11-30 |
公开(公告)号: | CN112348118A | 公开(公告)日: | 2021-02-09 |
发明(设计)人: | 何良华;任强;施小春;李鹏飞;罗涛 | 申请(专利权)人: | 华平信息技术股份有限公司;同济大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04 |
代理公司: | 上海光华专利事务所(普通合伙) 31219 | 代理人: | 徐秋平 |
地址: | 200433 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 梯度 维持 图像 分类 方法 存储 介质 电子设备 | ||
本发明提供一种基于梯度维持的图像分类方法、存储介质及电子设备,所述基于梯度维持的图像分类方法包括:获取待训练的图像集;将所述图像集划分为训练集和测试集;利用所述训练集训练分类胶囊网络模型,且在训练过程中通过图像预测胶囊的路由梯度系数维持胶囊层叠加时的梯度稳定;将所述测试集输入所述分类胶囊网络模型中进行图像分类的性能测试。本发明在图像分类所用的胶囊网络模型中通过路由梯度系数维持梯度稳定。不仅在某种程度上抑制了梯度的消失,而且还可以适当的可以放大梯度并将梯度更平滑地扩展到模型前面的网络层,提高了胶囊网络模型的图像分类性能。
技术领域
本发明属于深度神经网络的技术领域,涉及一种图像分类方法,特别是涉及一种基于梯度维持的图像分类方法、存储介质及电子设备。
背景技术
深度学习是近几年人工智能领域研究的一个热点方向,面向不同任务的神经网络的提出,更是加速了这一领域的发展。传统的神经网络在训练的过程中,无法学习特征之间的空间关系。基于传统神经网络的这一缺点,提出了胶囊网络。胶囊网络的提出,解决传统的神经网络在训练模型的时候无法整体的考虑多个神经元之间特征的空间关系,从而造成了信息的丢失,同时胶囊网络也可以更好的模仿人类大脑的思维模式。
在许多的分类任务中,对目标作出判别的时候仅仅根据目标的特征,丢失了特征之间的位置关系。例如在人脸识别的时候,神经网络仅仅判断图像中有没有存在眼睛、鼻子、嘴巴等重要特征,但是特征之间的位置关系,胶囊网络模型是不关心的。胶囊网络中胶囊的存在可以将特征之间的位置关系编码到胶囊中,对任务的判别更加合理和准确。在现有技术中,胶囊网络模型的训练由动态路由算法实现,动态路由算法是Hinton提出的一种学习胶囊层之间参数的算法。在胶囊网络的训练过程中,通过动态路由算法可以学习相邻胶囊层之间对应胶囊的耦合系数,使得模型寻找到低层胶囊和高层胶囊的对应关系,因此胶囊网络得以正常工作。
在神经网络的研究进展中,一个提高网络模型性能很直接的方法就是使网络的层数加深。这样模型可以学习到更强的非线性变换的能力。但是基于动态路由算法的胶囊网络却无法简单的叠加多个胶囊层,因为动态路由算法中由于耦合系数的存在会对梯度起放缩的作用。当堆叠深层胶囊网络模型时,将会造成梯度消失现象,使得模型无法正常工作。
因此,如何提供一种基于梯度维持的图像分类方法、存储介质及电子设备,以解决现有技术无法在利用胶囊网络进行图像分类时,较大程度地维持梯度的稳定等缺陷,成为本领域技术人员亟待解决的技术问题。
发明内容
鉴于以上所述现有技术的缺点,本发明的目的在于提供一种基于梯度维持的图像分类方法、存储介质及电子设备,用于解决现有技术无法在利用胶囊网络进行图像分类时,较大程度地维持梯度的稳定的问题。
为实现上述目的及其他相关目的,本发明一方面提供一种基于梯度维持的图像分类方法,所述基于梯度维持的图像分类方法包括:获取待训练的图像集;将所述图像集划分为训练集和测试集;利用所述训练集训练分类胶囊网络模型,且在训练过程中通过图像预测胶囊的路由梯度系数维持胶囊层叠加时的梯度稳定;其中,所述分类胶囊网络模型叠加多个所述图像预测胶囊的特征;将所述测试集输入所述分类胶囊网络模型中进行图像分类的性能测试。
于本发明的一实施例中,所述在训练过程中通过图像预测胶囊的路由梯度系数维持胶囊层叠加时的梯度稳定的步骤包括:将所述训练集进行特征提取,获取特征图,将所述特征图进行堆叠形成所述基本图像特征;对所有的所述基本图像特征进行仿射变换后得到第一图像预测胶囊;对所有的所述基本图像特征对应的第一图像预测胶囊叠加,得到第一胶囊中间量,并将所述第一胶囊中间量进行压缩处理,得到第一激活胶囊特征;通过所述路由梯度系数与所述第一胶囊中间量的乘积对第二次迭代所用的第二胶囊中间量作近似处理,以在维持梯度稳定的基础上在第二次迭代时形成组合图像特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华平信息技术股份有限公司;同济大学,未经华平信息技术股份有限公司;同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011377685.3/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序