[发明专利]基于胶囊网络的图像分类方法、存储介质及电子设备有效
申请号: | 202011377744.7 | 申请日: | 2020-11-30 |
公开(公告)号: | CN112348119B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 何良华;任强;高世忠;孙振宇;王军 | 申请(专利权)人: | 华平信息技术股份有限公司;同济大学 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/764 |
代理公司: | 上海光华专利事务所(普通合伙) 31219 | 代理人: | 徐秋平 |
地址: | 200433 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 胶囊 网络 图像 分类 方法 存储 介质 电子设备 | ||
本发明提供一种基于胶囊网络的图像分类方法、存储介质及电子设备,所述基于胶囊网络的图像分类方法包括:获取待训练的图像集;将所述图像集划分为训练集和测试集;利用所述训练集训练分类胶囊网络模型,在训练过程中根据所述训练集中图像特征仿射变换后形成的图像预测胶囊进行路由迭代;将所述测试集输入所述分类胶囊网络模型中进行图像分类的性能测试。本发明提出了不涉及耦合系数参与训练的自适应路由方法,在路由的迭代过程中可以使胶囊自适应地改变自身的特征,使胶囊向更有判别性的方向偏移,避免在出现梯度消失问题的同时也提高了模型的性能。
技术领域
本发明属于深度神经网络的技术领域,涉及一种图像分类方法,特别是涉及一种基于胶囊网络的图像分类方法、存储介质及电子设备。
背景技术
深度学习是近几年人工智能领域研究的一个热点方向,面向不同任务的神经网络的提出,更是加速了这一领域的发展。传统的神经网络在训练的过程中,无法学习特征之间的空间关系。基于传统神经网络的这一缺点,提出了胶囊网络。胶囊网络的提出,解决传统的神经网络在训练模型的时候无法整体的考虑多个神经元之间特征的空间关系,从而造成了信息的丢失,同时胶囊网络也可以更好的模仿人类大脑的思维模式。
在许多的分类任务中,对目标作出判别的时候仅仅根据目标的特征,丢失了特征之间的位置关系。例如在人脸识别的时候,神经网络仅仅判断图像中有没有存在眼睛、鼻子、嘴巴等重要特征,但是特征之间的位置关系,胶囊网络模型是不关心的。胶囊网络中胶囊的存在可以将特征之间的位置关系编码到胶囊中,对任务的判别更加合理和准确。在现有技术中,胶囊网络模型的训练由动态路由算法实现,动态路由算法是Hinton提出的一种学习胶囊层之间参数的算法。在胶囊网络的训练过程中,通过动态路由算法可以学习相邻胶囊层之间对应胶囊的耦合系数,使得模型寻找到低层胶囊和高层胶囊的对应关系,因此胶囊网络得以正常工作。
在神经网络的研究进展中,一个提高网络模型性能很直接的方法就是使网络的层数加深。这样模型可以学习到更强的非线性变换的能力。但是基于动态路由算法的胶囊网络却无法简单的叠加多个胶囊层,因为动态路由算法中由于耦合系数的存在会对梯度起放缩的作用。当堆叠深层胶囊网络模型时,将会造成梯度消失现象,使得模型无法正常工作。
因此,如何提供一种基于胶囊网络的图像分类方法、存储介质及电子设备,以解决现有技术无法在利用胶囊网络进行图像分类时,避免胶囊网络迭代过程中的梯度消失等缺陷,成为本领域技术人员亟待解决的技术问题。
发明内容
鉴于以上所述现有技术的缺点,本发明的目的在于提供一种基于胶囊网络的图像分类方法、存储介质及电子设备,用于解决现有技术无法在利用胶囊网络进行图像分类时,避免胶囊网络迭代过程中的梯度消失的问题。
为实现上述目的及其他相关目的,本发明一方面提供一种基于胶囊网络的图像分类方法,所述基于胶囊网络的图像分类方法包括:获取待训练的图像集;将所述图像集划分为训练集和测试集;利用所述训练集训练分类胶囊网络模型,在训练过程中根据所述训练集中图像特征仿射变换后形成的图像预测胶囊进行路由迭代;其中,用于图像分类的分类胶囊网络模型叠加多个所述图像预测胶囊的特征;将所述测试集输入所述分类胶囊网络模型中进行图像分类的性能测试。
于本发明的一实施例中,所述在训练过程中根据所述训练集中图像特征仿射变换后形成的图像预测胶囊进行路由迭代的步骤包括:将所述训练集中的图像进行特征提取,获取特征图,将所述特征图进行堆叠形成基本图像特征;对所有的所述基本图像特征的维度进行仿射变换,以对所述基本图像特征的维度进行调整,使其与组合图像特征的维度相同;对维度调整后的所有基本图像特征进行组合,并将组合的特征进行激活处理,以得到激活后的胶囊特征;根据所述基本图像特征和所述激活后的胶囊特征形成组合图像特征,以通过前一层胶囊中图像特征的组合形成后一层胶囊的图像特征。
于本发明的一实施例中,将所述基本图像特征对应的矩阵定义为:其中,i表示基本图像特征所在的层数,n表示第n个特征图,表示第n个特征图上的第1个特征对应的损失函数值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华平信息技术股份有限公司;同济大学,未经华平信息技术股份有限公司;同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011377744.7/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序