[发明专利]一种等变网络训练方法、装置、电子设备及存储介质有效

申请号：	202210080806.0	申请日：	2022-01-24
公开（公告）号：	CN114528976B	公开（公告）日：	2023-01-03
发明（设计）人：	陈智强;余山;陈阳	申请（专利权）人：	北京智源人工智能研究院
主分类号：	G06N3/04	分类号：	G06N3/04;G06N3/08;G06V10/82;G06V10/44;G06V10/764
代理公司：	北京辰权知识产权代理有限公司 11619	代理人：	付婧
地址：	100083 北京市海淀区***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种网络训练方法装置电子设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种等变网络训练方法、装置、电子设备及存储介质，方法包括：针对图像集中的每一图像，对图像进行目标群变换，将变换后的图像和图像输入等变网络进行学习，获取等变网络的输出损失；获取等变网络对图像学习的第一特征图和对变换后的图像学习的第二特征图，根据第一特征图和第二特征图确定等变损失；利用输出损失和等变损失对等变网络的参数进行优化。在不需要改变网络结构的基础上，通过在常规深度网络结构的损失函数中引入等变损失，并通过使用原始图像和经过目标群变换的图像输入网络，来引导网络学习目标变换群上的等变性，从而获得目标变换群的等变网络，避免了为特定的变换群人工设计对应的等变网络。

技术领域

本发明涉及人工智能技术领域，具体涉及一种等变网络训练方法、装置、电子设备及存储介质。

背景技术

通常，图像中可视对象的旋转、缩放等变换，会改变可视对象的外观，这样就会给神经网络带来很大的学习空间。目前可行的解决途径是增强神经网络的解耦能力，获得更紧凑的潜在学习空间，卷积神经网络具有内在的平移解耦能力，不管对象在输入中的位置如何，都能够学习到基本特征。为了进一步提高网络的解耦能力，有人提出了群等变理论和旋转群等变网络。

现有的等变网络主要依靠人工设计，然而这种人工设计的方式只能在简单的等变群上达到等变效果，很多复杂的变换群上很难人工设计出对应的等变网络。这就限制了在更加复杂的变换群上的等变网络发挥作用，并且人工设计负担也比较大。

发明内容

本发明的目的是针对上述现有技术的不足提出的一种等变网络训练方法、装置、电子设备及存储介质，该目的是通过以下技术方案实现的。

本发明的第一方面提出了一种等变网络训练方法，所述方法包括：

针对训练图像集中的每一图像，对所述图像进行目标群变换，将变换后的图像和所述图像输入预先构建的等变网络进行学习，并获取所述等变网络的输出损失；

获取所述等变网络对所述图像学习的第一特征图和对所述变换后的图像学习的第二特征图，并根据所述第一特征图和所述第二特征图确定等变损失；

在所述等变网络不满足收敛条件时，利用所述输出损失和所述等变损失对所述等变网络的参数进行优化。

在本申请的一些实施例中，所述根据所述第一特征图和所述第二特征图确定等变损失，包括：

对所述第一特征图进行目标群变换；利用变换后的第一特征图和所述第二特征图确定等变损失。

在本申请的一些实施例中，所述利用变换后的第一特征图和所述第二特征图确定等变损失，包括：

将变换后的第一特征图与所述第二特征图之间的等变度量误差确定为等变损失。

在本申请的一些实施例中，所述利用所述输出损失和所述等变损失对所述等变网络的参数进行优化，包括：