[发明专利]一种用于解决灾难性遗忘问题的终生学习方法有效
申请号: | 202011141948.0 | 申请日: | 2020-10-22 |
公开(公告)号: | CN112257864B | 公开(公告)日: | 2022-08-16 |
发明(设计)人: | 于元隆;刘子夜 | 申请(专利权)人: | 福州大学 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/04 |
代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 陈明鑫;蔡学俊 |
地址: | 350108 福建省福州市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 解决 灾难性 遗忘 问题 终生 学习方法 | ||
1.一种用于解决灾难性遗忘问题的终生学习方法,其特征在于,包括如下步骤:
步骤S1:将生成器更新前后的生成数据输入求解器编码部分,得到模型更新前后的新旧特征,并计算对应特征均值向量;
步骤S2;对特征均值向量进行重组,并依据重组特征均值向量构造白化的变换矩阵,得到模型更新前后的正交特征;所述步骤S2具体包括:
步骤S21:利用生成模型更新前的特征均值向量μt-1,构造对应变换矩阵进行白化,获得模型更新前的正交特征;
步骤S22:将新旧特征均值向量μt、μt-1进行线性组合,可得t时刻稳定的特征均值向量:μt=k1μt-1+k2μt;
步骤S23:基于步骤S22获得的特征均值向量,构造对应转换矩阵进行白化,获得生成模型更新后的正交特征;
步骤S3:基于正交特征获得生成模型更新前后的正交风格信息;
步骤S4:融合正交风格一致性的损失项来更新生成模型,生成可以代表旧任务的伪数据;
所述步骤S3中基于正交特征获得生成模型更新前后的正交风格信息以及步骤S4中融合正交风格一致性的损失项来更新生成模型的具体实现方式如下:
在得到更新前后图像的正交特征后,依据风格迁移算法,利用Gram矩阵得到在卷积层l下,更新前后图像的正交特征各自的正交风格表示形式Gl(x′t-1)和Gl(x′t),同时可得卷积层l对总正交风格损失的贡献为:
并且总的正交风格损失为:
其中是每个层对第t个任务中总损失的贡献的加权因子,L为求解器中卷积层的总数;
具有Nl个不同过滤器的网络层l具有Nl个特征图,每个特征图的大小为Ml,其中Ml是特征图的高度乘以宽度;网络层l中的正交风格信息存储在矩阵中,其中是第l层中的第i个过滤器的位置j的激活值;
在特征图中,每个数字都来自在相应位置处卷积的相应过滤器;特征相关性由中的Gram矩阵Gl给出,其中是矢量化特征图i和j之间的内积;Gram矩阵的非对角元素表示两个滤波输出特征之间的相关性,对角元素反映每个出现在图像中的滤波输出特征的值;通过利用构建在网络不同层上的正交风格特征空间捕获正交样式信息,获得图像的多尺度风格表示;
第t个任务下生成器的损失为生成模型的损失与正交风格损失的和,使得生成模型在更新的过程中保留图像稳定的正交风格信息;
其中,为生成对抗模型的损失,γ是正交风格损失的权重;
步骤S5:基于知识蒸馏算法训练求解器与生成的伪数据配对来代表旧任务,与新数据混洗用于求解器的更新;所述步骤S5具体包括:
训练求解器solver:
在任务t时刻中,让在任务增量步骤t-1中的求解器St-1作为教师模型;以教师模型St-1来指导学生模型St的学习,使得学生模型St在学习新任务同时维持已知任务的性能;任务t时刻的知识蒸馏损失:
其中y和是任务增量步骤t时刻St-1和St的预测矢量,N为St-1中类别数,是记录的概率和当前概率的修改版本:
T是温度;
通过在训练新任务时增加蒸馏损失来减轻先前任务的遗忘,在t时刻处求解器更新的损失为:
其中是当前任务的分类损失,β是蒸馏损失的权重。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011141948.0/1.html,转载请声明来源钻瓜专利网。