[发明专利]一种用于解决灾难性遗忘问题的终生学习方法有效

专利信息
申请号: 202011141948.0 申请日: 2020-10-22
公开(公告)号: CN112257864B 公开(公告)日: 2022-08-16
发明(设计)人: 于元隆;刘子夜 申请(专利权)人: 福州大学
主分类号: G06N3/08 分类号: G06N3/08;G06N3/04
代理公司: 福州元创专利商标代理有限公司 35100 代理人: 陈明鑫;蔡学俊
地址: 350108 福建省福州市*** 国省代码: 福建;35
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 用于 解决 灾难性 遗忘 问题 终生 学习方法
【说明书】:

发明涉及一种用于解决灾难性遗忘问题的的终生学习方法。该方法包括:(1)借助旧求解器的编码网络,获得生成模型更新前后的特征信息;(2)对更新前的特征进行白化,并通过新旧特征的线性组合来获得鲁棒特征,用于构造变换矩阵对新特征白化,从而获得更新前后的正交特征信息;(3)依据风格迁移算法,利用Gram矩阵得到生成模型更新前后的正交风格信息,并通过融合正交风格一致性的损失项来更新生成模型;(4)基于知识蒸馏算法训练求解器与生成的伪数据配对来代表旧任务,与新数据混洗用于求解器的更新。本发明能够减轻生成模型中随着任务增加造成的生成模型的遗忘以及由于求解器独立训练造成的分类信息丢失的问题,从而达到解决神经网络以及人工智能(AI)系统开发存在的终生学习中的灾难性遗忘问题。

技术领域

本发明涉及人工智能技术领域,具体为一种用于解决灾难性遗忘问题的的终生学习方法。

背景技术

现实世界中运行的计算系统往往会遇到连续的信息流,或者由于存储限制或隐私问题而只能临时使用数据的情景,此时需要从动态数据分布中学习和记住多个任务,不断更新模型来适应新任务。但是,机器学习所建立的是无法随时间适应或扩展其行为的静态模型,当处理新任务时,需要对整个模型进行重新训练,此时更新后的模型不再适用于旧任务的处理。终生学习(lifelong learning)试图去模拟人类的行为,使得针对序列任务,模型不仅可以很好的处理当前任务,也要保留处理旧任务的能力,有记忆的保留之前学到的知识,并逐渐扩展用于未来任务的学习。但是通过随机梯度下降训练的深度神经网络模型从非平稳数据分布中获取增量可用信息通常会导致灾难性的遗忘或干扰,即:随着新任务或领域的增加,先前学习的任务或领域的性能不应(显著)随时间降低。终生学习中的灾难性遗忘问题对神经网络以及人工智能(AI) 系统的开发提出了长期的挑战。

现今试图去解决灾难性遗忘的方法中,具有最理想效果的主流方法是基于数据重现的方法。主要是通过储存少部分样本或压缩样本到生成模型中,与新任务数据混洗用于新模型的训练。最值得注意的是Rebuffi等人的工作,该方法依据类别存储旧任务中每个类的样例子集,计算新旧任务各自特征向量,通过最近均值分类算法取其类别标签。但是这个方法受到联合训练的限制。D.Lopez-Paz等人提出用约束优化来解决这个问题,为后向/向前传输留出了更多空间,该方法提出限制新任务的更新,使其不干扰先前的任务。R.Aljundi等人将此方法扩展到了没有任务界限的在线的连续学习环境。然而,这些方法需要存储样本,随着任务的增加而造成存储容量的爆炸。

近年来,生成模型已经显示出生成高质量图像的能力,为建模数据生成分布和对生成的示例进行再训练提供了可能性。因此,Hanul Shin等人为了解决以上问题,提出generative replay(GR)的方法,在生成对抗网络(GAN)框架中训练了一个深度生成模型,以模仿过去的数据。然后将生成的数据与过去任务求解器的配对来表示旧任务。生成器-求解器对可以根据需要生成大量伪数据对,与新数据混洗来更新模型。该框架可用于涉及隐私问题的各种实际情况。但是基于生成模型的重现算法,需要生成模型的不断更新,性能极大的依赖于生成模型的质量。其存在的主要难点有:

(1)生成模型的遗忘

通过使用随机梯度下降技术训练的生成模型,随着任务序列的增加,在生成模型中压缩旧任务的数据,将慢慢忘记以前记住的分布。即遗忘发生在生成模型中,导致生成的数据不能表示先前任务的数据分布,这使得试图模拟联合训练的重现的方法不能很好的解决终生学习中的灾难性遗忘问题。

(2)求解器的误差传递

不同任务的求解器是独立训练的,因此新求解器无法保留先前学习的分类知识。另外,由生成器-求解器对产生的伪标签是one-hot形式,丢失了类别之间的分布信息。

发明内容

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011141948.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top