[发明专利]用于少样本故障诊断的具有自适应学习率的元学习方法在审
| 申请号: | 202210067075.6 | 申请日: | 2022-01-20 |
| 公开(公告)号: | CN114418117A | 公开(公告)日: | 2022-04-29 |
| 发明(设计)人: | 林焱辉;常亮 | 申请(专利权)人: | 北京航空航天大学 |
| 主分类号: | G06N20/00 | 分类号: | G06N20/00;G06K9/62;G06F30/27 |
| 代理公司: | 北京孚睿湾知识产权代理事务所(普通合伙) 11474 | 代理人: | 韩燕 |
| 地址: | 100191*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用于 样本 故障诊断 具有 自适应 学习 学习方法 | ||
本发明提供一种用于少样本故障诊断的具有自适应学习率的元学习方法,其包括以下步骤:确定相关超参数;对模型参数随机初始化;进行元训练包括:外循环迭代次数中嵌套内循环,在内循环迭代中,采样形成子任务,根据内循环中子任务的参数更新次数Γ计算得到参数计算样本的交叉熵损失,内循环结束后计算特征间多核最大均值差异并更新模型参数;进行精调循环包括:计算自适应的精调学习率,计算精调损失函数,最后得到用于目标任务故障诊断的模型并结束。本发明提出了用于元训练和精调的两种自适应学习率,并改进了元训练和精调的损失函数,解决了少样本学习中的过拟合和欠拟合问题,并且使模型具有更强的泛化能力。
技术领域
本发明涉及人工智能领域,尤其涉及一种用于少样本故障诊断的具有自适应学习率的元学习方法。
背景技术
机器设备的故障诊断对机器设备的安全运行和高效工作起着重要作用。随着深度学习技术的迅速发展,近年来基于深度学习的故障诊断方法得到了长足的发展。这些方法能够方便、快捷地实现准确的故障诊断,而不用依赖专家经验和耗时的人工特征提取操作。但是这些方法的成功依赖于大量的训练数据。否则,这些方法的效果将显著降低。然而,在实际情况中,收集足够的数据来训练故障诊断模型通常是昂贵甚至不切实际的。其中一个主要原因是,一旦机器设备出现故障,将被立即关闭以确保安全,这就导致仅能收集到少量故障数据。此外,与实验室中的机器设备不同,不能人为地在真实运行的机器设备中引入故障以获取故障数据。
为了应对用于训练故障诊断模型的数据不足的问题,当前主流方法包括三类:基于数据增强的方法、基于迁移学习的方法和少样本学习方法。基于数据增强的方法可以基于原始数据集生成新的数据从而增加数据量和多样性。然而,这类方法很难确保生成的数据的正确性和质量,特别是当真实原始数据极其有限时。因此,生成的样本无法提供足够有效的辅助信息。获取有效辅助信息的另一个方法是从其他不同但相关的任务(即辅助任务)中学习先验知识。为此,基于迁移学习的方法从相关但分布不同的辅助任务中学习知识,并迁移到目标任务中从而完成分类。然而,这类方法主要侧重于使模型能够适应于一个特定的目标任务。这类方法仍有进一步提高模型的泛化能力的空间,尤其是在数据量很有限的情况下。
比适应一个特定的目标任务更进一步,少样本学习方法从多个辅助任务中学习相关知识,以提高模型的泛化能力,从而能够适应于多个少样本目标任务,这就是元学习方法的思想。在故障诊断领域,机器设备经常在不同的工况下工作。虽然在每个工况下收集足够数量的数据是昂贵且不切实际的,但可以使用在不同工况下收集的数据来构成多个辅助任务。因此,将元学习方法应用于少样本故障诊断是合理且可行的。在基于度量的元学习方法中,由于辅助任务的分布之间存在的差异和数据的不足,很难提取到具有普遍性和区分度的特征,而且距离度量函数的选择也不便捷。与基于度量的元学习方法不同,模型无关元学习(MAML,Model-agnostic meta-learning)作为元学习方法的另一个类别,旨在通过元训练使模型具有更强的泛化能力,从而可以在使用来自目标任务的少量数据进行精调后,在目标任务上实现准确的分类。但是,如果目标任务的数据不足(尤其是每个类别只有一个样本可用时),则无法获得验证集。因此,在元训练和精调过程中,模型很容易过拟合或欠拟合。虽然可以通过退火元训练的学习率以缓解过拟合,但它只能单调地降低学习率,而不能动态调整学习率,这限制了它的有效性。因此学习率应根据模型性能进行动态调整,以解决过拟合和欠拟合问题。
发明内容
为了克服现有技术的缺陷,本发明提供一种用于少样本故障诊断的具有自适应学习率的元学习方法(MLALR,Meta-Learning with Adaptive Learning Rate),所述方法分为元训练和精调两个阶段,基于MAML框架对用于元训练和精调的两种学习率采用自适应学习率,并且改进了元训练和精调的损失函数,具体包括以下步骤:
S1,确定辅助任务目标任务外循环迭代次数J、内循环迭代次数P、内循环中子任务的参数更新次数Γ、以及精调的更新次数E;
S2,将模型参数随机初始化为θ0,设定第一循环变量j=1;设定第二循环变量e=1;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210067075.6/2.html,转载请声明来源钻瓜专利网。





