[发明专利]一种基于增量学习的材料吸声系数回归方法及系统在审
申请号: | 202210406214.3 | 申请日: | 2022-04-18 |
公开(公告)号: | CN115034354A | 公开(公告)日: | 2022-09-09 |
发明(设计)人: | 武星;王弘业;钱权 | 申请(专利权)人: | 上海大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06N20/00 |
代理公司: | 上海申汇专利代理有限公司 31001 | 代理人: | 翁若莹;柏子雵 |
地址: | 200436*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 增量 学习 材料 吸声 系数 回归 方法 系统 | ||
1.一种基于增量学习的材料吸声系数回归方法,其特征在于,包括以下步骤:
S100、加载上一次增量学习阶段学习到的模型参数Wpre、惩罚系数Fpre和样本回放池Mpre,定义当前一次增量学习阶段的模型参数W由Wpre赋值,惩罚系数F由Fpre赋值;
S200、根据批量大小将训练集进行批量划分得到批量训练数据集合D(n),n表示当前批量训练数据集合中的批量训练数据数目,同时设置当前一次增量学习阶段的训练轮数Nepoch;
S300、对模型进行Nepoch轮训练;
每轮训练中,对于批量训练数据集合D(n)中的每一个批量训练数据,基于步骤S100所得到的模型参数W以及上一次增量学习阶段学习到惩罚系数Fpre和样本回放池Mpre进行小批量梯度下降,对均方误差损失函数和惩罚损失函数进行反向梯度传播,同时更新模型参数W和惩罚系数F;
S400、对训练集进行水库采样,将采样得到的样本Mnow与上一次增量学习阶段的样本回放池Mpre合并得到新的样本回放池M;
S500、将当前一次增量学习阶段学习到的模型参数W、惩罚系数F和样本回放池M进行保存,以便下一阶段更新模型的时候不会忘记旧知识,达到缓解灾难性遗忘的问题。
2.如权利要求1所述的一种基于增量学习的材料吸声系数回归方法,其特征在于,步骤S100中,若当前一次增量学习阶段是首次增量学习,则对模型参数W进行随机初始化,惩罚系数F进行零初始化,样本回放池M为空。
3.如权利要求1所述的一种基于增量学习的材料吸声系数回归方法,其特征在于,对于批量训练数据集合D(n)中的第i个批量训练数据Di,步骤S300具体包括以下步骤:
S301、对样本回放池Mpre进行随机采样得到旧样本Dpre;
S302、将旧样本Dpre和第i个批量训练数据Di进行合并得到作为训练数据;
S303、将训练数据输入回归模型中得到预测值
S304、重复步骤301至步骤S303直至遍历批量训练数据集合D(n)中的每个批量训练数据,基于每个批量训练数据自身的真实和通过步骤303得到的预测值计算均方误差损失Ltrain,如下式所示:
式中,表示第i个批量训练数据Di自身的真实值
S305、根据步骤S304中获得的均方误差损失Ltrain进行梯度的反向传播,从而更新模型参数W,W的更新计算公式为:
式中,为模型参数W在均方误差中的梯度,ηw表示模型学习率,Ltrain(W)表示均方误差损失;
S306、根据梯度更新当前一次增量学习阶段的惩罚系数F,惩罚系数F的更新计算公式为:
式中,α为遗忘平衡参数;
S307,根据上一次增量学习阶段学习到的模型参数Wpre、惩罚系数Fpre计算惩罚损失Lpenalty,如下式所示:
式中,λ为权重;表示第i个参数的惩罚系数;Wi表示当前模型的第i个参数;Wipre表示上一次增量学习阶段学习到的模型的第i个参数;
S308、根据步骤S307获得的惩罚损失Lpenalty进行梯度的反向传播,从而更新模型参数W,W的更新计算公式为:
式中,为模型参数W在惩罚损失中的梯度,Lpenalty(W,Wpre,Fpre)表示惩罚损失。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海大学,未经上海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210406214.3/1.html,转载请声明来源钻瓜专利网。