[发明专利]一种机器学习神经网络模型优化方法、系统与设备在审
| 申请号: | 202111408777.8 | 申请日: | 2021-11-24 |
| 公开(公告)号: | CN114202059A | 公开(公告)日: | 2022-03-18 |
| 发明(设计)人: | 张智军;李钟希;任肖辉 | 申请(专利权)人: | 华南理工大学 |
| 主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06N20/00;G06F17/13 |
| 代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 周春丽 |
| 地址: | 510640 广*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 机器 学习 神经网络 模型 优化 方法 系统 设备 | ||
1.一种机器学习神经网络模型优化方法,其特征在于,包括以下步骤:
1)建立机器学习中的神经网络模型,建立非凸损失函数,并将非凸损失函数转化为非凸非线性规划模型;
2)将步骤1)中的非凸非线性规划模型进行局部近似二次规划,得到局部近似二次规划模型,并使用变参收敛微分神经动力学设计方法得到用于求解局部近似二次规划模型的变参收敛微分神经网络模型;
3)结合双时间尺度网络和步骤2)中的变参收敛微分神经网络模型,得到双时间尺度收敛微分模型;
4)结合粒子群算法的思想和步骤3)中的双时间尺度收敛微分模型,得到群体探索神经动态网络;
5)调用并求解步骤4)中得到的群体探索神经动态网络,得到的最优值作为步骤1)中非凸损失函数的最优参数;
6)将步骤5)中得到的最优参数返回给下位机,优化机器学习中的神经网络模型。
2.根据权利要求1所述的一种机器学习神经网络模型优化方法,其特征在于,步骤2)中,所述非凸非线性规划模型为
s.t.h(x)=0
g(x)≤0#(1)
其中,x∈Rn为非凸损失函数的参数,f:Rn→R是非凸损失函数,h:Rn→Rm表示可微的等式约束,g:Rn→Rp为可微的不等式约束,R表示实数,Rn表示n维实数,Rm表示m维实数,Rp表示p维实数。
3.根据权利要求2所述的一种机器学习神经网络模型优化方法,其特征在于,对非凸非线性规划模型进行求解,首先对每个点x都有一个非线性规划模型的局部近似二次规划模型
其中,y∈Rn为一个指示下降方向的方向向量,Q(x)∈Rn×n是一个近似二次规划模型的Lagrange函数的Hessian矩阵的对称正定矩阵,代表梯度符号;局部近似二次规划模型重写为
s.t.Ay=b
Cy≤d#(3)
其中,Q=Q(x)、b=-h(x)、d=-g(x);
其中,采用公式(2)的局部近似二次规划模型的的KKT条件来求解公式(3):
其中,和表示Lagrange乘子,算子表示Hadamard积,y*表示优化问题的一个解。
4.根据权利要求3所述的一种机器学习神经网络模型优化方法,其特征在于,将公式(4)的KKT条件替换为带有平滑Fischer-Burmeister函数的KKT条件:
其中σ表示一个接近于0的正数。
5.根据权利要求1所述的一种机器学习神经网络模型优化方法,其特征在于,步骤3)中所述变参收敛微分网络模型为
其中,γZ表示时间尺度变量,ψ(·)表示激活函数,表示z的导数,diag表示一个向量的对角矩阵,表示Hadamard除法,μE,μI均表示Lagrange乘丁,I表示单位矩阵。
6.根据权利要求1所述的一种机器学习神经网络模型优化方法,其特征在于,步骤3)中所述双时间尺度收敛微分模型表示为如下的形式:
其中,Ψ为线性激活函数,γx与γz为不同的时间尺度变量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111408777.8/1.html,转载请声明来源钻瓜专利网。





