[发明专利]一种控制永磁同步直线电机的方法及系统在审
| 申请号: | 201910399548.0 | 申请日: | 2019-05-14 |
| 公开(公告)号: | CN110323981A | 公开(公告)日: | 2019-10-11 |
| 发明(设计)人: | 张振宇;张昱;陈丽;林利彬;张东波;秦昊;凌翔;刘智;杨瑞;魏千洲;王晓旭 | 申请(专利权)人: | 广东省智能制造研究所 |
| 主分类号: | H02P21/00 | 分类号: | H02P21/00;H02P25/064;G05B11/42 |
| 代理公司: | 广州容大专利代理事务所(普通合伙) 44326 | 代理人: | 刘新年 |
| 地址: | 510000 广东省广*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 永磁同步直线电机 强化学习算法 永磁直线电机 自适应控制 存储介质 高速稳定 控制系统 强化学习 数学模型 伺服控制 伺服系统 推力波动 性能品质 准确控制 控制器 并行性 鲁棒性 速度环 自适应 自学习 确定性 代理 环节 应用 | ||
1.一种控制永磁同步直线电机的方法,其特征在于,所述的方法具体包括如下步骤:
建立永磁直线电机数学模型;
通过深度确定性策略梯度方法对永磁同步直线电机的速度环进行自适应控制;
获得最优的强化学习代理,实现PID伺服系统的参数的自动调整。
2.根据权利要求1所述的一种控制永磁同步直线电机的方法,其特征在于,于步骤通过深度确定性策略梯度方法对永磁同步直线电机的速度环进行自适应控制中,还包括如下步骤:
通过actor-critic网络构建强化学习代理的框架;
以PID速度伺服系统为环境对象,获取激励函数的跟踪误差曲线;
实现PID参数自动调整;
具体地,PID控制器由以下方程设计:
其中,u(t)表示控制器t时刻输出信号,u(t-1)表示控制器t-1时刻输出信号,Δu(t)表示控制器输出增量,ki,kp,kd分别表示比例、积分、微分系数,e(t)表示给定值与实际输出反馈值之差,e(t-1)表示上一时刻给定值与实际输出反馈值之差,e(t-2)表示上上时刻给定值与实际输出反馈值之差,Δe(t)表示当前时刻误差与上一时刻误差之差,Δe(t-1)表示上一时刻误差与上上时刻误差之差,Δ2e(t)=Δe(t)-Δe(t-1)。
3.根据权利要求2所述的一种控制永磁同步直线电机的方法,其特征在于,于步骤通过actor-critic网络构建强化学习代理的框架中;
critic的动作值函数具体为:
Q(st,μ(st|θμ)|θQ) (2)
actor的动作值函数具体为:
μ(st|θμ) (3)
其中,θQ和θμ分别表示critic在线网络和actor在线网络的权重,st表示存储当前状态,μ表示actor在线网络策略,Q表示critic在线网络对μ策略的评估。
4.根据权利要求2所述的一种控制永磁同步直线电机的方法,其特征在于,于步骤通过actor-critic网络构建强化学习代理的框架中;
actor评估网络选择动作采用的函数为:
at=[kp,ki,kd]=μ(st|θμ)+Noise (4)
其中,at代表t时刻代理执行的动作即t时刻ki,kp,kd的值,ki,kp,kd分别表示比例、积分、微分系数,μ表示actor在线网络策略,st表示存储当前状态,θμ代表actor在线网络的权重,Noise代表随机OU噪声。
5.根据权利要求1所述的一种控制永磁同步直线电机的方法,其特征在于,于步骤通过深度确定性策略梯度方法对永磁同步直线电机的速度环进行自适应控制中,还包括如下步骤:
从存储器中取出部分随机样本,进而进行训练更新目标网络;
具体的学习过程函数为:
其中,yi代表目标网络,ri代表在i学习过程中的回报值,si+1代表i+1时刻存储状态,分别代表目标权重,γ代表折扣因子。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东省智能制造研究所,未经广东省智能制造研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910399548.0/1.html,转载请声明来源钻瓜专利网。





