[发明专利]面向模块船运动特性分析的深度强化学习黑箱辨识方法有效

专利信息
申请号: 202310298470.X 申请日: 2023-03-24
公开(公告)号: CN116011350B 公开(公告)日: 2023-08-11
发明(设计)人: 朱曼;张家辉;文元桥;曹继宁;肖长诗 申请(专利权)人: 武汉理工大学三亚科教创新园;武汉理工大学
主分类号: G06F30/27 分类号: G06F30/27;G06N20/00
代理公司: 北京中济纬天专利代理有限公司 11429 代理人: 王燕燕
地址: 572024 海南省三亚市*** 国省代码: 海南;46
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 面向 模块 船运 特性 分析 深度 强化 学习 黑箱 辨识 方法
【权利要求书】:

1.面向模块船运动特性分析的深度强化学习黑箱辨识方法,其特征在于,包括以下步骤:

步骤S1:根据模块船运动坐标系以及模块船的运动描述,确定六自由度模块船运动模型;

步骤S2:根据确定出的六自由度模块船运动模型以及模块船运动特性,获得用以描述模块船运动特性的平面三自由度运动模型;

步骤S3:根据预设高精确度模块船运动模型,模拟模块船操纵运动,并结合传感器移动情况下模块船运动模型结构变化特点,选取深度强化算法为辨识方法;

步骤S4:根据深度强化学习算法对模块化船舶运动的模型进行辨识,得到辨识结果;

步骤S5:根据预设的评价标准,从辨识结果中选择准确率最高的黑箱模型作为目标三自由度模块船运动特性分析模型;

所述步骤S3中,选取深度强化算法中的DDPG算法为辨识方法,DDPG算法包括Actor网络、Critic网络、Target Actor网络和Target Critic网络;

在训练阶段,从Replay Buffer中采样一个批次的模块船运动数据,采样到的数据为(s,a,s',done),其中,s为行为;s'为下一时刻的行为;a为奖惩值;done为状态,所述Critic网络的更新过程为:

利用Target Actor网络计算出状态s'下的模块船运动动作:

a'=μ'(s'|θμ′)

利用Target Critic网络计算出状态动作对(s,a)的目标值:

y=r+γ(1-done)Q'(s',a'|θQ′)

利用Critic网络计算出状态动作对(s,a)的评估值:

q=Q(s,a|θQ)

利用梯度下降算法最小化模块船运动预测数据与模块船运动真实数据之间的差值Lc,从而对Critic网络中的参数进行更新:

Lc=(y-q)2

所述Actor网络的更新过程为:

利用Actor网络计算出状态s下的动作:

anew=μ(s|θμ)

利用Critic网络计算出状态动作对(s,anew)的评估值:

qnew=Q(s,anewQ)

利用梯度上升算法最大化累积期望回报qnew,对Actor网络中的参数进行更新;

所述DDPG算法采用软更新方式对目标网络进行更新,具体为:

Target Actor网络的更新过程:

Target Critic网络的更新过程:

其中,为学习率,学习率

所述步骤S4中,模块船运动动力学建模中,输入包括当前时间步的状态变量和控制变量,输出包括下一时间步的状态变量,具体描述为:

其中,xs(t)为模块船状态向量;u(t)为当前时间步长模块船的纵荡速度;f(·)为非线性映射的矩阵形式;xs(t+1)为下一个时间步的状态向量,由欧拉法以时间步长h表示;

根据公式遵循非线性映射的函数,函数用作待识别的黑箱模型:

其中u(t)、v(t)、r(t)分别表示当前时间步长模块船的纵荡速度、横荡速度和转艏角速度;δ(t)表示当前时间步长舵角;n(t)表示当前时间步长模块船上传感器的数量;

所述步骤S4中,辨识结果包括三自由度模块船运动特性纵荡速度、横荡速度、转艏角速度和经纬度坐标;

所述步骤S5的具体操作为:

将提取出的建模所需模块船运动数据分为输入-输出两组,其中,输入量包括转艏角速度、横向速度、纵向速度、经纬度坐标、命令舵角和传感器的数量,输出量包括转艏角速度、横向速度、纵向速度和经纬度坐标;

将对应于各运动模型的输入量和输出量输入给深度强化学习黑箱模型,利用所用模块船运动的输入-输出数据和深度强化学习黑箱辨识算法对各三自由度运动模型进行辨识,并对简化运动模型进行辨识;

对比分析所有结果,根据评价标准,选取精确度最高的模型为最理想的简化三自由度模块船运动特性黑箱辨识模型。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉理工大学三亚科教创新园;武汉理工大学,未经武汉理工大学三亚科教创新园;武汉理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202310298470.X/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top