[发明专利]一种基于增强学习智能算法的航海船舶运动控制方法有效

专利信息
申请号: 201711426992.4 申请日: 2017-12-26
公开(公告)号: CN108181900B 公开(公告)日: 2020-11-24
发明(设计)人: 袁银龙;俞祝良 申请(专利权)人: 华南理工大学
主分类号: G05D1/02 分类号: G05D1/02
代理公司: 广州市华学知识产权代理有限公司 44245 代理人: 王东东
地址: 510640 广*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于增强学习智能算法的航海船舶运动控制方法,包括:利用多模态传感器采集船舶的各类重要数据;对获取的数据信息进行滤波及融合处理,得到满足精度要求的各种状态数据,包括:船舶的姿态信息,船舶实际位置、船舶速度、海面风速、洋流速度等;通过评估函数对实际状态数据进行评估,得到当前时刻的奖赏值;通过增强学习智能算法不断的学习,最终得到在不同的环境状态条件下船舶的运动控制规律。本发明船舶运动控制方法,是不依赖于环境模型的一种优化算法,相比较传统的运动控制算法,控制更加灵活,并且可以在使用中持续优化学习。
搜索关键词: 一种 基于 增强 学习 智能 算法 航海 船舶 运动 控制 方法
【主权项】:
1.一种基于增强学习智能算法的航海船舶运动控制方法,其特征在于,包括如下步骤:S1船舶上安装多模态传感器,周期性采集当前t时刻的传感器数据信息;S2对传感器数据信息,进行滤波及归一化处理,归一化后处理后的环境状态信息为:式中,ct为当前t时刻的船舶姿态信息,pt为当前t时刻的船舶实际位置信息,为当前t时刻的船舶速度信息,为当前t时刻的海面风速信息,为当前t时刻的洋流速度信息,σt为其他多模态传感器的数据;S3根据动作‑状态值函数Q(St,a|θ)得到当前时刻t的运动控制动作at;S4执行S3得到的动作at,得到t+1时刻的状态数据信息S5通过评估函数对t+1时刻状态数据进行评估,得到当前时刻的奖赏值:Rt+1=f(St+1)式中,函数f是自定义的评价函数;S6通过最小化损失函数L(θ)来更新网络参数θ:其中γ为折扣因子;S7循环迭代上述步骤,直到网络参数θ达到收敛,即网络参数达到稳定,终止。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201711426992.4/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top