[发明专利]一种基于增强学习智能算法的航海船舶运动控制方法有效

申请号：	201711426992.4	申请日：	2017-12-26
公开（公告）号：	CN108181900B	公开（公告）日：	2020-11-24
发明（设计）人：	袁银龙;俞祝良	申请（专利权）人：	华南理工大学
主分类号：	G05D1/02	分类号：	G05D1/02
代理公司：	广州市华学知识产权代理有限公司 44245	代理人：	王东东
地址：	510640 广***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种基于增强学习智能算法的航海船舶运动控制方法，包括：利用多模态传感器采集船舶的各类重要数据；对获取的数据信息进行滤波及融合处理，得到满足精度要求的各种状态数据，包括：船舶的姿态信息，船舶实际位置、船舶速度、海面风速、洋流速度等；通过评估函数对实际状态数据进行评估，得到当前时刻的奖赏值；通过增强学习智能算法不断的学习，最终得到在不同的环境状态条件下船舶的运动控制规律。本发明船舶运动控制方法，是不依赖于环境模型的一种优化算法，相比较传统的运动控制算法，控制更加灵活，并且可以在使用中持续优化学习。
搜索关键词：	一种基于增强学习智能算法航海船舶运动控制方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于增强学习智能算法的航海船舶运动控制方法，其特征在于，包括如下步骤：S1船舶上安装多模态传感器，周期性采集当前t时刻的传感器数据信息；S2对传感器数据信息，进行滤波及归一化处理，归一化后处理后的环境状态信息为：式中，c_t为当前t时刻的船舶姿态信息，p_t为当前t时刻的船舶实际位置信息，为当前t时刻的船舶速度信息，为当前t时刻的海面风速信息，为当前t时刻的洋流速度信息，σ_t为其他多模态传感器的数据；S3根据动作‑状态值函数Q(St,a|θ)得到当前时刻t的运动控制动作at；S4执行S3得到的动作a_t，得到t+1时刻的状态数据信息S5通过评估函数对t+1时刻状态数据进行评估，得到当前时刻的奖赏值：Rt+1＝f(St+1)式中，函数f是自定义的评价函数；S6通过最小化损失函数L(θ)来更新网络参数θ：其中γ为折扣因子；S7循环迭代上述步骤，直到网络参数θ达到收敛，即网络参数达到稳定，终止。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于华南理工大学，未经华南理工大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201711426992.4/，转载请声明来源钻瓜专利网。

上一篇：控制车辆行驶的方法、装置及存储介质
下一篇：一种无人驾驶的田间作业机械、作业装置及控制方法

同类专利

专利分类

G 物理

G05 控制；调节
G05D 非电变量的控制或调节系统
G05D1-00 陆地、水上、空中或太空中的运载工具的位置、航道、高度或姿态的控制，例如自动驾驶仪
G05D1-02 .二维的位置或航道控制
G05D1-04 .高度或深度的控制
G05D1-08 .姿态的控制，即摇摆、俯仰角或偏航角的控制
G05D1-10 .三维的位置或航道的同时控制
G05D1-12 .寻找目标的控制

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于增强学习智能算法的航海船舶运动控制方法有效

专利文献下载