[发明专利]一种基于增强学习智能算法的航海船舶运动控制方法有效
申请号: | 201711426992.4 | 申请日: | 2017-12-26 |
公开(公告)号: | CN108181900B | 公开(公告)日: | 2020-11-24 |
发明(设计)人: | 袁银龙;俞祝良 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G05D1/02 | 分类号: | G05D1/02 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 王东东 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于增强学习智能算法的航海船舶运动控制方法,包括:利用多模态传感器采集船舶的各类重要数据;对获取的数据信息进行滤波及融合处理,得到满足精度要求的各种状态数据,包括:船舶的姿态信息,船舶实际位置、船舶速度、海面风速、洋流速度等;通过评估函数对实际状态数据进行评估,得到当前时刻的奖赏值;通过增强学习智能算法不断的学习,最终得到在不同的环境状态条件下船舶的运动控制规律。本发明船舶运动控制方法,是不依赖于环境模型的一种优化算法,相比较传统的运动控制算法,控制更加灵活,并且可以在使用中持续优化学习。 | ||
搜索关键词: | 一种 基于 增强 学习 智能 算法 航海 船舶 运动 控制 方法 | ||
【主权项】:
1.一种基于增强学习智能算法的航海船舶运动控制方法,其特征在于,包括如下步骤:S1船舶上安装多模态传感器,周期性采集当前t时刻的传感器数据信息;S2对传感器数据信息,进行滤波及归一化处理,归一化后处理后的环境状态信息为:
式中,ct为当前t时刻的船舶姿态信息,pt为当前t时刻的船舶实际位置信息,
为当前t时刻的船舶速度信息,
为当前t时刻的海面风速信息,
为当前t时刻的洋流速度信息,σt为其他多模态传感器的数据;S3根据动作‑状态值函数Q(St,a|θ)得到当前时刻t的运动控制动作at;S4执行S3得到的动作at,得到t+1时刻的状态数据信息
S5通过评估函数对t+1时刻状态数据进行评估,得到当前时刻的奖赏值:Rt+1=f(St+1)式中,函数f是自定义的评价函数;S6通过最小化损失函数L(θ)来更新网络参数θ:
其中γ为折扣因子;S7循环迭代上述步骤,直到网络参数θ达到收敛,即网络参数达到稳定,终止。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711426992.4/,转载请声明来源钻瓜专利网。