[发明专利]一种无人直升机模型在线学习方法及系统有效
| 申请号: | 202010476465.X | 申请日: | 2020-05-29 |
| 公开(公告)号: | CN111753464B | 公开(公告)日: | 2022-07-15 |
| 发明(设计)人: | 康宇;王雪峰;张倩倩;吕文君 | 申请(专利权)人: | 中国科学技术大学 |
| 主分类号: | G06F30/27 | 分类号: | G06F30/27;G06F30/15;G06N3/04;G06N3/08 |
| 代理公司: | 合肥天明专利事务所(普通合伙) 34115 | 代理人: | 闫客 |
| 地址: | 230026*** | 国省代码: | 安徽;34 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 无人 直升机 模型 在线 学习方法 系统 | ||
1.一种无人直升机模型在线学习方法,其特征在于,包括:
根据固定世界参考坐标系和以无人直升机质心为原点建立的随体坐标系,构建具有不确定项的无人直升机模型;
利用无人直升机历史飞行数据对两个残差卷积子网络进行训练,得到训练好的两个子网络;
利用训练好的两个子网络和动态哈达玛积层构建深度持续学习网络模型;
利用深度持续学习网络模型学习无人直升机模型中的不确定项,实现在线动态学习无人直升机模型;
所述构建的具有不确定项的无人直升机模型为:
其中,r=[x,y,z]T为无人直升机的位置,其中右上标T表示向量转置,q=[q1,q2,q3,q4]T为姿态四元数表示,v=[vx,vy,vz]T,ω=[ωx,ωy,ωz]T分别为随体坐标系中直升机线速度与角速度,为直升机位置r对时间的导数,为直升机姿态对时间导数,分别为直升机线加速度与角加速度,将线速度、角速度、线加速度、角加速度组成一个向量称之为直升机状态变量,u=[u1,u2,u3,u4]为控制输入,β表示所述深度持续学习网络模型权重参数,C12为参考系变换矩阵,g为重力加速度,为位姿导数变换矩阵,fv(s,u,β)是未知的线加速度,fω(s,u,β)是未知的角加速度,两者表示为直升机状态变量s、控制量u、及深度持续学习网络模型权重参数β的函数形式,所述构建的深度持续学习网络用于学习f的参数化表示。
2.如权利要求1所述的无人直升机模型在线学习方法,其特征在于,在所述利用无人直升机历史飞行数据对两个残差卷积子网络进行训练,得到训练好的两个子网络之前,还包括:
对所述无人直升机历史飞行数据进行预处理,并将预处理后的数据划分为训练数据集和测试数据集;
相应地,所述利用无人直升机历史飞行数据对两个残差卷积子网络进行训练,得到训练好的两个子网络,具体为:
利用训练数据集对两个残差卷积子网络进行训练,得到训练好的两个子网络。
3.如权利要求2所述的无人直升机模型在线学习方法,其特征在于,所述对所述无人直升机历史飞行数据进行预处理,并将预处理后的数据划分为训练数据集和测试数据集,包括:
采用zero-score方法对所述历史飞行数据x进行标准化处理,得到归一化后样本x';
将归一化后的样本中的动作状态数据与控制数据分别按照设定的时长从起始时间逐步滑动生成动作状态数据轨迹片段和控制数据轨迹片段;
将动作状态数据轨迹片段中前m1个时间步数据和控制数据轨迹片段中前m1个时间步数据一起作为历史信息数据,将控制数据轨迹片段中后m2个时间步数据作为未来控制输入数据,将动作状态数据轨迹片段中后m3个时间步数据作为未来状态真实标签;
将归一化后的样本数据按照设定的比例划分为训练数据集和测试数据集。
4.如权利要求3所述的无人直升机模型在线学习方法,其特征在于,所述利用训练数据集对两个残差卷积子网络进行训练,得到训练好的两个子网络,包括:
从所述训练数据集中分别随机抽取样本构成子训练数据集Di,i=1,2;
利用Xavier初始化方法初始化所述两个残差卷积子网络的权值,使权值满足均匀分布;
在两个子训练数据集分别迭代训练所述两个残差卷积子网络N个回合,得到训练好的两个子网络在训练过程中损失函数采用均方差函数,所述两个残差卷积子网络的参数更新采用Adam更新方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010476465.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于水蓄能的热源塔热泵系统的运行方法
- 下一篇:螺钉锁紧装置





