[发明专利]一种无人机自主降落方法、装置、电子设备及存储介质有效
申请号: | 202110747528.5 | 申请日: | 2021-07-02 |
公开(公告)号: | CN113359843B | 公开(公告)日: | 2023-06-20 |
发明(设计)人: | 滕雨橦;周俊琨;吉翔 | 申请(专利权)人: | 成都睿沿芯创科技有限公司 |
主分类号: | G05D1/10 | 分类号: | G05D1/10 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 唐正瑜 |
地址: | 610000 四川省成都市高新区中国(四川)自由贸易*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 无人机 自主 降落 方法 装置 电子设备 存储 介质 | ||
本申请提供一种无人机自主降落方法、装置、电子设备及存储介质,该方法包括:获取无人机的实时视频图像;计算实时视频图像与无人机预先存储的目标降落视频图像之间的相似度;通过强化学习策略网络根据相似度控制无人机的飞行方向和飞行速度,直到无人机成功降落至目标降落视频图像中的降落地点。通过使用强化学习策略网络根据实时视频图像与无人机预先存储的目标降落视频图像之间的相似度,来控制无人机的飞行方向和飞行速度,能够将实时视频中的连续图像相似度信息转换为无人机飞行方向和飞行速度的连续控制,有效地改善了无人机自主降落过程中飞行控制的连续性,从而提高了无人机自主降落的过程中飞行控制的稳定性。
技术领域
本申请涉及强化学习和无人机的技术领域,具体而言,涉及一种无人机自主降落方法、装置、电子设备及存储介质。
背景技术
无人机自主降落(Autonomous Landing of Unmanned Aerial Vehicle),又被称为无人机自动回收,是指一种用于无人机自动返回目标指定地点,并降落至目标指定地点的过程。
目前,针对无人机进行自主降落的方法通常是使用基于红外线锁定(InfraredRay Lock,IR-Lock)装置和激光雷达的自主降落方法,首先,人工地在目标降落地点放置红外线锁定(Infrared Ray,IR)信息标签,然后,无人机就可以通过激光雷达来搜索IR信息标签所在的大体范围,最后,利用IR-Lock传感器和IR信息标签实现无人机的自主降落。然而在具体的实践过程中发现,通过激光雷达和IR-Lock传感器获取的目标降落位置点有一定的误差,这种误差导致无人机自主降落的过程中对飞行速度控制的稳定性变差。
发明内容
本申请实施例的目的在于提供一种无人机自主降落方法、装置、电子设备及存储介质,用于改善无人机自主降落的过程中对飞行速度控制的稳定性变差的问题。
本申请实施例提供了一种无人机自主降落方法,包括:获取无人机的实时视频图像;计算实时视频图像与无人机预先存储的目标降落视频图像之间的相似度;通过强化学习策略网络根据相似度控制无人机的飞行方向和飞行速度,直到无人机成功降落至目标降落视频图像中的降落地点。在上述的实现过程中,通过使用强化学习策略网络根据实时视频图像与无人机预先存储的目标降落视频图像之间的相似度,来控制无人机的飞行方向和飞行速度,能够将实时视频中的连续图像相似度信息转换为无人机飞行方向和飞行速度的连续控制,有效地改善了无人机自主降落过程中飞行控制的连续性,从而提高了无人机自主降落的过程中飞行控制的稳定性。
可选地,在本申请实施例中,在通过强化学习策略网络根据相似度控制无人机的飞行方向和飞行速度之前,还包括:获取无人机视角下的第一实时图像;使用强化学习策略网络预测第一实时图像对应的飞行控制命令,以使无人机根据飞行控制命令进行控制飞行;在无人机根据飞行控制命令进行控制飞行之后,获取无人机视角下的第二实时图像;计算第二实时图像与无人机预先存储的目标降落视频图像之间的相似度;将相似度确定为强化学习策略网络的奖励值,并迭代更新强化学习策略网络的权重参数,直到强化学习策略网络的训练条件结束。在上述的实现过程中,通过将相似度确定为强化学习策略网络的奖励值,并迭代更新强化学习策略网络的权重参数,直到强化学习策略网络的训练条件结束,从而对强化学习策略网络进行有效地训练,能够将实时视频中的连续图像相似度信息转换为无人机飞行方向和飞行速度的连续控制,有效地改善了无人机自主降落过程中飞行控制的连续性,从而提高了无人机自主降落的过程中飞行控制的稳定性。
可选地,在本申请实施例中,获取无人机视角下的第一实时图像,包括:使用模拟器来模拟生成无人机视角下的第一实时图像;获取无人机视角下的第二实时图像,包括:使用模拟器根据飞行控制命令来模拟生成无人机视角下的第二实时图像。在上述的实现过程中,通过使用模拟器来模拟生成无人机视角下的第一实时图像,并使用模拟器根据飞行控制命令来模拟生成无人机视角下的第二实时图像,从而改善了难以在实际的环境中对无人机中的强化学习策略网络进行训练的问题,有效地减少了强化学习策略网络训练的时间,提高了强化学习策略网络训练的效率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都睿沿芯创科技有限公司,未经成都睿沿芯创科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110747528.5/2.html,转载请声明来源钻瓜专利网。