[发明专利]无人机决策模型训练方法、使用方法、设备及介质有效
申请号: | 202111503559.2 | 申请日: | 2021-12-09 |
公开(公告)号: | CN114239392B | 公开(公告)日: | 2023-03-24 |
发明(设计)人: | 袁银龙;焦朋朋;许亚龙;程赟;桑小虎;华亮;李俊红 | 申请(专利权)人: | 南通大学 |
主分类号: | G06F30/27 | 分类号: | G06F30/27;G06N3/045;G06N3/08;G06Q10/0637;G06Q50/26 |
代理公司: | 深圳市力道知识产权代理事务所(普通合伙) 44507 | 代理人: | 贺小旺 |
地址: | 226000*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 无人机 决策 模型 训练 方法 使用方法 设备 介质 | ||
1.一种无人机决策模型训练方法,其特征在于,所述方法包括:
向第一无人机发送初始化指令,以使所述第一无人机根据所述初始化指令采集所述第一无人机的第一态势信息与第二无人机的第二态势信息;
获取所述第一态势信息与所述第二态势信息,并根据所述第一态势信息与所述第二态势信息生成第一融合信息;
将所述第一融合信息输入待训练模型的评估层网络,所述评估层网络基于预设的第一策略生成与所述第一融合信息对应的分值期望;
所述待训练模型的决策层网络根据所述分值期望生成第二策略,并基于所述第二策略生成与所述第一融合信息对应的第一动作指令;
向所述第一无人机发送所述第一动作指令,以使所述第一无人机根据所述第一动作指令执行第一动作并在执行所述第一动作后采集所述第一无人机的第三态势信息以及所述第二无人机的第四态势信息;
获取所述第一无人机采集的所述第三态势信息与所述第四态势信息,并根据所述第三态势信息与所述第四态势信息生成第二融合信息;
将所述第二融合信息输入所述评估层网络以更新所述第一策略,直至所述待训练模型训练完成,得到无人机决策模型;
其中,所述第二态势信息是由多台所述第一无人机采集,所述根据所述第一态势信息与所述第二态势信息生成第一融合信息包括:
根据多台第一无人机采集的第二态势信息获取第二无人机的准确态势信息;
根据所述第一态势信息与所述准确态势信息生成对应第一无人机的第一融合信息。
2.根据权利要求1所述的方法,其特征在于,所述将所述第二融合信息输入所述评估层网络以更新所述第一策略之后,还包括:
将所述第二融合信息输入所述评估层网络,所述评估层网络基于更新后的所述第一策略生成与所述第二融合信息对应的优化期望;
所述决策层网络根据所述优化期望更新所述第二策略,并基于更新后的所述第二策略生成与所述第二融合信息对应的第二动作指令;
向所述第一无人机发送所述第二动作指令,以使所述第一无人机根据所述第二动作指令执行第二动作并在执行所述第二动作后采集所述第一无人机的第五态势信息以及所述第二无人机的第六态势信息;
获取所述第一无人机采集的所述第五态势信息与所述第六态势信息,并根据所述第五态势信息与所述第六态势信息生成第三融合信息;
将所述第三融合信息输入所述评估层网络以更新所述第一策略。
3.根据权利要求1所述的方法,其特征在于,所述获取所述第一态势信息与所述第二态势信息,并根据所述第一态势信息与所述第二态势信息生成第一融合信息,包括:
获取所述第一无人机采集的所述第一态势信息、与多台所述第一无人机采集的所述第二态势信息;
根据多台所述第一无人机采集的所述第二态势信息获取所述第二无人机的准确态势信息;
根据所述第一态势信息与所述准确态势信息生成对应所述第一无人机的所述第一融合信息。
4.根据权利要求3所述的方法,其特征在于,所述根据多台所述第一无人机采集的所述第二态势信息获取所述第二无人机的准确态势信息,包括:
解析所述第二态势信息获取所述第二无人机的第二位置信息与第二姿态信息;
根据多个所述第二位置信息确定所述第二无人机的准确位置信息;
获取多台所述第一无人机采集所述第二姿态信息的采集位置,并计算所述采集位置与所述准确位置信息的空间距离;
确定所述空间距离符合预设距离范围的采集位置,并根据所述采集位置对应的第二姿态信息确定所述第二无人机的准确姿态信息;
根据所述准确位置信息与所述准确姿态信息确定所述第二无人机的准确态势信息。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述将所述第二融合信息输入所述评估层网络以更新所述第一策略,包括:
根据所述第二融合信息确定所述第一动作指令对应的任务执行结果;
当所述任务执行结果为失败时,基于预设的评分函数并根据所述第二融合信息计算预评分信息;
根据所述预评分信息与预设的目标评分信息确定所述评估层网络输出所述分值期望的目标值,并根据所述第一融合信息与所述目标值调整所述第一策略。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南通大学,未经南通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111503559.2/1.html,转载请声明来源钻瓜专利网。