[发明专利]无人机决策模型训练方法、使用方法、设备及介质有效
申请号: | 202111503559.2 | 申请日: | 2021-12-09 |
公开(公告)号: | CN114239392B | 公开(公告)日: | 2023-03-24 |
发明(设计)人: | 袁银龙;焦朋朋;许亚龙;程赟;桑小虎;华亮;李俊红 | 申请(专利权)人: | 南通大学 |
主分类号: | G06F30/27 | 分类号: | G06F30/27;G06N3/045;G06N3/08;G06Q10/0637;G06Q50/26 |
代理公司: | 深圳市力道知识产权代理事务所(普通合伙) 44507 | 代理人: | 贺小旺 |
地址: | 226000*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 无人机 决策 模型 训练 方法 使用方法 设备 介质 | ||
本申请公开了一种无人机决策模型训练方法、使用方法、设备及介质,训练方法包括:获取第一无人机的第一态势信息与第二无人机的第二态势信息;根据第一态势信息与第二态势信息生成第一融合信息并输入待训练模型的评估层网络,评估层网络基于第一策略生成分值期望,待训练模型的决策层网络根据分值期望生成第二策略并基于第二策略生成第一动作指令;向第一无人机发送第一动作指令,并获取第一无人机的第三态势信息与第二无人机的第四态势信息;将根据第三态势信息与第四态势信息生成的第二融合信息输入评估层网络以更新第一策略,直至待训练模型训练完成,得到无人机决策模型,通过该模型提升无人机的适应能力、实现无人机决策的自主化与智能化。
技术领域
本申请涉及无人机技术领域,尤其涉及一种无人机决策模型训练方法、使用方法、设备及介质。
背景技术
目前,无人机在军事领域的应用十分广泛,尤其在战场环境分析、无人机群组作战等方面都发挥着重要作用,而在无人机群组作战的应用中,无人机完成任务作业的自主性是其中的关键因素。
但当前无人机群在实际的作战对抗时不够智能而且场景适应性差,需要一定程度的人工干预,导致无人机群在复杂的作战环境中难以作出准确的动作决策无法连续执行复杂的战斗作业。
因此,如何训练无人机决策模型以提升无人机的作战场景适应能力,以及实现无人机进行动作决策与动作执行的自主化、智能化,是本领域技术人员正在研究的热门课题。
发明内容
本申请提供一种无人机决策模型训练方法、使用方法、设备及介质,旨在通过训练无人机决策模型并使用该决策模型提升无人机的适应能力,以及实现无人机进行动作决策与动作执行的自主化、智能化。
第一方面,本申请提供了一种无人机决策模型训练方法,包括:
向第一无人机发送初始化指令,以使第一无人机根据初始化指令采集第一无人机的第一态势信息与第二无人机的第二态势信息;
获取第一态势信息与第二态势信息,并根据第一态势信息与第二态势信息生成第一融合信息;
将第一融合信息输入待训练模型的评估层网络,评估层网络基于预设的第一策略生成与第一融合信息对应的分值期望;
待训练模型的决策层网络根据分值期望生成第二策略,并基于第二策略生成与第一融合信息对应的第一动作指令;
向第一无人机发送第一动作指令,以使第一无人机根据第一动作指令执行第一动作并在执行第一动作后采集第一无人机的第三态势信息以及第二无人机的第四态势信息;
获取第一无人机采集的第三态势信息与第四态势信息,并根据第三态势信息与第四态势信息生成第二融合信息;
将第二融合信息输入评估层网络以更新第一策略,直至待训练模型训练完成,得到无人机决策模型。
可选的,将第二融合信息输入评估层网络以更新第一策略之后,还包括:
将第二融合信息输入评估层网络,评估层网络基于更新后的第一策略生成与第二融合信息对应的优化期望;
决策层网络根据优化期望更新第二策略,并基于更新后的第二策略生成与第二融合信息对应的第二动作指令;
向第一无人机发送第二动作指令,以使第一无人机根据第二动作指令执行第二动作并在执行第二动作后采集第一无人机的第五态势信息以及第二无人机的第六态势信息;
获取第一无人机采集的第五态势信息与第六态势信息,并根据第五态势信息与第六态势信息生成第三融合信息;
将第三融合信息输入评估层网络以更新第一策略。
可选的,获取第一态势信息与第二态势信息,并根据第一态势信息与第二态势信息生成第一融合信息,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南通大学,未经南通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111503559.2/2.html,转载请声明来源钻瓜专利网。