[发明专利]规则生成方法、装置、电子设备和存储介质有效
| 申请号: | 202010491559.4 | 申请日: | 2020-06-02 |
| 公开(公告)号: | CN111723941B | 公开(公告)日: | 2021-09-24 |
| 发明(设计)人: | 徐新海;张峰;李渊;张帅;李晟泽;刘逊韵 | 申请(专利权)人: | 中国人民解放军军事科学院战争研究院 |
| 主分类号: | G06N20/00 | 分类号: | G06N20/00 |
| 代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 李文清 |
| 地址: | 100091 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 规则 生成 方法 装置 电子设备 存储 介质 | ||
本发明实施例提供一种规则生成方法、装置、电子设备和存储介质,其中方法包括:将任一目标智能体在地理坐标系下的地理状态信息和地理行动信息,转换为以所述任一目标智能体为原点的相对坐标系下的相对状态信息和相对行动信息;对每一目标智能体的相对状态信息和相对行动信息进行关联规则挖掘,生成状态行动关联规则。本发明实施例提供的方法、装置、电子设备和存储介质,实现了从博弈对抗过程产生的海量数据中自动生成状态行动关联规则,生成的关联规则具有通用性,相比于人工方式,提高了规则生成的效率和准确性。
技术领域
本发明涉及人工智能技术领域,具体涉及一种规则生成方法、装置、电子设备和存储介质。
背景技术
近年来,随着人工智能技术不断发展,基于强化学习的自主博弈对抗日益受到广泛关注。通过对博弈双方对抗过程的分析,并以产生式规则的形式描述自主博弈决策背后的逻辑,能够增强强化学习决策行为的解释性。
现有的产生式规则生成方式主要分为人工总结和自动生成两种方式。面对大量的博弈对抗过程数据,使用人工总结方式生成产生式规则,对个人经验依赖程度高、效率低下并且错误率高。此外,博弈对抗数据与特定的任务场景高度关联,直接从某一具体对抗过程中挖掘得到的规则难以迁移到不同但相似的另一任务中应用,导致规则不具有通用性。
发明内容
本发明实施例提供一种规则生成方法、装置、电子设备和存储介质,用以解决现有的规则生成方法不能从博弈对抗数据中挖掘到具有通用性的关联规则的问题。
第一方面,本发明实施例提供一种规则生成方法,包括:
将任一目标智能体在地理坐标系下的地理状态信息和地理行动信息,转换为以所述任一目标智能体为原点的相对坐标系下的相对状态信息和相对行动信息;所述任一目标智能体的地理状态信息包括所述任一目标智能体的当前地理位置坐标、所述任一目标智能体的队友智能体的当前地理位置坐标和对方智能体的当前地理位置坐标,所述任一目标智能体的地理行动信息包括所述任一目标智能体的目标地理位置坐标;
对每一目标智能体的相对状态信息和相对行动信息进行关联规则挖掘,生成状态行动关联规则。
可选地,所述将任一目标智能体在地理坐标系下的地理状态信息和地理行动信息,转换为以所述任一目标智能体为原点的相对坐标系下的相对状态信息和相对行动信息,具体包括:
将任一目标智能体在地理坐标系下的地理状态信息,转换为以所述任一目标智能体为原点的相对坐标系下的相对状态信息;所述相对状态信息包括各其余智能体相对于所述任一目标智能体的对抗关系和当前相对位置信息;
将任一目标智能体在地理坐标系下的地理行动信息,转换为以所述任一目标智能体为原点的相对坐标系下的相对行动信息;所述相对行动信息包括所述任一目标智能体的目标相对位置信息。
可选地,所述相对坐标系下的相对位置信息是以所述任一目标智能体为原点的相对子区域中的一个;所述相对子区域是对以所述任一目标智能体为原点的三维区域进行划分得到的。
可选地,所述相对子区域具体是以所述任一目标智能体的运动方向为参照方向,对以所述任一目标智能体为原点的三维区域进行划分得到的。
可选地,所述将任一目标智能体在地理坐标系下的地理状态信息,转换为以所述任一目标智能体为原点的相对坐标系下的相对状态信息,具体包括:
基于所述任一目标智能体的当前地理位置坐标,以及任一其余智能体的当前地理位置坐标,确定所述任一其余智能体相对于所述任一目标智能体的差向量;
基于所述任一目标智能体的速度向量,以及所述任一其余智能体相对于所述任一目标智能体的差向量,确定所述任一其余智能体所属的子区域作为所述任一其余智能体的当前相对位置信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军军事科学院战争研究院,未经中国人民解放军军事科学院战争研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010491559.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种服装设计用打孔钳
- 下一篇:人体动作识别结果的评价方法、装置和电子设备





