[发明专利]连续状态空间智能体构建方法有效
申请号: | 202211134442.6 | 申请日: | 2022-09-19 |
公开(公告)号: | CN115212575B | 公开(公告)日: | 2022-12-20 |
发明(设计)人: | 武文;董润铮;孟庆超;王俊杰 | 申请(专利权)人: | 南京惠积信息科技有限公司 |
主分类号: | A63F13/57 | 分类号: | A63F13/57;A63F13/63;A63F13/837 |
代理公司: | 北京久维律师事务所 11582 | 代理人: | 邢江峰 |
地址: | 210000 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 连续 状态 空间 智能 构建 方法 | ||
1.一种连续状态空间智能体构建方法,其特征在于,包括:
获取游戏日志数据,所述游戏日志数据包括输入数据和输出数据;所述输入数据包括多个时间节点下的敌人位置信息、角色方向角和角色位置信息,所述输出数据包括在与输入数据相同的时间节点下,玩家控制角色做出的键盘鼠标操作信息;
对所述输入数据和输出数据进行数字化处理,组成多层复合数据结构;所述多层复合数据结构中,底层为时间节点组成的时间序列,中层为空间位置组成的路径数据,顶层为搜索树来加快搜索速度;
取数个历史时间节点构成第一时间序列,将当前时间节点下智能体的空间位置作为所述第一时间序列的特征值;
对所述特征值在搜索树中进行搜索,得到与所述特征值的差距小于临界值且长度与第一时间序列相同的第二时间序列;
比较所述第一时间序列与所述第二时间序列的加权平均方差;
根据所述加权平均方差,在第二时间序列中取得与第一时间序列的最近邻时间节点,将所述最近邻时间节点作为下一个时间节点输出;
比较所述第一时间序列与所述第二时间序列的加权平均方差,包括:
将第一时间序列与第二时间序列中的每一个时间节点求闵可夫斯基距离,并按照与当前时间节点的时间间隔对所述每一个时间节点赋予权重;
采用以下公式计算所述闵可夫斯基距离:
其中,δ表示闵可夫斯基距离,dx表示两个对应的时间节点的空间维度的对应差值,若空间维度为3维,设两个时间节点的空间维度分别为(x0,y0,z0),(x1,y1,z1),则dx0表示x1-x0,dx1表示y1-y0,dx2表示z1-z0,当p=1时为曼哈顿距离,当p=2时为欧氏距离,k表示空间维度。
2.如权利要求1所述的连续状态空间智能体构建方法,其特征在于,所述方法还包括智能体异常状态处理:
判断智能体移动速度计算值是否符合预期;
如果智能体移动速度计算值不符合预期,利用多层复合数据结构中包含的空间位置对智能体当前位置进行矫正,或者临时使用随机值进行处理。
3.如权利要求2所述的连续状态空间智能体构建方法,其特征在于,所述方法还包括响应互动状态:
对不同角色的输出和过程量进行综合判断,判断为可互动状态则对智能体执行动作空间中指定的互动动作。
4.如权利要求3所述的连续状态空间智能体构建方法,其特征在于,在第一人称射击游戏中,响应互动状态的整个流程为:预测敌人位置,根据智能体与敌人的相对位置,计算智能体的射击角度,智能体偏转至射击角度后进行瞄准,执行开火动作,更新状态。
5.如权利要求4所述的连续状态空间智能体构建方法,其特征在于,所述射击角度计算公式如下:
式中,P表示垂直方向角,垂直方向的0°方向为xy平面方向;Y表示水平方向角,水平方向的0°方向为x轴方向;dx、dy、dz分别表示智能体和敌人的空间位置对应维度的差值。
6.如权利要求5所述的连续状态空间智能体构建方法,其特征在于,所述方法还包括:
构建第一轻量级目标检测网络,输入实时游戏画面;
根据实时游戏画面对其中的人物进行识别并得到人物在画面中的位置,由此进行智能体发现敌人和触发瞄准射击的决策。
7.如权利要求6所述的连续状态空间智能体构建方法,其特征在于,所述方法还包括:
构建第二轻量级目标检测网络,输入实时双通道游戏声音,根据实时双通道游戏声音对声源所在方向进行定位,辅助智能体发现敌人。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京惠积信息科技有限公司,未经南京惠积信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211134442.6/1.html,转载请声明来源钻瓜专利网。