[发明专利]基于强化学习的足球机器人防守策略在审
申请号: | 201910541349.9 | 申请日: | 2019-06-21 |
公开(公告)号: | CN110280019A | 公开(公告)日: | 2019-09-27 |
发明(设计)人: | 李汉辉;梁志伟 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | A63F13/67 | 分类号: | A63F13/67;A63F13/812;G06F17/50;G06K9/62;G06N7/06 |
代理公司: | 南京正联知识产权代理有限公司 32243 | 代理人: | 张玉红 |
地址: | 210033 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 基于强化学习的足球机器人防守策略,基于半场进攻平台HFO环境和TD算法的足球机器人防守策略,所述HFO环境建立在RoboCup 2D仿真平台的基础之上;所述TD算法对防守角色的机器人进行强化学习,利用值函数的更新来优化策略,帮助机器人选择效果更佳的动作来提高球权占有率;然后在TD算法中加入通讯来提高强化学习的效率,利用广播来传递机器人状态‑动作等实时信息,加速算法收敛,提升机器人的协作防守效率。 | ||
搜索关键词: | 强化学习 足球机器人 算法 机器人 传递机器人 机器人选择 仿真平台 环境建立 加速算法 实时信息 优化策略 球权 收敛 占有率 角色 更新 广播 通讯 协作 帮助 | ||
【主权项】:
1.基于强化学习的足球机器人防守策略,基于半场进攻平台HFO环境和TD算法的足球机器人防守策略,其特征在于:所述HFO环境建立在RoboCup 2D仿真平台的基础之上;所述TD算法对防守角色的机器人进行强化学习,利用值函数的更新来优化策略,帮助机器人选择效果更佳的动作来提高球权占有率;然后在TD算法中加入通讯来提高强化学习的效率,利用广播来传递机器人状态‑动作等实时信息,加速算法收敛,提升机器人的协作防守效率。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910541349.9/,转载请声明来源钻瓜专利网。