[发明专利]无模型深度增强学习探索方法及装置有效
申请号: | 201711205687.2 | 申请日: | 2017-11-27 |
公开(公告)号: | CN107832836B | 公开(公告)日: | 2020-04-21 |
发明(设计)人: | 季向阳;张子函;张宏昌 | 申请(专利权)人: | 清华大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 北京林达刘知识产权代理事务所(普通合伙) 11277 | 代理人: | 刘新宇 |
地址: | 100084*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本公开涉及一种无模型深度增强学习探索方法及装置,所述方法包括:根据样本获取特征值;将所述特征值输入深度强化学习模型进行处理,得到动作价值;将所述特征值输入计数模型得到动作计数值;根据所述动作价值和所述动作计数值确定决策动作。通过选择不同执行次数的动作,在深度强化学习的探索过程中,更加全面的得到各动作的环境回报值,进而提高探索效率。 | ||
搜索关键词: | 模型 深度 增强 学习 探索 方法 装置 | ||
【主权项】:
一种无模型深度增强学习探索方法,其特征在于,所述方法包括:根据样本获取特征值;将所述特征值输入深度强化学习模型进行处理,得到动作价值;将所述特征值输入计数模型得到动作计数值;根据所述动作价值和所述动作计数值确定决策动作。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711205687.2/,转载请声明来源钻瓜专利网。