[发明专利]基于想象的智能体神经网络在审

专利信息
申请号: 201880013648.9 申请日: 2018-05-22
公开(公告)号: CN110622174A 公开(公告)日: 2019-12-27
发明(设计)人: 丹尼尔·彼得·维尔斯特拉;李宇佳;拉兹万·帕什卡努;彼得·威廉·巴塔利亚;塞奥法尼·纪尧姆·韦伯;拉尔斯·比辛;戴维·保罗·赖克特;奥里奥尔·温亚尔斯;尼古拉斯·曼弗雷德·奥托·黑斯;塞巴斯蒂安·亨利·拉卡涅雷 申请(专利权)人: 渊慧科技有限公司
主分类号: G06N3/04 分类号: G06N3/04;G06N3/08;G06N3/00
代理公司: 11219 中原信达知识产权代理有限责任公司 代理人: 周亚荣;邓聪惠
地址: 英国*** 国省代码: 英国;GB
权利要求书: 查看更多 说明书: 查看更多
摘要: 提出了一种用于选择要由智能体执行的动作的神经网络系统,所述智能体与环境交互来执行任务以尝试实现指定的结果。系统可以包括用于接收状态数据和场境数据并且输出动作数据的控制器。系统还可以包括用于接收状态和动作数据并且输出结果状态数据的想象模块。系统还可以包括用于接收状态数据和场境数据并输出路线数据的管理器,所述路线数据定义系统是执行动作还是想象。系统还可以包括用于存储场境数据的存储器。
搜索关键词: 接收状态 智能体 场境 神经网络系统 存储器 定义系统 动作数据 环境交互 路线数据 输出动作 输出结果 输出路线 状态数据 控制器 存储场 管理器
【主权项】:
1.一种用于任务学习的神经网络系统,其中,所述神经网络系统被用于选择要由智能体执行的动作,所述智能体与环境交互来执行任务以尝试实现指定的结果,所述系统包括:/n控制器神经网络模块,所述控制器神经网络模块被配置为接收状态数据和场境数据并且输出动作数据,其中所述状态数据表征所述环境的真实状态或想象状态,其中所述场境数据定义用于规划动作的场境和所拟议的动作的场境,并且其中所述动作数据定义要对所述环境或所述环境的想象版本执行的真实动作或想象动作;/n模型神经网络模块,所述模型神经网络模块被配置为接收所述状态数据和所述动作数据并且输出结果状态数据和奖励数据,所述结果状态数据定义由所述动作数据定义的动作所导致的状态,所述奖励数据定义所建模的奖励;/n管理器网络模块,所述管理器网络模块被配置为接收所述状态数据和所述场境数据并输出路线数据,其中所述路线数据定义所述系统要执行动作还是进行想象;以及/n用于存储所述场境数据的存储器,其中所述场境数据至少是从以下导出的:(i)所述状态数据或所述结果状态数据、(ii)所述动作数据以及(iii)所述奖励数据。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于渊慧科技有限公司,未经渊慧科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201880013648.9/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top