[发明专利]基于想象的智能体神经网络在审

申请号：	201880013648.9	申请日：	2018-05-22
公开（公告）号：	CN110622174A	公开（公告）日：	2019-12-27
发明（设计）人：	丹尼尔·彼得·维尔斯特拉;李宇佳;拉兹万·帕什卡努;彼得·威廉·巴塔利亚;塞奥法尼·纪尧姆·韦伯;拉尔斯·比辛;戴维·保罗·赖克特;奥里奥尔·温亚尔斯;尼古拉斯·曼弗雷德·奥托·黑斯;塞巴斯蒂安·亨利·拉卡涅雷	申请（专利权）人：	渊慧科技有限公司
主分类号：	G06N3/04	分类号：	G06N3/04;G06N3/08;G06N3/00
代理公司：	11219 中原信达知识产权代理有限责任公司	代理人：	周亚荣;邓聪惠
地址：	英国***	国省代码：	英国;GB
权利要求书：	查看更多	说明书：	查看更多
摘要：	提出了一种用于选择要由智能体执行的动作的神经网络系统，所述智能体与环境交互来执行任务以尝试实现指定的结果。系统可以包括用于接收状态数据和场境数据并且输出动作数据的控制器。系统还可以包括用于接收状态和动作数据并且输出结果状态数据的想象模块。系统还可以包括用于接收状态数据和场境数据并输出路线数据的管理器，所述路线数据定义系统是执行动作还是想象。系统还可以包括用于存储场境数据的存储器。
搜索关键词：	接收状态智能体场境神经网络系统存储器定义系统动作数据环境交互路线数据输出动作输出结果输出路线状态数据控制器存储场管理器
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种用于任务学习的神经网络系统，其中，所述神经网络系统被用于选择要由智能体执行的动作，所述智能体与环境交互来执行任务以尝试实现指定的结果，所述系统包括：/n控制器神经网络模块，所述控制器神经网络模块被配置为接收状态数据和场境数据并且输出动作数据，其中所述状态数据表征所述环境的真实状态或想象状态，其中所述场境数据定义用于规划动作的场境和所拟议的动作的场境，并且其中所述动作数据定义要对所述环境或所述环境的想象版本执行的真实动作或想象动作；/n模型神经网络模块，所述模型神经网络模块被配置为接收所述状态数据和所述动作数据并且输出结果状态数据和奖励数据，所述结果状态数据定义由所述动作数据定义的动作所导致的状态，所述奖励数据定义所建模的奖励；/n管理器网络模块，所述管理器网络模块被配置为接收所述状态数据和所述场境数据并输出路线数据，其中所述路线数据定义所述系统要执行动作还是进行想象；以及/n用于存储所述场境数据的存储器，其中所述场境数据至少是从以下导出的：(i)所述状态数据或所述结果状态数据、(ii)所述动作数据以及(iii)所述奖励数据。/n

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于渊慧科技有限公司，未经渊慧科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201880013648.9/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06N 基于特定计算模型的计算机系统
G06N3-00 基于生物学模型的计算机系统
G06N3-02 .采用神经网络模型
G06N3-12 .采用遗传模型
G06N3-04 ..体系结构，例如，互连拓扑
G06N3-06 ..物理实现，即神经网络、神经元或神经元部分的硬件实现
G06N3-08 ..学习方法

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于想象的智能体神经网络在审

专利文献下载