[发明专利]包括用于生成环境中的实体之间的数据编码关系的关系网络的强化学习系统在审
申请号: | 201980032397.3 | 申请日: | 2019-05-20 |
公开(公告)号: | CN112272831A | 公开(公告)日: | 2021-01-26 |
发明(设计)人: | 李宇佳;V.C.巴普斯特;V.扎姆巴尔迪;D.N.拉波索;A.A.桑托罗 | 申请(专利权)人: | 渊慧科技有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/00;G06N3/08 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 金玉洁 |
地址: | 英国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 提出了一种用于强化学习的神经网络系统,包括用于从状态数据中为环境中存在或至少潜在存在的多个实体中的每个实体提取相应实体数据的输入网络。实体数据描述实体。神经网络包含用于解析该数据的关系网络,该关系网络包括一个或多个注意力块,这些注意力块可以被堆叠以对实体数据执行连续的动作。每个注意力块包括用于实体中的每一个的相应变换网络。每个实体的变换网络能够基于多个其它实体的数据,将变换网络为该实体接收的数据变换为该实体的修改后实体数据。输出网络被布置成接收由关系网络输出的数据,并使用所接收的数据来选择相应动作(例如,来自可能动作的预定义空间中的动作)。 | ||
搜索关键词: | 包括 用于 生成 环境 中的 实体 之间 数据 编码 关系 网络 强化 学习 系统 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于渊慧科技有限公司,未经渊慧科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201980032397.3/,转载请声明来源钻瓜专利网。