|
钻瓜专利网为您找到相关结果 1066586个,建议您 升级VIP下载更多相关专利
- [发明专利]确定执行设备的动作选择方针-CN202080004369.3在审
-
李辉;宋乐
-
支付宝(杭州)信息技术有限公司
-
2020-04-02
-
2021-03-19
-
A63F13/56
- 描述了计算机实现的用于生成促使执行设备完成任务的动作选择方针的方法、系统和装置,包括计算机可读介质。获得表示被划分为子任务序列的任务的数据。获得指定了针对所述子任务序列中的子任务的策略神经网络(SNN)的数据。SNN接收包括由达到所述子任务的初始状态的动作序列的输入,并预测所述执行设备针对所述子任务的动作选择方针。所述SNN是基于针对所述子任务序列中该子任务之后的下一个子任务的值神经网络(VNN)来训练的。确定向SNN的输入。所述输入包括达到所述子任务的子任务初始状态的动作序列。基于所述SNN的输出确定用于完成所述子任务的动作选择方针。
- 确定执行设备动作选择方针
|