专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果1个,建议您升级VIP下载更多相关专利
  • [发明专利]基于对偶循环神经网络的序贯决策方法、装置及设备-CN202310385862.X在审
  • 温正棋;黎苏亿 - 中科极限元(杭州)智能科技股份有限公司
  • 2023-04-12 - 2023-10-27 - G06N3/092
  • 本发明公开了一种基于对偶循环神经网络的序贯决策方法、装置及设备,方法包括:对经马尔可夫决策过程建模的策略对抗环境中的每个离散时间步#imgabs0#,接收策略对抗环境在#imgabs1#时刻的当前状态以及多个历史状态,并叠加得到叠加状态;利用对偶循环神经网络对所述叠加状态进行推理,计算出#imgabs2#时刻下的状态价值S及优势动作价值V,并生成每个动作的动作价值Q;基于当前状态,根据动作节点拓扑排序模块通过Min‑Max算法对所有动作进行局部收益计算,并根据所述局部收益以及约束规则生成动作掩码;根据动作价值Q以及动作掩码确定输出至策略对抗环境的最终动作;获取策略对抗环境给予各方的反馈,并进入到下一个离散时间步。本发明通过深度强化学习方法解决序贯决策问题。
  • 基于对偶循环神经网络决策方法装置设备

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top