专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果2个,建议您升级VIP下载更多相关专利
  • [发明专利]一种基于多任务思想下的深度强化学习交通灯控制方法-CN202310278110.3在审
  • 孔燕;曹任捷;杨智超 - 南京信息工程大学
  • 2023-03-21 - 2023-08-01 - G08G1/07
  • 本发明公开了一种基于多任务思想下的深度强化学习交通灯控制方法,将平衡压力作为奖励函数构建深度强化学习框架,对交通信号灯进行智能调控。与以往信号灯控制的方法不同的是,本发明保留了以往方法的优越性,增强了相邻路口之间的互相协作,更是在最大压力概念的基础上更科学地平衡了各条出车道上的压力,从而更好地缓解了交通拥堵的情况,推进了智能交通的发展;本发明提出的一个交通灯控制算法TaskLight,它引用了多任务学习的思想,引入一种噪声机制并引入到了多任务学习框架,以此来权衡不同时间段每个任务的重要性程度。对于中心路口的效果更佳,对于缓解市中心路段的交通拥堵具有重要的现实意义。
  • 一种基于任务思想深度强化学习交通灯控制方法
  • [发明专利]一种基于目标导向的深度强化学习中优先经验回放方法-CN202310274087.0在审
  • 曹任捷;孔燕 - 南京信息工程大学
  • 2023-03-21 - 2023-05-30 - G06F9/48
  • 本发明公开了一种基于目标导向的深度强化学习中优先经验回放方法,步骤如下:对gym mountain_carv0的数据进行预处理;根据智能体小车在不同状态下与目标状态下的差异作为目标导向因子;利用DQN算法构建深度强化学习框架;根据行为值函数的TD‑error去量化经验的优先级的第一部分;将目标导向因子加入到优先级定义中成为优先级的第二部分,不断对整个网络进行更新,以求得到更好的结果。本发明保留了以往优先经验回放的优越性,也科学地完善了优先级的重新定义,对优先级的定义具有重要的参考意义;本发明提出的目标导向因子α,对于不同状态之间进行了合理的量化,对于经验回放中的优先级具有重要的研究意义。
  • 一种基于目标导向深度强化学习优先经验回放方法

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top