专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果798149个,建议您升级VIP下载更多相关专利
  • [发明专利]一种强化训练方法及基于强化的决策方法-CN202011451511.7有效
  • 刘震;王闯;周兴;李华 - 广州优策科技有限公司
  • 2020-12-09 - 2021-10-15 - G06N3/08
  • 本发明提供一种强化训练方法及基于强化的决策方法,其中,强化模型训练方法,包括如下步骤:获取多组历史状态数据;将每一组历史状态数据输入至强化模型,得到初步决策数据;将所述每一组历史状态数据和所述初步决策数据输入至预先建立的贝叶斯神经网络模型,得到状态变化量以及奖励值,所述状态量变化值为当前状态数据与下一状态数据的差值;根据所述每一组历史状态数据以及对应的初步决策数据、状态变化量以及奖励值更新所述强化模型的模型参数。通过实施本发明,能够增加强化模型训练样本量,提高强化效果,提高动态决策规划结果的准确性。
  • 一种强化学习训练方法基于决策
  • [发明专利]控制方法以及医学系统-CN201910413304.3有效
  • 彭宇劭;汤凯富;张智威;林轩田 - 宏达国际电子股份有限公司
  • 2019-05-17 - 2022-07-26 - G16H50/20
  • 一种强化系统的控制方法包含下列步骤。强化系统获得有关互动系统的训练数据,互动系统与强化智能体互动。训练神经网络模型以最大化强化智能体对应多个序列行动所收集到的累积奖励,其中强化智能体使用神经网络模型从一系列的多个候选行动中挑选出所述序列行动。在神经网络模型的训练过程中,根据所述序列行动中的症状询问行动与确诊症状之间的比较结果提供累积奖励当中的多个辅助奖励给强化智能体。通过提供辅助奖励以鼓励强化智能体去选择症状询问行动当中潜在答案较有机会为是的询问行动,借此提高提出关键性询问行动的可能性。本公开还涉及一种医学系统。
  • 控制方法以及医学系统
  • [发明专利]强化系统及训练方法-CN202110265955.X在审
  • 彭宇劭;汤凯富;张智威 - 宏达国际电子股份有限公司
  • 2021-03-11 - 2021-09-14 - G06N20/00
  • 一种训练方法,适用于具有一奖励函数的一强化系统去训练一强化模型,且包含:定义该奖励函数的至少一奖励条件;决定相对应于该至少一奖励条件的至少一奖励值范围;藉由超参数最佳化演算法从该至少一奖励值范围中搜寻出至少一奖励值;以及根据该至少一奖励值训练该强化模型。本公开内容更提供一种强化系统用以执行该训练方法。在没有通过实验人工决定精确数值的情况下,强化系统可自动地决定与多种奖励条件相对应的多个奖励值。据此,训练强化模型的过程或时间可以缩短。藉由自动地决定与多种奖励条件相对应的多个奖励值,经由强化系统训练出来的强化模型有很大的机会拥有高的成功率,从而能选择合适的动作。
  • 强化学习系统训练方法
  • [发明专利]基于强化的遥感样本迁移方法-CN202210984607.2有效
  • 彭哲;段红伟;邹圣兵 - 北京数慧时空信息技术有限公司
  • 2022-08-17 - 2022-11-01 - G06V20/13
  • 本发明公开一种基于强化的遥感样本迁移方法,该方法包括:S1从第一影像和第二影像上分别获取第一样本集和第二样本集;S2构建包括样本筛选模块和任务模块的强化模型;S3基于地学知识分别对第一影像和第二影像进行适应性划分,得到第一影像和第二影像的地学参照数据;S4将所述第一样本集、所述第二样本集、第一影像的地学参照数据和第二影像的地学参照数据输入至所述强化模型,对所述强化模型进行迭代训练,得到训练好的强化模型;S5使用所述训练好的强化模型的任务模块对第二影像进行任务处理。该方法通过构建强化模型,并引入地学知识训练强化模型,实现了顾及遥感样本特性的从源域到目标域的样本迁移。
  • 基于强化学习遥感样本迁移方法
  • [发明专利]一种实时监测的强化可变时长信号灯控制方法-CN202210545093.0有效
  • 陈铭松;方则宽 - 华东师范大学
  • 2022-05-19 - 2023-07-28 - G08G1/01
  • 本发明公开了一种实时监测的强化可变时长信号灯控制方法,包括:通过事先安装于道路上的物联网设备采集道路上的实时交通数据生成新定义的压力信息;基于上述各个压力信息设计强化方法,生成强化状态;在每个路口配置一个强化智能体,并且设计一个监视属性,通过所述智能体实时判断当前相位下,路口监视属性是否到达阈值;并根据是否达到阈值确定是否对信号灯的相位进行调整;存储数据并通过强化智能体的回放机制来更新网络参数;各个路口配置的强化智能体通过当前道路情况控制交通信号灯的相位选择本发明能够提高强化代理的学习能力,快速获得优秀的信号灯控制策略,并且控制效果大大提升。
  • 一种实时监测强化学习可变信号灯控制方法
  • [发明专利]基于联邦强化的多路口智能交通信号灯控制方法及系统-CN202110779122.5有效
  • 陈铭松;叶豫桐;赵吴攀 - 华东师范大学
  • 2021-07-09 - 2022-10-25 - G08G1/07
  • 本发明提出了一种基于联邦强化的多路口智能交通信号灯控制方法,主要包含以下几方面的内容:步骤1:通过对真实路口的精准建模,使用交通模拟软件Cityflow对城市交通和交通流量进行模拟。步骤2:每个强化智能体使用Advantage Actor‑Critic(A2C)强化算法,根据路口车流情况对交通信号灯实时控制,每个交叉路口的强化智能体由云服务器协调训练;步骤3:提出一种新的基于云‑边协同的联邦强化框架;步骤4:引入类似联邦学习的梯度共享与参数传递过程,在强化智能体之间实现知识共享。本发明还提出了一种基于联邦强化的多路口智能交通信号灯控制系统。本发明法不仅在车辆平均行驶时间方面取得了较好的控制效果,而且能快速收敛到全局最优解。
  • 基于联邦强化学习路口智能交通信号灯控制方法系统
  • [发明专利]一种基于机理模型的故障特征强化提取方法-CN202310610846.6在审
  • 周磊;肖洪;林志富;游瑞;唐轲 - 西北工业大学
  • 2023-05-29 - 2023-09-29 - G06F18/213
  • 本发明属于航空发动机故障诊断技术领域,具体涉及一种基于机理模型的故障特征强化提取方法。具体技术方案为:构建高精度航空发动机叶片级性能仿真模型,将该模型作为强化智能体,搭建强化环境,在特定的航空发动机故障环境中训练强化模型,当该强化模型收敛,提取航空发动机故障特征,构建航空发动机故障特征库该模型能够模拟不同工作叶片故障,支持同一部件内不同级工作叶片故障的模拟与特征增强,实现航空发动机叶片级精细化诊断目标,同时利用强化自适应学习故障特征以解决故障样本少、无法得到未知故障特征的问题。
  • 一种基于机理模型故障特征强化学习提取方法

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top