|
钻瓜专利网为您找到相关结果 798149个,建议您 升级VIP下载更多相关专利
- [发明专利]控制方法以及医学系统-CN201910413304.3有效
-
彭宇劭;汤凯富;张智威;林轩田
-
宏达国际电子股份有限公司
-
2019-05-17
-
2022-07-26
-
G16H50/20
- 一种强化学习系统的控制方法包含下列步骤。强化学习系统获得有关互动系统的训练数据,互动系统与强化学习智能体互动。训练神经网络模型以最大化强化学习智能体对应多个序列行动所收集到的累积奖励,其中强化学习智能体使用神经网络模型从一系列的多个候选行动中挑选出所述序列行动。在神经网络模型的训练过程中,根据所述序列行动中的症状询问行动与确诊症状之间的比较结果提供累积奖励当中的多个辅助奖励给强化学习智能体。通过提供辅助奖励以鼓励强化学习智能体去选择症状询问行动当中潜在答案较有机会为是的询问行动,借此提高提出关键性询问行动的可能性。本公开还涉及一种医学系统。
- 控制方法以及医学系统
- [发明专利]强化学习系统及训练方法-CN202110265955.X在审
-
彭宇劭;汤凯富;张智威
-
宏达国际电子股份有限公司
-
2021-03-11
-
2021-09-14
-
G06N20/00
- 一种训练方法,适用于具有一奖励函数的一强化学习系统去训练一强化学习模型,且包含:定义该奖励函数的至少一奖励条件;决定相对应于该至少一奖励条件的至少一奖励值范围;藉由超参数最佳化演算法从该至少一奖励值范围中搜寻出至少一奖励值;以及根据该至少一奖励值训练该强化学习模型。本公开内容更提供一种强化学习系统用以执行该训练方法。在没有通过实验人工决定精确数值的情况下,强化学习系统可自动地决定与多种奖励条件相对应的多个奖励值。据此,训练强化学习模型的过程或时间可以缩短。藉由自动地决定与多种奖励条件相对应的多个奖励值,经由强化学习系统训练出来的强化学习模型有很大的机会拥有高的成功率,从而能选择合适的动作。
- 强化学习系统训练方法
- [发明专利]基于强化学习的遥感样本迁移方法-CN202210984607.2有效
-
彭哲;段红伟;邹圣兵
-
北京数慧时空信息技术有限公司
-
2022-08-17
-
2022-11-01
-
G06V20/13
- 本发明公开一种基于强化学习的遥感样本迁移方法,该方法包括:S1从第一影像和第二影像上分别获取第一样本集和第二样本集;S2构建包括样本筛选模块和任务模块的强化学习模型;S3基于地学知识分别对第一影像和第二影像进行适应性划分,得到第一影像和第二影像的地学参照数据;S4将所述第一样本集、所述第二样本集、第一影像的地学参照数据和第二影像的地学参照数据输入至所述强化学习模型,对所述强化学习模型进行迭代训练,得到训练好的强化学习模型;S5使用所述训练好的强化学习模型的任务模块对第二影像进行任务处理。该方法通过构建强化学习模型,并引入地学知识训练强化学习模型,实现了顾及遥感样本特性的从源域到目标域的样本迁移。
- 基于强化学习遥感样本迁移方法
|