|
钻瓜专利网为您找到相关结果 51个,建议您 升级VIP下载更多相关专利
- [发明专利]一种第三方数控机床接入服务平台的方法及装置-CN202111187395.7有效
-
徐炫辉;尤鸣宇
-
同济大学
-
2021-10-12
-
2023-09-26
-
G05B13/02
- 本发明公开了一种第三方数控机床接入服务平台的方法及装置,其方法包括获取历史数据,并基于历史数据确定算法的输入、输出以及奖励函数;将算法的输入、输出以及奖励函数带入信赖域策略优化算法中进行强化学习,更新信赖域策略优化算法的策略参数;采用自我行为克隆加速强化学习的收敛,获取更新后的策略参数,基于更新后的策略参数更新信赖域策略优化算法;获取数控机床运行的当前数据,并基于当前数据确定算法的当前输入,将算法的当前输入带入更新后的信赖域策略优化算法得到算法的当前输出;根据算法的当前输出获取当前时间段运行的数据,并上传至服务平台;本发明能够有效解决第三方数控机床与服务平台数据通讯成本高的技术问题。
- 一种第三数控机床接入服务平台方法装置
- [发明专利]一种基于蒙特卡洛树探索的多智能体决策方法-CN202310090294.0在审
-
尤鸣宇;付豪;周洪钧;何斌
-
同济大学
-
2023-02-09
-
2023-06-23
-
G06N7/01
- 本发明提供一种基于蒙特卡洛树探索的多智能体决策方法,属于任务规划技术领域,包括1:基于分布式部分观测马尔可夫决策过程对多智能体决策任务进行建模;2:基于模型初始化蒙特卡洛树;3:在预设的时间内采用上限置信区间算法进行树内探索,采用随机策略对树外进行探索,拓展蒙特卡洛树节点,并根据产生的奖励更新蒙特卡洛树节点价值;4:根据已经构建的蒙特卡洛树进行多智能体决策,并对蒙特卡洛树进行剪枝,更新根节点的信念值,重复S3‑S4,直至任务完成。本发明中,采用在线探索方法,可以在有限的时间内取得Dec‑POMDP模型的近似解;对不同的智能体分别建立独立的蒙特卡洛树,降低了探索空间,加大了探索深度,提供了更好的求解质量。
- 一种基于蒙特卡洛树探索智能决策方法
- [发明专利]一种基于无监督图像编辑的多目标强化学习方法-CN202210469373.8在审
-
钱智丰;尤鸣宇
-
同济大学
-
2022-04-28
-
2022-09-20
-
B25J9/16
- 本发明涉及一种基于无监督图像编辑的多目标强化学习方法,包括:获取关于机器人控制场景的多目标任务数据集;训练对抗生成网络和特征空间编码器,将图像中与任务高度相关与不相关的因素进行解耦;对每个子空间对应全连接层的权重进行奇异值分解,获得贡献最大的若干个特征向量作为有语义信息的可编辑方向,并训练可编辑方向编码器来识别出可编辑方向的类别和尺度;基于可编辑方向编码器的输出得到图像的可编辑表征空间,作为控制策略网络的输入以及奖励函数的计算,同时通过在可编辑表征空间中可控地采样出各种目标任务来训练机器人,最终得到可完成多个目标的控制策略。与现有技术相比,本发明具有能够无监督解耦开任务相关因素、提升样本效率和泛化性能等优点。
- 一种基于监督图像编辑多目标强化学习方法
|