|
钻瓜专利网为您找到相关结果 57个,建议您 升级VIP下载更多相关专利
- [发明专利]一种移动机器人深度强化学习控制方法-CN202210207885.7在审
-
马宏宾;张华卿;金英
-
北京理工大学
-
2022-03-04
-
2022-06-14
-
G06N3/04
- 本发明涉及一种移动机器人深度强化学习控制方法,属于机器人智能控制技术领域。在机器人学习行为策略阶段,本发明在最大熵强化学习框架下提出了一种具有历史行为重用的off‑policy似然比策略梯度模型学习算法,用于对移动机器人进行端对端的行为控制。该方法提高了机器人行为学习过程中数据的利用率,从而提高了学习速度和采样效率,节省了机器人与环境的交互成本。同时,在对机器人的行为策略模型进行评估阶段,本发明提出了一种统一的评价网络模型来同时逼近状态值函数和动作值函数,通过该评价网络可以直接给出一个状态和动作的优势函数。相对于使用两个网络分别逼近状态值函数和动作值函数,该评价网络具有学习速度快、能够减小参数累积误差的优势。
- 一种移动机器人深度强化学习控制方法
|