[发明专利]基于模仿学习与强化学习结合的自动驾驶训练方法及系统在审
申请号: | 202111532390.3 | 申请日: | 2021-12-15 |
公开(公告)号: | CN114282433A | 公开(公告)日: | 2022-04-05 |
发明(设计)人: | 黄乐雄;王洋;须成忠;叶可江 | 申请(专利权)人: | 中国科学院深圳先进技术研究院 |
主分类号: | G06F30/27 | 分类号: | G06F30/27;G06N3/04;G06N3/08;G06N20/00 |
代理公司: | 深圳市科进知识产权代理事务所(普通合伙) 44316 | 代理人: | 刘建伟 |
地址: | 518055 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及模型学习领域,具体涉及一种基于模仿学习与强化学习结合的自动驾驶训练方法及系统。该方法及系统将采集到的训练数据输入至模仿学习网络进行预训练,将预训练后模仿学习网络的卷积层拷贝给强化学习网络,强化学习网络与环境继续互动学习,获得环境中新的训练数据加入经验回放池,强化学习网络从经验回放池中随机采样数据进行训练,对强化学习网络进行更新。本发明的结合训练方法针对自动驾驶的特点进行了优化,使得它在自动驾驶的仿真环境中性能良好。 | ||
搜索关键词: | 基于 模仿 学习 强化 结合 自动 驾驶 训练 方法 系统 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院深圳先进技术研究院,未经中国科学院深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202111532390.3/,转载请声明来源钻瓜专利网。
- 上一篇:一种中厚板材的等离子焊接设备及其工作方法
- 下一篇:一种预成型的拉延模具结构