[发明专利]车辆行驶决策模型的训练方法、行驶决策确定方法及装置有效
申请号: | 201911338944.9 | 申请日: | 2019-12-23 |
公开(公告)号: | CN111007858B | 公开(公告)日: | 2023-04-28 |
发明(设计)人: | 丁曙光;何毅晨;任冬淳 | 申请(专利权)人: | 北京三快在线科技有限公司 |
主分类号: | G05D1/02 | 分类号: | G05D1/02 |
代理公司: | 北京曼威知识产权代理有限公司 11709 | 代理人: | 方志炜 |
地址: | 100080 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本说明书公开了车辆行驶决策模型的训练方法、行驶决策确定方法及装置。本说明书实施例中的方法及装置,在训练决策模型的过程中,根据当前时刻的各信息得出当前时刻的额外奖励。额外奖励区别于一般奖励,该额外奖励是根据历史上的至少部分观测特征得到的。额外奖励与当前观测特征与预存的历史观测特征的可达性负相关。则训练后的决策模型更加关注历史上未被训练到的观测特征,能够对输入决策模型的数据进行更加全面的处理,也能够降低决策模型对历史上已经被训练到的观测特征的关注程度,提高决策模型的训练效率。此外,即使在某一方面的信息有限的情况下,通过训练后的决策模型也能够敏感的识别出该方面的信息并将其作为确定行驶决策的依据。 | ||
搜索关键词: | 车辆 行驶 决策 模型 训练 方法 确定 装置 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京三快在线科技有限公司,未经北京三快在线科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201911338944.9/,转载请声明来源钻瓜专利网。