[发明专利]用于确定调节系统的调节参数的方法在审
申请号: | 202011446770.0 | 申请日: | 2020-12-11 |
公开(公告)号: | CN112977461A | 公开(公告)日: | 2021-06-18 |
发明(设计)人: | B·阿尔特;M·赫尔曼 | 申请(专利权)人: | 罗伯特·博世有限公司 |
主分类号: | B60W40/09 | 分类号: | B60W40/09 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 姬亚东;刘春元 |
地址: | 德国斯*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 确定 调节 系统 参数 方法 | ||
本发明涉及用于使用机器学习来确定调节系统(100)、尤其是机动车(110)的调节系统(100)、尤其是用于调节机动车(110)的行驶运行的调节系统(100)的调节参数(θj)的方法(200),其中所述方法(200)包括:提供(210)行驶轨迹(D)的集合;在使用逆向强化学习方法的情况下从所述行驶轨迹(D)中推导(220)奖励函数(Rj);基于所述奖励函数(Rj)来推导(230)特定于驾驶员类型的聚类(Cj);针对相应的特定于驾驶员类型的聚类(cj)确定(240)调节参数(θj)。
技术领域
本公开涉及一种按照权利要求1所述的用于使用机器学习来确定调节系统、尤其是机动车的调节系统、尤其是用于调节机动车的行驶运行的调节系统的调节参数的方法。
本公开还涉及一种按照权利要求6所述的用于利用调节系统来对机动车进行调节的方法。
本公开还涉及一种按照权利要求10所述的调节系统。
背景技术
调节系统在机动车中例如被用作驾驶员辅助系统,以便在某些行驶情况下对机动车的驾驶员进行辅助或使机动车的驾驶员减轻负担。
为了实现该辅助功能,驾驶员辅助系统包括周围环境传感器,诸如雷达传感器、激光雷达传感器、激光扫描仪、视频传感器和超声传感器。只要车辆装备有导航系统,驾驶员辅助系统就也可以动用该系统的数据。此外,与车辆的车载电网优选地经由至少一条总线(BUS)、优选地CAN总线连接的驾驶员辅助系统也可以对车载系统、如尤其是转向系统、制动系统、动力总成系统和报警系统进行主动干预。
通常,在车队之内有调节系统可用的情况下,使用调节系统的统一的数据编制(Bedatung)。必要时,还可以使调节系统与运动模式或者舒适模式适配。与个人驾驶员的驾驶行为的单独适配到目前为止尚未公知。
因而,值得期望的是:提供一种调节系统,该调节系统能够实现与个人驾驶员的驾驶行为的这种单独适配。
发明内容
通过按照独立权利要求所述的调节系统和计算机实现的方法来实现这一点。
优选的实施方式涉及一种用于使用机器学习来确定调节系统、尤其是机动车的调节系统、尤其是用于调节机动车的行驶运行的调节系统的调节参数的计算机实现的方法,其中该方法包括:
提供行驶轨迹的集合D;
在使用逆向强化学习方法的情况下从行驶轨迹中推导奖励函数;
基于这些奖励函数来推导特定于驾驶员类型的聚类;
针对相应的特定于驾驶员类型的聚类确定调节参数。
在学习阶段,基于行驶轨迹的集合来使不同的驾驶员类型形成聚类。聚类的特性是:在同一聚类中的对象拥有类似的、尤其是相同的特性并且由此与不在同一聚类中的对象区别开。接着,在调节系统的应用阶段,调节系统可以通过选择特定的特定于驾驶员类型的聚类来与相应的驾驶员的驾驶行为单独适配。有利地,行驶轨迹基于不同的驾驶员或驾驶员类型的驾驶示范。
奖励函数、英文reward function是将奖励值分配给调节量的值的函数。有利地,奖励函数被选择为使得调节量与额定量的偏差越小,该奖励函数就取越大的值。按照本发明,针对相应的行驶轨迹确定相应的奖励函数,该奖励函数在该行驶轨迹方面被优化。
通过使用逆向强化学习方法、例如在使用逆向强化学习算法的情况下推导奖励函数。该方法和示例性的算法例如在https://arxiv.org/pdf/1712.05514.pdf:InverseReinforce Learning with Nonparametric Behavior Clustering, SiddharthanRajasekaran, Jinwei Zhang和Jie Fu下公开。
接着,基于这些奖励函数来推导驾驶员类型聚类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于罗伯特·博世有限公司,未经罗伯特·博世有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011446770.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:储热装置
- 下一篇:方法、程序指令、存储介质和装置