[发明专利]一种在移动人群环境中的机器人导航方法及系统在审
申请号: | 202210055610.6 | 申请日: | 2022-01-18 |
公开(公告)号: | CN114510038A | 公开(公告)日: | 2022-05-17 |
发明(设计)人: | 周风余;冯震;薛秉鑫;夏英翔;尹磊 | 申请(专利权)人: | 山东大学 |
主分类号: | G05D1/02 | 分类号: | G05D1/02 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 张庆骞 |
地址: | 250061 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 移动 人群 环境 中的 机器人 导航 方法 系统 | ||
1.一种在移动人群环境中的机器人导航方法,其特征在于,包括:
获取移动人群中各个行人的目标位置、首选速度、航向角、实时位置和实时速度以及机器人的实时位置和实时速度;
再基于机器人的风险区域模型,得到移动人群与机器人相邻的行人的风险区域并进行躲避,进而得到机器人的导航路径;
其中,所述基于机器人的风险区域模型为:
当机器人在限定时间内躲避成功时,通过对应奖励函数得到奖励;当机器人进入风险区域时,通过对应惩罚函数得到惩罚;风险区域的惩罚函数形式和生效范围取决于环境中机器人和行人的实时相对位置和速度。
2.如权利要求1所述的在移动人群环境中的机器人导航方法,其特征在于,机器人的导航路径是找到一个使期望收益最大化的最优策略
式中表示在t时刻获得的奖励,γ∈(0,1)是一个折扣因子,是最优值函数,是从时间t到时间tΔ=t+Δt的状态转移概率;是在t时刻整个系统的联合状态,是在tΔ时刻整个系统的联合状态,at表示在t时刻的动作;vpref表示首选速度。
3.如权利要求2所述的在移动人群环境中的机器人导航方法,其特征在于,使用时间差分学习方法来训练最优值函数。
4.如权利要求1所述的在移动人群环境中的机器人导航方法,其特征在于,所述风险区域包括位置风险区域和速度风险区域。
5.如权利要求4所述的在移动人群环境中的机器人导航方法,其特征在于,所述惩罚函数为基于速度的惩罚函数和基于位置的惩罚函数的总和。
6.一种在移动人群环境中的机器人导航系统,其特征在于,包括:
信息获取模块,其用于获取移动人群中各个行人的目标位置、首选速度、航向角、实时位置和实时速度以及机器人的实时位置和实时速度;
路径导航模块,其用于再基于机器人的风险区域模型,得到移动人群与机器人相邻的行人的风险区域并进行躲避,进而得到机器人的导航路径;
其中,所述基于机器人的风险区域模型为:
当机器人在限定时间内躲避成功时,通过对应奖励函数得到奖励;当机器人进入风险区域时,通过对应惩罚函数得到惩罚;风险区域的惩罚函数形式和生效范围取决于环境中机器人和行人的实时相对位置和速度。
7.如权利要求6所述的在移动人群环境中的机器人导航系统,其特征在于,在所述路径导航模块中,机器人的导航路径是找到一个使期望收益最大化的最优策略
式中表示在t时刻获得的奖励,γ∈(0,1)是一个折扣因子,是最优值函数,是从时间t到时间tΔ=t+Δt的状态转移概率;是在t时刻整个系统的联合状态,是在tΔ时刻整个系统的联合状态,at表示在t时刻的动作;vpref表示首选速度。
8.如权利要求6所述的在移动人群环境中的机器人导航系统,其特征在于,在所述路径导航模块中,所述风险区域包括位置风险区域和速度风险区域。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-5中任一项所述的在移动人群环境中的机器人导航方法中的步骤。
10.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-5中任一项所述的在移动人群环境中的机器人导航方法中的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210055610.6/1.html,转载请声明来源钻瓜专利网。