[发明专利]一种机器人驱动方法、系统、设备及存储介质在审
申请号: | 202310624527.0 | 申请日: | 2023-05-29 |
公开(公告)号: | CN116610066A | 公开(公告)日: | 2023-08-18 |
发明(设计)人: | 张旭阳;吉建民 | 申请(专利权)人: | 中国科学技术大学 |
主分类号: | G05B19/19 | 分类号: | G05B19/19 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 马天琪 |
地址: | 230026 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 机器人 驱动 方法 系统 设备 存储 介质 | ||
本申请公开了一种机器人驱动方法、系统、设备及存储介质,通过获取序列语言信息,将所述序列语言信息输入路径生成网络,得到目标参考路径,所述路径生成网络是根据机器人历史移动数据训练的,用以预测机器人目标参考路径的网络;基于机器人当前速度和所述机器人的加速度限值确定与所述目标参考路径匹配的目标速度,以所述参考路径和所述目标速度驱动机器人。即使用预先训练好的路径生成网络生成部分参考路径,基于当前速度和加速度的上下限值确定出最适合机器人当前状态的运行速度,根据确定出的速度和路线驱动机器人平稳移动。由此,机器人在障碍物较多的复杂室内环境中不产生碰撞地平稳运行,提高了机器人运行的稳定性。
技术领域
本申请涉及人工智能技术领域,特别是涉及一种机器人驱动方法、系统、设备、存储介质。
背景技术
对于任何移动设备而言,在其环境中导航的能力都很重要。首先避免诸如碰撞和不安全条件(温度、辐射、暴露于天气等)的危险情况,但是如果机器人的目的与机器人环境中的特定位置有关,则必须找到这些位置。深度强化学习在机器人导航方面展现出了很大的应用潜力。
现有技术中深度强化学习导航方法旨在训练端对端的导航策略,将机器人对环境的观察直接映射到其运动指令,例如线速度和角速度。在这些方法中,机器人的导航策略只需要响应当前环境,例如基于异步优势动作评价算法的导航方法,而并没有考虑一段时间内的平稳移动。但是,在实际应用场景中,除了避免碰撞机器人导航的平稳性也很重要。
因此,如何在保证机器人移动过程中不产生碰撞的基础上,提高移动的平稳性,是本领域技术人员亟待解决的技术问题。
发明内容
基于上述问题,本申请提供了一种机器人驱动方法、系统、设备及存储介质,用以提高机器人驱动过程中的平稳性。
为解决上述问题,本申请实施例提供的技术方案如下:
本申请第一方面提供了一种机器人驱动方法,包括:
获取序列语言信息,所述序列语言信息用于描述预设时间段内在目标环境中基于机器人获取到的环境信息;
将所述序列语言信息输入路径生成网络,得到目标参考路径,所述路径生成网络是根据机器人历史移动数据训练的,用以预测机器人目标参考路径的网络;
基于机器人当前速度和所述机器人的加速度限值确定与所述目标参考路径匹配的目标速度,所述加速度限值用于表征机器人的加速度最大值,和/或,加速度最小值;
以所述参考路径和所述目标速度驱动机器人。
可选的,所述序列语言信息的确定方式包括:
获取机器人观测到的环境信息、目标点相对于机器人的相对坐标和第一预设时间段内的已完成移动的参考路径,所述第一预设时间段早于当前时刻;
对获取到的内容进行编码,得到序列语言信息。
可选的,所述对获取到的内容进行编码,得到序列语言信息,包括:
将获取到的内容,输入每个种类各自对应的多层感知机,得到序列语言信息,所述多层感知机用于将各个种类的内容以统一的语言表示。
可选的,所述参考路径的表示方式包括:以若干个夹角的有序列表表示参考路径,所述夹角为固定于目标参考路径中的相距预设距离的两个点之间的连线,与机器人正前方的夹角。
可选的,所述确定与所述目标参考路径匹配的目标速度,包括:
根据机器人当前速度和所述机器人的加速度限值计算出下一时刻的速度区间;
对所述速度区间均匀采样,得到若干个速度样本;
根据预设评价指标对各个速度样本进行评价,选取其中符合预设速度要求的速度样本,作为目标速度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310624527.0/2.html,转载请声明来源钻瓜专利网。