[发明专利]路径规划方法、路径规划系统、电子设备及计算机存储介质有效
| 申请号: | 202011094399.6 | 申请日: | 2020-10-14 |
| 公开(公告)号: | CN112649010B | 公开(公告)日: | 2022-09-20 |
| 发明(设计)人: | 王涛;刘承堃;王晨 | 申请(专利权)人: | 桂林电子科技大学 |
| 主分类号: | G01C21/34 | 分类号: | G01C21/34;G01C21/28;G01S19/39 |
| 代理公司: | 北京化育知识产权代理有限公司 11833 | 代理人: | 尹均利 |
| 地址: | 541004 广西*** | 国省代码: | 广西;45 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 路径 规划 方法 规划系统 电子设备 计算机 存储 介质 | ||
1.一种路径规划方法,其特征在于,所述方法包括:
获取起始轨迹路径和终止轨迹路径;以及,
根据所述起始轨迹路径、所述终止轨迹路径与已训练模型参数恢复所述起始轨迹路径与所述终止轨迹路径之间的缺失路径;
所述获取起始轨迹路径和终止轨迹路径包括:
定义马尔科夫决策过程MDP模型,获取所述起始轨迹路径至所述终止轨迹路径的所有道路状态s,所有道路构成状态集合S*;
所述训练模型参数的获取方法包括:
S01,对所述所有道路构成状态集合S*进行归一化处理,获得所有道路构成状态归一化集合S;
S02,每两条相邻道路之间的状态转移动作定义为状态转移矩阵A,所述集合S中道路之间的状态转变需所述状态转移矩阵A参与,所述集合S中道路之间的转变经所述状态转移矩阵A作用转移到相邻道路的概率分布定义为Pss;
S03,将所述集合S每条道路长度的负数作为所述道路的初始回报函数r,总的回报函数集合为R=-S,衰减因子定义为γ;
S04,初始化最优值函数V,采用迭代算法公式:
计算所有状态集合S获得收敛最优值函数V*(s);其中,k为迭代当前状态;
S05,根据所有历史轨迹的路径,选择重复次数超过预设次数L的路径作为历史轨迹,对于任意一条历史轨迹tr=s1→s2→L→sq,所述任意一条历史轨迹的训练集合为M;
S06,根据历史轨迹的训练集合M,计算其行程时间相符程度:
当Maxj∈M(|tj-tk|)≠Minj∈M(|tj-tk|)时,
当Maxj∈M(|tj-tk|)=Minj∈M(|tj-tk|)时,
x(tr)=1;
其中,ti为历史轨迹的计算路径行程时间,tj为历史轨迹的统计路径行程时间,tk为历史轨迹的平均路径行程时间;
S07,根据历史轨迹的训练集合M,将每相邻两条道路的状态定义为si、sj,计算si转移至sj最优值函数:
Q(si→sj)=R(si)+γV*(sj)
S08,根据所述最优值函数求取si至sj的转移概率:
其中,sk为si相邻状态;
S09,计算历史轨迹tr在当前回报函数集合R和行程时间相符程度校正下的联合概率:
其中,m为大于1的历史轨迹的数量;
S10,重复步骤S05—S09,计算n条用于训练的历史轨迹在当前回报值集合R下的联合概率:
S11,对当前回报值集合R下的每个状态的初始回报函数r在(r-△,r+△)区间进行采样,得到回报值集合R的新的回报值集合R*;
S12,重复步骤S05—S09计算所有历史轨迹tr在新的回报函数集合R*和行程时间相符程度校正下的联合概率:
其中,m为大于1的历史轨迹的数量;
S13,根据联合概率P2(tr),计算n条用于训练的历史轨迹在新的回报值集合R*下的联合概率:
S14,根据的接受概率接受新的回报值集合R*;
S15,重复步骤S11—S14,直到满足步骤S14的接受概率条件,将接受新的回报值集合R*作为模型参数的当前回报值集合R。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于桂林电子科技大学,未经桂林电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011094399.6/1.html,转载请声明来源钻瓜专利网。





