[发明专利]一种基于位置学习效应的最短路径问题的启发式搜索方法在审
申请号: | 201710049917.4 | 申请日: | 2017-01-23 |
公开(公告)号: | CN106779251A | 公开(公告)日: | 2017-05-31 |
发明(设计)人: | 李小平;王亚敏;潘光磊;王爽;陈龙 | 申请(专利权)人: | 东南大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06N99/00 |
代理公司: | 南京瑞弘专利商标事务所(普通合伙)32249 | 代理人: | 唐绍焜 |
地址: | 211189 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种带基于位置学习效应的最短路径问题的精确求解的启发式搜索方法,特别涉及一种机器人路径规划方法。机器人在寻找最短路径的过程中,通过强化学习与环境进行交互,获取经验,意味着机器人可以以更小的代价通过同一条路径,因此该情况下的最短路径与无学习效应时的最短路径很可能是不同的。为了解决此问题,在机器人获取外部环境信息,根据先验知识确定学习效应函数之后,通过启发信息,设计出符合该问题需要的剪枝操作和过滤操作来提前排除确定不会出现在最短路径上的部分路径,从而加速搜索过程,使得机器人在合理有效的时间内寻找到一个精确的全局最短路径,进而用于指导机器人行驶。 | ||
搜索关键词: | 一种 基于 位置 学习 效应 路径 问题 启发式 搜索 方法 | ||
【主权项】:
一种基于位置学习效应的最短路径问题的启发式搜索方法,其特征在于,包括以下步骤:步骤1:搜索地图信息,得到有向图G=<N,A,c>,其中,N表示图G中所有结点的集合,A表示图G中所有弧的集合,则|N|表示图中结点数,|A|表示图中弧的数目,c(n,n*)表示结点n到n*之间的弧的代价;步骤2:根据机器人路径行驶的先验知识确定学习效应函数:根据有向图G,设计无学习效应时的估计函数h(n),h(n)表示结点n到终点的路径代价的估计值;然后根据学习效应函数和估计函数h(n),得到带有学习效应时的估计函数hl(n);步骤3:使用启发式搜索算法在考虑学习效应的有向图G中寻找最短路径:步骤31:通过将仅包含起点的路径P和通过该路径到达终点的估计值f的信息存入待扩展路径集合OPEN中;并将路径P记入搜索过程中形成的搜索图SG;步骤32:从待扩展路径集合OPEN中选择起点到终点估计值f最小的部分路径作为目前最有可能扩展为最短路径的路径;步骤33:如果路径P到达终点,判断待扩展路径集合OPEN是否为空;若为空,则执行步骤37;若不为空,则执行步骤34;步骤34:依次扩展选择的部分路径的后继结点,具体为:将后继结点加入部分路径构成新的部分路径,根据带有学习效应的估计函数,计算该结点到目标结点的估计值;将带有学习效应的新部分路径的实际值与该结点到目标结点的估计值相加,作为通过该部分路径到达目标结点的估计值;将新的部分路径、其包含的弧的数量及通过对应路径到达目标结点的估计值放入待扩展路径集合OPEN;将扩展路径记入搜索图SG;步骤35:通过剪枝、过滤操作删除搜索图SG中不可能扩展为最短路径的部分路径;步骤36:判断待扩展路径集合OPEN是否为空;若为空,则执行步骤37;若不为空,则执行步骤34;步骤37:根据搜索图SG得到起点到终点的最短路径。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710049917.4/,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06 计算;推算;计数
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理