[发明专利]一种基于广度优化算法的网约车订单分配系统在审
| 申请号: | 202310529837.4 | 申请日: | 2023-05-11 |
| 公开(公告)号: | CN116485150A | 公开(公告)日: | 2023-07-25 |
| 发明(设计)人: | 请求不公布姓名 | 申请(专利权)人: | 云南升玥信息技术有限公司 |
| 主分类号: | G06Q10/0631 | 分类号: | G06Q10/0631;G06Q10/04;G06Q30/0601;G06Q50/30;G06N3/092 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 650100 云南省昆明市西山区环城南路*** | 国省代码: | 云南;53 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 广度 优化 算法 网约车 订单 分配 系统 | ||
1.一种基于广度优化算法的网约车订单分配系统,其特征在于,包括订单发布模块、订单分配模块、策略评估模块;首先,对乘客发出的网约车订单请求根据区域划分,上传系统订单数据库,根据联合Q值强化学习算法,匹配出适合该网约车订单的空载网约车,其次,空载的网约车司机对系统匹配的网约车订单进行抢单,且网约车平台通过广度优化算法,建立系统派单策略,将订单派给最合适的空载网约车,最后,网约车平台根据订单反馈,构建订单评价体系,优化系统的订单分配策略。
2.根据权利要求1所述一种基于广度优化算法的网约车订单分配系统,其特征在于,所述订单发布模块,网约车平台根据自然地理边界进行划分,将不同位置的订单分类进入订单序列。
3.根据权利要求1所述一种基于广度优化算法的网约车订单分配系统,其特征在于,所述订单发布模块,网约车平台将订单信息上传数据库。
4.根据权利要求1所述一种基于广度优化算法的网约车订单分配系统,其特征在于,所述订单发布模块,通过联合Q值强化学习算法对网约车订单和网约车司机进行匹配,详细过程如下:
将区域模型通过正方形网格进行划分,正方形的边代表道路,节点代表路网交叉点,定义道路上相应的成本,由天气、日期、环境因素决定;网约车司机完成订单获得奖励,网约车司机空载运动获得零奖励,构建要素函数G:
N代表区域模型中的车辆数量,s代表状态集合,A代表联合动作空间,P代表状态转移概率,R代表奖励因子,代表折扣系数;t时刻状态表示为一个三元素元组,表示t时刻状态,l代表车辆位置,t代表时间,y表示网约车司机成功接单;定义t时刻动作,对行程进行分配,时刻,表示车辆位置在处,在时刻,司机未接单成功,时刻状态表示车辆位置在处,在时刻,司机接单成功;动作=(l,t),所有符合条件动作的空间用联合动作空间A表示;定义奖励函数:,分布表示各时间步长奖励的折扣系数,分布表示各时间步长的奖励;定义动作价值函数Q,公式如下:
E代表期望,表示t时刻状态,表示t时刻联合动作空间,分别表示初始时刻状态和联合动作空间,T表示总时间步长;构建算法的策略,代表将状态映射到动作空间上的分布策略,学习型贪婪策略公式如下:,argmax代表找到令取最大值时参数的函数,网约车司机遵循策略,获得预期累计奖励,状态值函数为:,t时刻,区域最优联合动作为所有网约车最优动作集合,通过因式分解,联合动作价值函数:,分别代表总的状态和总的联合动作空间,联合动作价值函数公式如下:
是一个历史联合动作,有独立动作函数,、分别代表第i个和第N个动作价值函数,、分别代表第i个和第N个动作,、分别代表第i个和第N个状态,将由分解,确保上上argmax函数得到的联合动作a和上argmax函数得到的独立动作一致,每辆网约车的独立最优动作,是联合最优动作的一部分;针对独立动作价值网络,每辆车的独立动作价值网络根据自身输入,输出动作价值,对所有车辆动作值有如下公式:
代表所有网约车的总动作价值,为每辆网约车的动作价值,通过所有车辆独立动作价值网络确定的动作来更新联合动作价值网络;针对状态价值网络,计算状态值V(s),弥补与真实的之间的差距;将联合动作价值函数分解,列出如下公式:
表示网约车独立最优动作,a表示网约车实际动作,当,时,所有网约车独立最优动作的值大于实际动作a的值,就代表全局最优动作;构建全局损失函数公式:
s代表当前状态,表示下一状态,r表示状态更新的奖励,表示估算实际动作价值函数的损失函数,代表因式分解的损失函数,代表损失函数的权重系数,其中:
f代表时序函数;更新联合动作价值,因式分解损失函数通过联合动作价值引导网约车总动作价值和状态值V(s)更新。
5.根据权利要求1所述一种基于广度优化算法的网约车订单分配系统,其特征在于,所述订单分配模块,网约车平台通过算法将订单分配给匹配的网约车司机,订单与匹配的网约车司机一对多模式,匹配的网约车司机通过自身抢单,获得订单的执行权。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云南升玥信息技术有限公司,未经云南升玥信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310529837.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:防雷击保护装置
- 下一篇:一种矿井废水用重型周边转动刮泥设备
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理





