[发明专利]一种面向大规模打车平台的任务匹配公平方法有效
申请号: | 202110642749.6 | 申请日: | 2021-06-09 |
公开(公告)号: | CN113240339B | 公开(公告)日: | 2022-08-30 |
发明(设计)人: | 童咏昕;史鼎元;宋冰晨;徐毅;许可 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q30/06;G06Q50/30 |
代理公司: | 北京永创新实专利事务所 11121 | 代理人: | 易卜 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 大规模 打车 平台 任务 匹配 公平 方法 | ||
本发明公开了一种面向大规模打车平台的任务匹配公平方法,属于计算机领域;具体是:首先,针对某城市,以固定时间频率将打车场景中空闲的在线司机和未服务的订单组成二分图;更新当前时间窗内的二分图各边权;然后,在更新完边权的二分图上,计算出每个在线司机对应的订单匹配;最后,对在线司机与对应订单的匹配结果进行学习,更新价值函数,用于下一个时间窗的评估;同时,根据更新的价值函数引导空闲的在线司机进入订单热区,避免在线学习的冷启动。本发明加入引导策略,调度司机到附近价值高的网格,实现了各司机的收益公平;同时,将公平性检查嵌入到查找增广路过程中,没有增加额外的时间复杂度。
技术领域
本发明属于计算机软件领域,涉及一种时空众包任务匹配方法,具体是一种面向大规模打车平台的任务匹配公平方法。
背景技术
现有技术中,面向大规模打车平台的任务匹配方法大部分都侧重于提供理论性能保证;为了得到理论保证,现有方法通常会对司机和订单(任务)之间复杂的时序依赖做出简单的假设,导致在现实应用中无法达到预期效果;通过使用强化学习来提高打车平台的运行效率,不仅在模拟环境中实现了最佳性能并且已经成功部署到现实场景中。
针对公平性的匹配方法可分为两类:静态和动态。静态公平任务匹配中,工人和任务都是静态的,而在大规模打车场景中司机(工人)和订单(任务)都是动态出现,因此司机和订单之间的公平匹配属于动态公平匹配问题。在动态公平匹配领域,一些工作针对云计算和web请求分配问题研究的是如何实现多台服务器之间的负载均衡。然而,这些工作的优化目标是服务器(工人)为同样数量或价值的计算或web请求(任务)提供服务。这一公平目标不适用于打车场景,因为在打车场景中工人是司机,每个司机具有不同的工作时间以及时序依赖的工作范围。
发明内容
针对上述问题,本发明考虑真实大规模打车场景的特性,基于强化学习兼顾公平和效率;提出了一种面向大规模打车平台的任务匹配公平方法,通过计算司机的收益率并通过公平性的量化指标进行验证,同时利用强化学习明确司机与订单匹配之间的时序依赖关系,学习可感知未来的匹配策略,并引导司机进入订单热区,达到了司机之间的收入公平性和平台总体效率双优化的效果。
所述的面向大规模打车平台的任务匹配公平方法,具体步骤如下:
步骤一、针对某城市,以固定时间频率将打车场景中空闲的在线司机和未服务的订单组成二分图;
二分图中的节点为司机和订单,司机和订单之间如果满足约束限制的空间距离,则两者之间存在一条边;
约束限制条件是指:在线空闲司机和未服务订单的空间直线距离小于阈值,阈值根据实际情况人为设定;
步骤二、初始化并更新当前时间窗内的二分图的边权;
具体过程为:
首先,将二分图的边权初始化为订单的价格;
订单价格为根据打车用户的出发地和目的地,打车平台自行计算的价格。
然后,根据初始的订单价格,利用价值函数更新所有二分图的边权;
更新公式为:
p为订单被取消的概率,pr为司机接受订单r的初始订单价格;y为折扣因子;τr为订单r完成需花费的时间;dr为订单r的目的地位置;为司机w的状态,包括司机当前位置和当前时间窗t;为状态价值函数;
步骤三、在更新完边权的二分图上,计算出每个在线司机对应的订单匹配。
具体过程为:
首先,利用BFS对二分图进行分解,对分解后的每个子图进行判断,如果子图只包含一个订单对应多个司机,或一个司机对应多个订单,直接从中选择权值最大的边作为匹配结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110642749.6/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理