[发明专利]一种基于逆强化学习的价格激励共享电动汽车调度方法在审
申请号: | 202210960983.8 | 申请日: | 2022-08-11 |
公开(公告)号: | CN115099718A | 公开(公告)日: | 2022-09-23 |
发明(设计)人: | 陈丽莉;邢晋奎;张延滋;冉伦;焦子豪 | 申请(专利权)人: | 北京工商大学;清华大学 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q30/06 |
代理公司: | 北京新科华领知识产权代理事务所(普通合伙) 16115 | 代理人: | 吴变变 |
地址: | 100048 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 强化 学习 价格 激励 共享 电动汽车 调度 方法 | ||
本发明公开了一种基于逆强化学习的价格激励共享电动汽车调度方法,包括:收集用户的历史出行数据,基于历史出行数据,根据调度场景构建车辆调度模型;基于历史出行数据和逆强化学习算法对用户的出行策略和行为偏好进行评估,获得区域服务价值;根据区域服务价值,结合用户用车需求,制定价格激励车辆调度策略;基于车辆调度模型,通过价格激励车辆调度策略与众包调度方式完成车辆调度。本发明的调度方法不仅能够更加合理地给出调度成本定价达到改善系统总成本的目的,同时具有更高的需求满足率,能够提升用户的满意度,降低运营商的潜在损失。
技术领域
本发明属于自适应控制领域,特别是涉及一种基于逆强化学习的价格激励共享电动汽车调度方法。
背景技术
目前共享电动汽车运营商采取的调度策略主要包括两种:人工调度策略和价格激励策略。
人工调度策略指的是运营商雇佣专业的调度驾驶员对服务区域或站点间的车辆进行重新分配,保证用户的用车需求得到及时的满足。作为目前应用最广泛的调度策略,学者们对其作出了丰富的研究。张瑞友等(2021)针对单向共享电动汽车服务系统,综合考虑了车辆里程、员工工作时间、车辆充电时间等限制,建立了以人工调度方式为基础的混合整数非线性规划模型,并通过适当的数学转化降低了问题的复杂度,对问题进行了有效的求解。姚恩建等(2020)针对人工调度成本过高的问题,根据运营数据,利用多项Logit模型分析了用户的选择行为,进而构建了面向自组织平衡的共享电动汽车人工调度优化模型,同时应用禁忌搜索算法对模型进行了求解,为运营商降低了调度总成本。王宁等(2018)在基于完全满足用户用车需求的前提下,首先采用遗传算法求出了站点之间的调度需求,并此基础上构建了共享电动汽车站点间的人工调度策略,同时通过调度收益最大化的混合整数规划模型优化了车辆调度路径,为运营商提供了合理的调度方案。Nair和Miller-Hooks(2011)研究了基于站点的共享汽车系统中的车辆调度问题,通过建立并求解具有联合机会约束的随机混合整数规划模型,验证了人工调度策略在缓解车辆分配不均衡问题商的作用。
价格激励作为目前快速发展的一种新型调度策略,主要有两种模式。第一种是运营商通过给予用户一定的奖励来影响用户的行程轨迹,进而达到车辆均衡的目标;第二种是采用众包的手段,给予普通用户一定的奖励,使其帮助运营商完成调度任务。王宁等(2018)从共享单车调度与价格激励出发,提出了基于用户激励的共享电动汽车自适应调度成本最优化模型,并通过算例验证了该激励策略在降低成本和提高用户满意度方面的有效性。Angelopoulos等(2016)针对单向共享电动汽车系统中的车辆分配不均衡问题,设计了能够动态为用户分配车辆的价格激励调度方案,以协调各个站点之间的需求,并通过算例验证该方案的可行性。Jorge(2015)针对基于站点的单向共享电动汽车系统中车辆分配不均衡现象,采用变化动态行程定价策略平衡用户的用车需求,进而建立了混合整数非线性规划模型,并通过算例分析验证了该策略在提升运营商利润方面的效果。
除了以上两类研究,不少学者还将两种策略综合考虑,构建了综合策略,以平衡共享电动汽车系统中的车辆不均衡现象。Jiao等(2020)为了缓解共享电动汽车系统中的车辆不均衡问题,结合价格激励方法和出行选择策略,构建了一种综合策略,并通过构建及求解混合整数非线性规划确定了最优的出行价格和最佳的调度方案。Huang等(2020)比较了人工调度策略、价格激励策略和综合策略在基于站点的单向共享电动汽车服务系统中的表现,结果表明综合策略能够有效的缓解系统中的车辆不均衡问题。Xu(2018)在结合人工调度和价格激励策略的基础上,构建了混合整数非线性规划模型,旨在满足单向共享汽车服务弹性需求的前提下,通过最优化车队规模、用户出行定价等变量,最大化运营商的整体利润,并设计了外部逼近算法对问题进行了求解。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工商大学;清华大学,未经北京工商大学;清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210960983.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种双电源切换装置及其控制方法
- 下一篇:单壁围堰变双壁围堰的施工方法
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理