[发明专利]一种模型训练的方法、运力分配的方法以及装置在审
申请号: | 202210408938.1 | 申请日: | 2022-04-19 |
公开(公告)号: | CN114861992A | 公开(公告)日: | 2022-08-05 |
发明(设计)人: | 俞扬;詹德川;周志华;陈振军;陈雄辉;于志华;吴奕男;黄方胜 | 申请(专利权)人: | 南京大学;北京三快在线科技有限公司 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q10/08 |
代理公司: | 北京曼威知识产权代理有限公司 11709 | 代理人: | 邓超 |
地址: | 210023 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 模型 训练 方法 运力 分配 以及 装置 | ||
本说明书公开了一种模型训练的方法、运力分配的方法以及装置。首先,获取历史数据。其次,将历史数据输入到待训练的生成器中,以预测在指定时刻配送区域内配送运力的运力数据,作为预测运力数据。而后,根据预测运力数据,以及确定出的在指定时刻配送区域对应的区域状况数据,构建第一训练样本。然后,将第一训练样本输入到预设的判别器中,确定第一训练样本属于真实数据的置信度,并确定第一训练样本对应的奖励值。最后,以最大化第一训练样本对应的奖励值,对生成器进行训练。本方法可以通过基于判别器确定出的第一训练样本属于真实数据的置信度,得到第一训练样本对应的奖励值,对生成器进行训练,使得生成器确定出更加准确的预测运力数据。
技术领域
本说明书涉及计算机技术领域,尤其涉及一种模型训练的方法、运力分配的方法以及装置。
背景技术
随着社会的高速发展,外卖行业越来越发达,越来越多人选择外卖的方式来点餐。由于城市中的不同区域的用户订单数量不同,若不能合理的分配各个配送区域内的配送运力,可能出现部分配送区域的配送运力不足,导致该部分配送区域的部分用户订单无人接取,从而出现用户订单超时的情况。
目前,通常通过人工分配的方法,分配各个配送区域的配送运力,而人工分配的方法并不能很好的预估出未来一段时间的各个配送区域所需的配送运力,从而出现由于各个配送区域的配送运力分配不合理,导致用户订单超时的情况。
因此,如何合理的分配各个配送区域的配送运力,则是一个亟待解决的问题。
发明内容
本说明书提供一种模型训练的方法、装置、存储介质及电子设备,以部分的解决现有技术存在的上述问题。
本说明书采用下述技术方案:
本说明书提供了一种模型训练的方法,包括:
获取历史数据,所述历史数据包含有历史上配送区域对应的区域状况数据以及历史上所述配送区域内的配送运力的运力数据;
将所述历史数据输入到待训练的生成器中,以预测在指定时刻所述配送区域内配送运力的运力数据,作为预测运力数据;
根据所述预测运力数据,以及通过所述运力数据确定出的在指定时刻所述配送区域对应的区域状况数据,构建第一训练样本;
将所述第一训练样本输入到预设的判别器中,确定第一训练样本属于真实数据的置信度,并根据所述第一训练样本对应的置信度,确定所述第一训练样本对应的奖励值;
以最大化所述第一训练样本对应的奖励值,对所述生成器进行训练,其中,所述生成器用于预测出分配配送运力时所需的运力数据。
可选地,根据所述第一训练样本对应的置信度,确定所述第一训练样本对应的奖励值,具体包括:
根据所述第一训练样本对应的置信度,确定第一训练样本对应的基础奖励值;
根据所述第一训练样本对应的基础奖励值以及通过所述生成器确定出的所述第一训练样本对应的惩罚值,确定所述第一训练样本对应的奖励值。
可选地,所述区域状况数据包括:配送运力的资源奖励;
通过所述生成器确定所述第一训练样本对应的惩罚值,具体包括:
对所述第一训练样本中的历史上配送区域对应的区域状况数据中的配送运力的资源奖励进行更改,确定更改后的第一训练样本;
将所述更改后的第一训练样本输入到待训练的生成器中,预测更改后的第一训练样本对应的预测运力数据;
根据所述第一训练样本对应的预测运力数据、所述更改后的第一训练样本对应的预测运力数据,确定所述第一训练样本对应的惩罚值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学;北京三快在线科技有限公司,未经南京大学;北京三快在线科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210408938.1/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理