[发明专利]一种基于融合机器学习和时间序列的需求预测方法在审
| 申请号: | 202210390768.9 | 申请日: | 2022-04-14 |
| 公开(公告)号: | CN114881294A | 公开(公告)日: | 2022-08-09 |
| 发明(设计)人: | 周云;王明征;黄小鹏;檀思蝶 | 申请(专利权)人: | 浙江工业大学;浙江大学 |
| 主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q10/06;G06K9/62;G06N20/00 |
| 代理公司: | 北京睿智保诚专利代理事务所(普通合伙) 11732 | 代理人: | 杜娟 |
| 地址: | 310014 *** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 融合 机器 学习 时间 序列 需求预测 方法 | ||
本发明公开了一种融合机器学习和时间序列的需求预测方法,涉及基于机器学习的数据驱动决策技术领域。具体步骤为:提取物料的属性特征和预测特征、需求数据,构建预测数据集;根据所述物料属性特征构建物料簇,并借助物料簇的数据对各物料进行特征选择,得到重要特征集;将重要特征集数据训练集和验证集用于机器学习模型训练和调参,并对训练集、验证集和测试集进行预测;基于训练集和验证集需求数据构建时间序列模型,得到需求修正值;将机器学习方法和时间序列方法的预测结果融合,得到最终预测结果。本发明将机器学习算法的学习能力和时间序列方法的波动刻画能力相结合,提升小样本量、高维特征数据场景下需求预测的效果。
技术领域
本发明涉及数据驱动决策技术领域,更具体的说是涉及一种基于机器学习和时间序列融合的需求预测方法。
背景技术
当前社会已处于大数据时代,需求预测在数据赋能中发挥着越来越重要的基础性作用。大量的商业决策,都依赖于精准的需求预测。然而,随着新零售、数字化运营的兴起,在商业场景下普遍存在着少量样本、高维特征的情形。比如只有几十、几百个样本,却可以提出几百、几千个特征。这就对需求预测的方法提出了巨大的挑战。
现有的预测方法,并不能很好地应对这类少量样本、高维特征的任务。一方面,机器学习特别适合具有较多特征的学习任务,然而,较少的样本量限制了这类算法的学习能力,难以刻画特征和需求之间的相关关系以及需求的波动性。尽管已有研究提出了一些解决基于小样本的机器学习预测方法,例如数据增强、降维等,部分解决了小样本学习面临的挑战。然而,当前的方法,对于波动性的刻画,仍存在较大不足。另一方面,传统的时间序列方法,对新零售等场景下大量出现的异常值特别敏感,且未能将大量的有用信息、特征整合到时间序列模型中,预测能力受限。
在基于时间序列数据预测需求的场景中,如何充分发挥机器学习和 ARIMA、移动平均等时间序列方法的优势,取长补短,提高对少量样本、高维特征的学习能力,是当前大数据领域亟待解决的重要问题之一。
发明内容
有鉴于此,本发明提供了一种基于机器学习和时间序列融合的需求预测方法。可以有效提升背景技术中指出的问题,在小样本量、高位特征数据的应用场景下的需求预测效果。
为了实现上述目的,本发明采用如下技术方案:
一种融合机器学习和时间序列的需求预测方法,具体包括以下步骤:
(1)提取物料属性特征和预测特征、需求数据,将预测特征和需求数据合并构建预测数据集;
(2)根据所述物料属性特征,聚类构建物料簇;
(3)利用物料簇内的训练集数据对所述预测特征进行筛选,得到物料重要特征集;
(4)将物料重要特征集对应的训练集数据输入机器学习模型训练;
(5)根据验证集数据,进行网格搜索调整参数;
(6)将测试集输入机器学习模型,得到预测结果;
(7)基于训练集和验证集的需求数据构建时间序列模型,得到需求修正值;所述训练集和验证集的需求数据包括需求本身和机器学习预测的需求残差值;
(8)将机器学习模型预测结果和时间序列的预测结果进行融合,得到最终的预测结果。
步骤(7)所述的需求修正值包括:历史的实际需求、机器学习预测需求的残差值;其中,残差值的计算公式为:
其中和分别表示物料i第t和k个阶段的实际需求,和分别表示物料 i第t和k个阶段的需求预测值。
融合方法包括基于机器学习的残差法,具体做法如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学;浙江大学,未经浙江工业大学;浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210390768.9/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理





