[发明专利]预测模型的训练方法、装置、介质和计算设备有效
申请号: | 202011433913.4 | 申请日: | 2020-12-10 |
公开(公告)号: | CN112232495B | 公开(公告)日: | 2022-03-04 |
发明(设计)人: | 胡文波;崔鹏 | 申请(专利权)人: | 北京瑞莱智慧科技有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 北京箴思知识产权代理有限公司 11913 | 代理人: | 李春晖 |
地址: | 100084 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 预测 模型 训练 方法 装置 介质 计算 设备 | ||
本发明的实施方式提供了一种预测模型的训练方法、装置、介质和计算设备。该方法包括:基于获取到的训练数据,以使所述预测模型的网络权重进行收敛为目标训练所述预测模型;通过所述预测模型输出与所述训练数据对应的预测分布;通过最大均值差异损失函数对所述预测分布进行计算,以使所述预测模型的网络权重再次进行收敛,并得到校准后的预测分布为目标训练所述预测模型。本发明的上述技术能够基于训练数据对预测模型进行训练,并通过预测模型输出与训练数据对应的预测分布,基于最大均值差异损失函数以及预测分布对预测模型进行训练,以使预测模型的网络权重再次收敛,得到校准后的预测分布,提升预测模型基于时序数据输出的预测结果的准确性。
技术领域
本发明的实施方式涉及深度学习技术领域,更具体地,本发明的实施方式涉及一种预测模型的训练方法、装置、介质和计算设备。
背景技术
本部分旨在为权利要求书中陈述的本发明的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
预测是机器学习中普遍存在的一类任务,广泛应用于各种场景中,如销售预测、股票分析、交通流量预测、天气预报等基于时序数据的预测。近年来随着深度学习技术突飞猛进的发展,深度模型在预测任务上取得了显著的进步。目前,通常会基于异方差神经网络对神经网络进行训练。然而,在实践中发现,基于异方差神经网络可能会基于已有的时序数据产生不可靠的预测分布和不确定性估计,且产生的概率分布往往是未校准的。可见,现有的神经网络基于时序数据得到的预测结果准确性较低。
发明内容
在本上下文中,本发明的实施方式期望提供一种预测模型的训练方法、装置、介质和计算设备。
在本发明实施方式的第一方面中,提供了一种预测模型的训练方法,包括:
基于获取到的训练数据,以使所述预测模型的网络权重进行收敛为目标训练所述预测模型;
通过所述预测模型输出与所述训练数据对应的预测分布;
通过最大均值差异损失函数对所述预测分布进行计算,以使所述预测模型的网络权重再次进行收敛,并得到校准后的预测分布为目标训练所述预测模型。
在本实施方式的一个实施例中,基于获取到的训练数据之前,所述方法还包括:
获取原始数据;
通过预设方式对所述原始数据进行预处理,得到所述原始数据对应的训练数据,其中,所述预设方式至少包括数据归一化处理。
在本实施方式的一个实施例中,当所述原始数据中包含时间序列数据时,所述预设方式还包括按照时间窗口格式对所述时间序列数据进行分割。
在本实施方式的一个实施例中,基于获取到的训练数据,以使所述预测模型的网络权重进行收敛为目标训练所述预测模型,包括:
将获取到的训练数据输入至所述预测模型的分布估计器;
通过所述分布估计器中的负对数似然损失函数对所述训练数据进行计算,以使所述预测模型的网络权重进行收敛为目标训练所述预测模型。
在本实施方式的一个实施例中,通过所述预测模型输出与所述训练数据对应的预测分布,包括:
通过所述预测模型输出与所述训练数据对应的均值和方差;
基于所述均值和所述方差计算得到预测分布。
在本实施方式的一个实施例中,所述最大均值差异损失函数包含核函数和再生核希尔伯特空间,通过最大均值差异损失函数对所述预测分布进行计算,以使所述预测模型的网络权重再次进行收敛,并得到校准后的预测分布为目标训练所述预测模型,包括:
从所述预测分布中获取数据样本;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京瑞莱智慧科技有限公司,未经北京瑞莱智慧科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011433913.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种外推星历与实时星历不间断切换方法
- 下一篇:电子束增材制造装置及方法