[发明专利]一种基于机器学习的时间序列数据填补与还原方法有效
申请号: | 201910947754.0 | 申请日: | 2019-10-08 |
公开(公告)号: | CN110457867B | 公开(公告)日: | 2020-12-25 |
发明(设计)人: | 郑泽宇;温苗苗;尚文祥;李鸽;李娜;何治;胡海滨;何辉辉;石磊 | 申请(专利权)人: | 杭州知衣科技有限公司 |
主分类号: | G06F30/27 | 分类号: | G06F30/27;G06N20/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 311200 浙江省杭州市萧山区*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及计算机时间序列数据分析与预测技术领域,具体涉及一种基于机器学习的时间序列数据填补与还原方法。使用基于领域的中位数+均值填充法,填充缺失值;通过线性规则,估算期望采样时刻的真实值;检测时间序列的波峰与波谷,平滑异常值;以采集的数十万条真实数据为样本,设计和生成时序特征,以真实结果为标签,基于极速梯度提升决策树(XGBoost)的机器学习模型进行训练,用于对海量未知数据进行预测。本发明解决了特定时间序列数据的缺失值多、波动性大、误差累积等问题,有效提高了数据填补与还原的准确率;并且较好地控制了机器学习模型的复杂度,能在小时级内完成上亿条数据记录的填补与还原,具有较强的实用价值。 | ||
搜索关键词: | 一种 基于 机器 学习 时间 序列 数据 填补 还原 方法 | ||
【主权项】:
1.一种基于机器学习的时间序列数据填补与还原方法,其特征在于,该方法步骤如下:/nS1、采集时间序列数据,包括不同物品、不同采样时刻的滑动窗口累计值;/nS2、收集真实的各采样间隔内的累计值;/nS3、使用基于领域的中位数+均值法,填充缺失值;/nS4、通过线性规则,估算期望采样时刻的真实采样值;/nS5、检测时间序列的波峰与波谷,平滑异常值;/nS6、以采集的真实数据为样本,设计和生成时序特征,以真实结果为标签,基于极速梯度提升决策树的机器学习模型进行建模训练,根据训练模型对未知数据进行预测。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州知衣科技有限公司,未经杭州知衣科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910947754.0/,转载请声明来源钻瓜专利网。