[发明专利]一种确定销量预测模型的方法和装置在审
申请号: | 201810551461.6 | 申请日: | 2018-05-31 |
公开(公告)号: | CN110555713A | 公开(公告)日: | 2019-12-10 |
发明(设计)人: | 张瞻;李聚信;蒋佳涛 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06K9/62 |
代理公司: | 11219 中原信达知识产权代理有限责任公司 | 代理人: | 张一军;张效荣 |
地址: | 100195 北京市海淀区杏石口路6*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 预测模型 样本数据 商品特征 商品销量 天气特征 测试集 训练集 计算机技术领域 机器学习算法 验证 方法和装置 模型预测 目标商品 商品数据 天气数据 天气 预测 | ||
本发明公开了一种确定销量预测模型的方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:从目标商品的商品数据中提取商品特征,从天气数据中提取天气特征,以确定样本数据集;将所述样本数据集划分为训练集和测试集,根据所述训练集和机器学习算法建立销量预测模型;将所述测试集输入所述销量预测模型,以验证所述销量预测模型。该方法通过提取商品特征和天气特征来确定样本数据集,利用所述样本数据集建立销量预测模型,并对销量预测模型进行验证,以通过该模型预测商品销量,既提高了销量预测模型的泛化能力,又能够很好的预测与天气有关的商品销量。
技术领域
本发明涉及计算机领域,尤其涉及一种确定销量预测模型的方法和装置。
背景技术
随着互联网技术和移动技术的发展,线上购物更加便利,用户在线购物的数量有着大幅增长,如何预测商品在未来一段时间的销量变得非常重要。影响商品销量的因素有很多,比如商品价格、商品季节性、促销活动、节假日和天气情况等。以天气情况为例,人们会根据天气情况来决定购买的衣服、食物、饮品等,尤其是对于酒精性饮料和羽绒服等商品,天气情况对其销量起了重要作用。现有的商品销量预测方法中,一般是统计历史同期的销量,再依据统计结果进行销量预测。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:现有技术在预测商品销量时,仅统计历史同期的销量,不考虑商品价格、商品季节性、促销活动、节假日和天气状况等因素对商品销量所带来的影响,对商品销量预测的准确度较差。
发明内容
有鉴于此,本发明实施例提供一种确定销量预测模型的方法和装置,通过提取商品特征和天气特征来确定样本数据集,利用所述样本数据集建立销量预测模型,并对销量预测模型进行验证,以通过该模型预测商品销量,既提高了销量预测模型的泛化能力,又能够很好的预测与天气有关的商品销量。
为实现上述目的,根据本发明实施例的一个方面,提供了一种确定销量预测模型的方法。
本发明实施例的一种确定销量预测模型的方法,包括:从目标商品的商品数据中提取商品特征,从天气数据中提取天气特征,以确定样本数据集;将所述样本数据集划分为训练集和测试集,根据所述训练集和机器学习算法建立销量预测模型;将所述测试集输入所述销量预测模型,以验证所述销量预测模型。
可选地,所述确定样本数据集,包括:将所述目标商品的样本特征和对应的标签组成的数据对作为一个样本数据,所有的所述样本数据构成样本数据集;其中,所述样本特征包括所述商品特征和所述天气特征,所述标签为所述目标商品的销量数据。
可选地,所述将所述样本数据集划分为训练集和测试集,包括:采用有放回的随机采样方法,从所述样本数据集中选取预设第一比例的样本数据作为原始训练集;采用有放回的随机采样方法,从所述原始训练集中选取预设第二比例的特征;将选取的所述特征和对应的所述标签组成的数据对作为训练集,将所述样本数据集中除所述训练集外的样本数据作为测试集。
可选地,其中,将所述训练集设置为当前集合,所述根据所述训练集和机器学习算法建立销量预测模型,包括:计算平方误差:遍历当前集合中每个所述特征的特征值,计算每个所述特征的特征值对应的平方误差;划分子集合:将最小平方误差对应的特征和特征值作为切分点,以对所述当前集合进行划分得到两个子集合,将所述两个子集合设置为所述当前集合;重复执行所述计算平方误差和所述划分子集合,直至满足停止条件,确定所述子集合对应的叶节点值;根据最小平方误差对应的特征、特征值和所述叶节点值生成回归树,将所述回归树作为销量预测模型。
可选地,所述停止条件为下列中的一个或多个:所述子集合的样本数量小于或等于第一阈值,所述子集合的特征个数小于或等于第二阈值,以及重复执行所述计算平方误差和所述划分子集合的次数大于或等于第三阈值。
可选地,所述确定所述子集合对应的叶节点值,包括:当所述子集合的样本数量小于或等于所述阈值时,计算所述子集合中的样本的标签的均值,将所述均值作为所述子集合的叶节点值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810551461.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:商品关联程度确定方法及装置
- 下一篇:用于输出信息的方法和装置