[发明专利]一种确定销量预测模型的方法和装置在审
申请号: | 201810551461.6 | 申请日: | 2018-05-31 |
公开(公告)号: | CN110555713A | 公开(公告)日: | 2019-12-10 |
发明(设计)人: | 张瞻;李聚信;蒋佳涛 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06K9/62 |
代理公司: | 11219 中原信达知识产权代理有限责任公司 | 代理人: | 张一军;张效荣 |
地址: | 100195 北京市海淀区杏石口路6*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 预测模型 样本数据 商品特征 商品销量 天气特征 测试集 训练集 计算机技术领域 机器学习算法 验证 方法和装置 模型预测 目标商品 商品数据 天气数据 天气 预测 | ||
1.一种确定销量预测模型的方法,其特征在于,包括:
从目标商品的商品数据中提取商品特征,从天气数据中提取天气特征,以确定样本数据集;
将所述样本数据集划分为训练集和测试集,根据所述训练集和机器学习算法建立销量预测模型;
将所述测试集输入所述销量预测模型,以验证所述销量预测模型。
2.根据权利要求1所述的方法,其特征在于,所述确定样本数据集,包括:将所述目标商品的样本特征和对应的标签组成的数据对作为一个样本数据,所有的所述样本数据构成样本数据集;其中,所述样本特征包括所述商品特征和所述天气特征,所述标签为所述目标商品的销量数据。
3.根据权利要求2所述的方法,其特征在于,所述将所述样本数据集划分为训练集和测试集,包括:
采用有放回的随机采样方法,从所述样本数据集中选取预设第一比例的样本数据作为原始训练集;
采用有放回的随机采样方法,从所述原始训练集中选取预设第二比例的特征;
将选取的所述特征和对应的所述标签组成的数据对作为训练集,将所述样本数据集中除所述训练集外的样本数据作为测试集。
4.根据权利要求3所述的方法,其中,将所述训练集设置为当前集合,其特征在于,所述根据所述训练集和机器学习算法建立销量预测模型,包括:
计算平方误差:遍历当前集合中每个所述特征的特征值,计算每个所述特征的特征值对应的平方误差;
划分子集合:将最小平方误差对应的特征和特征值作为切分点,以对所述当前集合进行划分得到两个子集合,将所述两个子集合设置为所述当前集合;
重复执行所述计算平方误差和所述划分子集合,直至满足停止条件,确定所述子集合对应的叶节点值;
根据最小平方误差对应的特征、特征值和所述叶节点值生成回归树,将所述回归树作为销量预测模型。
5.根据权利要求4所述的方法,其特征在于,所述停止条件为下列中的一个或多个:所述子集合的样本数量小于或等于第一阈值,所述子集合的特征个数小于或等于第二阈值,以及重复执行所述计算平方误差和所述划分子集合的次数大于或等于第三阈值。
6.根据权利要求4所述的方法,其特征在于,所述确定所述子集合对应的叶节点值,包括:当所述子集合的样本数量小于或等于所述阈值时,计算所述子集合中的样本的标签的均值,将所述均值作为所述子集合的叶节点值。
7.一种确定销量预测模型的装置,其特征在于,包括:
提取确定模块,用于从目标商品的商品数据中提取商品特征,从天气数据中提取天气特征,以确定样本数据集;
划分建立模块,用于将所述样本数据集划分为训练集和测试集,根据所述训练集和机器学习算法建立销量预测模型;
输入验证模块,用于将所述测试集输入所述销量预测模型,以验证所述销量预测模型。
8.根据权利要求7所述的装置,其特征在于,所述提取确定模块,还用于:将所述目标商品的样本特征和对应的标签组成的数据对作为一个样本数据,所有的所述样本数据构成样本数据集;其中,所述样本特征包括所述商品特征和所述天气特征,所述标签为所述目标商品的销量数据。
9.根据权利要求8所述的装置,其特征在于,所述划分建立模块,还用于:
采用有放回的随机采样方法,从所述样本数据集中选取预设第一比例的样本数据作为原始训练集;
采用有放回的随机采样方法,从所述原始训练集中选取预设第二比例的特征;
将选取的所述特征和对应的所述标签组成的数据对作为训练集,将所述样本数据集中除所述训练集外的样本数据作为测试集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810551461.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:商品关联程度确定方法及装置
- 下一篇:用于输出信息的方法和装置