[发明专利]一种预测商品属性数据及训练其模型的方法和装置在审
申请号: | 201710606959.3 | 申请日: | 2017-07-24 |
公开(公告)号: | CN108932648A | 公开(公告)日: | 2018-12-04 |
发明(设计)人: | 杨骏;史建明;李杰 | 申请(专利权)人: | 上海宏原信息科技有限公司 |
主分类号: | G06Q30/06 | 分类号: | G06Q30/06;G06F17/30 |
代理公司: | 上海容慧专利代理事务所(普通合伙) 31287 | 代理人: | 于晓菁 |
地址: | 200233 上海市徐汇*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 商品属性 特征向量 店铺 预测 方法和装置 属性数据 数据模型 数学回归 高斯混合模型 模型获得 特征表示 预测结果 和向量 无监督 有效地 分级 聚类 | ||
本发明公开了一种预测商品属性数据及训练其模型的方法和装置,其中,训练预测商品属性数据模型的方法,包括:获取店铺的特征向量,店铺的特征向量包括店铺等级的特征值;获取商品属性的特征向量,其包括商品所属品类所对应的属性类别的特征值和商品的已知属性数据;结合店铺的特征向量和商品属性的特征向量训练数学回归模型,获得用于预测商品的未知属性数据的模型。本发明中,通过结合店铺的特征向量和商品属性的特征向量训练数学回归模型获得的预测商品属性数据模型能够获得更准确的预测结果,并且采用了高斯混合模型,能够有效地利用无监督聚类方法对店铺分级、基于词袋和向量将商品属性特征表示。
技术领域
本发明涉及计算机领域,具体是机器学习领域,尤其涉及一种预测商品属性数据及训练其模型的方法和装置。
背景技术
目前,商品在出售前需要进行相关的市场调研以预测商品相关属性数据信息,例如,包括商品价格、销售量和市场寿命等等,尤其是商品定价,传统的定价方法来源于成本和收益方面的考量,实际操作中受定价人主观因素(经验、认知等)的影响,这样的定价方法往往忽略了当前客观市场情况和商品自身的情况。另一方面,企业通过市场调查的方法来对商品定价,即设计实验抽样得到样本并对总体估计,但这种方法得到的价格与实际存在偏差,且对资源和技术手段要求较高,不利于实施。
因此,本领域的技术人员致力于开发一种预测商品属性数据及训练其模型的方法和装置
发明内容
有鉴于现有技术的上述缺陷,本发明所要解决的技术问题是提供一种能够准确预测商品属性数据的预测商品属性数据及训练其模型的方法和装置。
为实现上述目的,本发明提供了一种训练预测商品属性数据模型的方法,包括以下步骤:
获取店铺的特征向量,所述店铺的特征向量包括店铺等级的特征值,所述店铺等级的特征值基于高斯混合模型获得,其中高斯混合模型公式是
其中K为模型的个数,h为所述店铺的特征向量的元素个数,πk为第k个高斯的权重,N(xi|μk,σk)则为第k个高斯的概率密度函数,其参数μk为均值,σk为方差,xi是所述店铺的特征向量的第i个元素;
获取商品属性的特征向量,所述商品属性的特征向量包括商品所属品类所对应的属性类别的特征值和商品的已知属性数据;
结合所述店铺的特征向量和所述商品属性的特征向量训练数学回归模型,以获得用于预测商品的未知属性数据的模型。
进一步地,所述店铺的特征向量还包括店铺总销售额的特征值、店铺商品总数量的特征值、品类总销售额的特征值和该品类商品总数量的特征值。
进一步地,所述商品所述品类所对应的属性类别基于词袋模型获得。
进一步地,当所述商品的描述与商品所属品类所对应的属性类别匹配,则该商品所属品类所对应的属性类别赋值为1,否则赋值为0。
进一步地,还包括:在训练数学回归模型前,对特征值进行预处理,所述预处理包括归一化处理和/或高维变量处理。
进一步地,所述归一化处理是将特征值除以该特征值所对应的最大值,所述高维变量处理是对特征值计算相应的平方项、立方项、四次方项和五次方项。
进一步地,所述商品的未知属性数据为商品的价格,所述数学回归模型为价值回归模型。
进一步地,所述价值回归模型包括随机森林回归模型、随机梯度下降模型和梯度提升决策模型中的至少一种。
本发明还提供了一种预测商品属性数据的方法,采用前面所述的训练预测商品属性数据模型的方法获得的模型预测商品的未知属性数据,以获得所述商品的未知属性数据的预测结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海宏原信息科技有限公司,未经上海宏原信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710606959.3/2.html,转载请声明来源钻瓜专利网。