[发明专利]商品品牌特征获取方法、销量预测方法、装置及电子设备有效
申请号: | 202010122140.1 | 申请日: | 2020-02-28 |
公开(公告)号: | CN111401409B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 黄泽;王梦秋;胡太祥 | 申请(专利权)人: | 创新奇智(青岛)科技有限公司 |
主分类号: | G06F18/214 | 分类号: | G06F18/214;G06Q30/0202;G06F18/23 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 蒋姗 |
地址: | 266200 山东省青岛市*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 商品 品牌 特征 获取 方法 销量 预测 装置 电子设备 | ||
本申请涉及一种商品品牌特征获取方法、销量预测方法、装置及电子设备,属于人工智能技术领域。该方法包括:获取包括目标商品品牌在内的多个商品品牌各自对应的历史日均销量序列;将每个商品品牌各自对应的历史日均销量序列转换为句子字符串;基于所有的句子字符串组成矩阵阵列,矩阵阵列中的每一行对应一个句子字符串;基于词向量模型将矩阵阵列中的每一个句子字符串转换为对应的句向量,得到语义向量矩阵;对语义向量矩阵中的每个句向量进行聚类,得到聚类后的目标商品品牌所在的类对应的标签,标签为目标商品品牌对应的品牌特征。避免采用独热编码带来的高维稀疏特征矩阵,以降低销量预测模型训练时的所需的时间以及空间并提高其预测精度。
技术领域
本申请属于人工智能技术领域,具体涉及一种商品品牌特征获取方法、销量预测方法、装置及电子设备。
背景技术
对于商场、超市而言,精确的商品销量预测可助其制定利益最大化的供补货策略,从而提升周转率,降低缺货率。在工业界,一般可以通过从店铺地理位置,客流量以及商品相关属性等构造特征,具体一般为对数值型特征进行不同周期的滑窗,对类别特征进行独热编码,然后使用集成树模型对商品未来销量进行预测。
但与商品属性相关的离散型特征如商品种类以及品牌信息等,数量繁多,一旦进行独热编码,会直接给集成树模型带来数以千记的高维且稀疏的特征维度,令其分裂节点时不得不遍历每一个由独热编码新生成的特征维度,这无论是对训练时所需内存空间还是时间,都带来了更大的开销,除此之外,独热编码后新生成的特征变得相互独立,且每个特征只有0或1两个取值,意味着分裂时采用的是one-vs-rest的切分方式,当特征维度高时,每个类别上的数据会较少,这时切分会不平衡,其能为模型带来的增益也会锐减,因此模型会更倾向于选择那些没有经过独热编码处理过的特征。
发明内容
鉴于此,本申请的目的在于提供一种商品品牌特征获取方法、销量预测方法、装置及电子设备,以改善目前采用独热编码来获取与商品属性相关的离散型特征时带来的高维稀疏特征矩阵,进而导致训练销量预测模型时需要额外的时间开销的问题。
本申请的实施例是这样实现的:
第一方面,本申请实施例提供了一种商品品牌特征获取方法,包括:获取包括目标商品品牌在内的多个商品品牌各自对应的历史日均销量序列;将每个商品品牌各自对应的历史日均销量序列转换为句子字符串;基于所有的句子字符串组成矩阵阵列,所述矩阵阵列中的每一行对应一个句子字符串;基于词向量模型将所述矩阵阵列中的每一个句子字符串转换为对应的句向量,得到语义向量矩阵;对所述语义向量矩阵中的每个句向量进行聚类,得到聚类后的所述目标商品品牌所在的类对应的标签,所述标签为所述目标商品品牌对应的品牌特征。本申请实施例中,将商品品牌特征相关性高的连续型变量特征序列-商品品牌历史日均销量序列,作为每个商品品牌自身的一种向量表示,并将其转换为句子字符串,然后基于所有的句子字符串组成矩阵阵列,并通过词向量模型将该矩阵阵列中的每一个句子字符串转换为对应的句向量,得到语义向量矩阵,然后对转换后的句向量进行聚类,并将聚类后的结果标签赋予对应序列的商品品牌,成为品牌特征新的特征取值,避免直接对数以千计的品牌作独热编码,从而避免采用独热编码带来的高维稀疏特征矩阵,以降低销量预测模型训练时的所需的时间以及空间并提高其预测精度。
结合第一方面实施例的一种可能的实施方式,基于词向量模型将所述矩阵阵列中的每一个句子字符串转换为对应的句向量,包括:基于doc2vector模型将所述矩阵阵列中的每一个句子字符串转换为对应的句向量。本申请实施例中,利用doc2vector模型可以直接从语义上下文学习到矩阵阵列中的每一个句子字符串对应的句向量,进而提高了转换效率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于创新奇智(青岛)科技有限公司,未经创新奇智(青岛)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010122140.1/2.html,转载请声明来源钻瓜专利网。