[发明专利]一种最大化利益的热门商品榜单制定方法有效
申请号: | 201810335230.1 | 申请日: | 2018-04-13 |
公开(公告)号: | CN108573408B | 公开(公告)日: | 2021-07-27 |
发明(设计)人: | 曹斌;侯晨煜;范菁 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02 |
代理公司: | 杭州天正专利事务所有限公司 33201 | 代理人: | 王兵;黄美娟 |
地址: | 310014 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 最大化 利益 热门 商品 制定 方法 | ||
1.一种最大化利益的热门商品榜单制定方法,包括如下步骤:
步骤1.数据预处理;
以天为时间粒度,将历史数据按照天为间隔进行划分,然后提取能够反映物品热门程度的各种特征,最终总结为三大类特征:统计类特征、转换类特征和比值类特征;在异常数据清洗方面,使用帕累托法则对特征数据进行清洗;最后把商品在第二天是否上榜的信息作为标签数据,与之前提取的特征数据组合成最终的训练数据集;
提取的三大类特征具体说明如下:
统计类特征:加入购物车次数、从购物车删除次数、购买次数、浏览量、浏览人数、浏览时长、加入购物车人数、从购物车删除人数、购买人数;
转化率类特征:浏览量/浏览人数、浏览时长/浏览人数、加入购物车人数/浏览人数、从购物车删除人数/浏览人数、购买人数/浏览人数;
比值类特征:返客率、老客户率、跳出率、活跃度;
步骤2.潜在热门上榜商品集的筛选;
设计了基于时间衰减的随机森林分类模型TDRF对商品的特征数据进行学习和预测,为每个商品计算第二天上榜的概率,记为上榜置信度X_Trust;然后通过设置阈值的策略,将X_Trust过低的商品过滤;经过这一方法,可以从海量的商品集合中筛选出较小的商品集合作为潜在热门上榜商品;
将随机森林与时间衰减函数相结合,用于潜在热门上榜商品集的分类筛选;首先利用历史数据为每一天训练一个随机森林模型,再将最新一天的商品特征输入到历史的随机森林模型中分别预测上榜概率,记做{c1,c2,…,ct},其中t表示使用的训练模型距离预测日期的天数之差;然后引入时间衰减函数,对之前预测的上榜概率进行,具体的时间衰减函数如下:
公式中t表示使用的训练数模型距离预测日期的天数之差,α是一个参数,用来控制衰减速度;通过时间衰减函数,能够惩罚较旧的训练数据得到的上榜概率值,从而更加合理地预测热门榜单;为了保证所有上榜概率的权重之和等于1,需要对衰减权重进行归一化处理,计算公式如下所示:
最终,第二天商品的X_Trust通过如下公式计算:
XTrust(c,w)=w1c1+w2c2+…+wtct (4)
步骤3.潜在热门商品集的重排序并制定榜单;
用基于行为数据的重排序模型BBRR将物品的历史数据与X_Trust相结合,对候选集中的物品计算排序分数,最终根据排序分数进行重排序,快速且准确的得到最终的热门商品预测排行榜单;在重排序的过程中,结合商品前一天的浏览量Pv、浏览人数Uv以及排行情况LRS,还结合了商品发布到目前的天数Ad,商品最近被浏览到目前的天数Ld;具体的计算方式如下所示:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810335230.1/1.html,转载请声明来源钻瓜专利网。