[发明专利]基于大数据用户行为分析的高潜在用户购买意向预测方法有效
申请号: | 201711164670.7 | 申请日: | 2017-11-21 |
公开(公告)号: | CN107944913B | 公开(公告)日: | 2022-03-22 |
发明(设计)人: | 王进;杨阳;周瑞港;孙开伟;欧阳卫华;邓欣;陈乔松 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06K9/62 |
代理公司: | 重庆市恒信知识产权代理有限公司 50102 | 代理人: | 刘小红 |
地址: | 400065 重*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明请求保护一种基于大数据用户行为分析的高潜在用户购买意向预测方法,包括:101数据预处理,对电商用户历史行为数据集进行预处理操作;102样本定义与打标,根据用户历史消费行为,以有交互的用户产品对为关键字构建样本;103训练集测试集划分,采用时间窗口划分法,将历史数据划分为训练集与测试集;104特征构建,对用户的历史行为数据进行特征工程构建;105算法设计与实现,首先对特征群特征选择和对数据集进行不平衡数据的处理,随后本发明提出一种两层模型迭代学习算法预测最终结果。本发明基于时间跨度45天的电商用户历史行为数据,建立预测模型,从而预测未来5天用户是否下单候选商品集合P中的商品。 | ||
搜索关键词: | 基于 数据 用户 行为 分析 潜在 购买 意向 预测 方法 | ||
【主权项】:
一种基于大数据用户行为分析的高潜在用户购买意向预测方法,其特征在于,包括以下步骤:101、数据预处理步骤:对电商用户历史行为数据进行包括去重、删除日成交量大于月平均成交量3倍的异常日期记录和按照各个行为类别重要性赋予其权重在内的预处理操作;102、样本定义与打标步骤:提取5天为跨度的时间窗口交互的用户产品对,以用户id和产品id为索引构建样本,对其进行打标操作;103、训练集与测试集划分步骤:利用时间窗口划分法,将步骤102打标操作后的数据以不同时间粒度划分训练集与测试集;104、特征提取步骤:在特征工程阶段,主要根据用户行为特征群。排名特征群和得分特征群进行特征提取;105、算法设计与实现步骤:对于数据集的类别不平衡分类问题,提出一种基于聚类的相似样本去除算法,包括步骤:首先将原始样本按照标签的不同分为两部分,然后对数量较多的一部分进行聚类操作,接下来在聚类过后的每个类中随机抽样部分样本,最后将不同类中随机抽取的样本合并为新的数据集,抽样比为原始数据中少的一部分数量比多的一部分数量;模型预测阶段提出一种两层模型迭代学习算法去预测用户最终是否会购买商品子集P中的商品,包括步骤:第一层利用前面数据预处理、打标、训练集划分、特征提取后的训练集训练第一层模型,利用第一层模型预测测试集的概率;将测试集预测概率从高到低排序,取排名前1/10为正样本输出,后1/10为负样本输出;将输出的正样本和负样本进行随机采样;将抽样出的正样本加入原训练集作为新增加的正样本,抽样出的负样本加入原训练集作为新增加的负样本;利用重新构建的训练集和xgboost急速梯度提升决策树训练得到第二层模型;重复直到每次输出的正样本数量总和为测试集中实际正样本数量。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711164670.7/,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置