[发明专利]基于大数据用户行为分析的高潜在用户购买意向预测方法有效

专利信息
申请号: 201711164670.7 申请日: 2017-11-21
公开(公告)号: CN107944913B 公开(公告)日: 2022-03-22
发明(设计)人: 王进;杨阳;周瑞港;孙开伟;欧阳卫华;邓欣;陈乔松 申请(专利权)人: 重庆邮电大学
主分类号: G06Q30/02 分类号: G06Q30/02;G06K9/62
代理公司: 重庆市恒信知识产权代理有限公司 50102 代理人: 刘小红
地址: 400065 重*** 国省代码: 重庆;50
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明请求保护一种基于大数据用户行为分析的高潜在用户购买意向预测方法,包括:101数据预处理,对电商用户历史行为数据集进行预处理操作;102样本定义与打标,根据用户历史消费行为,以有交互的用户产品对为关键字构建样本;103训练集测试集划分,采用时间窗口划分法,将历史数据划分为训练集与测试集;104特征构建,对用户的历史行为数据进行特征工程构建;105算法设计与实现,首先对特征群特征选择和对数据集进行不平衡数据的处理,随后本发明提出一种两层模型迭代学习算法预测最终结果。本发明基于时间跨度45天的电商用户历史行为数据,建立预测模型,从而预测未来5天用户是否下单候选商品集合P中的商品。
搜索关键词: 基于 数据 用户 行为 分析 潜在 购买 意向 预测 方法
【主权项】:
一种基于大数据用户行为分析的高潜在用户购买意向预测方法,其特征在于,包括以下步骤:101、数据预处理步骤:对电商用户历史行为数据进行包括去重、删除日成交量大于月平均成交量3倍的异常日期记录和按照各个行为类别重要性赋予其权重在内的预处理操作;102、样本定义与打标步骤:提取5天为跨度的时间窗口交互的用户产品对,以用户id和产品id为索引构建样本,对其进行打标操作;103、训练集与测试集划分步骤:利用时间窗口划分法,将步骤102打标操作后的数据以不同时间粒度划分训练集与测试集;104、特征提取步骤:在特征工程阶段,主要根据用户行为特征群。排名特征群和得分特征群进行特征提取;105、算法设计与实现步骤:对于数据集的类别不平衡分类问题,提出一种基于聚类的相似样本去除算法,包括步骤:首先将原始样本按照标签的不同分为两部分,然后对数量较多的一部分进行聚类操作,接下来在聚类过后的每个类中随机抽样部分样本,最后将不同类中随机抽取的样本合并为新的数据集,抽样比为原始数据中少的一部分数量比多的一部分数量;模型预测阶段提出一种两层模型迭代学习算法去预测用户最终是否会购买商品子集P中的商品,包括步骤:第一层利用前面数据预处理、打标、训练集划分、特征提取后的训练集训练第一层模型,利用第一层模型预测测试集的概率;将测试集预测概率从高到低排序,取排名前1/10为正样本输出,后1/10为负样本输出;将输出的正样本和负样本进行随机采样;将抽样出的正样本加入原训练集作为新增加的正样本,抽样出的负样本加入原训练集作为新增加的负样本;利用重新构建的训练集和xgboost急速梯度提升决策树训练得到第二层模型;重复直到每次输出的正样本数量总和为测试集中实际正样本数量。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201711164670.7/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top