[发明专利]一种基于两阶段组合的在线消费行为预测方法及系统在审
申请号: | 202110989631.0 | 申请日: | 2021-08-26 |
公开(公告)号: | CN113706195A | 公开(公告)日: | 2021-11-26 |
发明(设计)人: | 李刚;刘荣月;沈梦迪;马洪栋 | 申请(专利权)人: | 东北大学秦皇岛分校 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06Q10/08;G06Q30/06 |
代理公司: | 沈阳东大知识产权代理有限公司 21109 | 代理人: | 李珉 |
地址: | 066004 河北省秦*** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 阶段 组合 在线 消费行为 预测 方法 系统 | ||
本发明提供一种基于两阶段组合的在线消费行为预测方法及系统,涉及消费预测技术领域。本发明包括用户数据输入模块,用户数据处理模块,用户数据输出模块。将Logistic模型筛选出来的7个变量可以作为决策树模型的输入变量,使用决策树模型对用户浏览商品是否消费的行为进行二次预测,并输出购买商品的概率;将传统的统计模型与人工智能方法相结合,使在线消费行为预测模型既具有解释性又具有准确性,并为商家制定促销方案提供建议。
技术领域
本发明涉及消费预测技术领域,尤其涉及一种基于两阶段组合的在线消费行为预测方法及系统。
背景技术
Qiu等(2017)提出了一个两阶段的网络购物行为预测框架。首先,计算产品之间的相关性。然后,利用支持向量机(SVM)和层次贝叶斯离散选择模型计算顾客对候选产品的偏好。Silahtaroglu(2015)等收集网上购物行为和顾客的人口统计信息,并利用决策树和神经网络预测用户是否会在购物车中购买商品。
传统的统计计量模型具有很好的鲁棒性和可解释性,但其预测精度不够高,无法处理高维数据;人工智能方法准确性高,对数据分布没有严格要求,但其鲁棒性较差,并且机器学习方法是黑箱操作,造成输出结果的可解释性不高。所以,本文建立一个预测在线消费行为的两阶段组合模型。
发明内容
针对现有技术存在的问题,本发明提供一种基于两阶段组合的在线消费行为预测方法及系统。
为了解决上述技术问题,本发明采用以下的技术方案:
一方面,一种基于两阶段组合的在线消费行为预测方法,具体包括以下步骤:
步骤1:对用户在线浏览商品是否消费行为的历史数据进行预处理;其中历史数据包括定量指标值和定性指标值;
步骤1.1:将定量指标值采取最大最小标准化方法进行标准化处理;
步骤1.2:将定性指标值根据定性指标评分表进行打分;
步骤2:基于Logistic模型进行指标组合的筛选;
所述Logistic模型中,设n个独立指标变量x={x1,x2,…,xn},二元响应变量y∈{0,1},y=1表示某个用户购买商品,y=0表示某个用户不购买某个商品;设条件概率p(y=1|x)=p为样本x条件下事件y=1发生的概率,则Logistic回归模型表示为:
其中g(x)=w0+w1x1+…+wnxn,wn表示第n个独立指标变量的权重;
对比值比取对数得到:
通过公式2求出w0,w1,…,wn,若指标xm(m=1,2,…,n)的权重wm不为0且相应的显著性水平P值小于5%,则说明该特征对借款人的违约状态具有影响,保留该指标;否则删除该指标,以此进行变量筛选。
步骤3:将Logistic模型筛选出来的变量作为决策树模型的输入变量,使用决策树模型对用户浏览商品是否消费的行为进行二次预测,并输出购买商品的概率;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北大学秦皇岛分校,未经东北大学秦皇岛分校许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110989631.0/2.html,转载请声明来源钻瓜专利网。