[发明专利]一种基于两阶段组合的在线消费行为预测方法及系统在审
申请号: | 202110989631.0 | 申请日: | 2021-08-26 |
公开(公告)号: | CN113706195A | 公开(公告)日: | 2021-11-26 |
发明(设计)人: | 李刚;刘荣月;沈梦迪;马洪栋 | 申请(专利权)人: | 东北大学秦皇岛分校 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06Q10/08;G06Q30/06 |
代理公司: | 沈阳东大知识产权代理有限公司 21109 | 代理人: | 李珉 |
地址: | 066004 河北省秦*** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 阶段 组合 在线 消费行为 预测 方法 系统 | ||
1.一种基于两阶段组合的在线消费行为预测方法,其特征在于,包括以下步骤:
步骤1:对用户在线浏览商品是否消费行为的历史数据进行预处理;其中历史数据包括定量指标值和定性指标值;
步骤2:基于Logistic模型进行指标组合的筛选;
步骤3:将Logistic模型筛选出来的变量作为决策树模型的输入变量,使用决策树模型对用户浏览商品是否消费的行为进行二次预测,并输出购买商品的概率;
步骤4:输出用户是否购买的概率,供商家进行营销决策。
2.根据权利要求1所述的一种基于两阶段组合的在线消费行为预测方法,其特征在于,所述步骤1具体包括以下步骤:
步骤1.1:将定量指标值采取最大最小标准化方法进行标准化处理;
步骤1.2:将定性指标值根据定性指标评分表进行打分。
3.根据权利要求1所述的一种基于两阶段组合的在线消费行为预测方法,其特征在于,步骤2所述Logistic模型中,设n个独立指标变量x={x1,x2,…,xn},二元响应变量y∈{0,1},y=1表示某个用户购买商品,y=0表示某个用户不购买某个商品;设条件概率p(y=1|x)=p为样本x条件下事件y=1发生的概率,则Logistic回归模型表示为:
其中g(x)=w0+w1x1+…+wnxn,wn表示第n个独立指标变量的权重;
对比值比取对数得到:
通过公式2求出w0,w1,…,wn,若指标xm(m=1,2,…,n)的权重wm不为0且相应的显著性水平P值小于5%,则说明该特征对借款人的违约状态具有影响,保留该指标;否则删除该指标,以此进行变量筛选。
4.根据权利要求1所述的一种基于两阶段组合的在线消费行为预测方法,其特征在于,步骤3所述二次预测为,给定数据集D={(x1,y1),(x2,y2),…,(xi,yi),…,(xn,yn)},其中xi为输入的特征向量,yi∈{1,2,...,K}是一个包含K个类的类别变量,在消费者是否购买的问题中K=2,i=1,2,…,n,n为样本量;
使用基尼指数用来衡量数据集的不确定性,定义如式(3)所示:
对于二分类,即消费者是否购买问题中,K=2,则基尼指数表示为:
Gini(r)=2r(1-r) (4)
其中r表示表示节点j(j=1,2,…,J)中第k(k=1,2,…,K)类样本的比例;
基尼指数(Gini)值越小,不确定程度就越小,选择基尼系数最小的指标进行分支,然后判断是否购买,输出用户是否购买商品的概率。
5.一种基于两阶段组合的在线消费行为预测系统,用于实现权利要求1所述的一种基于两阶段组合的在线消费行为预测方法,其特征在于,包括:用户数据输入模块,用户数据处理模块,用户数据输出模块;
所述用户数据输入模块,将用户浏览商品的在线数据输入到用户数据输入模块;
所述用户数据处理模块,将用户数据输入模块的在线数据输入到用户数据处理模块,用户数据处理模型处理用户的在线数据,用于预测用户在线浏览行为购买商品的概率预测;
所述用户数据输出模块,用户数据处理模块输出用户在线消费,即是否购买商品的概率,卖家根据用户购买商品的概率进行决策。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北大学秦皇岛分校,未经东北大学秦皇岛分校许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110989631.0/1.html,转载请声明来源钻瓜专利网。