[发明专利]一种物流企业用户流失的预测方法在审
申请号: | 202210236265.6 | 申请日: | 2022-03-11 |
公开(公告)号: | CN114677167A | 公开(公告)日: | 2022-06-28 |
发明(设计)人: | 孙哲;王宇飞;孙知信;赵学健;汪胡青;高婧;胡冰 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06Q10/08;G06K9/62;G06N3/00 |
代理公司: | 南京苏科专利代理有限责任公司 32102 | 代理人: | 陈忠辉 |
地址: | 210023 江苏省南京*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 物流 企业 用户 流失 预测 方法 | ||
1.一种物流企业用户流失的预测方法,其特征在于:包括以下步骤:
S1:对于物流企业用户的原始数据集进行数据预处理,对于原始数据集,采用CDF累积分布函数进行数据转换,对于所有的特征进行分级分类处理,将所有的数据进行无量纲化;
S2:特征工程阶段处理:对数据集采用RF和CRITIC的方法来对数据进行特征提取和用户流失系数的评估;
S3:用户流失的预测处理,采用BAS和SVM相结合的方法,将种群的思想与BAS方法相结合,将种群以及最优解引导机制的思想加入到了BAS中,通过BAS对SVM的惩罚因子和核函数参数进行更好的寻优,使得到的局部和全局最优极值更加准确。
2.根据权利要求1所述的一种物流企业用户流失的预测方法,其特征在于:所述步骤S1中原始数据集中各个特征分类处理,特征包括基本信息数据、用户行为属性数据和物流企业属性数据,所述基本信息中包括用户编号、用户身份、用户规模、市场,用户行为属性数据包括服务情况、交易数量、收支情况,物流企业属性数据包括交易情况、资金补助,并对各个特征进行字段命名和编码。
3.根据权利要求2所述的一种物流企业用户流失的预测方法,其特征在于:利用CDF累积分布函数的方法进行数据转换,具体方法图如下:
对于分级分级处理后的特征,采用CDF累积分布函数对各个特征进行数据转换,各个特征中的所有数据表示为x(x1,x2,x3,...,xn),其中n是每个指标的总数据,指标中每个值的排序顺序表示为(x[1],x[2],x[3],...,x[n]),指标数据的转换过程如下:
对于负索引,首先采用相反数量的索引数,然后再采用CDF累积分布函数进行数据转换。
4.根据权利要求1所述的一种物流企业用户流失的预测方法,其特征在于:所述步骤S2具体包括以下步骤:
S21:通过RF对数据集中的特征指标进行特征的提取筛选,RF用多个决策树构成,每个决策树的生成遵循自上而下的划分原则,对每个决策树采取从根节点开始划分训练集的方法,对于每个树中节点,基于最小纯度节点的原则,选择其划分属性,同时分离训练数据集;
S22:使用CRITIC方法对于用户流失的风险进行评估。
5.根据权利要求4所述的一种物流企业用户流失的预测方法,其特征在于:所述步骤S21中决策树在训练时会生成子节点,当决策树满足分支停止的规则时,停止子节点的生长,对各个特征的“纯度”进行量化处理,计算各个特征的“纯度”方法如下:
S211:计算特征中信息熵的增益:
其中,S是进行训练的样本集,F为样本中所包含的特征,P(F|i)为在特征出现的情况下每个类别的概率,P(i)为特征在样本中出现的概率;
S212:将样本中的特征作为随机变量,对样本S进行划分训练:
S213:计算样本集中特征的“纯度”,将“纯度”高的特征提取出来:
6.根据权利要求4所述的一种物流企业用户流失的预测方法,其特征在于:所述步骤S22包括以下步骤:
S221:计算第j个特征指标和其他指标的冲突性量化指标:
其中,相关系数选取的是样本的协方差和标准差进行表示,
S222:计算第j个特征所包含的信息量:
S223:计算第j个特征的客观权重:
其中,Xij代表第i个一级指标中的第j个二级指标,代表第i个一级指标中的平均值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210236265.6/1.html,转载请声明来源钻瓜专利网。