[发明专利]用户流失原因的获取方法、装置、计算机设备和存储介质有效
| 申请号: | 202110293420.3 | 申请日: | 2021-03-19 |
| 公开(公告)号: | CN112686718B | 公开(公告)日: | 2021-06-29 |
| 发明(设计)人: | 杨健颖;何悦 | 申请(专利权)人: | 深圳索信达数据技术有限公司 |
| 主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06N20/00 |
| 代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 谢曲曲 |
| 地址: | 518051 广东省深圳市南山*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用户 流失 原因 获取 方法 装置 计算机 设备 存储 介质 | ||
1.一种用户流失原因的获取方法,其特征在于,所述方法包括:
获取流失用户数据;所述流失用户数据包括流失用户的不少于一项用户特征;
根据所述流失用户数据,通过预设的流失值计算公式,计算各用户特征的流失值;所述流失值是用于量化所述用户特征与用户流失之间关系的参数;
根据各用户特征的流失值,计算各用户特征的流失值占比;所述流失值占比是各项用户特征的流失值占总流失值的比重;所述总流失值是各项用户特征的流失值的和;
根据各用户特征的流失值占比,获取用户流失原因;
所述通过预设的流失值计算公式,计算各用户特征的流失值包括:
将所述流失用户数据代入预设的流失值计算公式,获取每项用户特征的流失值;
所述流失值计算公式为:
其中,“!”表示阶乘,“| |”表示集合中包含元素的个数,F表示全部用户特征的集合,表示从F集合中剔除第i个特征后剩下的特征集合,S表示F的子集,表示将第i个特征加入S后训练的流失用户判断模型,表示S与第i个特征的并集;表示基于S训练的流失用户判断模型。
2.根据权利要求1所述的方法,其特征在于,所述获取流失用户数据包括:
将目标用户数据输入至预先训练好的流失用户判断模型,输出流失用户数据;
所述流失用户判断模型是根据样本用户数据和样本用户的流失标签进行训练获取的;所述样本用户数据包括样本用户的不少于一项用户特征;所述流失标签是用于表征所述样本用户是否为流失用户的参数。
3.根据权利要求1所述的方法,其特征在于,所述根据各用户特征的流失值,计算各用户特征的流失值占比包括:
用0替换各用户特征的流失值中小于0的数据,计算各用户特征的流失值的和作为总流失值;
计算各用户特征的流失值与所述总流失值的比值,作为各用户特征的流失值占比。
4.根据权利要求2所述的方法,其特征在于,所述根据各用户特征的流失值占比,获取用户流失原因包括:
将各用户特征的流失值占比进行降序排列,生成流失值序列;
将所述流失值序列从最大值开始依次累加,获取所述流失值的累加值;
当所述累加值大于或等于预设的累加阈值时,将所述累加值对应的用户特征作为用户流失特征;
根据所述用户流失特征,获取用户流失原因。
5.根据权利要求4所述的方法,其特征在于,所述根据所述用户流失特征,获取用户流失原因包括:
根据所述用户流失特征,获取所述用户流失特征对应的WOE编码值;
将WOE编码值超过预设的WOE编码阈值的用户流失特征,通过预设的流失原因映射表,生成用户流失原因;所述流失原因映射表包含各用户流失特征与用户流失原因之间的映射关系。
6.根据权利要求5所述的方法,其特征在于,所述根据所述用户流失特征,获取所述用户流失特征对应的WOE编码值,之前还包括:
将所述目标用户数据中连续的用户特征进行分箱处理,获取各连续的用户特征对应的分箱;
计算各分箱的WOE编码值和所述目标用户数据中离散的用户特征的WOE编码值;
将所述WOE编码值大于预设的WOE编码阈值的用户特征设置对应的用户流失原因,生成用户流失原因映射表。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳索信达数据技术有限公司,未经深圳索信达数据技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110293420.3/1.html,转载请声明来源钻瓜专利网。





