[发明专利]对用户流失进行预测的方法、设备、存储介质以及处理器在审
申请号: | 201810157029.9 | 申请日: | 2018-02-24 |
公开(公告)号: | CN110197187A | 公开(公告)日: | 2019-09-03 |
发明(设计)人: | 杜家春;殷俊;纪超;杨赫;李英杰 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 贾允;肖丁 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 子集 分类器模型 属性集合 预测 存储介质 多个属性 分类模型 属性信息 处理器 机器学习 分类 | ||
1.一种对用户流失进行预测的方法,其特征在于,包括:
获取用户的多个属性的属性信息,所述多个属性为属性集合包括的属性;以及
基于所述属性信息,利用通过机器学习训练的分类模型,对所述用户的用户流失进行预测,所述分类模型包括第一分类器模型和第二分类器模型,其中
所述属性集合包括第一子集和第二子集,并且所述第一子集和所述第二子集所包括的属性互不相同,
所述第一分类器模型是根据所述属性集合中的属性训练的,
所述第一分类器模型根据所述第一子集中的属性进行分类操作,并且
所述第二分类器模型是根据加入新属性后的所述属性集合训练的,其中所述新属性是通过将所述第二子集中的至少一部分属性进行组合形成的。
2.根据权利要求1所述的方法,其特征在于,所述第一子集和所述第二子集是通过以下操作确定的:
根据所述属性集合中的属性训练所述第一分类器模型;
根据所述第一分类器模型进行分类所使用的属性确定所述第一子集;以及
从所述属性集合中去除所述第一子集,获得所述第二子集。
3.根据权利要求2所述的方法,其特征在于,形成所述新属性的操作包括:
根据所述第二子集中的属性训练第三分类器模型;以及
根据所述第三分类器模型将所述第二子集中的所述至少一部分属性进行组合,形成所述新属性。
4.根据权利要求3所述的方法,其特征在于,所述第一分类器模型、所述第二分类器模型以及所述第三分类器模型各包括至少一个分类树。
5.根据权利要求4所述的方法,其特征在于,形成所述新属性的操作包括:
统计所述第三分类器模型中各个属性组合出现的次数,其中所述属性组合为所述第三分类器模型的分类树的路径上前后相邻的预定数量的属性构成的组合;以及
选取出现次数高于预定次数的属性组合,形成所述新属性。
6.根据权利要求5所述的方法,其特征在于,统计所述第三分类器模型中各个属性组合出现的次数的操作包括:
获得各个属性组合在每一棵分类树上出现的次数;以及
将各个属性组合在每一棵分类树上出现的次数相加,得到所述第三分类器模型中各个属性组合出现的次数。
7.根据权利要求6所述的方法,其特征在于,获得各个属性组合在每一棵分类树上出现的次数的操作包括,在每一棵分类树上执行以下操作:
统计各个属性组合在分类树的每一条路径上出现的次数;以及
将各个属性组合在每一条路径上出现的次数相加,得到各个属性组合在分类树上出现的次数。
8.根据权利要求1至7中任意一项所述的方法,其特征在于,所述属性集合中的所述多个属性包括以下各项中的至少一项:用户的年龄、用户的性别、用户的地理位置、用户的职业、用户使用业务的总时长、用户最近一次使用业务的时长、用户最近一次使用业务的时刻距离当前时刻的时长、用户的总付费额、用户的最近一次付费额。
9.一种构建分类模型的方法,其特征在于,包括:
获取第一训练数据集合,并根据所述第一训练数据集合中的数据确定包括多个属性的属性集合;
利用第一训练数据集合通过机器学习的方式训练所述分类模型的第一分类器模型;
根据所述第一分类器模型确定所述属性集合的第一子集,其中所述第一子集中的属性为所述第一分类器模型进行分类所使用的属性;
从所述属性集合中去除所述第一子集中的属性,获得第二子集;
将所述第二子集中的至少一部分属性进行组合,形成新属性;以及
将所述新属性加入到所述属性集合中。
10.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制处理器执行权利要求1至17中任意一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810157029.9/1.html,转载请声明来源钻瓜专利网。