[发明专利]对用户流失进行预测的方法、设备、存储介质以及处理器在审
申请号: | 201810157029.9 | 申请日: | 2018-02-24 |
公开(公告)号: | CN110197187A | 公开(公告)日: | 2019-09-03 |
发明(设计)人: | 杜家春;殷俊;纪超;杨赫;李英杰 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 贾允;肖丁 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 子集 分类器模型 属性集合 预测 存储介质 多个属性 分类模型 属性信息 处理器 机器学习 分类 | ||
本发明公开了一种对用户流失进行预测的方法、设备、存储介质以及处理器,包括:获取用户的多个属性的属性信息,多个属性为属性集合包括的属性;以及基于属性信息,利用通过机器学习训练的分类模型,对用户的用户流失进行预测,分类模型包括第一分类器模型和第二分类器模型。其中,属性集合包括第一子集和第二子集,并且第一子集和第二子集所包括的属性互不相同,第一分类器模型是根据属性集合中的属性训练的,第一分类器模型根据第一子集中的属性进行分类操作,并且第二分类器模型是根据加入新属性后的属性集合训练的。其中新属性是通过将第二子集中的至少一部分属性进行组合形成的。本发明解决了现有技术中存在的预测不准确的技术问题。
技术领域
本发明涉及用户数据挖掘领域,特别涉及一种构建分类器进行分类和预测的方法、设备和处理器。
背景技术
很多由用户参与的业务(如网络游戏、电子商务、通信业务和微信等等)不可避免的会面临用户流失的问题。所谓用户流失,是指用户不再使用这个业务。对业务而言,这是一种损失,尤其是当流失的用户量特别大的时候,对业务的运营是一个巨大的打击。因此,能够在用户流失之前就能预测到用户即将流失,进而采取一些措施进行挽留,延长其在业务中的生命周期,对业务而言,是非常具有吸引力,非常重要的一项研究。
目前主流的预测用户流失的方法,都来自于机器学习领域,如决策树,支持向量机,朴素贝叶斯等。这几种方法相对都是较弱的预测方法,为了提高预测的准确率,可以以这些方法为基函数,使用加法模型进行提升。其中,基于决策树提升,产生的提升树就是一类有效的方法,XGBoost是提升树中的一个代表。
使用提升树模型进行用户流失预测时,输入是用户的各种属性和类别信息,输出是用户流失概率。该方法会根据这些属性,依次生成指定数目的决策树,其中,每一棵决策树的生成都依赖之前已经生成的决策树,目的是最小化到目前为止的模型预测值和与真实值之间的差异。
然而,在生产每一棵决策树的过程中,算法会采取贪心策略来选择树上每一个节点需要用到的分裂属性和相应的分裂值,所以有可能出现如下的情况:在给定之前节点的情况下,按照属性单个考察,总有某些属性,我们称之为弱属性,对预测的帮助没有另一些属性(我们称之为强属性)大。但如果把弱属性组合起来,很有可能就比单一的强属性对预测的帮助更大了,尤其是当强属性与弱属性的差异并不明显时,这时弱属性组合可以被挑选出来成为分裂属性。
但是,现有技术的提升树模型中,在贪心策略下,这些弱属性是不会被挑选出来成为分裂属性的。从而使得用户的属性信息不能得到充分的利用,进而使得对用户流失的预测的准确性受到影响。
并且进一步的,现有的分类模型由于在分类器的训练过程中同样存在对对象属性不能充分使用的问题。因此导致现有技术训练出来的分类模型分类不够准确的技术问题。
对于上面提到的现有技术中存在的用户的属性信息不能得到充分的利用,进而使得对用户流失的预测的准确性受到影响的问题以及现有技术训练出来的分类模型分类不够准确的技术问题,目前还没有提出有效的解决手段。
发明内容
为了解决现有技术的问题,本发明实施例提供了一种构建分类器进行分类和预测的方法、设备和处理器。所述技术方案如下:
第一方面,提供了一种对用户流失进行预测的方法,包括:获取用户的多个属性的属性信息,多个属性为属性集合包括的属性;以及基于属性信息,利用通过机器学习训练的分类模型,对用户的用户流失进行预测,分类模型包括第一分类器模型和第二分类器模型。其中,属性集合包括第一子集和第二子集,并且第一子集和第二子集所包括的属性互不相同,第一分类器模型是根据属性集合中的属性训练的,第一分类器模型根据第一子集中的属性进行分类操作,并且第二分类器模型是根据加入新属性后的属性集合训练的。其中新属性是通过将第二子集中的至少一部分属性进行组合形成的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810157029.9/2.html,转载请声明来源钻瓜专利网。