[发明专利]移动终端换机预测方法、装置、设备及可读存储介质有效
申请号: | 202010938689.8 | 申请日: | 2020-09-09 |
公开(公告)号: | CN112115991B | 公开(公告)日: | 2023-08-04 |
发明(设计)人: | 王权;冯广辉;王雷;居燕峰;李福;朱坚;陆向东;林俊德 | 申请(专利权)人: | 福建新大陆软件工程有限公司 |
主分类号: | G06F18/2431 | 分类号: | G06F18/2431;G06F18/214;G06Q10/04 |
代理公司: | 福州市京华专利代理事务所(普通合伙) 35212 | 代理人: | 宋连梅 |
地址: | 350015 福*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 移动 终端 预测 方法 装置 设备 可读 存储 介质 | ||
本发明公开了一种移动终端换机预测方法、装置、设备及可读存储介质,获取业务数据,构建RandomForst和XGBOOST模型,将样本在模型的叶子节点位置变换成one‑hot编码特征,生成第一特征;对第一特征进行特征组合,生成第二特征,并将第一特征及第二特征合并;采用集成过滤法对合并后的特征进行选择,剔除表征能力差的特征;构建样本权值函数,并对模型损失函数进行优化;基于bagging框架来构建逻辑回归随机森林,通过模型进行移动终端的换机预测。本发明技术方案具有表征能力强、成本低、预测准确且鲁棒性强的优点,可便于运营商精准向用户营销手机,具有较高的商业价值。
技术领域
本发明涉及大数据技术领域,特别涉及一种移动终端换机预测方法、装置、设备及可读存储介质。
背景技术
随着我国移动网络的的发展,4G、5G技术的普及,智能手机市场发展迅猛。智能手机的普及已经势不可挡,手机在人们日常生活中扮演这越来越重要的角色,通信、消费、学习等各个领域都离不开手机,手机俨然成为生活必需品。手机终端换机市场份额现如今变得巨大,用户换机频率明显增强,运营商如何利用自己掌握的海量用户业务数据,精准向用户营销手机成为运营商拓展市场的战略中心。
现有的技术中,主要从两个层面研究用户换机模型,第一种是采用传统的数据分析手段,构建用户画像;第二种是采用机器学习手段,构建用户换机模型。相比较第一种方式,第二种方式更加具有针对性,输出用户是否置换手机以及相应的换机概率,是主流的换机模型构建方式。
但是,现有的换机模型构建过程中,仍然存在着许多问题。第一,采用机器学习手段构建模型,需要人工构建表征能力强的特征,但是不同的业务场景要求构建不同的人工特征,人工成本过高。第二,构建的人工特征最终不一定有效,在数据量较大的情况下,验证特征的有效性又会耗费较多的时间。第三,换机数据中,置换手机的用户人群数量远远少于非换机人群的数量,样本类别分布不均衡,样本权值默认一致,如果采用默认的优化损失函数的方式,会降低模型在少数类的泛化能力。
发明内容
本发明要解决的技术问题是如何提供一种成本低、预测准确、泛化能力强的移动终端换机预测方法、装置、设备及可读存储介质。
一方面,为了解决上述技术问题,本发明的技术方案为:
一种移动终端换机预测方法,包括步骤:
S10:获取业务数据,构建RandomForst和XGBOOST模型,将样本在模型的叶子节点位置变换成one-hot编码特征,生成第一特征;
S20:对所述第一特征进行特征组合,生成第二特征,并将所述第一特征及所述第二特征合并;
S30:采用集成过滤法对合并后的特征进行选择,剔除表征能力差的特征;
S40:构建样本权值函数,并对模型损失函数进行优化;
S50:基于bagging框架来构建逻辑回归随机森林,通过模型进行移动终端的换机预测。
优选地,步骤S10包括:
S11:对原始数据进行清洗、缺失值插补、异常值剔除;
S12:采用交叉验证法和嵌入特征法构建RandomForst以及XGBOOST模型;
S13:利用RandomForst以及XGBOOST模型对原始数据进行预测,预测每一个样本在各自模型的叶子节点的位置;
S14:根据样本在RandomForst以及XGBOOST模型叶子节点的位置,构建多个one-hot向量,然后将多个one-hot向量合并成一个新的向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福建新大陆软件工程有限公司,未经福建新大陆软件工程有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010938689.8/2.html,转载请声明来源钻瓜专利网。