[发明专利]一种识别潜在用户的方法及对应装置有效
申请号: | 201711463187.9 | 申请日: | 2017-12-28 |
公开(公告)号: | CN109977977B | 公开(公告)日: | 2021-04-02 |
发明(设计)人: | 朱君瑀;黄淳瑶;郑茂;余凤丽;余韦;江勇;陈春松;梁恩磊;尚晶;舒敏根;黄岩 | 申请(专利权)人: | 中移动信息技术有限公司;中国移动通信集团有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q30/02 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 黄志华 |
地址: | 102209 北京市昌平区未来*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 识别 潜在 用户 方法 对应 装置 | ||
本发明实施例公开了一种识别潜在用户的方法及对应装置,用以解决现有技术识别潜在用户准确性低的问题。方法包括:选取N个已确认用户,并获得所述N个已确认用户的特征变量的值;将所述N个已确认用户作为原始样本集,并基于所述原始样本集构建随机森林分类模型;构建所述随机森林分类模型的损失函数,并使用L1范数、L2范数正则化所述损失函数;求解正则化后的损失函数的因变量为最小时所述自变量的最优解,并根据所述最优解更新所述所有基分类器的权重系数,生成新的随机森林分类模型;将待识别用户的特征变量的值输入所述新的随机森林分类模型,获得输出结果;根据所述输出结果确定所述待识别用户为潜在用户或非潜在用户。
技术领域
本发明涉及计算机技术邻域,特别涉及一种识别潜在用户的方法及对应装置。
背景技术
目前,各企业为了更加精准地把控用户需求,提高企业营销成功率,常使用随机森林算法对大量已确认的潜在用户和非潜在用户的用户数据进行分析,生成随机森林分类模型,并利用该模型确定待识别用户为潜在用户的概率。
但是,现有技术构造出的随机森林分类模型中,通常含有大量的由无用特征构建的基分类器,这些基分类器的预测性能非常差,严重影响到随机森林分类模型的最终输出结果,使得随机森林分类模型识别潜在用户的准确度降低。
发明内容
本发明实施例提供一种识别潜在用户的方法及对应装置,用以解决现有技术识别潜在用户准确性低的问题。
第一方面,第本发明实施例提供一种识别潜在用户的方法,包括:
选取N个已确认用户,并获得所述N个已确认用户的特征变量的值;其中,所述N个已确认用户的类型包括已确认的潜在用户和已确认的非潜在用户,所述N个已确认用户中每个用户对应至少一项特征变量;
将所述N个已确认用户作为原始样本集,并基于所述原始样本集构建随机森林分类模型;其中,所述随机森林分类模型的输入为用户的特征变量的值,输出是所述随机森林分类模型中所有基分类器判定所述用户为潜在用户的概率;
构建所述随机森林分类模型的损失函数,并使用L1范数、L2范数正则化所述损失函数;其中,所述损失函数的自变量为所述所有基分类器的权重系数;
求解正则化后的损失函数的因变量为最小时所述自变量的最优解,并根据所述最优解更新所述所有基分类器的权重系数,生成新的随机森林分类模型;
将待识别用户的特征变量的值输入所述新的随机森林分类模型,获得输出结果;根据所述输出结果确定所述待识别用户为潜在用户或非潜在用户。
在上述方案中,基于大量已确认用户的特征信息构造随机森林分类模型,然后利用损失函数对随机森林分类模型中的各基分类器的组合权重系数进行调整,生成新的随机森林分类模型,并使用新的随机森林分类模型对待识别用户进行识别。在权重系数调整过程中,引入了弹性网络的正则化项(即L1范数、L2范数)对损失函数进行正则化,使得调整后的随机森林分类模型所以不仅能抑制甚至删除预测准确度差的分类器,还能较大程度地保留相关性强且对最终集成系统有积极影响的基分类器,进而使得随机森林分类模型的最终的损失最小,大大提升随机森林分类模型识别潜在用户的准确性。
可选的,在基于所述原始样本集构建随机森林分类模型之前,所述方法还包括:在确定所述原始样本集中任一用户的特征变量的值超出预设范围时,将所述任一用户从所述原始样本集中删除;和/或,在确定所述原始样本集中任一用户的特征变量的值缺失时,根据所述原始样本集中除所述任一用户以外的其他用户的特征变量的值对所述任一用户缺失的特征变量的值进行填充。
通过本方式,可以将原始样本集中不合理的数据、冗余的数据清除,使得后续构造的随机森林分类模型更加可靠,进一步提高随机森林分类模型识别潜在用户的准确性。
可选的,所述损失函数的类型为log对数损失函数、最小二乘法损失函数、指数损失函数中的任一。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中移动信息技术有限公司;中国移动通信集团有限公司,未经中移动信息技术有限公司;中国移动通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711463187.9/2.html,转载请声明来源钻瓜专利网。