[发明专利]基于随机森林算法的网络潜力用户挖掘方法及系统在审
申请号: | 201610554562.X | 申请日: | 2016-07-14 |
公开(公告)号: | CN106228389A | 公开(公告)日: | 2016-12-14 |
发明(设计)人: | 龚灿 | 申请(专利权)人: | 武汉斗鱼网络科技有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06K9/62 |
代理公司: | 武汉智权专利代理事务所(特殊普通合伙)42225 | 代理人: | 沈林华 |
地址: | 430000 湖北省武汉市东湖开*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于随机森林算法的网络潜力用户挖掘方法及系统,涉及基于随机森林算法网络数据挖掘领域。该方法的步骤为:对每个抽样用户类别抽样选取指定数量的用户作为样本、并确定用户特征;对所有的用户特征进行多次抽样,根据每次抽样的用户特征的归一化特征值形成随机森林算法的决策树,在所有样本中为每棵决策树选取样本;基于随机森林算法,根据每棵决策树的样本和用户特征,将每棵决策树的数据分为2个类别,其中1类代表潜力用户,另1类代表非潜力用户;分别用每棵决策树对待分类用户进行分类,根据分类结果确定为待分类用户的类别。本发明不仅能够使得网络潜力用户的挖掘过程更加智能化,而且计算速度较快,工作效率较高。 | ||
搜索关键词: | 基于 随机 森林 算法 网络 潜力 用户 挖掘 方法 系统 | ||
【主权项】:
一种基于随机森林算法的网络潜力用户挖掘方法,其特征在于,该方法包括以下步骤:S1:在需要挖掘网络潜力用户的网络平台中,定义抽样用户类别为付费用户和从未付费用户,对每个抽样用户类别抽样选取指定数量的用户作为样本;S2:确定每个样本的用户特征;S3:计算每个样本的用户特征的归一化特征值Y,计算公式为:Y=(X‑MinX)/(MaxX‑MinX);其中X代表当前样本的用户特征参数,MinX代表所有样本中当前用户特征的最小参数,MaxX代表所有样本中当前用户特征的最大参数;S4:对所有的用户特征进行多次抽样,根据每次抽样的用户特征的归一化特征值形成随机森林算法的决策树;S5:在所有样本中,为每棵决策树选取指定数量的样本;S6:基于随机森林算法,根据每棵决策树的样本和用户特征的归一化特征值,将每棵决策树的数据分为2个类别,其中1类代表潜力用户,另1类代表非潜力用户;S7:根据每棵决策树中的2个类别对待分类用户进行分类,统计所有决策树中相同类别的数量,将相同数量多的类别确定为待分类用户的类别。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉斗鱼网络科技有限公司,未经武汉斗鱼网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610554562.X/,转载请声明来源钻瓜专利网。