[发明专利]信息处理方法、装置和计算机设备在审
申请号: | 201611266540.X | 申请日: | 2016-12-31 |
公开(公告)号: | CN106843941A | 公开(公告)日: | 2017-06-13 |
发明(设计)人: | 林海 | 申请(专利权)人: | 广东欧珀移动通信有限公司 |
主分类号: | G06F9/445 | 分类号: | G06F9/445 |
代理公司: | 广州华进联合专利商标代理有限公司44224 | 代理人: | 方高明 |
地址: | 523860 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信息处理 方法 装置 计算机 设备 | ||
本发明涉及一种信息处理方法、装置和计算机设备。所述方法包括:获取对应用程序的下载数据;提取所述下载数据的属性的特征值;将所述下载数据的属性的特征值导入到下载分类决策树中,所述下载分类决策树是根据应用程序的历史下载数据训练得到的;将下载数据的属性的特征值与所述下载分类决策树中各属性节点的特征值进行比较,根据比较结果得到所述下载数据的类别。通过下载分类决策树对下载数据的属性的特征值进行判断,识别出下载数据的类别,采用下载分类决策树对下载数据进行分类,可快速发现非正常下载,且准确率高。
技术领域
本发明涉及信息处理领域,特别是涉及一种信息处理方法和装置、构建下载分类决策树的方法和装置、计算机设备。
背景技术
随着网络技术的发展,产生了提供各种服务的应用程序。在应用商店等提供应用程序的下载平台上会记录应用程序被下载的次数,通常应用程序被下载的次数越多,表明使用者越多,会吸引更多的用户下载。为此,导致一些非正常下载行为的出现,即模拟正常用户下载应用程序,增加该应用程序的下载记录。目前无法准确的区分哪些下载行为是正常的下载行为,哪些下载行为是非正常下载行为。
发明内容
本发明实施例提供一种信息处理方法、装置、构建下载分类决策树的方法和装置和计算机设备,可以准确区分出非正常下载行为。
一种信息处理方法,包括:
获取对应用程序的下载数据;
提取对所述下载数据的属性的特征值;
将所述下载数据的属性的特征值导入到下载分类决策树中,所述下载分类决策树是根据应用程序的历史下载数据训练得到的;
将所述下载数据的属性的特征值与所述下载分类决策树中各属性节点的特征值进行比较,根据比较结果得到所述下载数据的类别。
一种信息处理装置,包括:
数据获取模块,用于应用程序的获取下载数据;
属性特征获取模块,用于提取所述下载数据的属性的特征值;
导入模块,用于将所述下载数据的属性的特征值导入到下载分类决策树中,所述下载分类决策树是根据应用程序的历史下载数据训练得到的;
类别识别模块,用于将下载数据的属性的特征值与所述下载分类决策树中各属性节点的特征值进行比较,根据比较结果得到所述下载数据的类别。
一种构建下载分类决策树的方法,包括:
获取对应用程序的历史下载数据,对所述历史下载数据进行采样形成训练样本数据集;
对所述训练样本数据集中每一样本数据提取多个属性的特征值;
获取所述训练样本数据集的各个属性的信息增益;
选取信息增益最大的属性;
将所述信息增益最大的属性的特征值相同的样本数据归类到同一训练样本数据子集;
依次对各训练样本数据子集获取训练样本数据子集中的各个属性的信息增益,选取信息增益最大的属性,将所述信息增益最大的属性的特征值相同的样本数据归类到同一训练样本数据子集,递归分裂构建下载分类决策树。
一种构建下载分类决策树的装置,包括:
样本采集模块,用于获取对应用程序的历史下载数据,对所述历史下载数据进行采样形成训练样本数据集;
属性提取模块,用于对所述训练样本数据集中每一样本数据提取多个属性及对应的特征值;
信息增益获取模块,用于获取所述训练样本数据集的各个属性的信息增益;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东欧珀移动通信有限公司,未经广东欧珀移动通信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611266540.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种改进型餐桌
- 下一篇:带有键盘图形用户界面的平板电脑