[发明专利]一种基于随机森林的KPI劣化根因识别方法和装置在审
申请号: | 201810938061.0 | 申请日: | 2018-08-17 |
公开(公告)号: | CN110837841A | 公开(公告)日: | 2020-02-25 |
发明(设计)人: | 张国华;何峥;张琪斌;陈香;王明 | 申请(专利权)人: | 北京亿阳信通科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F16/2458;G06Q10/06;G06Q50/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100093 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 随机 森林 kpi 劣化根 识别 方法 装置 | ||
本发明公开一种基于随机森林的KPI劣化根因识别方法,所述方法包括:获取建立KPI劣化根因分析模型的相关基础数据,所述基础数据包含影响因素的历史数据和需要分析的KPI实际数据;选取设定比例的基础数据作为训练集,根据所述训练集训练一定数量的决策树,并由所述决策树构建所述KPI劣化根因分析模型;将剩余所述基础数据作为测试集,利用所述KPI劣化根因分析模型获得影响各KPI各影响因素的影响因子。本发明还公开一种基于随机森林的KPI劣化根因识别装置。通过本发明可以提高对影响因子识别的精度和效率。
技术领域
本发明涉及通信行业的数据分析及机器学习技术领域,更具体的说,涉及一种劣化根因的识别技术。
背景技术
移动通信网络运营管理中需要关注一些重点KPI,如掉话率、呼损等,除了日常维护之外,运营商希望能够知道影响这些KPI的因素,获得这些KPI和网络之间的关联,方便后期网优任务分配及保障。
传统的根因识别方法的运行效率和计算精度较低,尤其是在面临成千上万的输入变量、训练数据存在缺失信息时,想获取准确的根因,更是难上加难。
因此,如何快速准确的识别劣化根因是亟待解决的问题。
发明内容
本发明提供了如下技术方案一种基于随机森林的KPI劣化根因识别方法,包括:
获取建立KPI劣化根因分析模型的相关基础数据,所述基础数据包含影响因素的历史数据和需要分析的KPI实际数据;
选取设定比例的基础数据作为训练集,根据所述训练集训练一定数量的决策树,并由所述决策树构建所述KPI劣化根因分析模型;
将剩余所述基础数据作为测试集,利用所述KPI劣化根因分析模型获得影响各KPI各影响因素的影响因子。
所述影响因素包含保持性指标、接入类指标、移动性指标、资源类指标和系统容量类指标,所述影响因素即为样本特征。
进一步的,所述根据训练集训练一定数量的决策树的方法具体为:
从大小为N的训练集中随机且有放回地抽取N个训练样本,作为所述决策树的训练集;
每个训练样本的特征维度为M,随机选取m(m≤M)个特征作为特征子集,每次树进行分裂时,从所述m个特征中选择最优特征进行分裂,获得决策树。
进一步的,由所述决策树构建所述KPI劣根因分析模型的方法具体为:
获得k棵决策树生成随机森林模型,即所述KPI劣根因分析模型;
将各决策树获得结果求平均作为随机森林模型的结果,即所述KPI劣根因分析模型的分析结果。
具体的,所述决策树的每一个节点即为一个影响因素,计算每个影响因素使得决策树平均减少的不纯度的值,将所述不纯度的值作为该影响因素的影响因子。
优选的,所述KPI劣根因分析模型采用方差或最小二乘法进行拟合。
优选的,将所述获得的各KPI影响因素的影响因子进行排序,根据所述排序结果输出影响因素及影响因子。
本发明还公开一种基于随机森林的KPI劣化根因识别装置,所述装置包括:
数据获取模块,用于获取建立KPI劣化根因分析模型的相关基础数据,所述基础数据包含影响因素的历史数据和需要分析的KPI实际数据;
模型建立模块,用于选取设定比例的所述数据获取模块获取的相关基础数据作为训练集,根据所述训练集训练一定数量的决策树,并由所述决策树构建所述KPI劣化根因分析模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京亿阳信通科技有限公司,未经北京亿阳信通科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810938061.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:弹簧钢片表面质量激光检测装置
- 下一篇:一种车用减震座椅结构