[发明专利]一种基于支持向量机的日志分类管理方法及系统在审
申请号: | 202010470201.3 | 申请日: | 2020-05-28 |
公开(公告)号: | CN111737459A | 公开(公告)日: | 2020-10-02 |
发明(设计)人: | 庆隆阳 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06K9/62 |
代理公司: | 济南舜源专利事务所有限公司 37205 | 代理人: | 张营磊 |
地址: | 215100 江苏省苏州市吴*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 支持 向量 日志 分类 管理 方法 系统 | ||
本发明提供一种基于支持向量机的日志分类管理方法及系统,所述方法包括如下步骤:S1.获取原始系统日志,并对原始系统日志进行解析得到结构化日志数据;S2.对结构化日志数据进行特征提取,针对每条日志提取一组数字特征向量,所有数字特征向量形成特征数据集;S3.对提取的特征数据集进行样本标注,并按照设定比例分为训练集和测试集;S4.获取支持向量机模型,通过训练集对支持向量机模型进行训练,再通过测试集对支持向量机模型进行验证;S5.训练好并验证过的支持向量机模型对新产生日志进行分类,并对各类别日志采用对应管理策略。
技术领域
本发明属于日志管理技术领域,具体涉及一种基于支持向量机的日志分类管理方法及系统。
背景技术
日志:网络设备、系统及服务程序等,在运作时都会产生一个叫日志的事件记录;每一行日志都记载着日期、时间、使用者及动作等相关操作的描述。
支持向量机(SVM):支持向量机是一种基于统计学习与结构风险最小化原理的机器学习方法,在样本较少的情况下,其同样具有优异的学习能力。
在存储集群的日程运行中,随着数据访问量的增大,集群系统所产生的日志文件随时间逐渐开始暴增。运维人员和研发人员一般都是根据系统产生的日志进行系统的了解和优化,但是因为大多数原始的系统日志是非结构化的文本信息,且存在大量冗余,这给运维和研发人员带来了繁琐的工作量。
此为现有技术的不足,因此,针对现有技术中的上述缺陷,提供一种基于支持向量机的日志分类管理方法及系统,是非常有必要的。
发明内容
针对现有技术的上述集群系统产生大量日志文件,给运维和研发人员带来繁琐工作量的缺陷,本发明提供一种基于支持向量机的日志分类管理方法及系统,以解决上述技术问题。
第一方面,本发明提供一种基于支持向量机的日志分类管理方法,包括如下步骤:
S1.获取原始系统日志,并对原始系统日志进行解析得到结构化日志数据;
S2.对结构化日志数据进行特征提取,针对每条日志提取一组数字特征向量,所有数字特征向量形成特征数据集;
S3.对提取的特征数据集进行样本标注,并按照设定比例分为训练集和测试集;
S4.获取支持向量机模型,通过训练集对支持向量机模型进行训练,再通过测试集对支持向量机模型进行验证;
S5.训练好并验证过的支持向量机模型对新产生日志进行分类,并对各类别日志设置对应管理策略。
进一步地,步骤S1具体步骤如下:
S11.获取原始系统日志;
S12.通过logkey方法对原始系统日志进行解析,得到常量结构数据和变量结构数据;所述常量结构数据包括系统程序源码消息,所述变量结构数据包括时间戳或参数值。
进一步地,步骤S2具体步骤如下:
S21.对结构化日志数据进行特征提取,针对每条日志提取消息计数向量、流程状态向量、用户操作功能的频度向量以及访问热度向量;
S22.将提取的四种特征组合为一组数字特征向量,所有数字特征向量形成特征数据集。
进一步地,步骤S3具体步骤如下:
S31.对提取的特征数据集进行关于对应日志状态的正负样本标注;
S32.将提取的特征数据集按照设定比例分为训练集和测试集。
进一步地,步骤S4具体步骤如下:
S41.获取支持向量机模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010470201.3/2.html,转载请声明来源钻瓜专利网。