[发明专利]一种基于支持向量机的日志分类管理方法及系统在审
申请号: | 202010470201.3 | 申请日: | 2020-05-28 |
公开(公告)号: | CN111737459A | 公开(公告)日: | 2020-10-02 |
发明(设计)人: | 庆隆阳 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06K9/62 |
代理公司: | 济南舜源专利事务所有限公司 37205 | 代理人: | 张营磊 |
地址: | 215100 江苏省苏州市吴*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 支持 向量 日志 分类 管理 方法 系统 | ||
1.一种基于支持向量机的日志分类管理方法,其特征在于,包括如下步骤:
S1.获取原始系统日志,并对原始系统日志进行解析得到结构化日志数据;
S2.对结构化日志数据进行特征提取,针对每条日志提取一组数字特征向量,所有数字特征向量形成特征数据集;
S3.对提取的特征数据集进行样本标注,并按照设定比例分为训练集和测试集;
S4.获取支持向量机模型,通过训练集对支持向量机模型进行训练,再通过测试集对支持向量机模型进行验证;
S5.训练好并验证过的支持向量机模型对新产生日志进行分类,并对各类别日志设置对应管理策略。
2.如权利要求1所述的基于支持向量机的日志分类管理方法,其特征在于,步骤S1具体步骤如下:
S11.获取原始系统日志;
S12.通过logkey方法对原始系统日志进行解析,得到常量结构数据和变量结构数据;所述常量结构数据包括系统程序源码消息,所述变量结构数据包括时间戳或参数值。
3.如权利要求1所述的基于支持向量机的日志分类管理方法,其特征在于,步骤S2具体步骤如下:
S21.对结构化日志数据进行特征提取,针对每条日志提取消息计数向量、流程状态向量、用户操作功能的频度向量以及访问热度向量;
S22.将提取的四种特征组合为一组数字特征向量,所有数字特征向量形成特征数据集。
4.如权利要求1所述的基于支持向量机的日志分类管理方法,其特征在于,步骤S3具体步骤如下:
S31.对提取的特征数据集进行关于对应日志状态的正负样本标注;
S32.将提取的特征数据集按照设定比例分为训练集和测试集。
5.如权利要求1所述的基于支持向量机的日志分类管理方法,其特征在于,步骤S4具体步骤如下:
S41.获取支持向量机模型;
S42.通过训练集对支持向量机模型进行交叉训练;
S43.选取径向基核函数,并根据训练结果对惩罚因子以及径向基核函数宽度进行调整;
S44.通过测试集对训练好的支持向量机模型进行验证和修正。
6.如权利要求1所述的基于支持向量机的日志分类管理方法,其特征在于,步骤S5具体步骤如下:
S51.通过训练好并验证过的支持向量机模型对新产生日志进行分类;
S52.对热日志设置延长日志压缩和保留时间的策略;
S53.对冷日志设置缩短压缩周期和保留时间的策略。
7.一种基于支持向量机的日志分类管理系统,其特征在于,包括
日志解析模块(1),用于获取原始系统日志,并对原始系统日志进行解析得到结构化日志数据;
日志特征提取模块(2),用于对结构化日志数据进行特征提取,针对每条日志提取一组数字特征向量,所有数字特征向量形成特征数据集;
数据集划分模块(3),用于对提取的特征数据集进行样本标注,并按照设定比例分为训练集和测试集;
模型训练及验证模块(4),用于获取支持向量机模型,通过训练集对支持向量机模型进行训练,再通过测试集对支持向量机模型进行验证;
日志分类模块(5),用于训练好并验证过的支持向量机模型对新产生日志进行分类,并对各类别日志设置对应管理策略。
8.如权利要求7所述的基于支持向量机的日志分类管理系统,其特征在于,日志解析模块(1)包括
日志分类模块(1.1),用于获取原始系统日志;
日志结构化解析单元(1.2),用于通过logkey方法对原始系统日志进行解析,得到常量结构数据和变量结构数据;所述常量结构数据包括系统程序源码消息,所述变量结构数据包括时间戳或参数值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010470201.3/1.html,转载请声明来源钻瓜专利网。