[发明专利]一种日志审计方法、装置、设备及可读存储介质在审
申请号: | 202110056186.2 | 申请日: | 2021-01-15 |
公开(公告)号: | CN112765172A | 公开(公告)日: | 2021-05-07 |
发明(设计)人: | 鲁芹;李名玉 | 申请(专利权)人: | 齐鲁工业大学 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/215;G06F16/18 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 李圣梅 |
地址: | 250353 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 日志 审计 方法 装置 设备 可读 存储 介质 | ||
本公开提供了一种日志审计方法、装置、设备及可读存储介质,属于信息安全技术领域,其中,所述日志审计方法通过历史日志数据,构建树形标签体系,针对树形标签体系中的每一个标签,确定目标特征对该标签的贡献率,并根据贡献率更新目标特征的权重,这样,在更新迭代过程中,逐渐增加匹配度高的权重,减少匹配度低的权重,可以提高标签与特征之间的匹配度,进而,基于更新权重后的树形标签体系,确定待审计日志数据的标签;基于标签,对待审计日志数据进行审计,可以全面、准确地确定出待审计日志数据的标签,提高日志审计效率。
技术领域
本公开属于信息安全技术领域,具体涉及一种日志审计方法、装置、设备及可读存储介质。
背景技术
本部分的陈述仅仅是提供了与本公开相关的背景技术信息,不必然构成在先技术。
日志是业务操作或者客服服务过程的详细记录,日志的快速解析与分析对提高业务服务水平、提升用户服务感知,甚至提升业务发展有着非常重要的作用。数据的标签用于反映数据的属性,是人类根据经验判断得到的,数据标签化体现了数据与数据之间的关系,便于从业务角度挖掘大数据的价值。
发明人发现,在日志审计过程中,通常采用人工设定标签的方法,对日志进行标签处理,这样所确定的标签往往全面性较差,而先确定日志的特征,再根据特征设定标签,则会产生特征与标签之间不匹配导致所确定标签不准确的问题。
发明内容
为了解决上述问题,本公开提出了一种日志审计方法、装置、设备及可读存储介质,通过历史日志数据,构建树形标签体系,针对树形标签体系中的每一个标签,确定目标特征对该标签的贡献率,并根据贡献率更新目标特征的权重,以提高标签与特征之间的匹配度,进而,基于更新权重后的树形标签体系,确定待审计日志数据的标签,以全面、准确地确定出待审计日志数据的标签。
本申请主要包括以下几个方面:
第一方面,本申请实施例提供了一种日志审计方法,所述日志审计方法包括:
基于获取的历史日志数据的多个标签,以及各标签对应的特征,构建树形标签体系;
针对所述树形标签体系中的每一个标签,确定该标签所对应的目标特征,基于目标特征,以及预设的目标特征的权重,确定目标特征对该标签的贡献率,基于所述贡献率,更新所述目标特征的权重;所述贡献率用于表征目标特征对标签的影响程度;
基于更新权重后的树形标签体系,确定待审计日志数据的标签;
基于所述标签,对所述待审计日志数据进行审计。
在一种可能的实施方式中,在所述基于获取的历史日志数据的多个标签,以及各标签对应的特征,构建树形标签体系之前,所述日志审计方法还包括:
获取历史日志数据,对所述历史日志数据进行数据清洗和结构化处理;
确定所述历史日志数据的多个标签,以及各标签对应的特征。
在一种可能的实施方式中,在所述确定所述历史日志数据的多个标签,以及各标签对应的特征之后,所述日志审计方法还包括:
获取预设时间范围内各标签出现的频率,将频率低于预设频率阈值的标签确定为目标标签;
滤除多个所述标签中的目标标签。
在一种可能的实施方式中,所述树形标签体系包括至少一棵标签树,以标签为叶子节点构建所述标签树,所述标签树还包括中间节点,基于各标签对应的特征,确定所述标签树的中间节点。
在一种可能的实施方式中,所述基于所述贡献率,更新所述目标特征的权重,包括:
确定目标特征的权重与贡献率之间的差值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于齐鲁工业大学,未经齐鲁工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110056186.2/2.html,转载请声明来源钻瓜专利网。