[发明专利]日志文件的报文提取方法、装置、设备、介质和程序产品在审
申请号: | 202210382243.0 | 申请日: | 2022-04-13 |
公开(公告)号: | CN114661686A | 公开(公告)日: | 2022-06-24 |
发明(设计)人: | 杨腾;林海;徐丽娜;林锐 | 申请(专利权)人: | 中国工商银行股份有限公司 |
主分类号: | G06F16/18 | 分类号: | G06F16/18;G06F16/16;G06F40/166;G06F40/205 |
代理公司: | 华进联合专利商标代理有限公司 44224 | 代理人: | 周清华 |
地址: | 100140 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 日志 文件 报文 提取 方法 装置 设备 介质 程序 产品 | ||
本申请涉及大数据技术领域,可用于金融领域,提供了一种日志文件的报文提取方法、装置、计算机设备、存储介质和程序产品。本申请能快速且准确地提取日志文件的报文,降低人力成本及实施难度。该方法包括:将从日志文件中提取的开始输入时间戳和结束输入时间戳进行等分化形成包含等分化时间戳的时间戳数组,然后确定待查找报文在时间戳数组中对应的时间戳区间,接着根据所述时间戳区间从日志文件中提取各相应行的日志文本,之后根据预设关键词依序对各相应行的日志文本进行分割,若在当前相应行的日志文本中分割出预设部分的日志文本段则判断日志文本段是否具有预设报文节点特征,若是则将日志文本段作为日志文件的报文提取结果。
技术领域
本申请涉及大数据技术领域,特别是涉及一种日志文件的报文提取方法、装置、计算机设备、存储介质和计算机程序产品。
背景技术
随着大数据技术的发展,越来越多的技术人员选择通过在日志文件中提取报文的方式,获取用于进行接口自动化测试的脚本数据,定时运行此类脚本数据有利于帮助技术人员实时监控接口研发质量,以便尽早发现可能导致程序故障的潜在问题、降低程序故障的修复成本。
目前,提取日志文件的报文的方法可借助文本匹配技术进行,但文本匹配技术需要通过将关键词词组构建为有序的关键词树,而日志文件中的关键词词组之间往往难以具备构建有序的关键词树的关联关系,故这种方法难以快速且准确地提取日志文件的报文。
发明内容
基于此,有必要针对上述技术问题,提供一种日志文件的报文提取方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
第一方面,本申请提供了一种日志文件的报文提取方法。所述方法包括:
将从日志文件中提取的开始输入时间戳和结束输入时间戳进行等分化,形成包含等分化时间戳的时间戳数组;
确定待查找报文在所述时间戳数组中对应的时间戳区间;
根据所述时间戳区间,从所述日志文件中提取各相应行的日志文本;
根据预设关键词依序对所述各相应行的日志文本进行分割;
若在当前相应行的日志文本中分割出预设部分的日志文本段,则判断所述日志文本段是否具有预设报文节点特征;
若是,则将所述日志文本段作为所述日志文件的报文提取结果。
第二方面,本申请还提供了一种日志文件的报文提取装置。所述装置包括:
数据处理模块,将从日志文件中提取的开始输入时间戳和结束输入时间戳进行等分化,形成包含等分化时间戳的时间戳数组;
区间确定模块,确定待查找报文在所述时间戳数组中对应的时间戳区间;
文本提取模块,根据所述时间戳区间,从所述日志文件中提取各相应行的日志文本;
文本分割模块,根据预设关键词依序对所述各相应行的日志文本进行分割;
特征判断模块,若在当前相应行的日志文本中分割出预设部分的日志文本段,则判断所述日志文本段是否具有预设报文节点特征;
结果获取模块,若是,则将所述日志文本段作为所述日志文件的报文提取结果。
第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210382243.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:弹弓钮扣
- 下一篇:考虑电力交易合约下的碳排放流分析方法及装置