[发明专利]测试结果分类模型训练方法、分类方法及装置在审
申请号: | 202110542887.7 | 申请日: | 2021-05-18 |
公开(公告)号: | CN113515625A | 公开(公告)日: | 2021-10-19 |
发明(设计)人: | 丁乐乐;冯城城;郭晟;郑华美 | 申请(专利权)人: | 中国工商银行股份有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F11/36;G06N3/04;G06N3/08 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 吴梦圆 |
地址: | 100140 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 测试 结果 分类 模型 训练 方法 装置 | ||
本公开提供了一种测试结果分类模型训练方法,应用于金融领域、人工智能领域或其它领域。测试结果分类模型训练方法包括:获取多个日志文本,其中,每个日志文本包括自动化测试执行失败的案例;根据多个日志文本生成训练样本数据集,其中,训练样本数据集中包括词向量矩阵以及词向量矩阵的标签信息;以及利用训练样本数据集训练待训练测试结果分类模型,得到用于对自动化测试结果进行分类的测试结果分类模型。本公开还提供了一种测试结果分类方法、测试结果分类模型训练装置、测试结果分类装置、电子设备、计算机可读存储介质及计算机程序产品。
技术领域
本公开涉及金融领域和人工智能技术领域,更具体地,涉及一种测试结果分类模型训练方法、分类方法、装置、电子设备、计算机可读存储介质和计算机程序产品。
背景技术
随着自动化测试的重要性越来越高,相应的执行频率也越来越快,每次执行都会产生大量的结果,其中失败的执行结果需要测试人员人工分类,相关技术中一般是预置一些关键字和所属分类的对照规则,将失败的执行结果关键报错日志和预置的关键字规则做字符串匹配,根据匹配结果进行分类,以达成分析的目的。
在实现本公开构思的过程中,发明人发现相关技术中至少存在分类有局限性、分类效果不佳以及人工分类成本较高的技术问题。
发明内容
有鉴于此,本公开提供了一种测试结果分类模型训练方法、分类方法、装置、电子设备、计算机可读存储介质和计算机程序产品。
本公开的一个方面提供了一种测试结果分类模型训练方法,包括:
获取多个日志文本,其中,每个上述日志文本包括自动化测试执行失败的案例;
根据多个上述日志文本生成训练样本数据集,其中,上述训练样本数据集中包括词向量矩阵以及上述词向量矩阵的标签信息;以及
利用上述训练样本数据集训练待训练测试结果分类模型,得到用于对自动化测试结果进行分类的测试结果分类模型。
根据本公开的实施例,上述根据上述日志文本生成训练样本数据集包括:
对上述日志文本进行预处理,以删除上述日志文本中的干扰字符,得到删减日志文本;
根据上述删减日志文本中的词数,将上述删减日志文本分割为至少一个分割日志文本;
生成与上述分割日志文本对应的至少一个词向量矩阵,其中,上述词向量矩阵的数量与上述分割日志文本的数量相同,上述词向量矩阵的一行表征上述分割日志文本中的一个词,上述训练样本数据集由至少一个上述词向量矩阵构成。
根据本公开的实施例,上述根据上述删减日志文本中的词数,将上述删减日志文本分割为至少一个分割日志文本包括:
确定上述删减日志文本中的词数;
在上述删减日志文本中的词数小于等于预设阈值的情况下,将上述删减日志文本确定为上述分割日志文本;
在上述删减日志文本中的词数大于上述预设阈值的情况下,利用预设滑动步长以及预设窗口长度的词窗口,将上述删减日志文本分割为多个上述分割日志文本。
根据本公开的实施例,上述利用预设滑动步长以及预设窗口长度的词窗口,将上述删减日志文本分割为多个上述分割日志文本包括:
将上述词窗口以上述预设滑动步长,沿着构成上述删减日志文本的词的排列路径每滑动一次,确定一个上述分割日志文本。
根据本公开的实施例,上述待训练测试结果分类模型包括卷积神经网络模型;
上述卷积神经网络模型包括依次级联的输入层、第一卷积层、第一池化层、第二卷积层、第二池化层、全连接层以及输出层。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110542887.7/2.html,转载请声明来源钻瓜专利网。