[发明专利]一种故障定位的方法、装置、存储介质及电子设备在审
| 申请号: | 202211643825.6 | 申请日: | 2022-12-20 |
| 公开(公告)号: | CN116185681A | 公开(公告)日: | 2023-05-30 |
| 发明(设计)人: | 雷志超;陈超宇;余航;李建国 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
| 主分类号: | G06F11/07 | 分类号: | G06F11/07;G06F11/22 |
| 代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 王剑 |
| 地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 故障 定位 方法 装置 存储 介质 电子设备 | ||
1.一种故障定位的方法,所述方法应用于在业务系统发生故障时,定位所述业务系统中故障源的根因指标;所述方法包括:
获取所述业务系统发生故障时,所述故障源的各状态指标;
将所述各状态指标输入预先训练的拟合模型,以使模型对输入的所述各状态指标进行拟合,作为第一拟合过程,获得所述拟合模型输出的执行失败的业务的数目,作为第一数目;
针对每个状态指标,将该状态指标作为目标指标,将除该目标指标之外的其他状态指标作为非目标指标;
将各非目标指标输入所述拟合模型,以使模型对输入的各非目标指标进行拟合,作为第二拟合过程,获得所述拟合模型输出的执行失败的业务的数目,作为第二数目;
根据所述第一数目与所述第二数目,以及所述拟合模型中的各层在所述第一拟合过程与所述第二拟合过程中输出的特征,确定所述目标指标对所述第一拟合过程的贡献度,作为所述目标指标的贡献度;
根据所述各状态指标的贡献度,在各状态指标中定位所述故障源的根因指标。
2.如权利要求1所述的方法,所述各状态指标包括CPU使用率、内存使用率、流量、TCP连接数中的至少一种。
3.如权利要求1所述的方法,预先训练拟合模型,具体包括:
预先确定所述业务系统在历史上发生故障时的历史故障源;
获取所述历史故障源在历史上发生故障时的各历史状态指标,并确定所述业务系统在历史上发生故障时执行失败的业务的实际数目,将所述各历史状态指标作为训练样本,将所述实际数目作为所述训练样本对应的标注;
将训练样本输入待训练拟合模型,以使模型对输入的所述各历史状态指标进行拟合,获得所述待训练拟合模型输出的执行失败的业务的数目,作为预测数目;
以所述预测数目与所述标注的差异最小为训练目标,对待训练拟合模型进行训练,得到拟合模型。
4.如权利要求1所述的方法,根据所述第一数目与所述第二数目,以及所述拟合模型中的各层在所述第一拟合过程与所述第二拟合过程中输出的特征,确定所述目标指标对所述第一拟合过程的贡献度,具体包括:
将所述第一数目与所述第二数目的差值作为所述拟合模型的最后一层的反向传播值;
将所述拟合模型的最后一层作为待传播层;
根据所述拟合模型中所述待传播层的上一层在所述第一拟合过程和所述第二拟合过程中输出的特征,确定所述上一层的传播系数;
根据所述待传播层的反向传播值和所述上一层的传播系数,计算所述上一层的反向传播值;
将所述上一层重新作为待传播层,并计算重新确定的待传播层的上一层的反向传播值,直至所述上一层为所述拟合模型的第一层时,将所述第一层的反向传播值作为所述目标指标对所述第一拟合过程的贡献度。
5.如权利要求1或4所述的方法,所述拟合模型至少包括层数为两层的多层感知机。
6.如权利要求4所述的方法,根据所述拟合模型中所述待传播层的上一层在所述第一拟合过程和所述第二拟合过程中输出的特征,确定所述上一层的传播系数,具体包括:
根据所述拟合模型中所述待传播层的上一层的每个节点在所述第一拟合过程中输出的特征,与所述上一层的所有节点在所述第二拟合过程中输出的特征的期望,确定所述上一层的传播系数。
7.如权利要求1所述的方法,根据所述各状态指标的贡献度,在各状态指标中定位所述故障源的根因指标,具体包括:
比较所述各状态指标的贡献度的大小;
将贡献度最大的状态指标定位为所述故障源的根因指标。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211643825.6/1.html,转载请声明来源钻瓜专利网。





