[发明专利]一种网络故障检测方法及装置有效
| 申请号: | 201811452294.6 | 申请日: | 2018-11-30 |
| 公开(公告)号: | CN109495311B | 公开(公告)日: | 2022-05-20 |
| 发明(设计)人: | 郑文楷 | 申请(专利权)人: | 锐捷网络股份有限公司 |
| 主分类号: | H04L41/0631 | 分类号: | H04L41/0631;H04L41/0677;H04L49/55;H04L69/163;H04L69/22 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 350002 福建省福州市仓*** | 国省代码: | 福建;35 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 网络故障 检测 方法 装置 | ||
本发明公开了一种网络故障检测方法,应用于交换设备的可编程交换芯片中,所述方法包括:所述可编程交换芯片对接收到的传输控制协议TCP报文进行数据流检测,获取所述TCP报文的五元组信息以及TCP序列号;当记录有所述TCP报文的五元组信息时,判断所述TCP序列号是否大于所述五元组信息对应的记录序列号;若所述TCP序列号不大于所述记录序列号,则将所述五元组信息对应的重传次数加一,并将所述记录序列号更新为所述TCP序列号;判断所述重传次数是否大于预设重传次数阈值;若所述重传次数大于所述预设重传次数阈值,则将所述TCP报文确定为故障报文并发送给故障处理设备以进行故障处理。本发明实施例能够提高网络故障检测的准确率。
技术领域
本发明涉及通信技术领域,尤指一种网络故障检测方法及装置。
背景技术
网络故障一直是数据中心网络需要解决的问题,随着网络环境愈加复杂,越难以及时准确地发现哪里发生了故障。TCP协议会通过报文重传的方式处理少量的报文丢包,但如果网络出现故障则会出现大量的重传报文。因此,少量的TCP重传并不一定说明网络发生故障,而网络故障必然会导致大量的报文重传,因此可以通过一定时间内的重传数量大小来粗略判断网络是否发生故障。
现有检测网络故障主要是在网络外部进行探测,当通信主机的TCP报文大量重传,得知网络出现故障时,在网络外部通过traceroute等手段来探测网络的连通性。但这种方法无法精确感知网络内部情况,还有多径等多种因素影响,准确性不高。因此,现有网络故障的检测方案准确率不高,效率太低。
发明内容
本发明实施例提供一种网络故障检测方法及装置,用以解决现有技术中网络故障检测准确率不高、效率低下的问题。
一种网络故障检测方法,应用于交换设备的可编程交换芯片中,所述方法包括:
所述可编程交换芯片对接收到的传输控制协议TCP报文进行数据流检测,获取所述TCP报文的五元组信息以及TCP序列号;
当根据所述TCP报文的五元组信息找到对应的记录序列号时,判断所述TCP序列号是否大于所述记录序列号;
若所述TCP序列号不大于所述记录序列号,则将所述五元组信息对应的重传次数加一,并将所述记录序列号更新为所述TCP序列号;
判断所述重传次数是否大于预设重传次数阈值;
若所述重传次数大于所述预设重传次数阈值,则将所述TCP报文确定为故障报文并发送给故障处理设备以进行故障处理。
进一步地,当根据所述TCP报文的五元组信息未找到对应的记录序列号时,所述方法,还包括:
将所述TCP报文的TCP序列号记录为所述五元组信息对应的记录序列号,并设置所述五元组信息对应的重传次数为0;所述五元组信息包括源IP、目的IP、协议号、目的端口号、源端口号。
其中,所述将所述TCP报文的TCP序列号记录为所述五元组信息对应的记录序列号,并设置所述五元组信息对应的重传次数为0,具体为:
将所述五元组信息进行哈希算法,得到五元组哈希值;
分别将所述TCP序列号和初始化为0的重传次数存入以所述五元组哈希值为索引的两个缓存中。
进一步地,在将所述TCP报文确定为故障报文并发送给故障处理设备以进行故障处理之后,所述方法,还包括:
将所述五元组信息对应的重传次数清零。
其中,所述将所述TCP报文确定为故障报文并发送给故障处理设备以进行故障处理,包括:
将所述TCP报文确定为故障报文并复制给所述交换设备的CPU进行故障处理;或者
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于锐捷网络股份有限公司,未经锐捷网络股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811452294.6/2.html,转载请声明来源钻瓜专利网。





