[发明专利]基于双向加权图模型的电力调度自动化系统故障溯源方法在审
申请号: | 202110542073.3 | 申请日: | 2021-05-18 |
公开(公告)号: | CN113128076A | 公开(公告)日: | 2021-07-16 |
发明(设计)人: | 薛冰;高欣;任昺;贾欣;傅世元;张光耀;黄子健;黄旭 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06F30/20 | 分类号: | G06F30/20;G06Q10/04;G06Q10/06;G06Q50/06;G06F111/08;G06F119/12 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 双向 加权 模型 电力 调度 自动化 系统故障 溯源 方法 | ||
1.一种基于双向加权图模型的电力调度自动化系统故障溯源方法,其特征在于,所述方法步骤包括:
(1)采集电力调度自动化系统中所有服务器组件CPU、内存、磁盘、网络、进程的资源占用数据,组件资源占用数据包括组件CPU特征、组件内存特征、组件磁盘特征、组件网络特征和组件进程特征下的运行数据,组件CPU特征包括等待时间、IO使用率、用户使用时间;组件内存特征包括使用率、碰撞率;组件磁盘特征包括IO读取计数、IO写入计数、IO读取位数、IO写入位数;组件网络特征包括最大文件描述符延迟时间、发送的IO字节、发送的IO包;组件进程特征包括IO读取计数、IO写入计数、IO读取字节、IO写入字节、已用文件描述符、内存使用率、CPU使用率,将上述特征下采集的运行数据组成的多个时间序列作为溯源方法的输入,对每个特征的时间序列采用k-means算法获得聚类中心,将其作为离散化后时间序列区间划分的端点,每个区间的均值作为连续特征的离散化结果,所有特征时间序列按照以上离散化方法转化为包含告警段的N个特征时间序列{S1,S2,...,SN},所有时间序列拥有相同的时间点集合{t1,t2,...,to},o表示时间点总个数,在每个相同时间点,所有时间序列均有取值,N表示组件的特征个数,剔除该N个特征时间序列中包含的告警时间段,获得无告警段特征时间序列{S1',S'2,...,S'N};
(2)计算组件信息熵和组件间传递熵,建立有无告警段的信息相关矩阵,通过其变化率衡量告警前后的差异程度,采用归一化技术获得信息差异矩阵,具体为:计算组件包含告警段的离散化后的特征时间序列{S1,S2,...,SN}中每个时间序列的自信息熵{H1(S1),H2(S2),...,HN(SN)},其中Hi(Si)为时间序列Si的自信息熵,i=1,2,...,N:
其中,x表示该特征时间序列Si中的某个时间点的特征值,αx表示该特征时间序列Si中x的所有可能取值,p(x)表示时间序列Si中特征值取值为x的概率:
其中qi(x)表示时间序列Si的所有时间点中特征值取值为x的时间点个数,计算除与自身特征时间序列外,两两特征时间序列间的传递熵{T1→2,T1→3,...,T1→N,T2→1,T2→3,...,T2→N,...,TN→N-1},任意两个时间序列的互信息被定义为两个变量共享的信息量的度量,互信息熵I(Si;Sj)用来衡量时间序列Si和Sj的共享信息量:
其中,Si表示第i个特征时间序列,Sj表示第j个特征时间序列,x和y分别表示特征时间序列Si和Sj中的某个时间点的特征值,αx和αy表示特征时间序列Si和Sj中x和y的所有可能取值,p(x,y)为联合分布概率,p(x|y)为条件概率:
其中,qi,j(x,y)表示特征时间序列Si的特征值取值为x并且特征时间序列Sj的特征值取值为y同时出现的时间点个数,q表示时间序列的长度,p(y)表示时间序列Si中特征值取值为y的概率,在互信息熵的基础上进一步扩展为传递熵,在传递熵的计算中除Si本身的信息外,Sj还提供了额外的信息来预测Si(t+1),设定传递熵Tj→i为特征时间序列Sj到Si的交互信息的度量:
其中,it表示特征时间序列Si在时间t时的特征值,it(k)表示it+1前的k个最近的特征时间序列Si的特征值,jt表示特征时间序列Sj在时间t时的特征值,jt(l)表示jt+1前的l个最近的特征时间序列Sj的特征值,传递熵具有方向性,因此Ti→j可以通过交换公式(6)中的变量获得,计算有告警段时间序列的自信息和互信息来建立因果关系矩阵A:
重复步骤(2)中计算有告警段时间序列的自信息和互信息来建立因果关系矩阵A的过程,计算无告警段时间序列{S'1,S'2,...,S'N}因果关系矩阵B,建立信息差异矩阵分别对信息差异矩阵C的对角线和非对角线信息变化率进行归一化处理,得出最终的信息差异矩阵;
(3)提取信息变化较高的特征及特征间交互信息,构建双向加权图模型,结合节点自身信息和出入度信息变化拟合故障源头程度指标进行排序,依据排序结果追溯故障源头,具体为:设定阈值Θ∈(0,1),cm,n(mN,nN,cm,n∈(0,1))表示信息差异矩阵C中第m行n列的值,遍历矩阵C并标记cm,n>Θ所在的行和列,保留所有标记过的行和列的值并将其他元素置零,得到信息差异矩阵C′,C′矩阵对角线值表示节点内部的自信息差异值,具体为告警前后特征自信息熵的变化率,C′矩阵非对角线值表示节点与节点间的互信息差异值,具体为告警前后特征间传递熵的变化率,将提取出的故障特征间的链接按照因果关系建立信息双向加权图模型,该模型包含两个信息,节点自身的权值表示Si自身故障程度,节点与节点间的双向链接的权值表示Si影响Sj以及Sj影响Si的故障因果关联程度,综合考虑节点自信息和节点作为故障源头时出度权值变化大、入度权值变化小的特点,根据节点自身信息变化并结合节点出度权值、入度权值信息变化拟合故障程度指标FS_degree,计算每个节点是故障源头的程度:
其中,Vi表示信息双向加权图模型中的单个节点,表示单个节点Vi的时间序列的自信息熵,ODCVi表示信息双向加权图模型中的单个节点Vi的出度变化率,其表征从单个节点Vi指向其余相邻节点的有向边权值变化的平均值;表示信息双向加权图模型中的单个节点Vi的入度变化率,其表征从其余相邻节点指向单个节点Vi的有向边权值的变化的平均值,和的具体定义如下:
其中,PONs of Vi表示与Vi相邻的有连接节点中有向边的方向是从Vi指出的节点集合,Vj表示与Vi相邻节点中属于PONs of Vi的单个节点,PTNs of Vi表示与Vi相邻的有连接节点中有向边的方向是指向Vi的节点集合,Vf表示与Vi相邻节点中属于PTNs of Vi集合的单个节点,NUM(PONs of Vi)表示与Vi相邻的有连接节点中有向边的方向是从Vi指出的节点的总数目,NUM(PTNs of Vi)表示与Vi相邻的有连接节点中有向边的方向是指向Vi的节点的总数目,表示单个节点Vi的时间序列和单个节点Vj的时间序列间的传递熵,表示单个节点Vf的时间序列和单个节点Vi的时间序列间的传递熵,遍历信息双向加权图模型的所有节点,采用FS_degree指标计算每个节点是故障源头的程度,从大到小进行排序得到故障源头程度排序表,排序表中节点排名越靠前表示该节点是故障源头节点的程度越大,设定参数K表示期望溯源到的故障源头节点的目标个数,参数K一般取值为20到50,依据目标个数,将排序表中前K个节点判定为故障源头节点,得出最终溯源结果。
2.根据权利要求1所述的方法,其特征在于,采集电力调度自动化系统中所有服务器组件CPU、内存、磁盘、网络、进程的资源占用数据,组件资源占用数据包括组件CPU特征、组件内存特征、组件磁盘特征、组件网络特征和组件进程特征下的运行数据,组件CPU特征包括等待时间、IO使用率、用户使用时间;组件内存特征包括使用率、碰撞率;组件磁盘特征包括IO读取计数、IO写入计数、IO读取位数、IO写入位数;组件网络特征包括最大文件描述符延迟时间、发送的IO字节、发送的IO包;组件进程特征包括IO读取计数、IO写入计数、IO读取字节、IO写入字节、已用文件描述符、内存使用率、CPU使用率,将上述特征下采集的运行数据组成的多个时间序列作为溯源方法的输入,对每个特征的时间序列采用k-means算法获得聚类中心,将其作为离散化后时间序列区间划分的端点,每个区间的均值作为连续特征的离散化结果,所有特征时间序列按照以上离散化方法转化为包含告警段的N个特征时间序列{S1,S2,...,SN},所有时间序列拥有相同的时间点集合{t1,t2,...,to},o表示时间点总个数,在每个相同时间点,所有时间序列均有取值,N表示组件的特征个数,剔除该N个特征时间序列中包含的告警时间段,获得无告警段特征时间序列{S'1,S'2,...,S'N},具体说明如下:采集电力调度自动化系统中所有服务器的CPU、内存、磁盘、网络、进程的资源占用数据,每个服务器下的资源占用情况包括IO读写情况、使用率、碰撞率、等待时间,将这些特征的时间序列作为溯源方法的输入,假定某个特征的值分布在[a,b]区间,去除所有特征值中的重复值,得出总数目为num,设定聚类的质心个数k为质心和样本点的误差平方和为SSE,SSE和k的关系图是一个手肘的形状,选择手肘位置的k值作为最佳聚类数目,
其中,Ci是第i个簇,poi为Ci中的样本点,mi是Ci的质心,根据k-means算法得出k个质心为{m1,m2,...,mk}(m1<m2<...<mk),将该特征的值划分为k+1个区间[a,m1],[m1,m2],…,[mk-1,mk],[mk,b],对每个区间内的特征值取平均,作为该区间段的离散化结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110542073.3/1.html,转载请声明来源钻瓜专利网。