[发明专利]一种基于肘形判据的同调机群聚类识别方法有效
申请号: | 201911156977.1 | 申请日: | 2019-11-22 |
公开(公告)号: | CN111046532B | 公开(公告)日: | 2022-07-29 |
发明(设计)人: | 颜云松;康明才;司庆华;杨正;朱传宏;张俊芳;王计林;许高阳 | 申请(专利权)人: | 南瑞集团有限公司;南京理工大学 |
主分类号: | G06F30/20 | 分类号: | G06F30/20;G06K9/62 |
代理公司: | 浙江翔隆专利事务所(普通合伙) 33206 | 代理人: | 王晓燕 |
地址: | 211106 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 判据 同调 机群 识别 方法 | ||
1.一种基于肘形判据的同调机群聚类识别方法,其特征在于,包括以下步骤:
步骤1、读取BPA稳定数据,形成发电机转子摇摆角差矩阵;
步骤2、采用最大最小距离法选取k个聚类中心;
步骤3、根据基于GSA的肘形判据估计最佳聚类个数;
步骤4、根据最佳聚类个数进行聚类分析,得到多个同调机群;
步骤1中,形成发电机转子摇摆角差矩阵的具体方法为:
(1)读取BPA稳定程序的swi稳定文件,形成发电机转子摇摆曲线数据矩阵A;
式中,xij表示第i台发电机j时刻的发电机转子角,n为发电机数目,p为仿真时间,单位为周波;
(2)对发电机转子摇摆曲线数据矩阵A进行处理,形成发电机转子摇摆角差矩阵D;
判断同调的Max-Min原则:
max|Δδi(t)-Δδj(t)|<β 式(2)
其中,Δδi(t)为发电机转子摇摆角差,Δδi(t)=δi(t)-δi(t0),t0为故障发生时刻,t一般取1到3s,β一般取5到10°,一般仿真时间大于所取的t,因此对矩阵A进行处理,形成发电机转子摇摆角差矩阵D;
式中,xij表示第i台发电机j时刻与第i台发电机故障发生时刻的转子摇摆角差值,t为仿真计算时刻,一般取1到3s;
步骤2中,采用最大最小距离法选取k个聚类中心;
采用最大最小距离法,确定聚类中心的初值,避免了k均值聚类算法随机选取聚类中心的缺点,从而避免了聚类陷入局部最小解,提高了聚类的稳定性与准确率,设聚类个数为k,最大最小距离法原理如下:
(1)设数据集D,随机选取其中一个数据对象xi作为聚类中心,记为G1,若k=1,则聚类中心选取已完成;
(2)搜索数据矩阵D,寻找D中与xi距离最远的数据xj,记为G2,若k=2,则聚类中心选取已完成;
其中,距离的定义为两个数据之间的欧式距离,即:
(3)设剩余数据集为Dl,计算任意xi属于Dl与G1和G2的欧式距离,记为di1,di2,令di=min{di1,di2},i=1,2,…,l;
(4)选取max{d1,d2,…,dl}对应的数据点作为第三个聚类中心,记为G3;
(5)当k≥4时,重复(3)、(4)步骤,继续选取聚类中心,直至选出第k个聚类中心,记为Gk;
步骤3中,GSA法估计最佳聚类个数的基本原理:
对于样本D,假设样本集被聚类成k个聚类,对于任意聚类cluster m,聚类内每个样本xi围绕聚类中心的距离为:
式中,Gm为聚类cluster m的中心;
对于聚类数k,其离散度定义为:
其中,|Gm|为聚类中心Gm所包含的数据点的个数;
GSA法的基本思想是利用该数据集的特性产生合适的参考分布数据集,并由参考数据集计算其聚类离散度的期望值,以E[lnDref(k)]表示,接着比较E[lnDref(k)]和lnD(k)即可帮助判断最合适的聚类个数;
定义:
ΔD(k)=E[lnDref(k)]-lnD(k) 式(7)
如果在某个k值点,E[lnDref(k)]的曲线和lnD(k)曲线之间的差距明显增加,那么对应的k值就是最佳的聚类个数值,如果E[lnDref(k)]曲线与lnD(k)曲线之间的差距随的增加没有明显变化,代表最合适的聚类个数为1;
步骤3中,基于GSA方法的肘形判据的基本原理:
肘形判据是一种通过分析数据集的聚类离散度与聚类个数的关系,按照k-1、k、k+1点的聚类离散度计算k处的肘形折角,并以最小肘形折角判断最佳聚类个数的判断依据,对于聚类个数是k的典型的聚类离散度lnW(k)与聚类数k的关系曲线,最大间隙值的出现实质上是对应着lnD(k)~k曲线从某个值开始明显下降平缓的“最小肘形折角”位置,各个折点处两条直线段夹成的折角θ(k),它由三部分组成,θL、θR和
即
其中,θL与W(k-1)和W(k)有关,θR与W(k)和W(k+1)有关;
θR=arctan{ln[W(k)-ln[W(k+1)]]} 式(10)
取最小的满足θ(k)<θ(k+1)的k为最佳的聚类个数;
θ(1)的求法采用上式计算;
步骤4中,基于切比雪夫距离和欧氏距离的加权指标为:
发电机机组功角曲线的切比雪夫距离为:
发电机机组功角曲线的欧式距离为:
可以发现,切比雪夫距离d1ij满足同调机组的原始定义,反映功角曲线超调情况,属于局部标准,欧氏距离d2ij反映功角振荡能量的大小,是全局标准,其物理意义是两机功角输出轨迹的相异程度,如果其很小则说明两机受扰后功角输出具有相似的摇摆特性,可视为一个同调机群;
在矩阵D中,如果有n台发电机,则对应有个相互距离,而由于切比雪夫距离d1ij和欧氏距离d2ij的量纲不同,引入基于权重距离的综合指标dij(k):
式中,a,b为权重值,选取a,b均为50%;
步骤4中,基于k-means聚类算法的同调机群分群步骤如下:
(1)输入步骤3得到的最佳聚类数k值;
(2)按照步骤2的最大最小距离法选取k个样本,把它们作为聚类中心;
(3)根据所设定的距离函数dij(k)计算所有样本数据与聚类中心之间的距离,如果某一点p距离第n个质心距离最近,则该点属于cluster n;
(4)计算同一个cluster中所有向量的平均值作为新的聚类中心;
(5)重复步骤(3)(4),直至所有聚类中心不再变化,聚类过程结束。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南瑞集团有限公司;南京理工大学,未经南瑞集团有限公司;南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911156977.1/1.html,转载请声明来源钻瓜专利网。