[发明专利]一种基于K-Means-HMM模型的分布式光伏电站故障预警算法有效
申请号: | 202010952635.7 | 申请日: | 2020-09-11 |
公开(公告)号: | CN112085621B | 公开(公告)日: | 2022-08-02 |
发明(设计)人: | 梁华锋;陈昊;林翀 | 申请(专利权)人: | 杭州华电下沙热电有限公司 |
主分类号: | G06Q50/06 | 分类号: | G06Q50/06;G06K9/62;G06V10/762;G06V10/774 |
代理公司: | 湖北天领艾匹律师事务所 42252 | 代理人: | 杨建军 |
地址: | 310000 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 means hmm 模型 分布式 电站 故障 预警 算法 | ||
1.一种基于K-Means-HMM模型的分布式光伏电站故障预警算法,其特征在于:包括如下步骤:
S1、采集生产记录N条,从这N条数据筛选出发电功率在1kw以上的数据M条,对采集的数据进行分档离散化,并以输出电流和电压两个维度进行K-Means聚类;
采集一年的生产记录共N条,每条记录含组件号、时间、输出电流、输出电压、发电功率五种参数,从这N条数据筛选出发电功率在1kw以上的数据M条,筛选出的发电功率数据最小值为1kw,最大功率为14.7kw;设某条数据的发电功率值为p,若n≤Pn+1,1≤n≤13,则n为该发电功率档数P,作为HMM模型状态序列的取值;
以输出电流和电压两个维度进行K-Means聚类的具体步骤如下:
对于M条数据中的输出电流,输出电压进行归一化处理,将输出电流,输出电压视为M*2大小的矩阵,归一化计算公式为:
其中:分别为矩阵中的行和列的索引,表示归一化后位置的矩阵元素,表示归一化前位置的矩阵元素,为归一化前j列中的最小矩阵元素,为归一化前j列中的最大矩阵元素;
对经过归一化后的输出电流,输出电压数据进行K-means聚类,K值设为20,得到M条数据的聚类结果C,聚类结果将作为HMM观测序列的取值;
S2、利用聚类后的光伏电站的工作状态样本数据训练HMM模型;
训练样本是根据某一年全年光伏电站的故障记录,在时间段该年的10个月份中选择32个正常运行时间点及对应组件编号,作为训练集正常状态标签,选择遮挡、导线短路、导线开路、电池老化四种故障的时间点各8个及对应组件编号,作为训练集故障状态标签;
在时间段该年的另外2个月份中,选择8个正常运行时间点及对应组件编号,作为测试集正常状态标签,选择遮挡、导线短路、导线开路、电池老化四种故障的时间点各2个及对应组件编号,作为测试集故障状态标签;
得到的每个正常状态标签,正常状态标签包含训练集和测试集,根据时间点和组件编号,在M条数据中寻找对应记录,选取对应时间点前300分钟到对应时间点的聚类结果C值和发电功率档数P值,得到训练集正常样本32个和测试集正常样本8个,每个样本含300个C值和300个P值;
对于得到的每个故障状态标签,故障状态标签包含训练集和测试集,根据时间点和组件编号,在M条数据中寻找对应记录,选取对应时间点前360分钟到前60分钟的聚类结果C值和发电功率档数P值,得到训练集故障样本32个和测试集故障样本8个,每个样本含300个C值和300个P值;
训练HMM模型的过程如下:
已知模型的状态序列状态的集合的数量N=13,观测值集合的数据量M=20,每个训练样本中的300个P值作为状态序列,300个C值作为观测序列,初始状态概率向量有13个元素,每个元素的值为1/13;对于训练集中的正常、遮挡、导线短路、导线开路、电池老化五种状态的样本,按照如下算法,分别训练五个HMM模型:
基于已知信息,使用有监督学习算法,求解HMM的转移概率矩阵A,观测概率矩阵B;
(1)转移概率矩阵A的求解:
对于所有的训练样本,统计C值由i转移到为j的样本个数为个,则由状态为i转移到状态j的概率的估计值为:
组成的矩阵即为转移概率矩阵A;
(2)观测概率矩阵B的求解:
对于所有的训练样本,统计C值为i且P值为j的样本个数为个,则状态为i且观测值为j的概率估计值为:
;
组成的矩阵即为观测概率矩阵B;
还需验证训练后的HMM模型的预测准确率,将测试样本的观测序列分别代入训练好的五个HMM模型,使用前向-后向算法进行计算,得到五个该观测序列出现的概率,前向-后向算法的公式如下:
其中是前向概率,即在t时刻部分观测序列为O1,O2,O3…,Ot,状态是的概率,记作:
是后向概率,即在t+1时刻部分观测序列Ot+2,Ot+3,…,OT,状态是的概率,记作:
根据上述公式计算得到的5个概率值,取最大概率值对应的模型类型,即为对测试数据的预测状态;根据预测的状态和实际状态即可计算出HMM模型的预测准确率,若准确率超出范围,则按照步骤S1到步骤S2,重新选取数据对HMM模型进行训练;
S3、采集光伏组件的实时生产数据,以输出电流和电压两个维度进行K-Means聚类,计算出聚类结果;
取任一光伏组件的输出电流,输出电压,长度为300分钟的数据,根据步骤S1中的归一化公式,计算输出电流和输出电压归一化后的值,并使用步骤S1中训练好的K-means模型计算出聚类结果;
S4、将聚类后的光伏组件的实时生产数据输入训练后的HMM模型,得到预警结果;
将S3中得到的300个聚类结果作为观测序列,分别输入五个已训练好的HMM,按照前向-后向算法,得到5个概率值,取最大概率值对应的模型类型,即为预测的状态。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州华电下沙热电有限公司,未经杭州华电下沙热电有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010952635.7/1.html,转载请声明来源钻瓜专利网。