[发明专利]一种多源异构电网运监业务数据融合方法有效

申请号：	202110317131.2	申请日：	2021-03-25
公开（公告）号：	CN112907222B	公开（公告）日：	2022-07-08
发明（设计）人：	胡伟;郭秋婷;马坤;黄建平;陈浩;盛银波	申请（专利权）人：	清华大学;国网浙江省电力有限公司嘉兴供电公司;国家电网有限公司
主分类号：	G06Q10/10	分类号：	G06Q10/10;G06Q50/06;G06K9/62;G06N3/04;G06N3/08
代理公司：	北京清亦华知识产权代理事务所(普通合伙) 11201	代理人：	罗文群
地址：	100084***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种多源异构电网业务数据融合方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种多源异构电网运监业务数据融合方法，其特征在于，包括：对多源异构电网运监业务数据预处理过程；基于深度学习的多源异构电网运监业务数据特征提取、分类识别过程；基于强化学习的决策级融合过程，最终获得数据量少、容错性高和分析能力强的数据集，用于对电力系统运监业务数据有价值信息进行有效挖掘；其中，所述方法具体包括以下步骤：

(1)对多源异构电网运监业务数据进行预处理，具体过程如下；

(1-1)从电网企业数据中台采集多源异构电网运监业务数据，包括电力用户用电信息采集系统数据、电力管理信息系统数据、电能计量系统数据、数据采集与监视控制系统数据、电力设备在线检测系统数据和风光电功率预测系统数据，并将采集的多源异构电网运监业务数据分别存储在相对应的子数据库集合中；

(1-2)遍历步骤(1-1)的多源异构电网运监业务数据，进行筛查定位，对异常数据及缺失数据进行均值补偿，对冗余和无效的数据进行清理，得到预处理数据集；

(2)利用深度学习模型，对步骤(1)的预处理后的多源异构电网运监业务数据进行特征提取和分类识别，包括以下步骤：

(2-1)从步骤(1-2)的预处理数据集中读取预处理后的数据；

(2-2)分别对预处理的各数据源数据，构建相应的稀疏降噪自编码器深度置信网络模型，设置模型参数，对模型进行训练，分别提取多源异构运监业务数据的数据特征，分别输出结果特征提取结果，具体过程如下：

(2-2-1)利用稀疏降噪自编码器建立一个单隐藏层网络，此处称为单隐层稀疏降噪自编码器，输入步骤(2-1)读取的预处理后的数据，并对单隐层稀疏降噪自编码器进行训练，获得权值W和偏置b，稀疏降噪自动编码器的代价函数为：

其中，ρ是稀疏性参数，是以ρ和为均值的两个伯努利随机变量间的相对熵，m表示步骤(2-1)中读取的预处理数据样本数量，为稀疏降噪自编码器的一个映射，表示噪声，y⁽ⁱ⁾表示输出，β表示稀疏惩罚项权重系数，s表示单隐藏层网络中隐含层神经元的数量；

(2-2-2)建立一个具有双层RBM受限玻尔兹曼机网络的DBN深度置信网络模型：

受限玻尔兹曼机的输入层和隐含层的联合配置能量函数如下：

其中，θ＝{a_i,b_j,W_ij}是受限玻尔兹曼机的参数，a_i和b_j分别代表受限玻尔兹曼机输入层神经元和隐含层神经元的偏置，x_i和h_j分别代表受限玻尔兹曼机输入层神经元和隐含层神经元的状态，W_ij为输入层神经元i与隐含层神经元j之间的连接权重；

在受限玻尔兹曼机中，用logistics函数表示激活状态时，输入层和隐含层各节点的激活概率为：

P(h_j＝1|x,θ)＝logistic(∑_iW_ijx_i+b_j)

P(x_i＝1|h,θ)＝logistic(∑_jW_ijh_j+a_i)

(2-2-3)将步骤(2-2-1)中得到的权值W和偏置b赋值给步骤(2-2-2)所建立的深度置信网络中的第一层受限玻尔兹曼机，并对第一层受限玻尔兹曼机进行初始化；

(2-2-4)对步骤(2-2-2)建立的含双层RBM受限玻尔兹曼机网络的DBN深度置信网络模型进行训练，利用DBN深度置信网络的深层次特征提取能力，提取数据特征，并进行结果输出，得到提取后的数据特征；

(2-2-5)根据多源异构运监业务数据中不同数据源的数据，分别进行步骤(2-2-1)-步骤(2-2-4)的特征提取过程，直到完成所有数据源的数据特征提取；

(3)根据步骤(2)提取的多源异构运监业务数据特征，利用强化学习方法，进行多源异构运监业务数据融合过程，具体过程如下：

(3-1)根据步骤(2-2-5)中提取的各数据源的数据特征，采用Parzen窗方法，对各数据源中的各个特征进行离散估计和概率密度估计，分别得到电力系统多源异构数据特征的概率分布，即特征x_i的概率分布p(x_i)、特征x_j,x_i的联合概率分布p(x_i,x_j)，特征类别属性Y的概率分布p(y)和特征x_j在特征类别属性Y下的条件概率分布p(x_j,y)，特征x_j,x_i在特征类别属性Y条件下的联合概率分布p(x_i,x_j,y)；

(3-2)根据步骤(2-2-5)中提取的各数据源的数据特征，建立信息熵指标H(X_i)，计算每个特征的信息熵H(X_i)及信息熵均值meanH，得到所有特征的信息熵，计算所有特征信息熵的均值，并分别将每个特征的信息熵与信息熵的均值进行比较，将高于信息熵均值的特征记录在信息熵表中；

meanH＝∑H(X_i)/n

其中，dom(X)表示特征x_i的取值范围，p(x_i)表示特征x_i的概率分布，n表示特征的总个数；

(3-3)利用步骤(3-1)中得到电力系统多源异构数据特征的概率分布，即特征x_i的概率分布p(x_i)、特征x_j,x_i的联合概率分布p(x_i,x_j)、特征类别属性Y的概率分布p(y)和特征x_j在特征类别属性Y下的概率分布p(x_j,y)，特征x_j,x_i在特征类别属性Y下的联合概率分布为p(x_i,x_j,y)，建立特征协同效应系数MIG((X_i,X_j)；Y)，计算每个特征的协同效应系数值MIG((X_i,X_j)；Y)及协同效应系数值的均值meanMIG：

MIG((X_i,X_j)；Y)＝MI((X_i,X_j)；Y)-MI(X_i；Y)-MI(X_j；Y)

其中，X_i和X_j分别表示步骤(2-2-5)中提取的各数据源的数据特征，Y表示步骤(2-2-5)中提取的各数据源的数据特征的类别属性，n表示特征的总个数；

根据上述计算结果，形成一个特征协同效应系数表，将特征协同效应系数中的与低于均值meanMIG的特征记入一个集合S中；

(3-3)构建一个强化学习环境，设定步骤(2-2-4)中提取的全部数据特征为环境，环境中包含不同特征的特征子集S_t，构成状态集S，即步骤(3-2)中的集合S，设定一个动作集A，动作集A中包括添加特征和删除特征，根据最终数据融合效果，设定收益R为特征子集在分类器上的分类准确率，建立强化学习模型，具体过程如下：

(3-3-1)S为状态集合，S_t指智能体Agent在t时刻所处的状态，且S_t∈S；

(3-3-2)A为动作集合，a_t指智能体Agent在t时刻所处的状态，且a_t∈A；

(3-3-3)R为收益，R(S_t,a_t)指智能体Agent在环境状态为S_t时，执行动作a_t获得的收益，收益R根据任务需要自定义；

(3-3-4)利用动作评价函数Q(S_t,a_t)，计算智能体Agent在环境状态为S_t时，执行动作a_t获得的最大累计收益Q(S_t,a_t)：

Q(S_t,a_t)＝R(S_t,a_t)+γmaxQ(S_t+1,a_t+1)

其中，γ为折扣系数，γ∈[0,1]，表示当前的收益较之未来的收益更重要，即时间越久，影响越小；

(3-4)将步骤(3-1)获得的信息熵、(3-2)中获得的协同效应系数表及步骤(2-2-4)提取的数据特征带入智能体Agent，智能体Agent根据添加、删除的动作所带来的不同收益作出决策，得到决策级多源异构运监数据融合结果，具体步骤如下：

(3-4-1)初始化特征参数及强化学习模型参数，初始化当前特征子集初始化折扣系数γ；

其中T为当前特征子集，表示智能体Agent在设定时刻已经选择特征的集合，H为候选特征子集，表示智能体Agent在设定时刻未被选入T中的特征集合；

(3-4-2)将步骤(3-1)的信息熵高于信息熵均值的特征计入集合HS，HS的初始为空集；

(3-4-3)将步骤(3-2)协同效应系数低于协同效应系数均值的特征计入集合MIGS，MIGS初始为空集；

(3-4-4)当时，随机添加一个特征X_add，X_add∈H，T←T∪{X_add}，H←H\{X_add}；

其中，X_add表示要添加的特征，X_del表示要删除的特征，T←T∪{X_add}表示将T与特征X_add取并集的结果赋值给T，H←H\{X_add}表示将H中删除特征X_add的结果赋值给H；

(3-4-5)从H∩HS中随机添加一个特征X_add，计算特征子集T∪{X_add}的分类准确率，记为R_add，从步骤(3-4-3)的集合MIGS查询特征子集T中协同效应系数较大的几对特征，随机选择几对特征中的一个特征，计算特征子集T\{X_add}分类准确率，记为R_del，对分类准确率R_add与分类准确率R_del进行比较：

若R_addR_del，则执行T←T∪{X_add},H←H\{X_add}

若R_addR_del，则执行T←T\{X_del},H←H∪{X_del}

(3-4-6)根据步骤(3-3-4)中的动作评价函数Q(S_t,a_t)，计算Q值，并更新Q表；

(3-4-7)判断Q是否达到最大值，若满足，则停止，并通过Q表输出与最大Q值相对应的特征子集S，将该特征子集S作为最终数据融合结果，实现多源异构电网运监业务数据融合，若不满足，则重复步骤(3-4-4)-(3-4-7)。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于清华大学;国网浙江省电力有限公司嘉兴供电公司;国家电网有限公司，未经清华大学;国网浙江省电力有限公司嘉兴供电公司;国家电网有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202110317131.2/1.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法；其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政；管理
G06Q10-02 .预定，例如用于门票、服务或事件的
G06Q10-04 .预测或优化，例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理，例如组织、规划、调度或分配时间、人员或机器资源；企业规划；组织模型
G06Q10-08 .物流，例如仓储、装货、配送或运输；存货或库存管理，例如订货、采购或平衡订单
G06Q10-10 .办公自动化，例如电子邮件或群件的计算机辅助管理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种多源异构电网运监业务数据融合方法有效

专利文献下载