[发明专利]一种多源异构数据融合和量测数据多源互校验方法及系统有效

专利信息
申请号: 202011397370.5 申请日: 2020-12-04
公开(公告)号: CN112199421B 公开(公告)日: 2021-03-09
发明(设计)人: 谢琳;张林鹏;李立新;叶瑞丽;张风彬;王岩;卫泽晨;崔灿;李宇佳;李劲松;宫玲琳;冯琼;王淼;门德月;徐鑫 申请(专利权)人: 中国电力科学研究院有限公司
主分类号: G06F16/2458 分类号: G06F16/2458;G06F16/25;G06Q10/06;G06Q50/06
代理公司: 北京中巡通大知识产权代理有限公司 11703 代理人: 郭瑶
地址: 100192 北*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 多源异构 数据 融合 多源互 校验 方法 系统
【权利要求书】:

1.一种多源异构数据融合和量测数据多源互校验方法,其特征在于,包括以下步骤:

对多源量测数据进行融合;

基于融合结果,对量测数据进行时序关系分析与特征提取;

根据提取的特征,计算多源关联分析与偏差量化指标;具体为通过离散标准化将原始数据值线性变换后映射到[0,1]之间,得到标准化后的不同数据源间的量测值;

计算不同数据源间量测值的距离度量和相关系数,得到距离度量和相关系数;

通过动态分配距离度量和相关系数的权重,计算不同数据来源之间量测偏差量化指标;

基于偏差量化指标,进行量测多源一致性校验。

2.根据权利要求1所述的多源异构数据融合和量测数据多源互校验方法,其特征在于,对多源量测数据进行融合,包括:

从消息总线获取的量测报文,按照电力调度数据对象结构化设计进行数据解析,得到多源量测数据;依据HBase数据存储结构,进行Rowkey区分,并按年份和电力调度数据对象维度分表存储量测数据;

数据获取通过运行在Hadoop集群上的Spark分布式计算引擎,将HBase中存储的量测数据加载到集群内存中进行多源量测数据融合。

3.根据权利要求1所述的多源异构数据融合和量测数据多源互校验方法,其特征在于,对量测数据进行时序关系分析与特征提取,包括:

根据时间序列不变性分析方法对历史数据进行特征提取,获得所述历史数据中包含的趋势变化规律和多源数据间的相互依赖关系;根据所述趋势变化规律和相互依赖关系,建立跨时空、跨调度间的多源数据特征因素集,完成对量测数据进行时序关系分析与特征提取;

其中,所述时间序列指将同一统计指标的数值按其发生的时间先后顺序排列而成的数列。

4.根据权利要求1所述的多源异构数据融合和量测数据多源互校验方法,其特征在于,所述计算多源关联分析与偏差量化指标具体方法如下:

计算两个相同统计口径、不同数据来源任意时刻i的量纲:

计算不同数据源间量测值的距离度量αX,Y

其中,p=2,XY均表示数据源,N表示量测点个数,表示数据源Xi时刻的量测值,表示数据源Yi时刻的量测值;

计算量测序列的相关系数ρX,Y

其中,表示数据源XN个量测值的平均值,表示数据源YN个量测值的平均值;

通过分析不同对象及统计口径数据,统计提取量测特征,动态分配模型权重w,计算不同数据来源之间量测偏差量化指标:

SIM(Vx,Vy)=X,Y+(1-w)(1-ρX,Y)。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电力科学研究院有限公司,未经中国电力科学研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011397370.5/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top