[发明专利]一种基于次序依赖的电力数据集修复方法有效
申请号: | 201811230601.6 | 申请日: | 2018-10-22 |
公开(公告)号: | CN109669932B | 公开(公告)日: | 2023-06-30 |
发明(设计)人: | 苏运;郭乃网;田英杰;许唐云;庞天宇;刘舒 | 申请(专利权)人: | 国网上海市电力公司;上海运邦信息科技有限公司 |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06F16/2458 |
代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 翁惠瑜 |
地址: | 200122 上海市浦东新区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 次序 依赖 电力 数据 修复 方法 | ||
本发明涉及一种基于次序依赖的电力数据集修复方法,该方法基于动态规划实现,包括以下步骤:a1)获取待修复的电力数据序列数组;a2)构建一数组dp,该数组中的元素dp[i]定义为所述电力数据序列数组中前i天中满足次序依赖的最长序列长度;a3)根据所述数组dp获得最长序列长度maxlen,通过递归方式依次得到最长满足次序依赖序列,完成修复,获得满足次序依赖的修复后数据。与现有技术相比,本发明具有缩短修复时间、提高修复效果等优点。
技术领域
本发明涉及一种电力数据处理方法,尤其是涉及一种基于次序依赖的电力数 据集修复方法。
背景技术
随着数字化技术的发展,为了保证系统的安全、可靠和高效运行,大量管理 信息系统、地理信息系统、电力市场信息系统以及电网运行的实时信息系统等在电 力系统中得到了广泛应用,产生了大量数据。这些海量数据的增加,特别是考虑到 这些数据从各方面、各层次和各环节详细及深入地描述了电力系统本身在各种条件 和情况下的属性,这为数据挖掘的应用创造了必要的条件。
数据质量检测是数据挖掘过程中一个重要而关键的过程,它对数据挖掘是否 成功起着巨大的作用。一个很直观的理解是,如果数据质量不佳,那么不管使用何 种数据挖掘方法,使用多么大量的计算资源,进行多么高效的计算,都很难得到符 合实际的分析结果。这是因为挖掘算法对其处理的数据集有一定的要求,比如数据 完整性好、数据的冗余性少、属性之间的相关性小。然而,实际系统中的数据一般 都具有不完整性、冗余性和模糊性等问题,很少能直接满足数据挖掘算法的要求。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于次序依 赖的电力数据集修复方法。
本发明的目的可以通过以下技术方案来实现:
一种基于次序依赖的电力数据集修复方法,该方法基于动态规划实现,包括以 下步骤:
a1)获取待修复的电力数据序列数组;
a2)构建一数组dp,该数组中的元素dp[i]定义为所述电力数据序列数组中前i天中满足次序依赖的最长序列长度;
a3)根据所述数组dp获得最长序列长度maxlen,通过递归方式依次得到最长 满足次序依赖序列,完成修复,获得满足次序依赖的修复后数据。
进一步地,步骤a2)中,所述次序依赖表示为即电力数据 随时间单调递增。
进一步地,步骤a2)中,dp[i]通过状态转移方程迭代获得:
dp[i]=Max(dp[j]+1)i∈[1,len]j∈[1,i-1]
其中,len为电力数据序列数组长度,dp[1]=1。
进一步地,步骤a3)中采用简单滑动平均方法修复数据。
本发明还提供一种基于次序依赖的电力数据集修复方法,该方法基于动态规划和二分查找实现,包括以下步骤:
b1)获取待修复的电力数据序列数组;
b2)构建一数组d,该数组中的元素d[k]定义为长度为k的满足次序依赖最长 子序列的最小末尾元素;
b3)根据所述数组d通过栈输出最长满足次序依赖序列,完成修复。
进一步地,步骤b2)中,所述次序依赖表示为即电力数据 随时间单调递增。
与现有技术相比,本发明具有以如下有益效果:
1)基于家用电力读数数据集的特征,本发明使用次序依赖来描述数据遵循的 准则,基于次序依赖实现错误电力数据的修复,相较于常见的信号处理方法在电力 数据集上具有显著的改善,修复时间和效果上都具有较大优势。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网上海市电力公司;上海运邦信息科技有限公司,未经国网上海市电力公司;上海运邦信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811230601.6/2.html,转载请声明来源钻瓜专利网。