[发明专利]一种基于次序依赖的电力数据序列数组优化方法在审
申请号: | 201910469083.1 | 申请日: | 2019-05-31 |
公开(公告)号: | CN110287176A | 公开(公告)日: | 2019-09-27 |
发明(设计)人: | 苏运;吴力波;周阳;马戎;施政昱;陈伟;郭乃网;田英杰;瞿海妮;张琪祁;时志雄;宋岩;庞天宇;沈泉江 | 申请(专利权)人: | 国网上海市电力公司;复旦大学 |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06F16/2457;G06F16/27 |
代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 叶敏华 |
地址: | 200002 上海市浦东新区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 站点 等价类 电力数据 序列数组 中心站点 算法 优化 合并 全局 并行 修复 传递 保证 | ||
本发明涉及一种基于次序依赖的电力数据序列数组优化方法,包括步骤:1)在每个站点Si上运行算法BuildEC,获取局部等价类;2)利用DisBuild算法建立每个站点的相同属性上的全局等价类,将每个站点上各个属性上不同的值和出现次数传递到该属性的中心站点上;3)对不同属性上的全局等价类进行合并,直到所有的站点都没有等价类的合并;4)完成步骤3)后,在中心站点确定一个目标值,随后将目标值发送给各个站点,站点接收到数据之后并行完成数据的修,完成数据的优化。与现有技术相比,本发明具有提升数据质量、减少修复过程中的修改,有利于保证数据一般性等优点。
技术领域
本发明涉及电力数据优化技术领域,尤其是涉及一种基于次序依赖的电力数据序列数组优化方法。
背景技术
随着电力行业中数字化技术的广泛应用,为了保证系统的安全、可靠和高效运行,大量管理信息系统、地理信息系统、电力市场信息系统以及电网运行的实时信息系统等在电力系统中得到了广泛应用,产生了大量数据。这些海量数据的增加,特别是考虑到这些数据从各方面、各层次和各环节详细及深入地描述了电力系统本身在各种条件和情况下的属性,这为数据挖掘的广泛应用创造了必要的条件。
数据质量是一个多维的概念,每个维度代表一个审视数据质量的角度,例如一致性(Consistency)、完整度(Completeness)、精简度(Concise Representation)、及时度(Timeliness)和可理解度(Understandability)等。在实践中,数据一致性是一个常见的度量标准。通过在数据集上定义数据应该遵循的准则,并在随后检测数据一致性,以及修复数据以实现一致性,可以有效消除数据集中的错误,并为之后的数据挖掘等工作带来帮助。现有对电网电力大数据分析的方法中,采用传统依赖进行电力数据集的评估修正,次序依赖和传统依赖(如函数依赖)的一个核心区别是,次序依赖是定义在属性的列表上,而传统的依赖关系通常定义在属性的集合上,次序依赖能够提升数据质量。
对于一个给定的次序依赖φ=X|→Y,一个次序oφ被其左侧的属性列X所决定,接着,oφ将作用于右侧的属性列,这可能会导致不一致,这正是我们想修复的问题。我们形式化的定义了左侧属性列决定的次序,并且根据次序依赖的两种不一致类型,分裂(split)和交换(swap),使用等价类(Equivalence Class)以及次序(Order)的方法去解决这两种不一致。当且仅当不存在分裂和交换时,对应的次序依赖成立。对于一个次序依赖φ=X|→Y,我们将所有元组按照X上的次序排序,将相同的合并为一个等价类,再用一个链表表示等价类之间的次序关系,这就形成了我们所需要的次序。其中我们仅仅保存元组的标识符tid,以降低空间消耗。
多个次序依赖可能共享他们的(部分)右侧属性,在这种情况下,相同的右侧属性列上可能会有多个次序需要满足,然而这些次序本身之间可能会产生冲突,无法一个一个去处理这些次序,因为修复一个次序可能会导致违背其他次序,且易需要修改,一个更好的策略是将这些序合并为一个总的序oφ,当oφ满足时,所有的次序oφ1,...,oφm也都将满足。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于次序依赖的电力数据序列数组优化方法。
本发明的目的可以通过以下技术方案来实现:
一种基于次序依赖的电力数据序列数组优化方法,包括如下步骤:
步骤1、在每个站点Si上运行算法BuildEC,获取局部等价类;
步骤2、利用DisBuild算法建立每个站点的相同属性上的全局等价类,将每个站点上各个属性上不同的值和出现次数传递到该属性的中心站点上,具体过程如下:
21)对每个在函数依赖集中的属性A,选择一个中心站点记为SA,当站点数大于函数依赖集中的属性个数时,对每个属性分配一个中心站点,否则优先给函数依赖左边的属性分配站点;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网上海市电力公司;复旦大学,未经国网上海市电力公司;复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910469083.1/2.html,转载请声明来源钻瓜专利网。