[发明专利]一种基于时态数据系统的类周期规则挖掘方法在审
申请号: | 201810055150.0 | 申请日: | 2018-01-19 |
公开(公告)号: | CN110162547A | 公开(公告)日: | 2019-08-23 |
发明(设计)人: | 曲逸文;衣学武 | 申请(专利权)人: | 曲逸文 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/22 |
代理公司: | 北京东方盛凡知识产权代理事务所(普通合伙) 11562 | 代理人: | 牟炳彦 |
地址: | 264000 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 周期规则 时态数据 时态 趋势序列 时序特征 峰谷 挖掘 伸缩性 关联规则 惯量计算 规则挖掘 时间周期 数据系统 索引序列 突发事件 噪声数据 周期特性 周期现象 差计算 大数据 时效性 跨度 统计 发现 | ||
本发明公开了一种基于时态数据系统的类周期规则挖掘方法,用来发现无明显周期特性的时态相关属性之间的类周期规则。该方法包括:对时态数据系统中的关注属性进行时态处理,构造出时序特征数据;对时序特征数据进行惯量计算,得到关注属性的惯性趋势序列;在惯性趋势序列基础上,计算关注属性的峰谷链特征;构造关注属性的峰谷统计索引序列;通过跨度离散差计算,得出数据系统的类周期规则。本发明能够实现对无数学意义上的周期现象进行关联规则的计算,克服时间周期上的伸缩性和噪声数据的干扰,挖掘出类周期规则,具有良好的时效性和可靠性,可对突发事件和不可预见性事件的大数据进行规则挖掘,指导人们趋利避害,具有良好的实用效益。
技术领域
本发明涉及一种基于时态数据系统的类周期规则挖掘方法,属于计算机大数据和云计算领域。
背景技术
目前的数据规则挖掘技术主要集中在传统的趋势分析和关联分析领域,用来揭示目标数据系统的发展趋势和诱因性知识;其对事件的周期性规律分析主要是对于一些具有数学意义上严格的周期性规则进行挖掘,缺乏对于无数学意义的周期性规则进行实时分析的手段。
发明内容
为解决上述问题,本发明提供一种基于时态数据系统的类周期规则进行实时挖掘的方法,来发现无明显周期特性的时态相关属性之间的类周期规则。
本发明的技术方案为:
一种基于时态数据系统的类周期规则挖掘方法,其特征在于,该方法包括以下步骤:
A.对时态数据系统中的关注属性进行时态处理,构造出时序特征数据和关注属性的考察点序列;
B.对时序特征数据进行惯量计算,得到关注属性的惯性趋势序列;
C.在惯性趋势序列基础上,计算关注属性的峰谷链特征;
D.构造关注属性的峰谷统计索引序列;
E.通过跨度离散差计算,发现数据系统的类周期规则。
优选的,所述步骤A的具体实现方式为:
时态数据系统的模型描述如下:记目标时态系统的时间区间为T={t1,t2…tn};关注属性记为F={F1,F2…Fm},m为关注属性的维度;关注属性的特征值记为f={f1,f2…fp},p为特征的维度;所关注属性的特征值从记录到更新的时间区间记为关注属性的生命周期Tl=[Tb,Te],生命周期内的属性特征值为定量,生命周期选定为等长生命周期;时间粒度是系统展开时态信息的最小时间区间,记为g;
基于上述构建的时态数据系统,建立时态特征模式为其中和表示在当前系统时间粒度g下,关注属性F的生命周期起点和终点,则根据s个不同的生命周期,将会建立以下时态特征模式记录:
其中,fi表示第i个生命周期内关注属性的特征值;表示第i个生命周期的时间起点;表示第i个生命周期的时间终点;g表示时态系统的当前时间粒度;
至此完成了时序特征数据的构建,则关注属性的考察点序列为:
则属性Fi的考察点序列第k个考察点
优选的,所述步骤B的具体实现方式为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于曲逸文,未经曲逸文许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810055150.0/2.html,转载请声明来源钻瓜专利网。