[发明专利]基于Eclat的多元时间序列关联规则挖掘方法在审
申请号: | 201710763342.2 | 申请日: | 2017-08-30 |
公开(公告)号: | CN107562865A | 公开(公告)日: | 2018-01-09 |
发明(设计)人: | 张春慨 | 申请(专利权)人: | 哈尔滨工业大学深圳研究生院 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 深圳市科吉华烽知识产权事务所(普通合伙)44248 | 代理人: | 胡吉科 |
地址: | 518000 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出了一种基于Eclat的多元时间序列关联规则挖掘方法,包括(1)生成垂直数据集;(2)生成MINHASH矩阵,MINHASH矩阵需要指定参数k;(3)利用MINHASH矩阵估计原始数据集中的候选项集;(4)根据最小支持度把候选集剪枝后得到频繁项集1;(5)在哈希频繁1项集两两合并生成新的频繁2项集;(6)循环步骤(5)直到无法合并,结束算法。本发明显著的加快关联规则挖掘速度,达到及时获取时间序列数据分析结果的目标,虽然牺牲了挖掘的精确性,但可以大大的提高挖掘效率、节约机器内存。 | ||
搜索关键词: | 基于 eclat 多元 时间 序列 关联 规则 挖掘 方法 | ||
【主权项】:
一种基于Eclat的关联规则挖掘方法,其特征在于:所述方法包括:(1)生成垂直数据集;(2)生成MINHASH矩阵,MINHASH矩阵需要指定参数k,其意义是矩阵最多有k行;(3)利用MINHASH矩阵估计原始数据集中的候选项集;(4)根据最小支持度把候选集剪枝后得到频繁项集1;(5)在哈希频繁1项集两两合并生成新的频繁2项集;(6)循环步骤(4)、(5)直到无法合并,结束算法;其中,步骤(3)中使用MinHash估计集合交集大小,对于多个集合S1,S2,…Si,…,Sm,包含最多元素的集合大小为nmax=maxi|Si|,集合交集大小估计值为X=|∩kmin(Si)|nmaxk,]]>其中∩kmin(Si)表示使用MinHash方法抽样形成的哈希矩阵中集合Si的交集。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学深圳研究生院,未经哈尔滨工业大学深圳研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710763342.2/,转载请声明来源钻瓜专利网。