[发明专利]基于Eclat的多元时间序列关联规则挖掘方法在审
申请号: | 201710763342.2 | 申请日: | 2017-08-30 |
公开(公告)号: | CN107562865A | 公开(公告)日: | 2018-01-09 |
发明(设计)人: | 张春慨 | 申请(专利权)人: | 哈尔滨工业大学深圳研究生院 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 深圳市科吉华烽知识产权事务所(普通合伙)44248 | 代理人: | 胡吉科 |
地址: | 518000 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 eclat 多元 时间 序列 关联 规则 挖掘 方法 | ||
1.一种基于Eclat的关联规则挖掘方法,其特征在于:所述方法包括:(1)生成垂直数据集;(2)生成MINHASH矩阵,MINHASH矩阵需要指定参数k,其意义是矩阵最多有k行;(3)利用MINHASH矩阵估计原始数据集中的候选项集;(4)根据最小支持度把候选集剪枝后得到频繁项集1;(5)在哈希频繁1项集两两合并生成新的频繁2项集;(6)循环步骤(4)、(5)直到无法合并,结束算法;其中,步骤(3)中使用MinHash估计集合交集大小,对于多个集合S1,S2,…Si,…,Sm,包含最多元素的集合大小为nmax=maxi|Si|,集合交集大小估计值为
其中∩kmin(Si)表示使用MinHash方法抽样形成的哈希矩阵中集合Si的交集。
2.根据权利要求1所述的方法,其特征在于:所述步骤(1)中,在原始事务集上经过倒排得到垂直数据集。
3.根据权利要求1所述的方法,其特征在于:步骤(2)还包括释放垂直数据集以节省内存。
4.根据权利要求1所述的方法,其特征在于:所述最小支持度使用MinHash估计。
5.根据权利要求1所述的方法,其特征在于:所述方法应用于多元时间序列的关联规则挖掘。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学深圳研究生院,未经哈尔滨工业大学深圳研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710763342.2/1.html,转载请声明来源钻瓜专利网。