[发明专利]一种基于滑动窗口的频繁项集并行增量挖掘的方法在审
申请号: | 202210077060.8 | 申请日: | 2022-05-11 |
公开(公告)号: | CN114691749A | 公开(公告)日: | 2022-07-01 |
发明(设计)人: | 马汉达;方伟 | 申请(专利权)人: | 江苏大学 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/182 |
代理公司: | 成都智涌知识产权代理事务所(普通合伙) 51313 | 代理人: | 魏振柯 |
地址: | 210000 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明属于数据处理分析领域,具体涉及一种基于滑动窗口的频繁项集并行增量挖掘的方法,针对现有并行增量挖掘方法在大数据环境下运行效率低的问题。本发明的主要实现步骤为:数据集获取与预处理;数据集划分为多块增量数据集;挖掘单批次数据集的频繁项集和准频繁项集;若当前窗口中存在前批次数据集,则将当前批次数据集的挖掘结果与前批次的挖掘结果合并更新;否则,进入持久化当前窗口中增量更新后的频繁项集和准频繁项集并输出频繁项集;如此,继续输入增量数据集,循环上述增量挖掘步骤。本发明通过引入滑动窗口等技术,加快了判定是否为频繁项集的速度,结合Spark并行计算和Hadoop分布式存储,使得该发明具有良好的挖掘效率。 | ||
搜索关键词: | 一种 基于 滑动 窗口 频繁 并行 增量 挖掘 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏大学,未经江苏大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202210077060.8/,转载请声明来源钻瓜专利网。