[发明专利]一种基于KNL集群的近期数据流项集挖掘方法与装置在审
申请号: | 201710131405.2 | 申请日: | 2017-03-07 |
公开(公告)号: | CN106919694A | 公开(公告)日: | 2017-07-04 |
发明(设计)人: | 吴韶华 | 申请(专利权)人: | 郑州云海信息技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京集佳知识产权代理有限公司11227 | 代理人: | 罗满 |
地址: | 450018 河南省郑州市*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 knl 集群 近期 数据流 挖掘 方法 装置 | ||
1.一种基于KNL集群的近期数据流项集挖掘方法,其特征在于,包括:
随着滑动窗口的滑动扫描所述滑动窗口中的数据流;
通过遗传算法处理所述数据流然后挖掘出所述数据流的频繁项集。
2.根据权利要求1所述的基于KNL集群的近期数据流项集挖掘方法,其特征在于,在扫描滑动窗口中的数据流之前,还包括:
设定滑动窗口的大小为W1。
3.根据权利要求2所述的基于KNL集群的近期数据流项集挖掘方法,其特征在于,在随着滑动窗口的滑动扫描所述滑动窗口中的数据流之后,在通过遗传算法处理所述数据流然后挖掘出所述数据流的频繁项集之前还包括:
将所述滑动窗口分割为若干个大小为W2的嵌套窗口。
4.根据权利要求3所述的基于KNL集群的近期数据流项集挖掘方法,其特征在于,通过遗传算法处理所述数据流然后挖掘出所述数据流的频繁项集具体为:
通过并行遗传算法对若干个大小为W2的所述嵌套窗口中的数据流进行第一频繁项集挖掘;
对若干个所述嵌套窗口对应的所述第一频繁项集合并扫描获得所述滑动窗口中所述数据流的第二频繁项集。
5.根据权利要求4所述的基于KNL集群的近期数据流项集挖掘方法,其特征在于,在对若干个所述嵌套窗口对应的所述第一频繁项集合并扫描获得所述滑动窗口中所述数据流的第二频繁项集之后,还包括:
扫描数据流流动后的滑动窗口的新数据流,然后挖掘数据流流动后的嵌套子窗口的第三频繁项集,根据所述第三频繁项集和数据流未流动的嵌套子窗口的第四频繁项集计算数据流流动后的滑动窗口的第五频繁项集。
6.一种基于KNL集群的近期数据流项集挖掘装置,其特征在于,包括:
扫描单元,用于随着滑动窗口的滑动扫描所述滑动窗口中的数据流;
频繁项集挖掘单元,用于通过遗传算法处理所述数据流然后挖掘出所述数据流的频繁项集。
7.根据权利要求6所述的近期数据流项集挖掘装置,其特征在于,还包括:
窗口设定单元,用于设定滑动窗口的大小为W1。
8.根据权利要求7所述的近期数据流项集挖掘装置,其特征在于,还包括:
嵌套窗口确定单元,用于将所述滑动窗口分割为若干个大小为W2的嵌套窗口。
9.根据权利要求8所述的近期数据流项集挖掘装置,其特征在于,频繁项集挖掘单元包括嵌套窗口频繁项集挖掘子单元和合并子单元:
嵌套窗口频繁项集挖掘子单元,用于通过并行遗传算法对若干个大小为W2的所述嵌套窗口中的数据流进行第一频繁项集挖掘;
合并子单元,用于对若干个所述嵌套窗口对应的所述第一频繁项集合并扫描获得所述滑动窗口中所述数据流的第二频繁项集。
10.根据权利要求9所述的近期数据流项集挖掘装置,其特征在于,还包括:
频繁项集更新单元,用于扫描数据流流动后的滑动窗口的新数据流,然后挖掘数据流流动后的嵌套子窗口的第三频繁项集,根据所述第三频繁项集和数据流未流动的嵌套子窗口的第四频繁项集计算数据流流动后的滑动窗口的第五频繁项集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州云海信息技术有限公司,未经郑州云海信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710131405.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种提高热词曝光覆盖率的方法和装置
- 下一篇:一种信息推荐方法及终端