[发明专利]一种基于内存的频繁模式挖掘方法有效
申请号: | 201610662641.2 | 申请日: | 2016-08-14 |
公开(公告)号: | CN106250549B | 公开(公告)日: | 2019-09-20 |
发明(设计)人: | 刘铎;林怡;黄柏钧;朱潇 | 申请(专利权)人: | 重庆大学 |
主分类号: | G06F16/901 | 分类号: | G06F16/901 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 麦小婵;郝传鑫 |
地址: | 400044 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于内存的频繁模式挖掘方法,它包括以下步骤:步骤1,构建频繁模式初始树,创建频繁模式树的根结点T,以“null”标记;再次扫描数据库,将读取的每条事务中的频繁项选出并按L中的次序排序;排序后以null为根结点构建一条频繁模式树的路径,只对路径上位于最末的结点的计数加1,路径上的其他结点的计数保持不变;依次扫描完整个数据库中所有事务后获得频繁模式初始树;步骤2,用深度优先搜索算法对频繁模式初始树依次进行遍历,遍历结点的计数器值为该结点本身的值加上其所有孩子结点的值。本发明的技术效果是:能减少对NVM的写操作,能快速的构建频繁模式树;且能减少对靠近根结点的结点计数域大量密集的写操作,延长了NVM寿命。 | ||
搜索关键词: | 一种 基于 内存 频繁 模式 挖掘 方法 | ||
【主权项】:
1.一种基于内存的频繁模式挖掘方法,其特征是,包括以下步骤:步骤1,构建频繁模式初始树1)、依次扫描数据库中的每一条交易记录,获得数据库中所包含的全部项的支持度计数,排除支持度计数值小于阈值的项,剩余的项即为频繁项,对频繁项按其支持度计数降序排列得到一个列表L;2)、创建频繁模式树的根结点T,以“null”标记;3)、再次扫描数据库,将读取的每条事务中的频繁项选出并按L中的次序排序;排序后以null为根结点构建一条频繁模式树的路径,只对路径上位于最末的结点的计数加1,路径上的其他结点的计数保持不变;依次扫描完整个数据库中所有事务后获得频繁模式初始树;步骤2,用深度优先搜索算法对频繁模式初始树依次进行遍历,遍历结点的计数器值为该结点本身的值加上其所有孩子结点的值。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆大学,未经重庆大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610662641.2/,转载请声明来源钻瓜专利网。
- 上一篇:一种代码更新方法
- 下一篇:一种实时关联新闻推荐内容的方法和装置