[发明专利]频繁项集的生成方法及装置有效
申请号: | 201510960773.9 | 申请日: | 2015-12-18 |
公开(公告)号: | CN105512322B | 公开(公告)日: | 2019-02-15 |
发明(设计)人: | 高尚;王宁;崔大凯;刘安;周灵艳;李莉 | 申请(专利权)人: | 中国农业银行股份有限公司 |
主分类号: | G06F16/2457 | 分类号: | G06F16/2457 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
地址: | 100005 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请提供了一种频繁项集的生成方法实施例,本实施例首先确定数据元个数N、频繁支持度及原始数据集,若数据元个数为1,则使用包含分组过滤规则的数据库查询语句,从数据项中,查询个数满足频繁支持度的数据项,生成一元频繁项集,若数据元个数大于1,获得一个一元频繁项集、N‑1元频繁项集及N个原始数据表,使用包含分组过滤规则及关联规则的数据库查询语句,对多个数据表进行关联及分组过滤,获得满足频繁支持度的N元目标数据项,生成N元频繁项集。可见,本实施例中使用数据库查询语句表示关联分析的规则,该种基于数据库查询的方式,不需构建复杂的数据结构,运算量较小,生成效率较高。本申请还提供了一种频繁项集的生成装置。 | ||
搜索关键词: | 频繁 生成 方法 装置 | ||
【主权项】:
1.一种频繁项集的生成方法,其特征在于,包括:确定待生成频繁项集的数据元个数N、频繁支持度及原始数据表;其中,所述原始数据表中包含若干组数据项;若所述数据元个数N为1,则使用包含分组过滤规则的数据库查询语句,从所述若干组数据项中,查询所在组的个数满足所述频繁支持度的目标数据项,将包含所述目标数据项的数据表确定为一元频繁项集;其中所在组的个数即包含目标数据项的组的个数;若所述数据元个数N大于1,则获得一个一元频繁项集、一个N‑1元频繁项集及N个原始数据表,使用包含表关联规则及分组过滤规则的数据库查询语句,对所述一元频繁项集、N‑1元频繁项集及N个原始数据表进行关联及分组过滤查询,获得所在组的个数满足所述频繁支持度的N元目标数据项,将包含所述N元目标数据项的数据表确定为N元频繁项集。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国农业银行股份有限公司,未经中国农业银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510960773.9/,转载请声明来源钻瓜专利网。