[发明专利]基于递增投影规则的广义无冗余序列规则挖掘方法在审

专利信息
申请号: 201510312885.3 申请日: 2015-06-09
公开(公告)号: CN104915683A 公开(公告)日: 2015-09-16
发明(设计)人: 尤涛;杜承烈;吴其蔓;钟冬;成驰 申请(专利权)人: 西北工业大学
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 西北工业大学专利中心 61204 代理人: 王鲜凯
地址: 710072 *** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于递增投影规则的广义无冗余序列规则挖掘方法,用于解决现有序列规则挖掘方法生成序列规则效率低的技术问题。技术方案是包括冗余性检查和递增投影产生规则两部分,通过多规则的关联关系,将频繁闭序列和序列生成子的检查精简到重叠集的检查,通过递增消除冗余的方法经行规则投影,从而提升了时间及空间效率。该方法在保障规则完备性的前提下,得到了更为精简的序列规则,提高了生成序列规则的效率。
搜索关键词: 基于 递增 投影 规则 广义 冗余 序列 挖掘 方法
【主权项】:
一种基于递增投影规则的广义无冗余序列规则挖掘方法,其特征在于包括以下步骤:第一部分、冗余性检查的步骤如下:步骤一、遍历搜索找出闭序列集和生成子集的相同序列构成的重叠集,并删除重叠集中的相同元素;对于输入的频繁闭序列ee及其生成子集合ge,扫描得到生成子和闭序列的重叠项是:AB、ABC和ABCD;步骤二、找出重叠集在闭序列集合生成子集的投影和被投影序列,即找出生成子集中能被重叠集元素投影的序列集合,并找出闭序列集中能被重叠集中元素投影的序列集合;得到重叠集公共集合ge’,元素包括AB、ABC和ABCD;扫描频繁闭序列集合ee,以及生成子集合ge,得到能投影元素集合g2:A;能被投影的元素集合g1:ABCDE;步骤三、对重叠集的所有序列进行冗余迹检查,遍历重叠集中元素,将不满足冗余迹检查的元素删除;对于重叠集进行冗余性迹检查后得到重叠集元素AB、ABC和ABCD;第二部分、递增投影产生规则的步骤如下:步骤一、得到冗余性迹检查后的频繁闭序列及其生成子的重叠集,以及频繁闭序列中可被重叠集元素投影的投影集合,以及重叠集中可被生成子投影的被投影集合;得到重叠集元素包括AB、ABC和ABCD;g1集合:ABCDE;g2集合:A;步骤二、将重叠集中的元素按照字典序排列;按照字典序排列得到AB、ABC和ABCD;步骤三、按照字典序对重叠集中元素依次进行投影;AB、ABC投影得到AB—>C;AB、ABCD投影得到AB—>CD;ABC、ABCD投影得到ABC—>D;最终r1集得到满足置信度阈值的如下序列规则:ABC—>D;AB—>C;AB—>CD;步骤四、将重叠集元素投影到投影集中得到无冗余序列规则,并将被投影集中元素投影到重叠集中得到无冗余序列规则;对于无冗余规则集合r3:A、AB投影得到A—>B;A、ABC投影得到A—>BC;A、ABCD投影得到A—>BCD;对于无冗余规则集合r2:AB、ABCDE投影得到AB—>CDE;ABC、ABCDE投影得到ABC—>DE;ABCD、ABCDE投影得到ABCD—>E;最终得到所有的无冗余序列规则集合为r1、r2、r3之和,包括ABC—>D;AB—>C;AB—>CD;A—>B;A—>BC;A—>BCD;AB—>CDE;ABC—>DE;ABCD—>E。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201510312885.3/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top