[发明专利]基于递增投影规则的广义无冗余序列规则挖掘方法在审
| 申请号: | 201510312885.3 | 申请日: | 2015-06-09 |
| 公开(公告)号: | CN104915683A | 公开(公告)日: | 2015-09-16 |
| 发明(设计)人: | 尤涛;杜承烈;吴其蔓;钟冬;成驰 | 申请(专利权)人: | 西北工业大学 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 西北工业大学专利中心 61204 | 代理人: | 王鲜凯 |
| 地址: | 710072 *** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明公开了一种基于递增投影规则的广义无冗余序列规则挖掘方法,用于解决现有序列规则挖掘方法生成序列规则效率低的技术问题。技术方案是包括冗余性检查和递增投影产生规则两部分,通过多规则的关联关系,将频繁闭序列和序列生成子的检查精简到重叠集的检查,通过递增消除冗余的方法经行规则投影,从而提升了时间及空间效率。该方法在保障规则完备性的前提下,得到了更为精简的序列规则,提高了生成序列规则的效率。 | ||
| 搜索关键词: | 基于 递增 投影 规则 广义 冗余 序列 挖掘 方法 | ||
【主权项】:
一种基于递增投影规则的广义无冗余序列规则挖掘方法,其特征在于包括以下步骤:第一部分、冗余性检查的步骤如下:步骤一、遍历搜索找出闭序列集和生成子集的相同序列构成的重叠集,并删除重叠集中的相同元素;对于输入的频繁闭序列ee及其生成子集合ge,扫描得到生成子和闭序列的重叠项是:AB、ABC和ABCD;步骤二、找出重叠集在闭序列集合生成子集的投影和被投影序列,即找出生成子集中能被重叠集元素投影的序列集合,并找出闭序列集中能被重叠集中元素投影的序列集合;得到重叠集公共集合ge’,元素包括AB、ABC和ABCD;扫描频繁闭序列集合ee,以及生成子集合ge,得到能投影元素集合g2:A;能被投影的元素集合g1:ABCDE;步骤三、对重叠集的所有序列进行冗余迹检查,遍历重叠集中元素,将不满足冗余迹检查的元素删除;对于重叠集进行冗余性迹检查后得到重叠集元素AB、ABC和ABCD;第二部分、递增投影产生规则的步骤如下:步骤一、得到冗余性迹检查后的频繁闭序列及其生成子的重叠集,以及频繁闭序列中可被重叠集元素投影的投影集合,以及重叠集中可被生成子投影的被投影集合;得到重叠集元素包括AB、ABC和ABCD;g1集合:ABCDE;g2集合:A;步骤二、将重叠集中的元素按照字典序排列;按照字典序排列得到AB、ABC和ABCD;步骤三、按照字典序对重叠集中元素依次进行投影;AB、ABC投影得到AB—>C;AB、ABCD投影得到AB—>CD;ABC、ABCD投影得到ABC—>D;最终r1集得到满足置信度阈值的如下序列规则:ABC—>D;AB—>C;AB—>CD;步骤四、将重叠集元素投影到投影集中得到无冗余序列规则,并将被投影集中元素投影到重叠集中得到无冗余序列规则;对于无冗余规则集合r3:A、AB投影得到A—>B;A、ABC投影得到A—>BC;A、ABCD投影得到A—>BCD;对于无冗余规则集合r2:AB、ABCDE投影得到AB—>CDE;ABC、ABCDE投影得到ABC—>DE;ABCD、ABCDE投影得到ABCD—>E;最终得到所有的无冗余序列规则集合为r1、r2、r3之和,包括ABC—>D;AB—>C;AB—>CD;A—>B;A—>BC;A—>BCD;AB—>CDE;ABC—>DE;ABCD—>E。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510312885.3/,转载请声明来源钻瓜专利网。





