[发明专利]一种序列规则的挖掘方法及系统在审
| 申请号: | 201510777308.1 | 申请日: | 2015-11-11 |
| 公开(公告)号: | CN105404668A | 公开(公告)日: | 2016-03-16 |
| 发明(设计)人: | 于磊 | 申请(专利权)人: | 内蒙古大学 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 李相雨 |
| 地址: | 010021 内蒙古自治区呼*** | 国省代码: | 内蒙古;15 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 序列 规则 挖掘 方法 系统 | ||
1.一种序列规则的挖掘方法,其特征在于,包括:
在至少一个序列中的所有序列元素中获取频繁序列元素;包含所述频繁序列元素的序列占所述至少一个序列的比例大于第一阈值;
在所述频繁序列元素形成的关联规则中,获取所有的目标关联规则以组成第一集合;
其中,所述目标关联规则的前件和后件均由不分顺序的至少一个频繁序列元素组成;为所述目标关联规则的前件和后件各自规定一种排列顺序后形成一个有序目标规则;
所述目标关联规则的目标支持度大于第二阈值;所述目标关联规则的目标支持度为该目标关联规则所有有序目标规则在所述至少一个序列中的支持度的总和;
所述目标关联规则的目标置信度大于第三阈值;所述目标关联规则的目标置信度为所述至少一个序列中符合该目标关联规则的任一有序目标规则的序列的数量,与所述至少一个序列中包含该目标关联规则的前件的序列的数量之间的比值。
2.根据权利要求1所述的序列规则挖掘方法,其特征在于,所述在所述频繁序列元素形成的关联规则中,获取所有的目标关联规则以组成第一集合,包括:
获取以两个所述频繁序列元素分别作为前件和后件而形成的所有目标关联规则,并加入第一集合;
重复执行下述步骤,直到不能得到新的目标关联规则:在第一集合中的一个目标关联规则的前件或后件中加入不包含在该前件和该后件中的频繁序列元素,以将形成的目标关联规则加入至第一集合。
3.根据权利要求2所述的序列规则挖掘方法,其特征在于,所述在第一集合中的一个目标关联规则的前件或后件中加入不包含在该前件和该后件中的频繁序列元素,以将形成的目标关联规则加入至第一集合的步骤,包括:
在将一个频繁序列元素加入至一个目标关联规则的前件或后件中时,判断该频繁序列元素是否没有出现在任意一个该目标关联规则的相符序列中;所述目标关联规则的相符序列为所述至少一个序列中符合该目标关联规则的序列;
若是,则不再将该频繁序列元素加入至前件包含该目标关联规则的前件、后件包含该目标关联规则的后件的目标关联规则的前件或后件中。
4.根据权利要求3所述的序列规则挖掘方法,其特征在于,所述在第一集合中的一个目标关联规则的前件或后件中加入不包含在该前件和该后件中的频繁序列元素,以将形成的目标关联规则加入至第一集合的步骤,还包括:
若一个频繁序列元素于一个目标关联规则的所有相符序列中全部位于该目标关联规则的前件中的频繁序列元素首次出现的位置之后,则不再将该频繁序列元素加入至该目标关联规则的前件中;
若一个频繁序列元素于一个目标关联规则的所有相符序列中全部位于该目标关联规则的后件中的频繁序列元素最后出现的位置之前,则不再将该频繁序列元素加入至该目标关联规则的后件中。
5.根据权利要求2所述的序列规则挖掘方法,其特征在于,所述在第一集合中的一个目标关联规则的前件或后件中加入不包含在该前件和该后件中的频繁序列元素,以将形成的目标关联规则加入至第一集合的步骤,包括:
在所有频繁序列元素排列而成的一个参考序列中,若一个频繁序列元素没有位于一个目标关联规则的前件中的所有频繁序列元素之前,则不向该目标关联规则的前件中加入该频繁序列元素;
在所述参考序列中,若一个频繁序列元素没有位于一个目标关联规则的后件中的所有频繁序列元素之前,则不向该目标关联规则的后件中加入该频繁序列元素。
6.一种序列规则的挖掘系统,其特征在于,包括:第一获取模块和第二获取模块;其中,
所述第一获取模块用于在至少一个序列中的所有序列元素中获取频繁序列元素;包含所述频繁序列元素的序列占所述至少一个序列的比例大于第一阈值;
所述第二获取模块用于在所述频繁序列元素形成的关联规则中,获取所有的目标关联规则以组成第一集合;
其中,所述目标关联规则的前件和后件均由不分顺序的至少一个频繁序列元素组成;为所述目标关联规则的前件和后件各自规定一种排列顺序后形成一个有序目标规则;
所述目标关联规则的目标支持度大于第二阈值;所述目标关联规则的目标支持度为该目标关联规则所有有序目标规则在所述至少一个序列中的支持度的总和;
所述目标关联规则的目标置信度大于第三阈值;所述目标关联规则的目标置信度为所述至少一个序列中符合该目标关联规则的任一有序目标规则的序列的数量,与所述至少一个序列中包含该目标关联规则的前件的序列的数量之间的比值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于内蒙古大学,未经内蒙古大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510777308.1/1.html,转载请声明来源钻瓜专利网。





