[发明专利]普适的事件序列频繁情节挖掘方法有效

申请号：	201810342362.7	申请日：	2018-04-16
公开（公告）号：	CN108563757B	公开（公告）日：	2021-05-28
发明（设计）人：	朱辉生;陈琳;李金海;周爱平;俞杨建	申请（专利权）人：	泰州学院
主分类号：	G06F16/901	分类号：	G06F16/901
代理公司：	南京正联知识产权代理有限公司 32243	代理人：	文雯
地址：	225300 ***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	事件序列频繁情节挖掘方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种普适的事件序列频繁情节挖掘方法，用于对数字化平台的日志数据的事件序列的频繁情节进行挖掘，其特征在于：在给定事件序列、窗口宽度、支持度阈值和支持度定义的前提下，基于深度优先搜索方式和共享前/后缀树存储结构来挖掘事件序列上的所有频繁情节，挖掘过程中兼顾多种支持度定义包括窗口发生、最小发生、头发生、总发生、非交错发生、非重叠发生、最小且非重叠发生，单遍扫描事件序列，且不产生候选频繁情节；具体为，

S1、初始化共享前/后缀树T；

S2、扫描事件序列一遍，依据支持度定义和支持度阈值，发现所有的频繁1-情节并按字典序排列；

S3、对于每个频繁1-情节α，在共享前/后缀树T中生成根结点的孩子结点N_α，每个结点包括情节名、情节发生集和孩子指针集三个域，为了兼顾考虑窗口发生、最小发生、头发生、总发生、非交错发生、非重叠发生、最小且非重叠发生的支持度定义，每个情节的发生集为其最早转移发生集；

S4、分别对每个频繁1-情节α，进行如下递归处理：依次取出每个频繁1-情节β对α进行情节增长，令增长后的情节为γ＝concat(α,β)或γ＝concat(β,α)，即γ是以α为前缀或后缀进行增长，每次增长后依据支持度定义计算γ的发生集，若γ是频繁情节，则在树T中添加N_α的孩子结点N_γ，并对γ进行类似于α的情节增长处理，如此不断迭代，直至没有发现更长的频繁情节为止，得到事件序列上所有频繁情节；步骤S4中，对于总发生的支持度定义，情节增长时采用后缀增长；对于基于窗口发生、头发生、最小发生、非交错发生、非重叠发生、最小且非重叠发生的支持度定义均采用前缀增长。

2.如权利要求1所述的普适的事件序列频繁情节挖掘方法，其特征在于：步骤S1中，共享前/后缀树T是一棵有向根树，除根结点外，共享前/后缀树T中的每个结点是一个三元组(Name,Occ,Child)，其中Name表示该结点对应的情节，Occ表示该结点对应情节的发生集，Child表示该结点的孩子指针集，共享前/后缀树T中父结点的Name，要么是子结点Name的前缀，要么是子结点Name的后缀。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于泰州学院，未经泰州学院许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201810342362.7/1.html，转载请声明来源钻瓜专利网。

上一篇：一种基于HDFS的电力设备监测大数据存储方法
下一篇：用户数量测算方法、装置、设备和存储介质

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]普适的事件序列频繁情节挖掘方法有效

专利文献下载