[发明专利]一种含时间约束工作流的挖掘算法有效
申请号: | 201810365422.7 | 申请日: | 2018-04-23 |
公开(公告)号: | CN108647253B | 公开(公告)日: | 2022-09-06 |
发明(设计)人: | 宋巍;尚庆民;常震;戴汪洋 | 申请(专利权)人: | 南京理工大学 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458 |
代理公司: | 南京理工大学专利中心 32203 | 代理人: | 陈鹏 |
地址: | 210094 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 时间 约束 工作流 挖掘 算法 | ||
本发明公开了一种含时间约束工作流的挖掘算法,以含时间戳的事件日志作为输入,以挖掘出的正确的含时间约束的工作流模型作为输出;首先从日志中挖掘出事件之间的关系;之后,根据挖掘出的关系推导计算出事件的时间约束;最后,调用α算法中事件关系的模型生成算法生成不含时间约束的工作流模型,并将时间约束附加到相应的事件上获得时间约束工作流模型。本发明挖掘的时间约束工作流模型具有更好的完备性、准确性和可靠性,更接近实际的工作流过程,普遍适用于点事件日志、区间事件日志以及混合型事件日志。
技术领域
本发明属于数据挖掘领域,具体涉及一种含时间约束工作流的挖掘算法。
背景技术
随着互联网技术和云计算的不断发展,工作流相关的技术在如今的信息系统中扮演着越来越重要的角色。从传统的自动化办公系统、组织业务管理系统到最近的服务组合和云环境下的大数据应用等,都有大量的工作流产生,如何挖掘出高质量的工作流模型成为一项也成为一项重要的技术。
事件日志,是计算机信息系统的重要组成部分,记录了系统执行中发生的事件,及事件对应的时间、操作者和生命周期等相关信息,对理解复杂系统的活动至关重要,具有很大的价值。事件日志由多条事件序列组成,每条事件序列记录了一次系统执行的相关信息,具有真实性和客观性的特点。通过挖掘事件日志生成工作流模型能够更加贴近实际业务事件执行的先后次序,推断实际业务流程执行所需要的时间。
工作流挖掘,是一种从工作流日志中提取有用信息的一种技术,通过对系统运行产生的日志进行分析,能够重现业务流程的真实过程,可以为业务过程重构、优化提供重要参考意见,推动了如软件回归测试等计算机相关技术的发展。
现有的过程挖掘技术多数基于仅包含点事件或仅包含区间事件的事件日志进行挖掘,然而现实中的事件日志大多是混合型的,现有过程挖掘技术应用到混合型事件日志需要对日志进行预处理,将点事件扩充为区间事件,或删除区间事件的开始事件或结束事件,无法保证挖掘出正确的过程模型。
发明内容
本发明的目的在于提供一种含时间约束工作流的挖掘算法,在事件日志为包含时间戳的日志的情况下,挖掘出事件日志对应的正确的时间约束工作流模型。
实现本发明目的的技术解决方案为:一种含时间约束工作流的挖掘方法,用于挖掘含时间戳的事件日志的工作流模型,以包含时间戳的事件日志为输入,以挖掘出的时间约束工作流模型为输出结果,挖掘方法步骤如下:
步骤1,基于事件序列挖掘事件关系,扫描混合型事件日志的每一条事件序列,获取基于事件序列的事件关系,之后推导出整个日志层面的事件关系;
步骤2,挖掘事件日志中每个事件对应的时间约束,根据事件的时间戳和求得的日志层面的事件关系,计算事件从使能到开始发生和到完成分别需要的时间,通过不断读取事件序列对时间约束不断更新获得整个日志层面的时间约束;
步骤3,调用α算法中基于日志层面事件关系的模型生成算法生成不含时间约束的工作流模型,之后将事件的时间约束附加到模型的事件,获得最终的时间约束工作流模型。
本发明与现有技术相比,其显著优点为:本发明所提方法普遍适用于点事件日志、区间事件日志以及混合型事件日志;相较于传统方法,本发明适用范围最广,挖掘出的时间约束工作流模型具有更好的完备性和可靠性,更加贴近实际业务流程。
附图说明
图1是本发明提供的含时间约束工作流的挖掘算法的流程图。
图2是以XES格式描述的事件日志文件示意图。
图3是最终挖掘出的过程模型图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810365422.7/2.html,转载请声明来源钻瓜专利网。