工作流挖掘中隐含任务的探究

2016-05-28 08:12王燊
无线互联科技 2016年6期

王燊

摘 要:文章首先分析工作流网中隐含任务可能出现的情况,基于α算法,提出在噪声环境下能发现隐含任务的改进α算法。该算法利用依赖/频率表确定日志中任务间依赖关系并判断是否存在隐含任务,向工作流网中添加隐含任务,通过对隐含任务合并、去冗操作完善工作流网。最后,用一个案例对改进算法进行验证。

关键词:工作流网;依赖/频率表;工作流日志;隐含任务

工作流是一类能够完全或是部分自动执行的经营过程,它定义任务间相互关系来完成业务流程的自动化执行和管理。工作流挖掘是一种自动化的过程分析技术,从流程日志中自动获得有价值的信息,建立工作流模型,使得所建模型可以重现原始工作流网。

对含有隐含任务、噪音数据等不完整日志的挖掘是当今面临的难题之一。大部分不完整日志都是由于含有隐含任务造成的,现有的大多掘算法在挖掘隐含任务时都不能得到正确的模型。少数几个能解决隐含任务的算法,如算法、基因算法都只是能挖掘部分结构的隐含任务,并不能解决全部的隐含任务问题。

1 研究现状

在文献[1]中,Agrawal等人最早提出利用工作流管理系统日志挖掘工作流模型。Herbest提出一种基于ADONIS模型的算法,该算法可以挖掘并行结构、选择结构,但是该算法不能检测隐含的结构,而且对循环结构的发现能力也是非常有限的。

隐含任务是指存在于业务流程中但不存在于流程日志中的任务,因为它们不存在于流程日志中,所以非常难被挖掘。国外学者Aalst对隐含任务的挖掘作了大量研究工作,他提出一种#α算法,可以在DIWF-nets中很好的发现隐含任务,但是该算法仍然存在问题,例如算法的挖掘效率不高等。

2 相关技术

Petri网为工作流建模提供了形式化的方法和分析技术。由Aalst引入工作流建模的Petri网称工作流网,它是Petri网的一个子集。

定义6(隐含任务)隐含任务是指存在于业务流程中但不存在于流程日志中的任务,在流程中仅仅起到路由作用的任务,目的是为了真实任务的并行执行。

工作流挖掘中一般认为所有信息都会记录在日志中,其实不然,隐含任务就没有在日志中出现。导致隐含任务产生的情况有2种:(1)日志记录的过程中有噪声或信息的错误丢失。(2)任务在日志中没有被记录,比如只作为路由的任务,如图1所示(阴影是隐含任务)。图中隐含任务的加入仅是因为路由选择的需要,并不对应具体的工作。其作用是为了B和D,E和F并行执行。

如果不考虑流程中隐含任务的作用,那么挖掘出来的结果模型可能不会符合日志所记录的流程行为,导致挖掘结果不正确。

[参考文献]

[1]Agrawal R,Gunopulos D,Leymann F.Mining process models from workflow logs[C]//Proceedings of the 16th.International Conference of Extending Database Technology.Valencia,Spain,1998.

[2]马慧,汤庸,吴凌坤.α_H算法:工作流挖掘中一种能挖掘隐含任务的扩展α算法[J].计算机科学,2011(4):221-225.

[3]吴建强.噪声环境下工作流挖掘算法研究[D].广州:华南理工大学,2012.

Exploration on Implicit Task in the Workflow Mining

Wang Shen

(Beifang University of Nationalities, Yinchuan 750021, China)

Abstract: First, by analyzing the situations where a hidden task may appear in the WF-Net,a new α#-algorithm- based om αalgorithmis proposed to find the hidden tasks under the noise environment.Using the dependence-frequency table,It ascertains the dependencies between tasks in logs and determines if there are hidden tasks ,then inserts hidden tasks in the WF-Net. To perfect the WF-Net,it merges and removes the hidden tasks. Last,a case is presented to verify theα#-algorithm.

Key words: WF-Net; dependence-frequency table;logs of workflow; hidden tasks