基于数据影响的多对象交互流程偏差检测方法

2024-05-24 13:18钱陈婧方贤文张希为
计算机应用研究 2024年3期

钱陈婧 方贤文 张希为

摘 要:

現有的大多数偏差检测方法能够识别来自流程活动及部分数据属性的偏差,但是无法处理流程执行过程中数据变化对流程的影响问题,尤其是在涉及多对象交互的情况下。针对这一问题,提出了一种多对象交互情况下基于数据影响的业务流程偏差检测方法。首先,基于控制流与数据信息识别可能的偏差活动;然后,根据数据变化对活动的影响定义影响集;接着,将以对象为中心的概念引入偏差检测过程,形式化以对象为中心的Petri网模型,在此基础上,通过分析对象是否对其修改的数据具有执行权限,分类并定义了四种数据影响类型及其计算标准,据此得到基于数据影响的偏差检测结果;最后,与其他偏差检测方法对比验证,结果表明,应用该方法得到的偏差检测结果值得到提升,并且能够处理多对象交互的流程偏差。该方法能够有效捕获多对象交互流程中数据变化影响的流程活动,提高偏差检测的合理性与准确性。

关键词:数据影响;以对象为中心;数据Petri网;影响集;偏差检测

中图分类号:TP391.9   文献标志码:A    文章编号:1001-3695(2024)03-035-0880-07doi: 10.19734/j.issn.1001-3695.2023.07.0315

Deviation detection method for multi-object interaction processes based on data impact

Qian Chenjinga, Fang Xianwena,b, Zhang Xiweia

(a.College of Mathematics & Big Data, b.Anhui Province Engineering Laboratory for Big Data Analysis & Early Warning Technology of Coal Mine Safety, Anhui University of Science & Technology, Huainan Anhui 232001, China)

Abstract:

Most existing deviation detection methods are capable of identifying deviations from process activities and data attributes, but they fail to address the issue of how changes in data during process execution impact the process, especially in cases involving interactions among multiple objects. To address this issue, this paper proposed a business process deviation detection method based on data impact in the context of multi-object interactions. Firstly, this method identified potential deviant activities based on control flow and data information. Then, it defined impact sets based on the impact of data changes on activities. Next, it introduced the concept of object-centric into the deviation detection process and formalized the object-centric Petri net model. On this basis, by analyzing whether the object had execution privilege on the data it modified, this paper classified and defined four types of data impacts and their calculation criteria, from which the results of deviation detection based on data impacts were obtained. Finally, compared with other deviation detection methods, the results show that the devia-tion detection results obtained by applying the method are improved and are able to handle process deviations for multi-object interactions. This method can effectively capture the process activities affected by data changes in multi-object interaction processes and improve the rationality and accuracy of deviation detection. Key words:data impact; object-centric; data Petri net; impact set; deviation detection

0 引言

业务流程模型描述了流程执行的标准和预期的规范过程,大量的事件数据也从业务流程中产生。在流程执行中,偏差检测旨在通过区分偏离行为和正常行为来识别异常的执行,一致性检查技术作为过程挖掘领域中的一个重要组成部分,通过一定的度量方法来反映在事件日志中的实际行为与流程模型中指定的预期行为的匹配程度[1],因此,通常将对一致性检查技术的研究作为关于过程模型与事件日志之间偏差检测的重点。

一致性检查将过程的建模行为与观察到的行为进行对比,以检测、定位以及解释它们之间的偏差[2,3]。控制流一致性检查解决了流程中活动的执行顺序问题,除此之外,近年来,许多关于一致性检查的研究还考虑了包括时间[4]、资源、生命周期[5]等在内的其他数据相关属性。文献[6]提出一种多视角在线一致性检查技术,融合基于前缀对齐的一致性检查技术和基于对齐的多视角一致性检查技术,在多视角过程模型和事件流之间返回一个最优的多视角前缀对齐;文献[7]利用两个迹的活动依赖关系,并基于一个宽松迹等价的概念,将一致性检查问题转换为迹一致性分析问题,实现了数据感知的业务流程一致性检查;文献[8]集成了现有的偏差检测方法和上下文的概念,提出了一个解决上下文感知偏差检测问题的框架,并使用带有专用语义的积极和消极上下文来扩展上下文概念。

此外,传统对工作流网的偏差检测研究往往孤立地关注单个研究对象,但在现实情况下,流程的执行可能由多个具有复杂相互关系的对象间的活动组成。针对这一问题,文献[9]将以对象为中心的事件日志作为信息系统中实际数据和传统事件日志之间的一种表示方式,并从中发现一个以对象为中心的Petri网;文献[10]提出一种基于重放的一致性检查方法,应用跳转策略重放日志迹以寻找偏差;文献[11]提出了一种将对象交互信息纳入预测模型的方法,从而提高了预测分析的质量。

然而,在上述工作中,检测模型与日志间的偏差时都只考虑当前状态下的活动及其数据信息,而不考虑数据变化问题,以及在数据产生变化后对依赖于此数据的后续活动的影响问题。例如:在实际工业生产制造流程中,产品的生产制造所涉及的价格、库存等数据信息不断变化,一旦数据更改,后续流程也就相应发生变化。在这种情况下,现有的偏差检测方法观察到这些活动看起来偏离流程的正常执行,因此被视为异常行为,而这在实际流程执行过程中是完全合理的。于是文献[12]提出一种半自动化的数据影响分析方法,接收数据项和关于流程执行的当前状态信息,从活动、数据项和受影响的网关方面分析数据更改的影响;进一步地,文献[13,14]在一致性检查中将流程执行过程中的意外事件和数据变化考虑在内,通过分析流程执行过程中涉及的数据更新及其对预期行为的影响,考虑了对流程执行过程中意外偏差的响应,更好地捕捉了对偏差的适应行为。另一方面,工业生产通常需要制造商与供应商之间协作完成,零件的采购数量、交易金额等信息需由两者协商,其数据更改也应当由正确的执行方执行。分析在这样多对象交互情况下的数据变化在现实场景中是至关重要的,但现有的以对象为中心的偏差检测方法的研究并不多见。

基于上述研究工作,本文提出了一种在多对象交互的场景下检测过程模型与事件日志之间偏差的方法。该方法分析在多对象交互的流程执行过程中所涉及的数据变化及其对后续活动的影响,并从多个视角将影响类型划分成四种类型具体分析,从而灵活解决来自事件日志或者模型中的偏差问题。由于Petri网提供了完整的图形化表示方式,并且能够形象地模拟、描述复杂流程的行为交互与状态变化,所以使用Petri网来对流程进行建模。此外,为了综合控制流与数据流视角,量化其检测结果,有效且直观地评估迹与模型的一致性,本文使用适应度作为一个统一的度量标准。

1 动机案例

盡管流程模型能够用于定义流程的有效执行以达到某业务目标,但在实际执行中,流程往往具有灵活多变性。大多数的一致性检查技术都能够反映出流程中存在的问题,但其判断和指出所观察到偏差原因的能力是有限的。图1展示的是一个产品制造流程的Petri模型,流程从一个订单的创建过程开始,接下来根据订单内容进行生产工作,并最终将产品交付给客户,完成一个订单的执行。

在一个订单的执行过程中,通常会涉及发送订单的客户、进行生产的制造商以及提供生产所需零件的供应商这几个对象,从各自的角度来看,他们都执行各自单独的流程,并通过三者间的交互共同组成一个完整的流程。

假设在给定的流程执行中,制造商检查零件库存时发生疏忽,向供应商发送新的零件采购请求,此时产生一条迹σ1,其中:σ1=〈a,e,f,b,g,h,g,k,m,n,o,l,p,h,i,c,d, j〉。通过将其与模型对齐,得到的结果如图2所示。

根据现有的偏差检测技术,检测到迹与流程模型之间存在大量偏差。然而,制造商在重新进行仓检后,发现原本统计的生产所需零件库存不足,需要向供应商进行采购,然后继续后续的生产工作,因此,对于原有的一致性检查技术判定的部分偏差行为,在实际生活中具有合理的解释。同时,在实际订单执行过程中,涉及到客户、制造商和供应商这三个执行对象,他们分别负责不同的活动及其交互,并对不同数据具有修改权限。例如在给出的迹中,订单交易金额的改变仅仅可由供应商根据制造商发送的零件数量进行计算更改,而交付给制造商的零件数量也是由制造商在选择追加零件采购数量后进行了调整。

针对这种情况,本文提出一种基于数据影响的业务流程偏差检测方法,实现对流程行为的一致性分析。此方法对流程模型以对象为中心建模,并从控制流和数据流的角度出发,通过分析数据更改对流程活动的影响以辨别真实偏差行为。

即执行序列与预期存在一定偏差,这个偏差来源于制造商重新进行仓检所产生的数据变化,以及变化对后续活动的数据影响。而在第1章中,根据对齐结果得到的标准适应度值仅为0.56,显然,根据这个结果,示例迹被认为是严重偏离预期的异常执行序列,这与第1章所述事实不符。两相比较,本文方法能够更合理地检测日志与流程之间的偏差问题,并能够帮助解释偏差产生的原因。

4 实验

为了验证所提方法的可行性与适用性,本章将详细阐述相关实验步骤。首先介绍实验所使用的数据集;然后详述对数据集进行的处理;最后,将方法应用至处理后的数据集,评估其效果,并将得到的结果与标准偏差检测技术进行比较,得出结论,即本文方法在偏差检测上更具准确性且更合理。

4.1 实验数据处理

对于本文提出的基于数据影响的业务流程偏差检测方法,根据算法2可以求得影响集以修正标准偏差检测方法中产生的检测误差问题。为验证方法在检测流程模型和事件日志之间偏差的准确性,实验使用文献[21]所述OCEL标准存储的一个描述订单管理的真实数据集(http://ocel-standard.org/),对其使用ProM中的OC-PM Model插件从数据集中挖掘得到一个以对象为中心的Petri网模型以用于偏差分析。

首先根据这些数据集挖掘得到Petri网模型,形成完全匹配的模型与日志序列,接着使用PLG对这些日志序列注入不同程度、不同类型的偏差行为,由此得到对应的携带不同程度和类型的偏差的日志,对这些生成的日志序列,执行本文所述偏差检测算法,并与现有方法进行对比。注意,与本文方法不同,现有的大多数偏差检测方法针对一个单一对象流程,因此,在使用以对象为中心的事件日志时,需将其扁平化。

对于无偏差的执行序列,实验将四种不同类型的偏差事件注入其中:a)随机地将一个或多个事件添加至已发生序列或随机地删除其中一个或多个已存在事件;b)随机地修改两个已存在事件的时间戳;c)随机地修改已存在事件的原有数据值,包括输入和输出数据;d)随机将一个或多个事件的执行对象替换为其他对象,以及四种偏差类型的混合。并按照5%、10%、15%、20%的偏差比例将偏差类型平均分配,由此每条日志可以得到20种不同类型的偏差序列。

4.2 实验效果评估

实验选择三种标准的一致性检查方法[23~25],分别采用三种不同的基本对齐技术,将其应用至处理后的事件日志中,同时创建本文所述基于数据影响的业务流程偏差检测方法,据此分析标准适应度和数据影响适应度之间的预期检测差异,其中,标准适应度记为SF,基于数据影响的适应度记为OIF。三种标准一致性检查技术与本文方法都将Petri网模型作为输入,并将适应度作为其度量标准,因此在实验中能够消除不同衡量标准而产生的误差。

图4~6给出所选三种方法的标准适应度和本文所提数据影响适应度的结果对比,图中对角线上的点表示两种方法适应度值相等的情况,对角线上方的点表示本文的适应度值高于标准适应度的情况,下方的点则表示相反的情况。在图4和5中,本文方法的适应度值对比其他方法没有明显的提升,這是因为这两种方法仅用来处理控制流偏差,在数据失配的情况下,无法检测到这种偏差行为,这一点从两图的表格中可以看出,在不考虑无法识别的偏差后,OIF平均值要高于SF平均值,同时,三种方法均无法针对执行对象产生的偏差。对比结果表明,本文方法获得的适应度值更高。

图7给出在注入同样偏差比例的情况下,几种方法的适应度与偏差类型之间的关系,从图中可以看出,方法1和2均无法处理仅数据偏差的情况,三种方法也都无法处理以对象为中心的流程偏差情况。在日志中包含混合偏差的情况下,本文方法的适应度值最高,在仅包含活动偏差时,本文方法得到的适应度值均与其他三种方法相差不大,在仅包含数据失配偏差的情况下,则获得了比方法3更高的适应度值,同时,本文方法能够处理多对象交互下的偏差问题。因此,可以得出结论,本文提出的基于数据影响的偏差检测方法在对活动冗余和数据失配的检测上得到了较高的提升。总体上,与标准方法相比,在多对象交互的流程中,以对象为中心的数据影响偏差检测方法能在检测偏差的同时有效捕捉并处理受影响的偏差活动。

为验证所提四种影响类型对偏差检测结果的提升,图8给出不同影响类型对偏差检测效果的评估,横坐标给出根据Petri网模型使用PLG生成的任意10条具有偏差的日志L1至L10,纵坐标分别为应用不同影响类型得到的偏差检测适应度结果。

从图8可以看出,当只考虑控制流影响时,检测结果与标准方法SF1相差无几,当同时考虑控制流与数据流影响以及数据对决策点的影响时,检测结果得到了很大提升。

同时,观察图例所示的第3、4条折线趋势可以得出,在考虑对象对数据的修改权限后,得到的适应度值呈现小幅度降低,这是由于在考虑流程交互时执行对象对数据的修改权限后,检测到非法的数据更改所带来的。

5 结束语

了解数据以及数据的变化对整个流程的影响是非常重要的,流程参与者可以据此处理流程执行过程中产生的变化。本文提出了一种在多对象交互流程下,基于数据影响的业务流程偏差检测方法,该方法首先根据控制流和数据流信息遍历流程模型与给定事件日志,筛选获得发生偏差的活动;然后针对这些偏差活动进行以对象为中心的数据影响分析,分析包括数据对控制流、数据对数据流、数据对流程决策以及影响活动的数据的更改是否由正确的对象执行这四个方面;最后由实验验证表明,相比其他的偏差检测方法,本文方法更为准确,且更具合理性。然而,本文方法需要追溯整条路径,降低了检测效率,并且无法处理执行过程中预期外的输入数据及其更改,未来的工作将尝试解决这一局限性,并在检测结果的准确性和时间效率上进行权衡,提高方法在现实生活中的使用效率。

参考文献:

[1]Dunzer S,Stierle M,Matzner M,et al. Conformance checking: a state-of-the-art literature review [C]// Proc of the 11th International Conference on Subject-Oriented Business Process Management. New York: ACM Press,2019: 1-10.

[2]張力雯,方贤文. 基于对齐处理与偏差检测的业务流程适合度分析 [J]. 计算机集成制造系统,2020,26(6): 1573-1581. (Zhang Liwen,Fang Xianwen. Business process fitness analysis based on alignment processing and deviation detection [J]. Computer Integrated Manufacturing System,2020,26(6): 1573-1581.)

[3]Wang Lu,Du Yuyue,Qi Liang. Efficient deviation detection between a process model and event logs [J]. IEEE/CAA Journal of Automatica Sinica,2019,6(6): 1352-1364.

[4]Gryuger J,Kuhn M,Bergmann R. Reconstructing invisible deviating events: a conformance checking approach for recurring events [J]. Mathematical Biosciences and Engineering,2022,19(11): 11782-11799.

[5]刘聪,程龙,曾庆田,等. 基于Petri网的分层业务过程挖掘方法 [J]. 计算机集成制造系统,2020,26(6): 1525-1537. (Liu Cong,Cheng Long,Zeng Qingtian,et al. Petri net-based hierarchical business process mining [J]. Computer Integrated Manufacturing System,2020,26(6): 1525-1537.)

[6]Nagy Z,Werner-Stark A. An alignment-based multi-perspective online conformance checking technique[J].Acta Polytechnica Hungarica,2022,19(4): 105-127.

[7]Song Wei,Jacobsen H A,Zhang Chengzhen,et al. Dependence-based data-aware process conformance checking [J]. IEEE Trans on Services Computing,2018,14(3): 654-667.

[8]Park G,Benzin J V,Van Der Aalst W M P. Detecting context-aware deviations in process executions [C]// Proc of International Confe-rence on Business Process Management. Cham: Springer,2022: 190-206.

[9]Van Der Aalst W M P,Berti A. Discovering object-centric Petri nets [J]. Fundamenta Informaticae,2020,175(1-4): 1-40.

[10]Carrasquel J C,Mecheraoui K. Object-centric replay-based confor-mance checking: unveiling desire lines and local deviations [J]. Modeling and Analysis of Information Systems,2021,28(2): 146-168.

[11]Galanti R,De Leoni M,Navarin N,et al. Object-centric process predictive analytics [J]. Expert Systems with Applications,2023,213: 119173.

[12]Tsoury A,Soffer P,Reinhartz-Berger I. Data impact analysis in business processes: automatic support and practical implications [J]. Business and Information Systems Engineering,2020,62(1): 41-60.

[13]Tsoury A,Soffer P,Reinhartz-Berger I. Impact-aware conformance checking [C]// Proc of the 17th International Conference on Business Process Management Workshops. Cham: Springer,2019: 147-159.

[14]Tsoury A,Soffer P,Reinhartz-Berger I. How well did it recover?Impact-aware conformance checking [J]. Computing,2021,103(1): 3-27.

[15]Tario Z,Charles D,Mcclean S,et al. Anomaly detection for service-oriented business processes using conformance analysis [J]. Algorithms,2022,15(8): 257.

[16]Felli P,De Leoni M,Montali M. Soundness verification of data-aware process models with variable-to-variable conditions [J]. Fundamenta Informaticae,2021,182(1): 1-29.

[17]Liu Cong,Zeng Qingtian,Duan Hua,et al. Petri net based data-flow error detection and correction strategy for business processes [J]. IEEE Access,2020,8: 43265-43276.

[18]Xiang Dongming,Liu Guanjun,Yan Chungang,et al. Checking the inconsistent data in concurrent systems by Petri nets with data operations [C]//Proc of the 22nd IEEE International Conference on Parallel and Distributed Systems. Piscataway,NJ: IEEE Press,2016: 501-508.

[19]Wang Yadi,Yu Wangyang,Teng Peng,et al. A detection method for abnormal transactions in e-commerce based on extended data flow conformance checking [J]. Wireless Communications and Mobile Computing,2022,2022: 1-14.

[20]Adams J N,van der Aalst W M P. Ocπ: object-centric process insights [C]// Proc of the 43rd International Conference on Applications and Theory of Petri Nets and Concurrency. Cham: Springer,2022: 139-150.

[21]Ghahfarokhi A F,Park G,Berti A,et al. OCEL: a standard for object-centric event logs [M]// Bellatreche L,Dumas M,Karras P,et al. New Trends in Database and Information Systems. Cham: Springer,2021: 169-175.

[22]Adams J N,Van Der Aalst W M P. Precision and fitness in object-centric process mining [C]// Proc of the 3rd International Confe-rence on Process Mining. Piscataway,NJ: IEEE Press,2021: 128-135.

[23]Lee W L J,Verbeek H M W,Munoz-Gama J,et al. Recomposing conformance: closing the circle on decomposed alignment-based conformance checking in process mining [J]. Information Sciences,2018,466: 55-91.

[24]Qi Hongda,Du Yuyue,Qi Liang,et al. An approach to repair Petri net-based process models with choice structures [J]. Enterprise Information Systems,2018,12(8-9): 1149-1179.

[25]Bergami G,Maggi F M,Marrella A,et al. Aligning data-aware decla-rative process models and event logs [C]// Proc of the 19th International Conference on Business Process Management. Cham: Springer,2021: 235-251.