智能电子监察模型研究与应用

2018-01-17 08:01卿颖
浙江工业大学学报 2018年1期
关键词:项集业务流程引擎

, ,卿颖,

(1.浙江工业大学 之江学院,浙江 绍兴 312000;2.浙江工业大学 计算机科学与技术学院,浙江 杭州 310023;3.约翰霍普金斯大学信息安全学院,美国 巴尔的摩 21210;4.浙江工业职业技术学院 电气电子工程分院,浙江 绍兴 312000)

关键业务流程监察是廉政风险预防的有效措施之一,传统依靠人监管的模式已经很难适应现代的需要.随着各行业关键业务流程信息化建设日趋完备,权力监督信息化体系已具备了基础和条件,同时也促进了各类电子监察技术的进步.目前,国内已有相关电子监察方面研究报道,胡立龙[1]使用了一种基于规则的监察引擎,实现了电子监察、预警纠错、绩效评估和服务决议等功能.其主要思想是从软件的应用逻辑中分离出政务规则.芦源[2]在规则引擎的基础上,实现了监察数据实时处理、规则并行执行以及简单、便捷的业务规则配置管理等,解决了电子监察的实时性以及复杂业务规则管理等问题.朱树原[3]研究了工作流在监察系统中的运用,采用了轻量级工作流管理系统构建工作流执行引擎,完成系统各功能模块的编码实现.

上述文献研究主要是针对规则引擎,解决了关键业务流程的监察问题.但对权力结构模型,包括权力边界、权力定位、权力约束规则和权力相关性等方面的文献研究,报道却不多.基于规则的监察多侧重在单节点上,无法充分挖掘出蕴含在大数据背后的隐性知识.如何基于大数据开展智能监察技术的研究,已经成为未来权力信息化监督的发展方向.笔者以权力运行大数据为背景,研究关键业务领域的权力监督智能化方法,提出了一种基于SBLN的权力结构智能电子监察模型.

1 风险监察模型描述

1.1 基于工作流的SBLN模型

一个组织关键业务逻辑一般具有一定的复杂性和多样性.如何构架统一的业务逻辑体系或工作流程控制中心是解决问题的关键.目前,大部分业务系统都采用单一工作流模型控制节点状态,但是复杂大系统,尤其是多系统融合,权力运行路径具有跨系统和多节点协同控制的特性.在分析多种权力运行流程后,提出一种基于复杂业务流程的SBLN空间模型.

一般来讲,一个复杂业务系统都可以通过降维的方法分解成为多个子系统.定义一个复杂系统空间为S=(s1,s2,…,si),i=1,2,…,n,S中包含多个子系统,即系统层(System layer);定义si=(bi1,bi2,…,bim),i=1,2,…,m,bim为第i个子系统的分支层(Branch layer);定义bim=(lim1,lim2,…,limk),i=1,2,…,k,limk为环节层(Link Layer);定义limk=(nimk1,nimk2,…,nimkj),i=1,2,…,j为节点层(Net layer),定义为nimkj.这样四层体系结构关联一体构成了基于复杂系统的SBLN空间结构模型.

一个复杂系统可以由多个子系统组成,每一个系统由多个分支组成,每一个分支又由不同的节点组成.其中业务流程节点是SBLN模型最末端节点,岗位作用在流程节点上,因此流程节点是权力最小作用点.

1.2 监察点

从SBLN模型可以看出:一个业务系统的环节下往往有多个节点,对每个业务节点操作和数据流动形成了业务流程.电子监察思想是针对某一个关键岗位,在SBLN空间结构模型中的职权进行监察,即对某一岗位职权进行监察,连接起来就形成了对整个系统的监察体系.根据权力在规则范围内运行和权力超出规则运行之间的不确定性,定义廉政风险较大的点作为监察点.根据业务类型的不同以及权力运行的性质,一个监察点监测被分析抽象成为即时限监察、经费监察、规范监察和程序监察四种不同维度.同一维度下有多个可监察点,同一监察点有多种监察维度,岗位、SBLN模型和监察维度共同构建出了电子监察体系.

1.3 监察模型

一个业务系统往往包含多条业务线,每一条业务分支都可能流过多个不同的环节和节点,不同业务又有不同的业务节点部署和风险控制方法.采用SBLN结构模型生成多个实例,每个实例对应一个监察对象.一般来说,一个复杂系统往往需要配置多个监察对象.岗位节点就是监察最小对象之一,业务节点与业务分支有关,与岗位职权有关.图1为岗位、职权、岗位职权、监察节点和监察维度的关系模型.

图1 岗位节点和业务流程关系模型Fig.1 Relation model of post nodes and business flow

业务流程L1,L2,L3上有多个业务流程节点,其中每个业务流程节点都有对应行使该职权的岗位.因此职权点和行使职权的岗位共同构成了一个岗位职权点,并对其配置动态监测也就是定义为监察点.业务流程节点可以描述为L={L1,L2,…,Ln},其中L为业务流程组成的矩阵;L1~Ln分别为业务系统中各独立流程.岗位节点可描述为G={G1,G2,…,Gn},其中G为岗位节点组成的矩阵;G1~Gn分别为业务系统中各个岗位.通过LTG的计算可以得新的矩阵K,即

(1)

2 监察引擎

电子监察引擎是一套数据处理流程,是电子监察端输入业务监察数据到输出监察结果的完整过程,由数据传输和数据监察两条子流程构成.

数据传输流程包括数据采集、数据清洗、数据转换和数据上载5个环节.数据采集是采集工具从业务系统采集监察源数据的过程,根据采集对象的具体情况可分为定时采集和即时采集.由于采集过程中存在数据缺失、重复和异常等情况,因此需要对采集到的源数据进行数据清洗.数据清洗是从源数据中监测出异常数据,再进行修补的过程.数据转换环节将修补后的数据转换成电子监察系统能识别的数据格式,再交由数据上载环节将数据上载到电子监察数据库.数据传输流程为监察系统提供了可靠的格式化监察数据.

数据监察流程包括数据分装、监察处理和信号输出等环节.基于监察大数据库,分装调度函数抽取数据中的监察维度信息,执行数据分装操作,将监察数据按监察维度进行分装.当有新数据插入监察数据表时,公共触发器触发,引导数据通过监察引擎.监察引擎提取监察表中数据,抽取集合中数据监察类型信息,调取相应节点监察处理流程和规则集.监察处理流程根据数据的监察点编码,从监察规则表中找到对应监察点的监察规则,并将数据与规则进行对比,输出监察信号.定义监察规则为R={code,t1,t2,f1,f2,S,P},其中:code为监察点编码;t1,t2分别为时限规则中的时间节点;f1,f2分别为费用监察规则中的费用节点;S为规范监察中的规则数据;P为程序监察中的监察数据.定义监察规则集合为LR={r1,r2,r3,…,rn|rn∈R},监察引擎通过对监察点编码的检索,在规则集合LR中挑选出合适的监察规则,并计算监察规则与监察数据的偏差度.信号输出环节收集各个维度的监察数据偏差信息,根据偏差值的大小,输出RGB监察信号数据.

监察引擎是对业务流程的动态数据进行规则集处理和归一化的系列操作.不同维度的监察对象的数据经过监察引擎的规则处理后,分别按照时限、经费、规范和程序4种维度处理,转换为具有统一项目监察特征(项目编码、项目负责人、所在部门、流程节点、岗位职权、监测类型、监察时间、监测结果)的输出信号集,这样无论何种业务监察(例如:采购、科研、基建、后勤和教学等项目)都可以统一输出具有RGB特征信号的数据集.监察信号数据成为了监察结果统一的载体,把不同过程监测数据通过监察规则集转化为定性显示的符号规格语言描述,为后续监察分析提供统一数据基础,使监察结果更具有可观性和可测性.

2.1 过程监察

监察引擎解决了单一业务节点的监察问题,但是在现实的工作环境中,关键业务环节权力运行是否规范不仅仅依靠该环节的业务数据变化情况,还需要其他相关业务环节的监察数据作支撑.建立基于多监察点的多维度监察引擎是复杂业务监察需求,为此,需要进一步改进电子监察模型.假设,多维度的过程监察依赖多个监察点的数据,甚至需求监察系统外的相关业务数据.建设多维度监察引擎首先需要定义多维度监察主题T={n1,n2,…,nm,c|n∈N},其中:c表示需要监察的项目编号;N={code,r,d|r∈R}为批处理任务相关监察节点集合,code为监察点编码,d为该监察点监察维度,r为监察规则库R中的监察规则.然后根据监察主题,对监察规则函数TransRule()进行建模.最后定义输出信号规则,根据当前主题下的监察数据对于监察规则函数的符合程度,输出RGB格式的监察信号.

基于时限和过程的监察引擎:假设业务流程包含多个串行节点,各个节点可自由跳转任意节点.该流程上布控了多个维度的监察点,其中时序监察点规定了单一节点处理时间不允许超过ΔTi(i=1,2,…,n)天,流程处理总时间不能超过TMAX天.在系统实际运行的过程中发现,单一节点时限监察未出现违规预警的情况下,流程持续总时间经常超过TMAX天.由于单节点监察未发出预警,但部分节点之间存在多次反复流转的情况,导致总时间超过TMAX天.针对上述问题建立基于时限监察和程序监察的多维度监察引擎,其中业务审批监察流程如图2所示.

图2 重现业务流程Fig.2 Examine and approve flow

图2中N0到Ni+m节点分别为业务流程中的必要工作流节点,ti1和ti2分别为Ni任务节点的起始时间和结束时间,Δti=ti2-ti1即Ni任务节点的持续时;Pj(j=1,2,3,4,5,6,7)为串行业务流程节点跳转次数.通过分析,只有节点退回,才会加长业务流程总时间.因此以Ni节点为例,DNi=P1+P2+P3为该节点进行退回操作的次数,各个业务环节分别设置了程序监察和时限监察两种监察维度.监察主题描述为:单一节点处理时间控制在ΔTi天内,总体时间控制在TMAX天内,业务退回次数设定最大值M次,但是实际情况下只要总体时间不超过TMAX天,退回次数可以不设上限.基于监察主题的描述定义监察规则函数为

(2)

当业务数据完全符合监察规则函数时,多维度监察规则输出Green信号.若审批总时间未超过期限,但是有一个或多个节点不满足时限或程序维度的监察要求,则输出Yellow信号.若总体时间超出期限直接输出Red预警信号,并找出退回次数大于M的环节节点编码(NetCode),由预警处理模型直接发送预警通知到相关部门.

(3)

2.2 多层次Apriori挖掘算法

电子监察模型作为一个数据集成平台,经过一段时间的运作,会积累大量监察数据和信号数据.这些数据中隐藏着大量单条数据无法显现隐性知识.Apriori挖掘算法能发现项集之间的相关性,描述了事务某些属性同时出现的规律和模式.例如针对采购招标类系统而言,相关性分析可以获取各个评标专家与供应商企业之间的关联关系.包括某个专家与中标企业关联度,投标企业之间的关联度,为在“串标”或“专家不正当”行为提供依据,关联性挖掘为监察提供了一种智能分析手段.

设系统中的投标项目为数据集T=(t1,t2,…,tn),投标项目中的专家为项集E=(e1,e2,…,ei),投标公司为项集G=(g1,g2,…,gj),中标公司为项A,则t=(e1,e2,…,ei,g1,g2,…,gj,A).对t数据集进行Apriori算法迭代,可获得t数据集中的频繁集.若sup(ei⟹A)confidence(ei⟹A)较高可认为ei专家与A企业可能存在腐败行为;若sup(gj⟹A)confidence(gj⟹A)较高可认为gi公司与A企业可能存在串标行为.

单次Apriori算法能找出专家、中标公司和投标公司之间的强关联关系,但是无法找出专家与串标公司之间的强关联关系.因此笔者提出多层次的Apriori算法,以找出更多隐藏在数据中的腐败问题.多层次的Apriori算法旨在单次Apriori算法结果的基础上再次进行关联性计算,找出更为精确的关联结果.设系统中的投标项目为数据集T=(t1,t2,…,tn),项目投标公司为项集G=(g1,g2,…,gj),中标公司为项A,则t=(g1,g2,…,gj,A).对数据集t进行单次Apriori算法计算,找出所有与中标公司存在强关联关系的投标公司项集,即所有存在串标风险的企业项集P=(p1,p2,…,pk).设专家项集E=(e1,e2,…,ei),s=(e1,e2,…,ei,g1,g2,…,gj).对数据集s进行Apriori算法计算,找出所有专家与投标企业关联度较高的项集,即所有专家与企业之间存在强关联关系的项集Q=(q1,q2,…,qm).用P项集对Q项集进行剪枝,若存在pk⊆qm(k,m=1,2,…,n)则保留qm.电子监察模型通过对历史招标数据的相关性挖掘,找出具有关联关系的专家、投标企业项集Q,并计算出专家与串标企业间的置信度confidence(ei⟹pk).若confidence(ei⟹pk)≤0.05,则认为专家ei和串标企业pk之间存在较弱的关联关系;若0.05≤confidence(ei⟹pk)≤0.1,则认为专家企业之间存在关联关系;若confidence(ei⟹pk)≥0.1,则认为企业和专家之间联系较强.

假设某信息系统中专家数据集为E=(e1,e2,e3,e4,e5),投标单位数据集为G=(g1,g2,g3,g4,g5),中标公司为A.在监测历史数据中分别对E项集、中标公司A,以及G项集、中标公司A进行相关性挖掘.

图3 相关性柱状图Fig.3 Apriori result histogram

图3(a)是对E,A,G,A分别进行单次挖掘结果,可以看出e2A,e4A,g2A,g5A之间的置信度超过了0.1,即项集之间存在较强关联度,可认为e2,e4专家与中标企业A可能存在强关联行为,g2,g5企业与A企业可能存在互关联性行为.使用专家与企业的强关联结果集对企业与中标企业强关联结果集剪枝得到投标企业、中标企业和专家间具有强关联关系的项,如3(b)所示.由于e4g2A置信度较高,可认为e4专家g2投标企业和A中标企业三者之间可能存在强关联度.

3 电子监察在高校采购系统中的应用

采购管理系统是高校关键业务流程之一,以采购业务流程管理与监察为实例阐述电子监察过程.采购业务流程按照采购类型一般可以划分为货物、工程和服务3大类型,不同的采购类型、采购目录、经费来源和经费类型具有不同业务归口办理流程.根据采购全过程特征,也可以将采购管理系统划分为采购预算、采购计划、采购任务、采购委托、采购执行、采购合同、采购验收、采购支付和采购资产等业务模块.其中每个业务模块都具有不同的分支流程.

实施应用监察步骤:1) 分析采购业务流程,构架以预算项目为核心的SBLN业务流程结构模型,配置业务流程的系统(S)、分支(B)、环节(L)和节点(N)体系,并成型配置清单;2) 设计流程监察节点,配置监察点的维护、类型、参数和规则集;3) 采集采购业务流程的节点多维数据(时间、经费、规范和程序),并经过预处理,将格式化数据发送到相应的监察数据中心;4) 监察系统接受采购系统传输数据并启动规则引擎,实时处理监测数据,并按照统一项目监察特征数据的要求,输出监察信息集.以下为某学校的采购计划子流程的实时监察数据情况.

采购计划流程节点:采购申请、采购初审、归口审核、采购受理和采购审批.图4为采购计划流程某月份监察信号统计,由图4可知:采购计划流程中采购初审和采购审核节点红牌率较高,表示节点超时限操作情况较为严重.

图4 采购申请环节信号统计Fig.4 Application process process signals of purchasing system

4 结 论

对复杂业务流程分析的基础上,通过研究业务流程的组成和结构,提出了一种基于复杂业务流程的SBLN的智能电子监察模型.SBLN监察模型将业务系统抽象为由流程节点为最小单位的网状空间结构,研究了如何在其上构建风险监察点,并制定了监察的方法和维度.找出了一种较为通用的监察方法,对各类信息业务系统的业务运作进行实时监察.研究了基于规则推理和智能监察模型,监察引擎和数据挖掘算法,对电子监察数据进行相关性推理,挖掘潜藏在大数据中的隐性知识.利用大数据的优势,尽可能挖掘出对监察人员或机构有价值的信息,为其执行监督和决策提供智力支持.该研究成果已应用于实际电子监察系统中,结果显示研究成果对加强业务领域权力运行规范性监督有深远的意义.

[1] 胡立龙.基于规则引擎的电子监察系统的设计与实现[D].长沙:湖南大学,2013.

[2] 芦源.基于规则的实时监察引擎的设计与实现[D].沈阳:东北大学,2007.

[3] 朱树原.工作流技术在纪检监察信息管理系统中的应用[D].天津:天津大学,2011.

[4] 周志逵,徐先传.数据仓库中数据抽取、转换及加载工具研究[J].北京理工大学,2003,23(6):720-723.

[5] TANAKA M, AOYAMA N, SUGIURA A, et al. Integration of multiple knowledge representation for classification problems[J]. Artificial intelligence in engineering,1995,9(4):243-251.

[6] 王亚南.专家系统中推理机制的研究与应用[D].武汉:武汉理工大学,2006.

[7] 张潇元,刘利人,韩海雯,等.基于SOA云架构的电子监察业务平台的设计与构建[J].计算机科学,2014,41(z2):473-477.

[8] 马玉玲.基于clustering算法的事务抽样关联规则挖掘算法[J].计算机应用,2015(z2):77-79.

[9] ZHANG Zaifang, CHENG Hui, CHU Xuening,et al. Aided analysis for quality function deployment with an Apriori-based data mining approach[J]. International journal of computer integrated manufacturing,2010,23(7):673-686.

[10] MAJA H, ELIZABETH C. Onto-agent methodology for design of ontology-based multi-agent systems[J].International journal of computer systems science; engineering,2008,23(1):19-30.

[11] 郝平,倪国华,余育青.基于OLAP分析和关联规则的区域能耗预警系统研究[J].浙江工业大学学报,2013,41(5):534-538.

[12] 高雪,谢仪,侯红卫.基于多指标面板数据的改进的聚类方法及应用[J].浙江工业大学学报,2014,42(4):468-472.

[13] 李伟,臧立涛,李澎林.面向层级结构的任务动态分配策略[J].浙江工业大学学报,2016,44(5):501-504.

猜你喜欢
项集业务流程引擎
航天企业基于信息化的业务流程体系构建方法研究
基于共现结构的频繁高效用项集挖掘算法
ERP系统在企业财务管理和业务流程管理中的应用
新海珠,新引擎,新活力!
车坛往事4:引擎进化之屡次失败的蒸汽机车
基于矩阵相乘的Apriori改进算法
互联网+背景下物流公司的业务流程再造
基于质量管理体系为基础的核心业务流程优化
蓝谷: “涉蓝”新引擎
不确定数据中的代表频繁项集近似挖掘