李莎莎,崔铁军
(1. 辽宁工程技术大学 工商管理学院,辽宁 葫芦岛 125105;2. 辽宁工程技术大学 安全科学与工程学院,辽宁 葫芦岛 125105)
在任何项目构成的管理系统中,都存在博弈问题。系统中各参与者都在使用各种行为,力求使己方收益最大化,同时平衡各方收益,满足各方要求。就最简单工程系统而言,直接劳动者往往是被雇佣的,是直接操作系统的人。他们以自己收益最大化为目标,同时采用简便、易行且成本最低的行为完成系统赋予的工作,一般是片面的收益最大化。但往往操作者的这些行为综合在一起导致系统发生故障或事故,给系统整体收益带来不利影响。另一角度,系统管理者往往是系统的所有者和受益人。他们以系统整体收益最大化为目标,一般不可考虑操作者群体的收益情况。因此当操作者和管理者成为系统运行的参与者时,他们的行为为各自收益最大化服务。同时,作为系统运行参与者,他们要考虑对方行为,从而调整己方行为,在获得收益最大化的同时满足对方要求。因此操作者和管理者组成了具有博弈特征的系统,而如何在管理者角度分析和保障系统收益成为研究的关键问题。
关于各类系统博弈和收益问题的研究已有很多。风险收益动态视角下政府与社会资本合作演化博弈[1];动态激励视角下建筑工人不安全行为演化博弈[2];资源投入不确定情形下的合作博弈策略[3];网络博弈合作剩余收益分配[4];新零售模式下供应链收益博弈优化[5];三方博弈视角下项目安全行为策略分析[6];进化博弈的矿工不安全行为研究[7];多方博弈下起重作业人员有意不安全行为分析[8];基于动态博弈的矿工不安全行为研究[9]和干预[10];风险管理合作中的演化博弈分析[11];建设工程管理的合作博弈决策[12]。这些研究一般专注于各自领域,并取得了良好效果,作者也在相关领域进行了一些研究等[13-15]。但缺乏对多事件组成系统的收益情况研究。操作者和管理者对系统中各事件可能采取各种行为,那么对两者而言这些事件收益是不同的。进一步,如果这些事件间存在逻辑关系,共同演化导致了系统收益的变化,则是一个复杂的演化过程。现有分析方法难以胜任。
针对上述问题,论文使用SFN[16-20]对演化过程进行表示和处理,将操作者和管理者不同行为作用于事件后的收益,定义为事件综合收益,作为SFN边缘事件。确定边缘事件演化过程逻辑关系和处理方法,演化后得到最终事件,即系统收益,并判断胜出者。
任何系统,特别是实际工程建设过程作为系统研究时,可从人、机、环、管4个方面对系统需要的各种目标进行评价和分析,当然还有更细分类。这里人是系统的实际操作者,是系统中付出劳动的,操作各类机器的人。人存在不安全行为,这主要是对机器、环境及管理的不适应。机是系统中人的主要操作对象,在机发生物理破坏和不可逆破坏前一般不发生故障。机存在不安全状态,该状态一般是由人的不安全行为和环境因素干扰造成的。环境在系统中对人和机都有影响,但主要是对人的干扰。适合和不适合的环境对人的不安全行为有明显影响。管是系统中对人的约束,也是对机器操作的规范,使人避免不安全行为,管的具体实施者仍是人。因此上述系统可视为由操作系统的人和管理操作者的人,即操作者和管理者作为参与者的系统。
操作者是系统的使用者,具有安全行为和不安全行为。例如施工现场电焊过程中,焊工对于穿绝缘鞋这个事件可以采取安全和不安全行为。安全行为包括穿符合要求的绝缘鞋等;不安全行为包括不穿绝缘鞋或穿损坏的绝缘鞋等。操作者选择安全行为或不安全行为的动机是考察行为后该事件给己方带来的收益。安全行为往往投入更大,需满足繁琐的规章制度;不安全行为往往是方便快捷的,根据直观而定。还需考虑行为后管理者对操作者行为的反应,可能对操作者收益有利或不利。操作者会综合考量,在一定概率条件下选择安全或不安全行为。
管理者是系统的管理或拥有者,系统整体收益可以说是管理者的收益。因此他们往往从系统收益最大化出发考虑行为策略,对操作者进行管理,包括惩罚和奖励行为。例如施工现场电焊过程,管理者对操作者穿绝缘鞋或不穿绝缘鞋可采取不同的行为或无行为。对穿符合要求绝缘鞋的操作者进行奖励,一般情况下管理者没有奖励行为;对不穿或穿不符合绝缘鞋的操作者进行惩罚,一般都对这种情况进行惩罚。管理者从系统和项目整体出发考量收益,并确保最大化;一般不考虑操作者的收益最大。基于此,管理者根据操作者行为在一定概率条件下选择惩罚和奖励行为。
因此,系统中管理者行为和操作者行为都力求己方收益最大化,同时满足对方的基本要求使对方妥协,两方策略构成了博弈系统。该系统在生产生活中普遍存在,只要存在管理者和操作者就存在这样的博弈系统,因此,研究参与者行为博弈和导致的系统收益具有重要意义。
系统存在两个参与者相互博弈时,对系统中一个事件,操作者和管理者可执行不同行为满足己方收益。例如上节的穿绝缘鞋事件,双方都有一定概率采取各自的不同行为。系统中另一事件,比如焊枪接地线接触位置选择,理论上可接在任何金属构件上。但不可接在脚手架、钢筋笼或周围设备金属外壳上,例如操作者的安全行为是接在专用地线上,不安全行为是接在上述构件上。但由于现场条件限制,地线时常接在上述构件而不接地。操作者有一定概率选择安全或不安全行为;同样管理者也根据实际情况对操作者的接地事件进行管理,有一定概率采取惩罚和奖励行为。
穿绝缘鞋事件和焊接接地事件操作者都采取了一定行为,同时管理者也采取了对应行为。这时出现另一捆扎钢筋事件,使得操作者必须徒手捆扎钢筋,当然操作者和管理者对该事件也要采取适当行为。这3个事件组合在一起,最坏的情况是操作者触电,操作者收益下降,导致停工,管理者收益下降;或者不发生触电事故,操作者蒙混过关,管理者并未发现,两者收益不变。可见操作者和管理者组成了以收益为目标的博弈系统。
可见系统层面的收益取决于使系统发生故障的基本原因,即基本事件在受到操作者和管理者综合行为处理后,两者得到的收益情况。这些原因事件收益相互交织,因果演化成为一连串的事件组合,最终形成系统收益。该过程与系统故障过程发生机理类似,且系统中发生意外和故障是导致这些事件和系统功能效用变化的主要原因,而功能直接影响收益。作者提出使用SFN研究操作者和管理者博弈系统的收益问题。
博弈论源于20世纪初,又称对策论。主要研究参与者之间对抗和合作交织情况下,如何决策从而使己方获得较大收益,并使对方接受。博弈是两个或多个参与者组成系统的局势,至少应包括参与者、策略和收益。参与者是博弈存在的基础,参与者不一定是人,可以是任何与其他系统存在竞争合作关系的系统;策略是参与者根据系统局势和各方情况在采取具体行为前进行的分析与考量。收益指各参与方在经过一系列竞争合作采用各种行为后,己方获得的目标方面的收益。那么操作者与管理者行为导致系统收益变化是博弈问题。
作者将系统故障过程中各种事件及其逻辑关系抽象为系统故障演化过程(System Fault Evolution Process,SFEP),用SFN表示SFEP[16-20]。SFN包括节点和有向线段。节点代表事件,包括SFEP起始原因的边缘事件,经历的过程事件和系统最终故障情况的最终事件。有向线段表示事件之间的传递关系,从原因事件指向结果事件;传递概率表示原因事件导致结果事件的可能性。过程事件和最终事件是结果事件,它们有多个原因事件时下角标标注原因事件间逻辑关系。这样SFN可表示复杂的SFEP、事件间逻辑关系及演化流程。由操作者和管理者组成博弈系统,由于操作者和管理者的不同行为会导致不同的收益,那么对同一事件的不同行为得到的事件收益就可作为SFN的边缘事件,通过SFN分析得到最终系统收益情况。使用SFN表示操作者与管理者行为的事件综合收益与演化所得系统收益的关系,并通过博弈论思想解决是可行的。
根据文献[2],基于SFN的综合操作者与管理者行为博弈的系统收益分析方法的基本参数定义如下:
r1:操作者安全行为己方收益,R1={r11,···,r1i,···,r1I},选择安全行为概率P={p1,···,pi,···,pI}。
I:边缘事件数量,i=1,···,I。
r2:操作者安全行为对方(管理者)收益,R2={r21,···,r2i,···,r2I}。
r3:操作者不安全行为己方收益,R3={r31,···,r3i,···,r3I},选择不安全行为概率1-P={1-p1,···,1-pi,···,1-pI}。
r4:操作者不安全行为对方收益,R4={r41,···,r4i,···,r4I}。
h:操作者不安全行为系统损失,H={h1,···,hi,···,hI}。
b1:管理者对对方不安全行为罚金,B1={b11,···,bi1,···,b1I},选择惩罚行为概率Q={q1,···,qi,···,qI}。
b2:管理者对对方安全行为奖金,B2={b12,···,bi2,···,b2I},选择奖励行为概率1-Q={1-q1,···,1-qi,···,1-qI}。
上述安全与不安全行为,惩罚和奖励行为都针对同一个事件ei,所有边缘事件的集合e={e1,···,ei,···,eI}。
其中,CA为安全行为操作者收益;CU为不安全行为操作者收益。
其中,XF为惩罚行为管理者收益;XZ为奖励行为管理者收益。
对单一事件而言,操作者和管理者行为后得到的事件综合收益CXavg是操作者采取的安全和不安全行为给操作者带来的收益Cavg与管理者采取的惩罚和奖励行为给管理者带来的收益Xavg的差值,如式(3)所示。
将式(3)展开,分别根据基本参数合并同类项,得到这些基本参数和对应行为概率与事件综合收益的关系,如表1所示。
表1 基本参数与事件综合收益关系Table 1 Relationship between basic parameters and comprehensive event profit
对应于操作者和管理者的博弈过程,边缘事件相当于操作者行为和管理者行为产生的事件综合收益。系统最终收益可能取决于操作者和管理者对多个事件采取的不同行为,因此这些行为对所有事件e1~i处理后产生的事件综合收益是按照SFN相互作用最终形成系统收益C XTavg。例如,事件e1和事件e2同时发生导致后即事件发生,两者是与关系。即操作者和管理者行为后所得两个事件综合收益之间也跟随着相同逻辑关系传递到系统收益。这时两事件同时存在,后继事件收益是他们综合收益的和。当两事件之一发生导致后继事件发生,两者是或关系。在管理者角度,乐观情况下的后继事件收益取两事件综合收益较大者;悲观情况下取较小者。当然,SFN中事件逻辑关系很多[21-22],可对应得到事件综合收益逻辑关系。这些逻辑关系都基于与或关系,因此给出事件综合收益与或关系得到后继事件综合收益算法,分别如式(5)~(6)所示。
如下给出一个SFEP的SFN,如图1所示。
图1 SFN的模型Fig.1 Model of SFN
图1是某工程项目中事故的SFEP。边缘事件包括e1、e2、e3、e4,代表导致事故的基本原因;E1、E2、E3表示过程事件,是边缘事件相互作用后的中间事件;T表示最终事件,是系统最终事故状态。
由3.3节可知,事件之间的演化和逻辑关系可等同于事件综合收益的演化和逻辑关系。因此,e1、e2、e3、e4可代表操作者和管理者行为后产生的事件综合收益。过程事件和最终事件下角标的“·”和“+”分别表示与关系和或关系。根据图1和SFN的化简方法[16-20]得到系统收益 CXTavg的事件收益c x1av~g4结构表达式,如式(7)所示。
基于乐观和悲观角度,将式(5)~(6)分别代入式(7)得到系统收益C XTavg,分别如式(8)~(9)所示。
乐观系统收益
悲观系统收益
上述过程完成了系统收益的分析。该系统的参与者是操作者和管理者,操作者有安全和不安全行为,管理者有惩罚和奖励行为。对于任何一个导致系统故障的边缘事件,操作者和管理者都可采取这些行为。因此,经过这些行为处理后的事件对于参与者将得到收益。不同边缘事件之间逻辑关系不同,最终演化为系统的最终事件。可使用SFN方法研究事件综合收益和系统收益关系,进而判断系统中参与者的胜出方。为类似的施工安全管理、组织管理、工程管理等的参与者提供博弈方案,使己方利益最大化。
在系统中,对各事件操作者和管理者都有概率采取不同行为导致各事件综合收益变化,进而导致系统收益变化。对事件综合收益表达式进行化简,重新组合得到各基本参数在事件综合收益中出现的概率。给出了与或关系的事件综合收益与后继事件收益逻辑关系表达式,从而确定系统收益和博弈胜出者。通过实例说明方法分析流程,得到了实例系统的各事件综合收益和系统收益。说明了方法的适用性和正确性。