李莎莎,崔铁军
(1.辽宁工程技术大学 工商管理学院,辽宁 葫芦岛 125105;2.辽宁工程技术大学 安全科学与工程学院,辽宁 阜新 123000)
在实际系统运行过程中,系统的安全性和收益可从人、机、环、管4方面论证。机子系统是其中最为可靠的系统,在规定时间内和条件下一般不发生故障,可保证系统稳定收益。环境子系统一般受到各种调节措施限制,因而变化不大。机子系统发生故障主要是人子系统采取的不当和不安全行为造成的;环子系统主要作用于人子系统,并转化为人的不安全行为。同时管子系统主要约束人的不安全行为和不当操作。系统的管理者可使用惩罚和奖励行为来应对操作者的安全和不安全行为,从而保障系统可靠安全获得收益。收益是多方面的,比如安全收益、经济收益和质量收益等。在系统运行过程中,系统的实际操作者或工作者与系统的管理者或所有者,围绕操作者收益和管理者收益展开博弈,博弈目标是在对方承受范围内使己方的收益最大。
关于各种系统内不同主体相互博弈及其收益分析的研究较多[1-10],这些研究在各自领域都有较好的适应性,同时解决了实际问题。但操作者不同行为、管理者不同行为,及二者不同行为之间的相互影响是不同的。2操作者的安全与不安全行为就有4种组合方式。其行为可能以不同逻辑方式导致后继结果产生,如2者同时产生不安全行为,则导致后继不安全结果发生;或是二者之一产生不安全行为就会导致后继不安全结果发生。同样管理者对于每个操作者行为都会制定奖惩行为,这亦会相互影响。那么操作者行为和管理者行为交织在一起则相当复杂,对整个系统而言判断最终收益情况是困难的。
因此本文提出基于系统故障演化过程(System Fault Evolution Process,SFEP)思想[11-14],借助空间故障网络(Space Fault Network,SFN)和博弈方法,研究系统中操作者和管理者的不同行为给各自带来的收益,并判断博弈胜出方。建立系统操作者与管理者行为博弈演化与收益分析方法。
SFEP是表示系统故障过程中各种事件及其逻辑关系的方法,SFN用于表示和研究SFEP。SFN包括节点和有向线段,节点代表事件,包括起始的原因事件,经历的过程事件和系统最终故障情况的最终事件;有向线段表示事件之间的传递关系,从原因事件指向结果事件;传递概率表示原因事件导致结果事件的可能性;中间事件和最终事件有多个原因事件时下角标标注原因事件间逻辑关系,如图1所示。这样SFN可表示复杂的SFEP及其事件间逻辑关系及演化流程,研究方法包括转化法和结构法[11-15]。因此SFEP可表示任意具有事件和事件间逻辑关系特征的系统演化过程,同样作为表示方法的SFN亦可处理具有类似特征的过程。由操作者和管理者组成博弈系统,由于其不同的行为会导致不同的收益,那么对于同一事件的不同行为得到的收益就可作为SFN的边缘事件,分析得到最终系统收益情况。
图1 SFN模型
博弈论源于20世纪初,又称对策论,是分析事物之间矛盾的工具之一,涉及2个或多个参与者决策和行为的相互影响,是确定局势的常用数学方法。主要研究参与者之间对抗和合作交织情况下,如何决策从而使己方在过程中获得较大利益并同时使对方接受。方法逻辑源于Bayesian决策理论,本质上是逻辑完备的,是在多个参与者及行为相互影响下的最优决策方法。博弈是系统局势,至少应包括参与者、策略和收益3要素,参与者是博弈存在的基础,可以是任何与其他系统存在竞争合作关系的系统;策略是参与者根据系统局势和各方情况在采取具体行为前进行的分析与考量;收益指各参与方在经过一系列竞争合作采用各种策略后,己方获得的目标收益。
对系统操作者与管理者实施不同行为的相互影响,最终达到各方收益的过程是博弈过程,具有各行为相互作用构成的复杂网络结构,适合使用SFN处理。
首先给出假设:1)系统博弈主体为操作者和管理者;2)操作者行为包括安全和不安全行为;3)管理者行为包括惩罚和奖励行为;4)操作者代表系统操作和工作人员;5)管理者代表系统管理和所有人,管理者收益等同于系统收益;6)每个操作者和管理者只对1个边缘事件产生行为。强调操作者和管理者行为的演化最终结果时称为系统收益;强调操作者和管理者对立时称为管理者收益。建立博弈演化与收益分析方法,从基本参数确定、博弈过程的博弈逻辑关系、博弈演化结果表示与确定3方面具体实现。
(1)
式中:Cavg为操作者采取的安全和不安全行为给操作者带来的收益集合;P为安全行为发生概率;CA为安全行为给操作者带来的收益集合;CU为不安全行为给操作者带来的收益集合;Q为惩罚发生概率;R1为操作者执行安全行为给操作者带来的收益集合;R2为操作者执行安全行为给系统带来的收益集合;R3为操作者执行不安全行为给操作者带来的收益集合。
(2)
式中:Xavg为管理者采取的惩罚和奖励行为给系统带来的收益集合;XF为惩罚行为给系统带来的收益集合;XZ为奖励行为给系统带来的收益集合;R4为操作者执行不安全行为给系统带来的收益集合;B1为管理者对操作者不安全行为实施惩罚行为的罚金集合;H为操作者不安全行为带来的系统损失集合;B2为管理者对操作者安全行为实施奖励行为的奖金集合。
在SFEP中,各种事件是相互交织在一起的网络结构,其联系是因果关系,常见的包括与、或和传递关系。与关系表示原因事件同时存在导致结果事件;或关系表示只要有1个原因事件存在就可导致结果事件;传递关系表示有且只有1个原因事件可导致结果事件。当然还有更复杂的逻辑关系存在于事件之间,例如泛逻辑学中柔性逻辑关系有20种[17-18]。这里为说明方便只给出常用的与或逻辑关系的操作者收益和管理者收益表达式。采用悲观和乐观2个角度研究其收益关系。悲观情况下操作者收益和管理者收益的与或逻辑表达式,如式(3)~(4)所示:
(3)
(4)
乐观情况下,操作者收益和管理者收益的与或逻辑表达式,如式(5)~(6)所示:
(5)
(6)
由式(3)~(6)可知,悲观情况下操作者的收益尽可能大,管理者收益尽可能小;反之乐观情况下,操作者的收益尽可能小,管理者收益尽可能大。因此乐观和悲观是对管理者而言的。
系统故障发生往往是很多原因造成的,可归结为人、机、环、管4方面。机器可靠性最高,如人按照规章制度安全操作,机器不会出现不安全状态导致故障;同理环境对系统故障的影响在非极端条件下亦不明显,且一般通过对人的干扰使人产生不安全行为造成故障,因此在整个系统中,人和管显得特别重要。
在SFEP中,最初的原因事件称为边缘事件,可描述操作者对系统的操作行为。无论安全或不安全行为,在多个边缘事件描述的多个操作者行为后,总能通过SFEP得到SFN,进而最终演化得到众多操作者在系统层面的收益。当然这些边缘事件的主体可能是同1个操作者,也可能是多个操作者,但从操作行为角度这并不重要,操作行为的事件数量才是关键。同理,对应于任何操作都有相应的管理行为,包括惩罚和奖励。可见操作者、操作行为、管理者、管理行为的数量相同,都对应于同一组边缘事件,最终演化得到众多管理者在系统层面的收益。对操作者和管理者而言,经历整个SFEP后,如果操作者收益CSFN大于管理者收益XSFN,则操作者胜出,对管理者不利;反之CSFN小于XSFN,则管理者胜出,对操作者不利。作为系统的管理者和投资方希望后者出现;而作为操作者和被雇佣者则希望前者出现,可见操作者和管理者构成了博弈关系。
将SFEP表示为SFN后由事件和连接组成,边缘事件可代表操作者和管理者行为后的收益,对应的最终事件可代表博弈演化后操作者和管理者的收益;连接表示二者行为后收益之间的逻辑关系,连接蕴含着传递概率,表示原因事件导致结果事件的发生概率。由于事件代表操作者和管理者收益,因此设传递概率为1。CSFN和XSFN及关系,如式(7)所示:
(7)
根据SFN通过式(7)得到SFEP的博弈演化过程表达式CSFN和XSFN,进一步解析式(3)~(6)得到博弈演化过程收益表达式。乐观和悲观2种情况分别对应式(5)~(6)和式(3)~(4),再将所有操作者收益如式(1)和对应的管理者收益如式(2),带入博弈演化过程收益表达式,可最终得到二者博弈结果。
根据式(1)~(2)和图1,得到边缘事件的操作者收益和管理者收益,根据系统结构系统层面的操作者收益和管理者收益如式(8)所示:
(8)
进一步,式(8)结合式(3)~(4)进行悲观角度的操作者和管理者博弈,如式(9)所示:
(9)
式(8)结合式(5)~(6)进行乐观角度的操作者和管理者博弈,如式(10)所示:
(10)
通过上述过程即可求出悲观和乐观情况下CSFN和XSFN的关系,乐观时管理者的系统收益最大化,悲观时操作者的群体利益最大化。当确定了图1中4项工作对于操作者和管理者的收益具体值后,带入式(9)~(10)可求得CSFN和XSFN的具体数值,并比较关系获得悲观和乐观情况下的博弈胜出者,进而为操作者和管理者选择适合的行为进行收益博弈提供决策依据。由于是数值带入过程,且式(9)~(10)计算简单,因此这里对带入计算不做赘述。
1)研究博弈过程的博弈逻辑关系。基于SFN的事件间逻辑关系,采用悲观和乐观2个角度研究事件间相互作用后的收益关系。给出悲观和乐观情况下操作者收益和管理者收益的与或逻辑表达式。
2)研究博弈过程的演化结果。基于SFN的演化过程得到系统层面的操作者和管理者的博弈演化过程表达式和博弈演化过程收益表达式,并最终判断胜出者。通过实例说明算法的流程和有效性。