张 勤
(清华大学核能与新能源技术研究院,北京 100084)
核电机组的安全性是核电发展的基本前提,但其经济性 (包括建造成本和可用度)也必须兼顾,否则核电将失去市场竞争力。当前,包括我国在内的世界各国正在大力研究和发展第三代、第四代新型先进核电机组。但这些先进机组却不能改变已经在役的448台机组 (含我国大陆的35台)的现状。此外,安全性也难以仅仅通过增加设施的冗余度和提高设备安全等级来提高,因为一方面受制于成本;另一方面任何设备都不可能100%可靠。事实上,共同原因失效和多个常规故障叠加以及人因失效往往是导致重大核事故的主因,而频度较高的小故障和故障应对失当 (操作人员对故障的误判、判断不及时、措施不及时不精准等)以及基于状态安全导向原则的粗放式的现有故障和事故操作规程等,即使不足以导致或能够防止出现重大核事故,也会导致核电站的可用度降低 (特别是计划外停堆),增加核电站的运行成本。
图1所示为典型的压水堆核电站系统示意图,也是美国三哩岛核电站的系统示意图。其中4个圆圈为三哩岛核事故中发生故障和虚假信号的部位。
图1 典型的压水堆核电站系统图及三哩岛核事故故障点示意Fig.1 Illustration of the typical PWRNPP and the fault locations of the Three Mile Island nuclear accident
美国三哩岛核事故的大体经过如下:二回路冷凝泵故障停转,反应堆停堆,二回路辅助给水系统自动启动,但辅助给水系统的隔离阀在定期检修后忘了打开,辅助给水过不去,导致蒸汽发生器蒸干,一回路压力上升,泄压阀自动打开泄压,但压力降低后不能按照要求回座关闭,导致堆芯失水失压,紧急注入系统自动启动。此时稳压器水位显示为高,导致操作员误判紧急注入系统误启动,遂手动将其关闭,致使堆芯裸露,酿成大祸。事后分析知一回路在泄压阀不能关闭的情况下形成了一个小破口,一回路压力降低,导致产生大量气泡,推高了稳压器水位。如果将稳压器的水位高信号结合压力低等信号进行组合推理,可知水位高是虚假信号,或操作员对水位高原因的理解有误。总之,这些虚假信号或知识缺陷是可以通过信号组合分析推理来识别的[1-2]。但这种复杂的组合推理对于人类操作员来说非常困难,尤其是在面临巨大的安全和经济压力的情况下。
三哩岛核事故以及后来的切尔诺贝利核事故和福岛核事故使人们进一步提高了对核电站安全性的要求,包括采用更为严格的以安全为导向的操作规程。例如事故半小时内不允许人干预反应堆系统、不得手动关闭紧急注入系统等。但这样做的同时也丧失了早期干预故障、减小故障后果的机会,导致核电站运行成本增加,同时安全性也未必能够显著提高。为此,人们又想办法改进核电站的设计,增加其固有安全性,也就是建造新一代核电机组。但新型核电机组也会因为大量采用新技术、新设备、新工艺而导致增加核电站的经济性的不确定性。事实上,目前全世界在建的第三代或第四代先进核电机组建造成本都大大超出了预算。此外,新型核电机组对于改进在役核电站的安全性和可用度并无帮助。
人工智能技术既可用于新建核电站,也可用于在役核电站。难度小、投入少、见效快,是改进硬件和加强管理之外的另一条提高核电站安全性和可用度的有效途径。自1979年美国三哩岛核事故以来,人们已经为此进行了不懈的努力。但迄今尚未见到成功应用的报道。究其原因,主要是核电站故障工况下异常和正常的信号多、变化快、故障模式多样复杂 (包括初因和非初因事件及其组合、不确定证据、虚假信号和负反馈工况等复杂情况)、故障重复性少、完全相同的机组少、可用于机器学习的故障数据少、要求推理速度快 (每秒钟要完成数百甚至数千的信号和故障变量的组合推理计算)、要求推理结果可解释性强等。而现有主流人工智能技术几乎都是基于大数据机器学习的黑箱模型 (例如神经网络NN、贝叶斯网络BN、支持向量机SV M等),大型复杂工业系统 (包括核电站)领域既无可供计算机学习的大量故障数据,也难以接受黑箱模型的无可解释性的推理结果。总之,基于大数据机器学习的黑箱人工智能模型很难在核电等大型复杂工业系统故障诊断领域得到有效应用。
为解决上述问题,经过数十年研究,本文作者提出了基于领域专家知识的动态不确定因果图(Dyna mic Uncertain Causality Graph,DUCG)理论模型[3-9],并初步开发了基于DUCG的核电站实时故障监测、预报、诊断、发展预测和决策支持的软件平台 (含知识库编辑器、推理机、人机界面、通信接口等),并针对岭东核电站发电机、宁德核电站模拟机二回路 (含蒸汽发生器)、清华大学核电站模拟机 (已退役)二回路 (含蒸汽发生器)以及化工系统TE模拟器、卫星电源系统等工业系统进行了近百项实时故障实验,迄今正确率达到100%。
此外,DUCG还具有知识库全图形表达、知识库模块化建造和自动合成、知识库和推理结果可解释性强、推理速度快、容错能力强 (包括虚假信号和局部错误知识库)、概率参数精度要求低、适用于负反馈等复杂动态工况、能诊断从未出现过的故障以及不确定证据推理、不完备知识库推理、概率风险评价 (与基于常规事件树和故障树的PSA方法比较,DUCG能严谨处理隐藏于故障树之间的相关性和逻辑循环)等功能。
以清华大学核电模拟机为例,其二回路示意图如图2所示。
图2 典型的压水堆二回路示意图Fig.2 Illustration of a typical secondary loop of a pressured water reactor
图3 核电模拟机二回路主要故障诊断DUCG图Fig.3 DUCGfault diagnosis for the secondary loop system of the NPPsimulator located at Tsinghua University
该系统的故障诊断DUCG知识库如图3所示。其中,矩形B变量代表可能的根原因故障或其组合、圆形X变量代表从DCS系统收到的信号变量、红色有向弧代表变量间的因果关系 (每个有向弧是一个由原因变量的状态与结果变量的状态组合而成的矩阵,其中的概率参数代表原因导致结果出现的不确定性,通常为稀疏矩阵,即只表达异常状态之间的确定或不确定因果关系)、逻辑门代表输入变量的任意逻辑组合、虚线红色有向弧代表条件因果关系 (在条件成立时因果关系成立)。注意有些变量互为因果关系。例如X23(二回路蒸汽温度)和X26(反应堆功率)互为因果:温度升高会导致功率降低 (负反馈),功率降低又会导致温度降低(正反馈),温度降低又会导致功率升高 (正反馈),即这两个信号由于正反馈和负反馈形成的闭环导致信号随时间动态振荡。此外还有三个蒸汽管线及主蒸汽联箱的压力互为因果等。
设定模拟机故障为蒸汽发生器C中U型管破裂 (B102,1),收到的异常信号如图4所示。
本例的DUCG动态诊断结果如图5~图9所示。其中的时间间隔并不是恒定的,而是根据收到新的异常信号而自动确定的。由于t1时刻已知可能的故障只有一个,其发生概率已确定为100%。
图4 C蒸汽发生器U形管破裂故障异常信号Fig.4 Abnormal signals in the case of a U-type tube rupture in steam generator C
图5 t 1时刻诊断结果Fig.5 Diagnosis result in timet 1
图6 t 2时刻的DUCG诊断结果Fig.6 The diagnosis result at timet 2其中只有X 15,0这一个负证据
图7 t 3时刻的DUCG诊断结果Fig.7 The diagnosis result at timet 3其中已无负证据
图8 t 4时刻的DUCG诊断结果Fig.8 The diagnosis result at timet 4
大亚湾岭东核电站发电机组的DUCG故障诊断知识库如图10所示。其中包含了633个变量,由32个DUCG子图自动合成。其中B变量205个,X变量427个,逻辑门 (G变量)5个,缺省变量 (D变量,即未知或缺省原因变量)1个,因果关系矩阵2952个。
采用取自SIS系统的实时数据 (期间没有异常发生),由领域工程师根据各种故障可能的信号变化人为修改数据,使之模拟故障工况数据,进行试验,共设计了26个故障,在信号充分时,均达到100%的诊断正确率。
此例中,将变量的物理位置在发电机的平面图和立体图 (可任意旋转)上进行了关联,可以在应用界面中直接看到故障发生的位置,结合屏幕上的文字说明,帮助操作员直观了解具体是什么故障及其精准位置,如图11~图12所示。
图9 t 5时刻的DUCG诊断结果Fig.9 The diagnosis result at timet 5
图10 岭东核电站发电机DUCG故障诊断知识库Fig.10 DUCG knowledge base for fault diagnosis of generator of Lingdong NPP
图11 发电机两个可能故障的图形及列表排序显示Fig.11 Two possible faults ranked according to pr obabilities with graphical location
图12 发电机转子匝间短路诊断结果三维显示图Fig.12 3D graphical fault location of short circuit bet ween rotors of generator
依托设在北京的宁德核电站1号机组的模拟机进行了DUCG知识库建库和故障实验,所建造的二回路知识库如图13所示。
其中包含175个变量,B变量 (故障或故障组合)34个,BX变量 (集成故障,代表信号缺少无法区分但影响相同的一组B变量)2个,X变量139个。完成典型故障实验24个,诊断正确率100%,在常规笔记本电脑上运行每一步推理时间小于1 s,能够跟上核电机组每秒发送一组信号的频率。实验中收到的信号曲线示例如图14~图15所示。
故障诊断结果图示例如图16所示。
基于DUCG的正确检测、预报、诊断和发展预测,可以准确采用EOP而非SOP来处理故障。初步实验和分析 (包括安全性和经济性比较)表明:采用精准的EOP可显著提升核电站安全性和经济效益。本实验中至少10个的效益非常明显 (可避免跳堆)。
图13 宁德核电1号机组二回路故障诊断DUCG图Fig.13 DUCGf or fault diagnosis of secondary loop,Unit 1,Ningde NPP
图14 给水除气系统水箱温度变化Fig.14 Temperature of feed water gas cleaner
图15 汽轮机负荷Fig.15 Load of turbine
图16 2号故障诊断的动态生成的诊断结果及信号发展随时间变化的DUCG立体图Fig.16 Cubic DUCGshowing diagnostic result automatically generated according to dynamic evidence received online
从实用性的角度,进行了操作员实验:将操作员分为两组,一组无DUCG辅助,另一组有。第一次实验第一组费时较少,因为第二组不熟悉如何使用DUCG;第二次实验两组不相上下;第三次实验第二组明显胜出。
根据DUCG的正确诊断,可以实施更为精准的故障工况操作。以下是一个实例。
故障描述:凝结水抽取泵CEX001PO故障停运,且CEX003PO泵无法启动。此时,只有CEX002PO一台泵在运行,除氧器水位控制阀CEX025 VL和026 VL处于自动调节状态,为保持除氧器的水位平衡,将会加大泵和阀的开度。由于一台凝结水抽取泵只能提供50%的流量,而此时机组仍以满功率运行,除氧器的水位将缓慢下降,CEX025 VL、026 VL开度继续增大,导致CEX002PO因流量过大而出口压力降低。当出口压力低于1.63 MPa时,凝结水抽取泵CEX002PO将面临跳泵风险。此外,CEX002PO流量过大,也会增加泵因汽蚀而停运或损坏的风险。一旦CEX002PO跳泵,意味着三台凝结水抽取泵全部停运,势必引起除氧器水位低,引发跳堆。
SOP操作规程:
目标:维持除氧器水位 (此时报警信号较多,除氧器水位报警信号等级较高)。
操作:由于除氧器水位下降,根据 “什么参数发生变化了,就控制什么参数”的原则,将会继续开大除氧器水位控制阀CEX025 VL和026 VL开度。
结果:除氧器水位继续降低,导致跳堆;泵CEX002PO由于出口压力过低或汽蚀损坏跳泵,引起跳堆;由于CEX002PO流量过大发生汽蚀,导致泵损坏或使用寿命缩短。
在DUCG诊断基础上按照EOP操作规程,可操作如下:
目标:同时维持除氧器水位和CEX泵的出口压力。
操作:手动启动CEX003PO,确认该备用泵无法启动。关注除氧器水位和CEX泵的出口压力两个参数,将除氧器水位控制阀CEX025 VL和026 VL切为手动调节,在保证水位不过低的同时,出口压力也不过低。由于故障原因经DUCG诊断已经确定,一台CEX泵无法满足机组负荷,需要很快地以5%(50 MW/min)的速度降功率至50%功率 (500 MW)。此时,一个CEX泵已经能够维持这个功率,机组大致处于稳定状态。降功率过程中仍需要关注除氧器水位和CEX泵的出口压力,保证这两个参数不进入跳堆区间。由于手动调节不能够自动跟踪瞬态,为降低风险,需要适时将控制阀CEX025 VL和026 VL切回自动调节。为保证操作中的无扰动切换,需要待功率能够维持500 MW时,调节CEX025 VL、026 VL,使除氧器水位至2.5 m,然后将这两个阀门开到自动状态,实现自动跟踪和自动调节。
结果:切换至50%功率运行,避免非计划停堆和泵汽蚀。
在进行的24个故障实验中,至少有10个可以通过类似操作避免计划外停堆,安全和经济效益明显。
此外,以上结果是在遵守现有操作规程的前提下实现的。如果根据DUCG的诊断结果,确知故障位置,则可修改目前粗放的操作规程,实现精准调控,预计会取得更加明显的安全和经济效益。
DUCG知识库的构建分为变量定义、构建子图和子图合成三个步骤。变量定义可在二维工程图和三维工程图上进行定位,并在应用界面中按照定位闪烁显示。图17~图18是变量定义示例,图19~图20是子图构建示例,图10和图13是自动合成DUCG图示例。合成图是最终的知识库,一般比较复杂,难以看懂。但可以把每一个根原因故障B变量的逻辑关系单独显示出来,以便审查其正确性。知识库的修改通常在子图中进行,局部修改后由DUCG编辑器自动合成为新知识库。知识库合成后,结合DUCG推理机和实时通信和预处理模块,即可实现对象系统的实时在线动态故障监测、预报、诊断、发展预测和决策支持。
图17 二维图上的变量定义示例Fig.17 Illustration of variable definition on 2D graph
图18 三维图上的变量定义示例Fig.18 Illustrative example of variable definition on 3D graph
图19 DUCG子图示例1Fig.19 Illustration 1 of sub-DUCGs
图20 DUCG子图示例2Fig.20 Illustration 2 of sub-DUCGs
1)进一步完善和测试有关功能,采用更好的编程语言 (例如采用J2EE改进推理机,使之能够更好地利用数据库功能、采用H5编写用户界面以替代目前已不受大公司支持的Flex),提高软件可靠性和计算精度及速度,改善用户界面。
2)进行工程实际应用中试,进一步检验DUCG系统的各项功能。
3)构建核电站各子系统的DUCG知识库并进行测试验证。
参考文献:
[1]Qin Zhang,David Okrent,George Apostolakis,et al.An expert system approach for fault diagnosis to cope with spurious sensor signals and process state uncertainty[J].Reliability Engineering and System Safety,1991,34:121-142.
[2]Qin Zhang,Jin Gu,Xuegao An,et al.Application of FBOLES-a prototype expert system f or fault diagnosis of nuclear power plants[J].Reliability Engineering and System Safety,1994,44:225-235.
[3]Qin Zhang.Dynamic uncertain causality graph for knowledge representation and reasoning:discrete DAG cases[J].Journal of Computer Science and Technology,2012,27(1):1-23.
[4]Qin Zhang,Chunling Dong,Yan Cui,et al.Dynamic uncertain causality graph for knowledge representation and probabilistic reasoning:statistics base,matrix and fault diagnosis[J].IEEE Trans.Neural Net works and Learning Systems,2014,25(4):645-663.
[5]Qin Zhang.Dynamic uncertain causality graph for knowledge representation and probabilistic reasoning:directed cyclic graph and joint probability distribution[J].IEEE Trans.Neural Net works and Learning Systems,2015,26(7):1503-1517.
[6]Qin Zhang.Dynamic uncertain causality graph for knowledge representation and probabilistic reasoning:continuous variable,uncertain evidence and failure forecast[J].IEEE Trans.Systems,Man and Cybernetics,2015,45(7):990-1003.
[7]Qin Zhang,Shichao Geng.Dynamic uncertain causality graph applied to dynamic fault diagnosis of large and complex systems[J].IEEE Trans.Reliability,2015,64(3):910-927.
[8]Qin Zhang,Zhan Zhang.Dynamic uncertain causality graph applied to dynamic fault diagnoses and predictions with negative feedbacks[J].IEEE Trans.Reliability,2016,65(2):1030-1044.
[9]Qin Zhang,Quanying Yao.Dynamic uncertain causality graph for knowledge representation and reasoning:utilization of statistical data and domain knowledge in complex cases[J].IEEE Trans.Neural Net works and Learning Systems,DOI:10.1109/TNNLS.2017.2673243,2017.