基于CNN的核电站主冷却剂系统压力预测

2021-10-23 12:13:58王梦蝶王俊玲于成波哈尔滨工程大学核安全与仿真技术国防重点学科实验室哈尔滨5000中国核动力研究设计院成都6004

哈尔滨商业大学学报(自然科学版) 2021年5期

王梦蝶，王俊玲, 于成波(.哈尔滨工程大学核安全与仿真技术国防重点学科实验室，哈尔滨5000; .中国核动力研究设计院，成都 6004)

我国的核电技术日趋成熟，由国家自主研发的“华龙一号”已成为新的“中国名片”走向世界[1].在核电迅速发展的同时，如何确保电站安全运行也一直备受关注.2011年，日本福岛的核泄漏事故再次对核电的发展产生深远影响.保障核电站安全运行成为了核电发展过程中最为重要的工作[2].核电站系统中的设备数量众多且冗杂，相关物理参数互相耦合.在故障发生时，操作员很难从众多变化参数中准确分析且判断故障类型.如果操作员判断失误，将会导致事故程度加重，比如美国三里岛事故就是因为操作员未能准确判断故障原因，从而操作失误引起堆芯失水[3].若能根据核电站运行中的实时数据进行人工智能化参数预测，及早发现异常，实时了解工况走势，为操作员提供早期预警，将降低操作员误判可能性，确保核电站安全运行.

随着大数据时代、数字化仪表和智能算法的迅速发展，人工智能相关方法已经应用在核电控制系统，如故障诊断、状态预测、环境监测等方面[4-6].龚安等人使用长短期记忆方法用于核电装置主泵电机温度预测[7].A·Zhang等人通过深度学习相关方法对反应堆产生的热功率进行预测[8].J·Yang等人利用自动编码器和长短期记忆方法对核电站进行状态监测并识别故障类型[9].

深度学习不仅应用在图像识别、语音处理上，其自动提取特征的能力还被广泛应用在各领域[10].深度学习区别于传统的手动选取特征的方法，能够提取深层次的故障本质特征，提高故障诊断的准确率[11].基于此，本文使用深度学习中最为普遍的模型-卷积神经网络应用在核电站的主要参数预测.通过预测异常工况下的主冷却剂系统压力走势，了解核电站当前状态，帮助操作员及时处理故障，确保核电站稳定运行.

1 卷积神经网络

近年来，作为深度学习应用最广泛的方法之一的卷积神经网络受到众多领域研究者的关注[12-13].不同于常规的卷积神经网络，本文构建的模型不包含池化层，仅利用卷积层进行自动特征提取，再通过全连接层达到预测目的.

1.1 卷积层

通过对输入数据进行卷积运算，卷积层自动地提取相应事件的深层特征.对于输入层数据，卷积运算以一定间隔的滤波器滑动，将滤波器内元素与局部数据对应元素相乘后求和得到相应的特征值图，计算公式如式(1)所示.

(1)

其中：

ha,b为特征值图中第a行第b列的特征值元素；

f为ReLU非线性激活函数；

wc,d为滤波器中第c行第d列的权重元素；

xa+c,b+d为第a+c行第b+d列的输入数据；

b为权重偏置值.

1.2 全连接层

卷积层输出的特征值图通过展平层进行一维化处理.展平层所得的一维特征向量进入全连接层进行运算.全连接层中的结点与上一层的所有结点相关联，计算公式如式(2)所示.

zi=f(wi×h+bi)

(2)

其中：

zi为全连接层中第i个元素的特征值；

h为上一层的特征向量；

f为ReLU非线性激活函数；

wi为与第i个元素相关的权重值；

bi为与第i个元素相关的偏置值.

1.3 数据归一化

在深度学习模型中，为了降低数据值分布变化的影响进行归一化处理，将数据分布映射在一个特定区间，比如[0,1]或[-1,1].归一化的常见方法包含最小-最大归一化(min-max normalization)、均值归一化(mean normalization)和标准差归一化(z-score).z-score方法更适用于特征最小值和最大值都属于未知，或有离群数据超出取值范围的情况.均值归一化更适合数据中含有负值的情况，映射到[-1,1]的范围.最小-最大归一化适合单一事件并以此为标准进行归一化处理，不适用多个事件的统一处理.

本文通过各个传感器的特征除以该传感器训练事件中最大值达到归一化目的，以保留各个传感器的特征信息，数学表达式如式(3)所示.

(3)

测试、验证事件以训练事件中最大值为标准，进行归一化处理.

2 基于CNN的参数预测模型

2.1 多步预测滚动

多步窗格所包含的信息量比单步窗格多，窗格滚动更具有实时性和丰富性，预测准确率更高.多步窗格滚动的方式如图1所示.

其中原始数据是多维时间序列，窗口大小为i，原始传感器个数为m，预测传感器个数为n.

滚动预测的时间窗格跨度越大，窗格所包含的信息量越多，但是在异常工况下，参数值变化快，所以时间窗格i需控制在一定范围内.

2.2 基于CNN的模型

本文基于CNN的网络模型为一层输入层、一层卷积层、一层展平层、两层全连接层、一层输出层，如图2所示.模型的输入是多个特定传感器的时间序列，形成一个类似于图像的二维矩阵数据.卷积层包含36个大小为2×2的滤波器，其输出通过展平后进入到两层神经元数为128的全连接层.ReLU非线性激活函数为在卷积和全连接的层之后应用.输出层是由数量等于预测传感器数的神经元所组成的全连接层，激活函数为线性激活函数.构建的CNN模型中未考虑池化层，因为输入层的数据通过卷积层提取到关于相邻传感器的特征信息，池化层的加入可能会导致传感器特征值信息的缺失.

图2 基于CNN的模型结构

2.3 评估指标

平均绝对误差(Mean Absolute Error，MAE)是绝对误差的平均值，用于衡量预测值与实际值的误差，表达式(4)如下所示.

(4)

其中：

xt为t时刻传感器的实际读数；

yt为t时刻模型的预测值；

K为数据预测点的个数.

通过计算测试集数据的MAE值来评估模型的精准度.

3 实验验证

3.1 实验数据

实验数据来自于美国Micro-Simulation Technology(MST)公司所开发的模拟仿真与严重事故分析软件PCTRAN[14-15].本文选自可适用于三回路的PCTRAN，从0 s开始模拟运行，每秒输出93个传感器参数.选定SBLOCA事件作为研究的异常工况，选择跟主冷却剂系统相关的33个传感器参数，预测该工况下主冷却剂系统压力的走势.本文设定在正常满功率运行50 s后发生SBLOCA事件，一共运行300 s.

3.2 数据预处理

将模型的事件除以训练事件中各个传感器的特征最大值，进行归一化处理，加速训练收敛速度.

本文设置时间窗格为i=5.根据数据特性，0～4 s的第一个窗格预测第5 s的主冷却剂系统压力值.窗口依次以步长为1 s的方式进行滚动，将时长为300 s的事件分割成296个每5 s的局部数据.

3.3 模型训练

本文使用Python3.6语言和Keras深度学习框架来构建模型.优化算法采用Adam算法，采用的学习率为默认值0.001，损失函数采用MAE，设置迭代次数为500次.训练事故破口面积为5、10、15 cm2.为测试模型对破口存在差异的事件的适应性，对比训练事件的破口范围对模型的包容性，分别训练单一的破口10 cm2的事件和以5 cm2为递增的多类破口事件，并选定破口面积为10 cm2事件为验证集.选取500次迭代中验证集损失函数值最小的一次为最终模型,以防止过拟合现象.选定破口面积为8 cm2和11 cm2事件为测试集，验证模型的泛化能力.

参照文献[5]中利用LSTM进行异常工况下的事件走势预测，本文以文献[5]构建的模型进行对比研究.表1为各模型迭代500次中的最小损失值，可以看出LSTM_A模型的验证集损失值会比训练集小一个数量级，原因在于文献[5]中未使用验证集，且使用Dropout以避免过拟合.而CNN模型的训练损失值与验证损失集相差较小，模型状况良好.但是相关损失值不能完全反馈出模型的优劣，增加评估指标对模型的优劣进行评判.

表1 模型损失值

3.4 实验结果与分析

根据SBLOCA其他历史相关参数去预测主冷却剂系统压力的走势，在缺少主冷却剂系统压力的参数情况下，预测主冷却剂压力的走势.两种深度学习方法分别对单一破口和多类破口事件进行训练，四种模型的评估结果如表2所示.

表2 模型的实验评估指标值(MAE)

表2中的4种模型对训练事件和测试事件进行预测，计算出主冷却压力预测值与实际值在每个时间点的平均绝对误差.从评估值结果看，多类CNN模型在不同事件上均具有更小的评估值.CNN_A模型和LSTM_A模型只有在破口面积为10 cm2的训练事件具有更小的评估值，随破口变化越大，平均绝对误差值变大.其原因是模型未曾学习过其他破口事件，当事件相较于训练事件的变化越大，模型预测值偏离真实值越多.CNN_B模型和LSTM_B模型因为学习的事件范围较大，适应性更强，预测值与真实值偏差较少.

测试事件进入模型中，如图3、4，单一模型能预测出事件走势，但多类模型学习过破口范围的端点事件，所以对测试事件具有更好的适应性.图4截取事件50～100 s的局部预测趋势，能看出多类事件更贴合真实值.对同一类型的事件，训练事件包含的范围越广，越能准确预测范围内的未训练事件.

图3 CNN模型在11 cm2破口下的预测结果

图4 CNN模型在11 cm2破口下的局部事件预测结果

即使LSTM模型应用在时间序列上具有优势，但从表2的评估值，可以看出绝大部分的LSTM模型输出的预测值比CNN模型更偏离真实值. 对比图5、6，在单一事件或者多类事件上，CNN模型预测出的事件趋势都比LSTM模型具有更强的适应性.

图5 单一事件下，不同模型局部适应性对比图

图6 多类事件下，不同模型局部适应性对比图

4 结语

本文基于CNN模型对核电站异常工况进行预测.在数据预处理中，使用多步窗格滚动方法将长时间序列分割成每5 s的局部数据并利用训练事件中每个传感器的参数最大值进行归一化处理，保留信息特征以增加模型精准性.多步窗格预测方法可以在理论上预测任意时间长度的信息，也可以预测多个传感器的实时数据.使用卷积层进行深层次特征提取，将各传感器信息相互关联，构建CNN模型.本文通过实验证明，LSTM模型和CNN模型在工况预测中都有很良好的预测能力.CNN模型相较于LSTM误差较小，有更优秀的预测结果.对于不同程度的同一类型事件，训练事件范围越广，更能预测该类型下的事件走势，减少构造其他程度的模型，具有更好的适应性.本文证明CNN模型应用在核电控制领域中的事件预测走势方面具有优秀的性能，能帮助核电操作员对当前情况进行预测分析.

本文通过核电模拟软件验证结果，在后续工作中可以通过核电站的实际数据验证该模型的实用性.在实际应用中，找到同一类型事件的适当范围以构建最优适应性的模型并应用到其他重要参数进行预测.