刘 钢,李晓东,金轶群,刘 川,罗智斌,谢宙桦,冯铁玲,黄善锋
(1.中电四会热电有限责任公司,广东 四会 526242;2.西安热工研究院有限公司,陕西 西安 710054)
工业循环冷却水在钢铁、电力、化工等工业生产过程中发挥着重要的作用,占据了工业用水的50%以上[1-2]。然而,在工业循环冷却水运行的过程中,循环冷却水在大气、凝汽器等换热器中频繁循环使用,不断蒸发浓缩导致循环冷却水的pH值、碱度、硬度和浓缩倍率等水质指标发生变化,使得循环冷却水系统存在腐蚀、结垢等问题,导致发电系统的换热效率下降或腐蚀,影响机组正常运行[3]。因此,对工业循环冷却水系统运行状态进行预测并及时处理,就成为火力发电等工业领域中的重要问题[4-5]。为此,本文提出了一种基于深度卷积神经网络(convolutional neural network,CNN)的循环水系统运行状态预测方法,该方法根据工业循环水水质特征,搭建了深度卷积神经网络,该网络由3个卷积层、3个池化层、2个全连接层组成。深度卷积神经网络通过多层卷积对水质数据特征进行提取,从而对循环水系统运行状态进行分类。实验结果表明,深度卷积神经网络在工业循环水系统运行状态预测分类中能达到94%的识别率,具有较强的泛化能力。对解决循环水系统运行状态预测问题具有重要的意义。
循环冷却水系统的安全稳定运行对水质等指标有着严格的要求,各水质等指标相互关联,共同作用形成循环冷却水系统各种运行状态[6-8]。循环水系统的运行状态通常可分为结垢、结垢风险大、腐蚀、腐蚀风险大、杀菌剂过量、抑菌效果差、排放风险大、排放超标、黏泥大和达标10个类别。一旦发现循环冷却水系统运行状态不正常如结垢等需及时处理,对循环水运行方式采取措施进行调整,避免影响正常的工业生产。
然而,循环水系统运行状态无法直接检测,需利用可测的水质指标进行预测。目前,可测指标主要有18个:pH值、有机磷、酚酞碱度、全碱度、氯离子、余氯、浊度、浓缩倍率、COD、正磷、总磷、硬度、钙离子、镁离子、阻垢剂含量、进口水温、出口水温、乏汽温度。在这些指标中,大部分指标之间存在着相互联系,部分运行状态与主要指标之间的关系如图1所示。结垢状态受多种因素影响,而阻垢剂又在一定程度上同时影响Ca2+、有机膦、腐蚀速率和碳酸钙垢的形成等,同时碳酸钙垢又受温度、Ca2+、有机膦等影响,多种因素呈链式影响,并能反映某种运行状态的情况。
图1 水质指标关系Fig.1 Relationship diagram of water quality indicators
由图1可见,若利用主成分分析法(principal components analysis,PCA)对这些指标进行特征提取,会失去一部分原有的数据特征,影响循环冷却水系统运行状态预测的准确率[9-10]。而深度卷积神经网络具有自动抽取数据特征的优点,因此,本文为了完整的保存整个数据特征,提出了基于深度卷积神经网络的循环水系统运行状态预测方法,利用循环水冷却水质等数据的测量值,预测循环冷却水系统运行状态。
本文提出的基于深度CNN循环水系统运行状态预测方法框架如图2所示。利用卷积神经网络可以自动提取数据特征和多输出的特性,将数据直接导入神经网络进行输出分类[11]。针对数组数据进行的卷积神经网络可以参考图像数据的处理思路,其中循环水水质的18个可检测指标作为卷积神经网络的输入,循环水系统运行状态的10个类别作为卷积神经网络的输出。
图2 循环水系统运行状态预测流程Fig.2 Flow chart of operation state prediction for the circulating water system
卷积神经网络模型示意如图3所示。由图3可见,同样利用卷积核在数据段上的平移卷积进行特征信息的抽取,得到1个一维的特征矩阵,其表达能力强于原始的数据段[12-13];然后对抽取的信息进行池化下采样,即卷积核在数据段上的平移,池化也是通过在特征信息段上的平移来完成。这里应用最大值池化即对所选中的池化窗口中的数据保留其中的最大值,在保持分类准确率的前提下抛弃部分参数以减少过拟合风险[14]。
图3 卷积神经网络模型示意Fig.3 Schematic diagram of the convolutional neural network model
由Alexander Waibel提出的卷积神经网络在Lecun等人[15]的完善中实现了多层网络训练,其复杂度相较于全连接神经网络更低,运算的参数也更少。卷积神经网络结构如图4所示,可以分为输入层、卷积层、池化层、输出层[16],其中卷积层和池化层的局部连接。权重共享和池化层的池化下采样是卷积神经网络的特点,可有效缩减全连接神经网络容易过拟合的特性,不对数据中某个数据特别依赖,更全面的对信号进行采样和特征提取。
图4 卷积神经网络结构Fig.4 Architecture of the convolutional neural network
由图4可见:数据通过输入层进入卷积层后通过卷积核的不断平移对原始数据进行特征抽取,由于每次只关注卷积核大小的部分区域就达到了局部连接的效果;然后通过池化下采样抛弃样本数据中不重要的数据减少参加运算的参数,有效防止过拟合的发生;最后数据流向全连接层也就是输出层进行数据权重的汇总并得出输出结果。
本文提出的卷积神经网络包含1个输入层、3个卷积层和3个池化层,最后经过全连接层后进行输出分类。
模型中各神经元的具体关系如图5所示。神经元之间相互连接,为了避免整个网络过度依赖某个神经元即某个特征而形成过拟合,在每层网络中加入Dropout层随机使部分神经元不工作,在训练时这些神经元以某一设定的概率保留,而每次前向通道中工作的神经元都是随机筛选的,从而减少了训练过程中对某个或某些神经元的过分依赖。输出估计值经过softmax层进行优化后进行最终的输出[17]。
图5 神经网络结构Fig.5 Neural network structure
在输出环节使用交叉熵即损失函数作为评价指标,输出的预测值通过softmax层进行计算后确定多分类的概率,再利用这个概率进行交叉熵的计算,得到具体的损失函数结果后进行优化从而确定分类的输出结果。交叉熵和softmax的计算公式为:
式中:p为期望概率输出;q为实际概率输出。
在原始数据放入神经网络训练之前必须对数据进行处理,以便神经网络能更高效地处理数据并达到收敛,数据处理过程步骤如下。
1)获取数据 本文选取水质pH值、总碱性、COD等18个循环水检测指标作为数据输入,将相对独立的10个循环水系统运行状态和5个目标值,分批次进行独立训练。
2)选取研究对象 在数据整理过程中发现循环水水质的结垢腐蚀问题在所有的目标类别中最为突出,数据也相对比较完善,故把结垢腐蚀问题作为本文主要研究对象。
3)划分数据集 对采样的数据集进行标记后以7:3比例划分为训练集和测试集(即70%的数据用来训练模型,30%的数据用来测试模型的准确程度),能较有效地保证模型的效果展示。
4)归一化处理 对数据进行归一化处理使得各特征处于同一规格,方便后续权重的计算等。归一化处理公式为:式中:XNi为归一化结果,其值为[0,1]。以上均为数据预处理部分,之后则将数据输入到深度卷积神经网络进行模型搭建。
该实验数据由某电厂现场采集获得,部分主要水质指标数据见表1。由于数据量较大,表1只展示了部分数据。
表1 循环水部分水质数据Tab.1 Circulating water quality index data (part)
对数据进行归一化等预处理后将其划分为训练集(70%)与测试集(30%),训练集用来训练神经网络参数,测试集用来测试神经网络泛化能力。
在训练中不同的层数和卷积核对模型影响很大,在经过多次模型参数调整后考虑模型复杂度确定了3层深度卷积神经网络模型,并经过反复实验可以确定相对较优的超参数和卷积核大小见表2。
表2 卷积神经网络模型超参数设置Tab.2 Hyperparameter setting of the convolutional neural network model
此次实验在Python环境下实现,在将循环水所有数据重复1 000次输入网络对模型参数进行训练后获得最终实验结果。图6和图7分别为BP神经网络和本文提出的方法在同一训练集和测试集数据上的表达曲线。
图6 BP神经网络模型训练与测试结果Fig.6 Training and testing results of the BP neural network model
图7 卷积神经网络模型训练与测试结果Fig.7 Training and testing results of the convolutional neural network model
由于循环水数据同时存在多种状态类别故将其分为5个相对独立的批次,分别进行模型的训练,具体有10个情况类别。表3为应用本文方法和BP神经网络对于10类情况识别的多次训练平均结果。由表3可见,无论是结垢还是腐蚀或是其他几类情况,本文方法的识别准确率均优于BP神经网络。由上述结果可得,本文所提出的基于深度卷积神经网络的循环水系统状态识别方法在不需要人工提取特征的前提下,有效解决了数据指标较多时自动提取循环水系统特征并对状态进行多分类的问题。
目前,工业循环水水质状态的判断大多基于现场运行人员经验进行判断,过度依赖运行人员的经验。为提高工业循环水系统运行状态预测的准确率,本文提出了一种基于深度卷积神经网络的智能循环水系统运行状态方法。该方法利用深度学习算法的优势,在不需要人工提取特征的前提下能够准确地预测出循环水系统运行状态。在工业循环水数据多样性的背景下,提高了水质类别判断的准确性,降低了对人为判断的依赖性,提高了工业循环水运行的稳定性。经过电厂的真实数据进行验证,本文方法具有较好的准确率和泛化能力,对工业循环水系统运行状态预测和维护工业生产具有重要意义。