戚凯旋,朱凌云
(东华大学信息科学与技术学院 上海 201600)
在实际的燃气锅炉工作环境中,工作人员需要对锅炉内部的燃烧稳定性进行实时监控,以确保整个燃烧流程的效率和稳定性[1]。随着数字图像处理和机器学习的发展,传统的火焰检测技术(例如热电阻测温、紫外线探测等)逐渐退出历史舞台。通过电荷耦合器件(charge coupled device,CCD)摄像机采集图像,再经过处理提取特征参数,最后建立火焰状态检测模型的方法,已成为学术界研究的主流[2]。锅炉火焰状态检测除了对图像进行预处理外,也要从图像自身特性进行分析,提取出对建模有利的特征,从而更有利于对锅炉内部进行有效监控和异常检测[3]。
在复杂工业环境下,锅炉内壁和火焰周围空气可能会因为火焰光照影响而亮度偏大,一些分割算法会把其当成火焰的一部分,使得分割效果变差。在算法层面,支持向量机(support vector machine,SVM)和神经网络被广泛应用于锅炉火焰状态检测领域。不少研究人员在此基础上结合优化算法,以达到优化的目的[4-6]。锅炉火焰图像受限于自身单调的图像特性,能够提取到的特征维度较低。这对于传统的支持向量机模型学习是不利的[7]。神经网络支持对特征进行深层交叉,但在一定程度上损失了模型的可解释性和简便性[8-9]。梯度提升决策树(gradient boosting decision tree,GBDT)支持对特征进行交叉,对非线性数据具有很好的拟合能力,并且具备可解释性。近年来,GBDT在很多结构化数据的训练场景下都能取得比神经网络更优异的效果[10-11]。
本文首先对燃气火焰的燃烧特性进行分析,使用基于色调、饱和度、明度(hue,saturation,value,HSV)空间的阈值分割算法[12],有效避免了火焰强光使得分割后面积偏大的问题;然后采集火焰中心区域的颜色、轮廓、矩特征,使用GBDT+逻辑回归(logistic regression,LR)算法[13]搭建火焰状态检测模型;最后对比试验了SVM、深度神经网络(deep neural networks,DNN)、GBDT+LR在相同数据集的指标情况。
本文采用的火焰图像来源于现场CCD相机拍摄的燃气火焰视频,完整地记录了点火→燃烧不稳定→燃烧充分→最终熄灭的过程。天然气火焰在不同的燃烧状态下有着不同的特性:燃烧不充分时,火焰呈亮黄色,振荡幅度较大;在过渡阶段,火焰黄蓝相间,振荡幅度相对于燃烧不充分时有所减弱;燃烧充分时,火焰呈蓝色,振荡幅度较小。因此,本文将火焰燃烧状态归为燃烧不充分、燃烧较充分以及燃烧充分三种状态。
在实际工业环境中,CCD相机成像过程通常会伴随产生散粒噪声和高斯噪声。高斯噪声与光强度无关,无论像素值是多少,高斯噪声的平均水平保持不变。而散粒噪声又称泊松噪声。泊松噪声随着光强增大,平均噪声也增大。试验选择在火焰图像中加入随机散粒噪声作为噪声干扰,并对比了中值滤波、均值滤波、高斯滤波、双边滤波的去噪试验效果,最终得出结论:中值滤波对于燃气火焰场景的噪声能够起到很好的抑制作用。中值滤波去噪前后图像如图1所示。
图1 中值滤波去噪前后图像Fig.1 Images before and after median filtering
图像分割一般基于阈值、边缘、区域、运动等特性。由于火焰运动极不规律,基于边缘或者运动的算法会带来较大的误差,而且火焰自身与背景阈值相差较大。因此,本文选取基于阈值分割的算法作进一步研究。目前,以大津(OTSU)法为代表的自适应阈值分割算法在锅炉火焰检测领域的应用较为广泛。由于锅炉内壁环境较暗,当火焰亮度较高时,采用大津法进行图像分割可能会造成分割后的火焰偏大。这是因为火焰周围的空气亮度较高,导致分割出现误差。根据火焰前景和背景在HSV颜色空间的S分量上存在显著差异这一特点,本文采用基于HSV空间S分量的阈值分割算法进行分割。基于S阈值分割前后图像如图2所示。
图2 基于S阈值分割前后图像Fig.2 Images before and after segmentationbased on S threshold
由于火焰自身极不规律的运动特性,在图像分割后可能存在一些空洞,会影响到对火焰面积等特征的准确提取。由于分割后的图像已是二值图像,本文使用漫水填充方法进行处理。漫水填充前后图像如图3所示。
图3 漫水填充前后图像Fig.3 Images before and after flooding filling
锅炉天然气火焰在不同燃烧阶段颜色分量的占比情况会发生变化。当天然气燃烧不充分时,火焰呈现亮黄色,此时火焰的红色分量较多。当天然气稳定燃烧时,火焰呈纯净的蓝色,此时火焰的蓝色分量增多。R分量变化趋势如图4所示。
图4 R分量变化趋势Fig.4 Change trend of R component
由图4可以看出:在燃烧初期,R分量均值较高,此时燃气火焰处于不稳定的燃烧状态;从150帧左右开始,火焰由不稳定的燃烧状态过渡至稳定的燃烧状态,达到稳定后的R分量均值较低。
同样的,不同燃烧状态的图像在HSV空间上的分量也存在着较大的差异。S分量变化趋势如图5所示。
图5 S分量变化趋势Fig.5 Change trend of S component
由图5可以看出,当火焰充分燃烧时,S分量均值明显高于不充分燃烧状态下的S分量均值。
当天然气燃烧不充分时,火焰的振荡频率较高。此时,火焰面积较大,变化幅度也较大。火焰面积变化趋势如图6所示。
图6 火焰面积变化趋势Fig.6 Change trend of flame area
由图6可知,前半部分时间帧的火焰面积平均值偏高且方差较大;而在充分燃烧的状态下,火焰的振荡较为稳定,故提取图像分割后的有效周长和面积作为特征。
火焰在燃烧过程中存在闪烁现象,且振荡比较剧烈。除了通过颜色维度和轮廓维度对火焰图像进行刻画外,还需要寻找一种更加稳定的特征对频繁变化的火焰图像进行有效表达。图像的距不受光照、噪声以及几何形变的影响,在图像识别领域应用广泛。设x为随机变量、c为常数、k为正整数,则E[(x-c)k] 为x关于c点的k阶距。对于M×N的火焰图像,其(p+q)阶几何矩如式(1)所示:
(1)
式中:f(i,j)为火焰图像在坐标点(i,j)处的灰度值。
零阶几何距代表火焰图像的面积,一阶几何矩代表火焰图像的质心。为了构造出图像距特征的平移不变性,以火焰图像的质心作为中心构建中心矩。中心距的计算只与火焰图像的点以及火焰质心有关,与火焰自身位置无关,即中心矩具备平移不变性。中心距可以由几何矩的变换推导得出。其(p+q)阶中心矩如式(2)所示:
(2)
此外,二阶几何矩可用于计算火焰图像的方向,也称为惯性矩。三阶几何矩反映了火焰图像的方位和斜度。
GBDT以决策树中的分类回归树(classification and regression tree,CART)回归树为基础,利用梯度提升思想,即拟合每一轮训练过程中的残差,在GBDT中残差定义为损失函数的负梯度。定义数据集D作为回归树的输入,回归树的输出为f(x)。训练时,首先对弱学习器进行初始化,如式(3)所示。
(3)
然后,遍历所有的样本以计算残差,即损失函数的负梯度,如式(4)所示。
(4)
将上一步计算得到的残差作为新的样本,输入至下一个基学习器进行训练,并得到一棵新的CART回归树。对树生成的叶子节点计算最佳拟合值,并更新强学习器,如式(5)、式(6)所示。
(5)
(6)
式中:J为回归树生成的叶子节点个数。
LR本质上属于广义线性回归模型。对于一般的线性回归,有:
y=θ0+θ1x1+θ2x2+...+θnxn
(7)
逻辑回归在线性回归的基础上,将线性回归的结果映射到Sigmoid函数中,如式(8)所示。
(8)
对于损失函数的求解,使用极大似然估计,首先得到概率函数:
P(y|x;θ)=[hθ(x)]y[1-hθ(x)]1-y
(9)
因为样本数据相互之间独立,所以概率函数可以转换为参数的似然函数形式:
(10)
对似然函数取对数,并使用梯度下降算法进行求解。
GBDT+LR组合模型的优势在于:通过GBDT的叶节点编码实现对特征的自动交叉,从而引入非线性的特征组合。GBDT的原始特征输入为通过图像预处理操作提取的火焰参数,之后GBDT利用树模型的分裂特性实现不同特征的交叉组合,进行更深层次的学习。训练结束后,树模型的叶子节点表示特征的最佳分裂位置,GBDT的输出代表对原始输入历时节点编码。GBDT+LR结构如图7所示。
图7 GBDT+LR结构图Fig.7 Structure diagram of GBDT + LR
x作为一条输入样本,在左右进行遍历,分别落到两颗树的叶子节点上。假设该样本落在左边叶子节点的编码为[0,1,0],落在右边叶子节点的编码为[0,1],则该样本经过GBDT最终变为一个5维的向量,作为LR的新输入进行训练。
本文研究了GBDT+LR、SVM、DNN在相同的火焰特征数据集的分类指标情况。首先,验证了三种算法模型在相同数据集上的准确率情况。单组试验的准确率如图8所示。
图8 单组试验的准确率Fig.8 Accuracy of single group experiment
对比结果表明,基于GBDT+LR的分类模型明显优于传统的SVM和DNN模型。为了对模型的综合性进行准确的度量,进行50次重复试验。每次随机选取20% 数据集作为验证集,并计算准确率、精确率、召回率、F1、Kappa指标。重复试验的指标平均值及标准差如表1所示。
表1 重复试验的指标平均值及标准差
从表1可以看出,经过多次重复试验后,GBDT+LR模型的各项指标平均值都优于其他模型。在50次试验指标的平均值和标准差方面,DNN略优于SVM,GBDT+LR得到的试验结果标准差远小于其他两个模型。这说明了GBDT+LR模型在处理不规律的火焰特征数据时具有明显的优势。
本文首先通过对燃气火焰进行完整、有效的预处理,为之后的火焰特征提取奠定基础。除了基于火焰特性提取的特征之外,创新性地将GBDT+LR模型的方案引入火焰状态检测领域,实现了对特征的进一步非线性组合,增强了模型的表达能力。试验证明,基于GBDT+LR的燃气火焰状态检测模型具有很好的精度和稳定性。