伍伟强
(浙江大唐乌沙山发电有限责任公司,浙江 宁波 315700)
分布式控制系统和其他信息系统可以保存电厂设备的大规模运行数据,包括设备的能耗特性[1],因此可通过对机组运行数据进行主成分分析来识别能耗率。但能耗指标众多,相互关联性强且复杂,难以进行乘法运算和回归分析。传统的能耗识别方法虽然消除了各个变量变化程度的差异,但是丢失了部分数据信息,因此准确性较低。在此基础上,设计了一种新的识别方法解决现有能耗识别方法分析不准确的问题。
选用图像识别法进行信息采集,利用计算机技术将实物图像转化成数据资料,在信息采集时可以利用其拟人化的特点从而实现数据的自动处理。传统的信息采集方法必须依靠人工识别,还要进行手动分类,资源消耗较高。图像识别法可以大大减少人工消耗,更符合目前的火电厂能耗识别需求,能够促使能耗识别更加准确以及识别链条更加完整[2]。
实时监控火力发电厂电气设备的能耗,并持续收集和存储相关数据。由于数据在不断增长和更新,火力发电厂能耗影响因素之间的关系也较为复杂,因此应加强图像识别技术在火电厂用电数据采集研究中的应用。能耗数据可通过摄像头采集,利用图像识别技术准确定位和预测能耗数据中蕴含的问题和规律,为火电厂电机节能降耗提供依据[3]。
采集原始的火电厂信息数据,进行数字化仪表预处理,之后对图像进行校正,定位正确区域,从而完成识别,以满足图像识别系统的需要[4]。模式识别以图像处理与计算机视觉、语音语言信息处理、脑网络组、类脑智能等为主要研究方向,研究人类模式识别的机理以及有效的计算方法。数字设备的识别过程主要包括五个步骤,即图像采集、图像预处理、图像歪斜校正、数字域的粗定位和分割、数字识别。
图像数据信息处理的应用目标是实现实时识别,因此有必要检查能耗信息识别方法是否完善可靠。由于能耗识别方法需要利用计算机识别技术[5],因此需要采集计算机能耗识别中的各项参数,列出采集能耗参数中的问题,根据问题进行后续的性能指标评估。采集能耗信息时,要注意信息采集是否存在延时现象,避免影响信息采集识别效率,降低信息与图片采集数据的完整度,导致采集信息与实际样本信息不匹配。
本研究的机组能耗特性是指机组发电煤耗率与各能耗指标之间的特性关系,结合现场经验和热力学原理,建立公式(1)所示的火电厂机组能耗识别模型。
(1)
公式(1)中,z代表发电煤耗比率,xi代表能耗指标,ai、bi、ci代表单位向量值。根据建立的能耗识别模型,可以进行多元统计,降维分析和线性变量转化,采集不同的主成分变量,重新规划变量之间的关系。
实际应用过程中,首先选取需要进行能耗识别检验设备在常规条件下的设备运行参数,以初始数据集为样本,计算数据样本变化后的能耗指标变化情况,如表1所示。
表1 能耗指标变化情况
由表1可知,随着数据样本数的增加,能耗指标的数值也在不断增加。可以根据上文设计的能耗识别模型进行指标维度转换,根据指标的实际方差进行线性变换,变换后的单位向量与转置向量之间存在固定关系,需要根据综合指标的数值计算新的变量方差,完成变量极值的计算。
设置与电气机组相关的特征值,与相关的正交单位特征向量相拟合,为了保证能耗识别的准确性,设计方法使用拉格朗日乘数法对初始的特征向量进行方差验证,保证在火电厂电气机组运行过程中提取到的能耗数据始终准确,提取出的信息符合后续的主成分分析检验标准。研究方差中主成分元素与实际主成分贡献率的关系可知,火电厂原始能耗数据信息与变化能耗信息对实际测试结果的影响非常大,因此首先需要使用PCA进行原始变量检测,之后对检测的变量进行标准化处理,构建PCA变量,得出主成分的相关性质,完成初步主成分分析。但经过实际分析发现,此时的能耗数据存在各成分不相关的问题,需要改进原有的主成分分析法,进一步分析火电厂机组的耗能情况。
根据火电厂的相关知识,一个装置的能耗水平主要取决于该装置的制造水平、设计水平以及实际生产过程中能耗指标的完成情况(即运行水平)。控制机组和外部因素,包括煤炭机组历史运行数据中包含的各种重要信息,如机组的能耗特性、环境温度和负荷系数等。在本方法中,使用改进的PCA从设备的大量操作数据中提取数据特征,增加数据识别的准确性。基于该数据特征,使用指定的算法建立相关的能耗特性回归线性方程,根据该方程计算出此时能耗中的相关参数,并利用此参数计算机组能耗的敏感性。敏感性是建立能耗指标的基础,能够反映出能耗的特征,决定整个能耗过程中的识别准确性。
根据火电厂的工作原理和节能知识,影响火电厂能耗的指标因素包括锅炉燃烧系统能耗指标、汽轮机蒸汽系统能耗指标、出力系数等综合指标。建立单位能耗分析评价指标体系,考察各变量之间的相关性。PCA主要通过去除原始变量之间的相关性达到降维和数据特征提取的目的,它假设原始数据中的许多指标具有很强的相关性,在进行主成分分析改进时需要注意原始数据的差异性特征变化,可以根据各变量的信息关系,设计相关的方差矩阵以及符合能耗识别需求的改进能耗分析式。
设计的能耗分析式受实际应用的影响,存在方差简化问题,在使用前需要消除变异程度对分析信息造成的影响,将对角元素进行重组,结合差异变化情况消除火电厂机组数量对能耗信息处理的影响,增加火电厂机组能耗识别的敏感性。进一步分析火电厂机组的实际能耗,结合现有方法的应用原理进行能耗变化叠加,选取相应的能耗灵敏性指标分析其与常见因素之间的变化关系,计算此时能耗的敏感程度。
火电机组能耗识别敏感性分析中需要消除灵敏系数对能耗导数的影响,设计运行参数计算函数,进一步分析主成分变量与能耗指标之间的对应关系。进一步优化设计的主成分分析模型,计算回归方程参数累计方差贡献率,保证火电厂机组能耗敏感性的分析效果。
在火电厂电气机组能耗识别前,需要定位数字化仪表的数字区域。先去除边缘区域,提取出数字的近似区域,将数字信息一一分割,再进行数字识别[6]。数字设备图像的目标区域是数字信息区域,数字区域定位操作的目的是寻找并提取正确的数字区域。因此,要想为整体图像提供鲜明的黑白视觉效果,就要在进行倾斜校正后对灰度图像进行二值化处理,以便从图像中提取出亮度值较高的数字区域。二值化后的图像主要包含上下边框、两侧的白点、数字和黑色背景,且数字分布比较集中,这样就可以利用投影法确定数字域的大致位置,以此提高能耗识别的准确性。
为了提高火电厂机组能耗识别的识别效果,可根据火电厂机组的实际运行现状进行特征提取,设置能耗识别过程中所需指标的计算公式。使用Kaiser-Meyer-Olkin软件,计算能耗识别SKMO系数,进行PCA分析,SKMO系数的取值应在0~1之间,以0.9为最佳,0.5以下则不适合。根据分析结果设计相应的系数变化矩阵,根据显著性水平差值进行矩阵假设,机组的能耗指标种类复杂,包括机组出力系数、给水温度、出口温度、水流量、压力、给风率、给风温度等,可以依次对上述指标进行标准化处理,计算各部分变量得分,实现火电厂电气机组的能耗识别。
为了检验本研究设计的基于改进主成分分析的火电厂电气机组能耗识别方法能否解决文献[2]方法中的分析不准确问题,以及能否适应目前的火电厂机组运行状态,进行了以下实验分析。
选取某火电厂进行电气机组能耗识别分析,实验前需要对能耗数据进行KMO检验,进行主成分分析前需要检验SKMO值,主要是为了检测能耗与方法之间是否存在必要联系,经过统计列出该项展示值,得出变量的卡方统计量无显著性差异,将其应用于实验。
由于能耗识别结果会受到火电厂电气机组实际运行情况的影响,因此在进行实验前必须确保火电厂机组运行的稳定性。根据上述方法进行原始能耗KMO检验并进行卡方统计,卡方统计数值为25 545.55,此时显著性水平趋近于0,证明此时该电气机组符合后续的实验需求。使用均值化方法对数据进行原始处理,根据火电厂实际信息进行主成分变量标准化,得出此时各个电气机组的特征值,如表2所示。
表2 各个电气机组的特征值
由表2可知,此时各个电气机组的特征值符合后续的测试标准,可进行后续电气机组能耗识别实验。
采集火电厂不同电气机组的准确能耗数值后,分别使用文献[2]方法和本研究设计的能耗分析法进行能耗识别,识别结果如表3所示。
表3 实验结果
由表3可知,在机组能耗识别结果中,本研究设计的能耗识别方法能将能耗识别的误差降到最低,证明本研究设计方法的能耗识别效果较好,能够实现能耗的准确识别,具有一定的有效性和应用价值。
基于改进主成分分析的火电厂电气机组能耗识别方法,改进了主成分分析法存在的数据分析不敏感问题。可以将火电厂机组能耗识别的误差降到最低,对减少火电厂煤炭消耗量、节约物资、减少不可再生资源的浪费具有重要意义。