杨增杰,曾令龙,谭尚仁,赵志清
(华能澜沧江水电股份有限公司检修分公司,云南 昆明 650000)
发电机定子绕组通过电磁感应原理进行能量交换,工作中需承受不断变化的机械力、电场、热力作用,定子绕组绝缘性能、寿命也在缓慢发生变化[1-2]。定子绕组绝缘由于生产制造工艺、使用绝缘材料不同和现场安装工艺差异等会在发电机定子绕组绝缘内部或表面造成不同的绝缘小缺陷,如绝缘内部间隙、绕组端部绑扎造成的间隙毛刺[3]、相间距离过小[4]、二次引线与绕组端部距离较近、线棒槽内电晕[5]、端部电晕、表面脏污、绝缘受潮等,由此发电机运行状态下绝缘总是存在局部放电,不同的绝缘故障对应着不同的局部放电特征[6]。随着运行年限增加某些缺陷发展恶化其缺陷表征的局部放电图谱就更加明显。通过检测水轮发电机定子绝缘的局部放电并诊断绝缘中存在的主要缺陷,评估绝缘状态[7-10]指导检修,在检修中对主要缺陷加以控制延缓老化速度是必要的。随着大数据人工智能的发展,在发电机绕组上安装绝缘局部放电检测传感器采集局部放电脉冲信号收集故障样本数据,在绝缘故障局部放电案例样本数据中挖掘特征,建立绝缘局部放电故障数据库;通过人工智能模式识别[11-15]方法构建、训练诊断模型;将训练好的算法模型应用于新的发电机绝缘故障诊断,降低人工诊断门槛,提高诊断效率,为状态检修提供客观的数据支撑,在目前状态检修的大环境中有较大的应用价值和意义。本文以常用的电容耦合器绝缘局部放电检测系统采集的发电机绝缘局部放电数据为基础,探索诊断分析模型算法。构建训练诊断分析模型包含5个步骤。步骤(1)局部放电在线监测数据预处理;步骤(2)建立绝缘局部放电故障数据库;步骤(3)建立诊断模型;步骤(4)绝缘故障数据库数据集训练诊断模型;步骤(5)模型算法应用。
发电机局部放电在线监测系统由80pF电容耦合传感器、局放信息处理上位机系统构成。采集到的局部放电信号经降噪去干扰[16]、分类统计后存入数据库,数据构成如下:
(1)测试样本信息,包含测试样本号、时间、测试相、量程、测量状态。主要用于标识测试时参数、测试过程是否正常,为确保局放数据不被测试参数影响,量程和测量状态用于数据清洗,清除测试过程异常或参数不一致的样本。
(2)测试样本局部放电原始数据,一个正玄波电压周期内局部放电脉冲活动的幅值、相位、放电脉冲数的统计。该数据代表着发电机绕组绝缘内外、绕组槽内、端部整体放电情况,其放电脉冲的分布、统计数量、统计幅值,代表着不同的绝缘故障类型。是故障识别的主要特征。
(3)通过原始数据计算得到的局部放电综合数据,表征故障程度。由分别代表正放电数量、负放电数量、正放电幅值、负放电幅值的4个数值数据组成,符号分别为NQN+、NQN-、Qm+、Qm- 。该数据是有原始数据计算得到的中间数据,便于监测最严重故障发展趋势,但放电脉冲分布等信息缺失,为确保识别诊断的准确性,该特征不采用,只用于结果标识。
发电机运行中工况动态变化,在线局部放电检测装置也在调整,在绕组中无电压时不测量或标识无同步信号,在测试数据超量程时测试结果显示异常,重新估计量程调整后再次测量,直至测试结果显示所有脉冲均被测到时显示测试状态OK。因此测试数据中有很多异常样本数据。
(1)异常样本清除。以测试状态为依据清除检测局放脉冲不完整数据样本,正常样本中不同相不同时段量程不同,按量程将样本归类。清除样本中脉冲统计全为0值的样本。
(2)局部放电在线监测数据结构化[17],原始数据是通过坐标表示的一系列数值,每一个脉冲的位置、数值以及所有脉冲的分布含有丰富的故障类别信息,为确保信息完整被模型捕捉,将局部放电数据图像化表示。从局部放电在线监测系统导出局部放电原始数据,从中逐一提取样本局部放电幅值、相位、放电脉冲数量的统计数据,将数据合并成具有正负局部放电幅值、相位、脉冲数的局部放电样本原始数据集,数据形式30×100数组。将样本原始数据集转换为灰度图,在灰度图同一坐标下画出50Hz正弦波曲线,得到局部放电样本幅值相位图像,原始数据及对应灰度图如图1。灰度图对应30×100原始数据矩阵,30行对应放电幅值,与量程对应,100列对应0到360°相位,每个矩阵元素的数值大小表示该位置放电脉冲数与灰度图的颜色深度对应。图像数据用于深度学习诊断[18-21]模型训练,图像与数据对应,用于展示。
(a)原始数据(a)Initial data
(b)灰度图(b)Grey-scale diagram
发电机绕组绝缘局部放电样本数据来源有试验室模拟试验数据[22]、真机离线试验数据、真机在线监测数据。大型水轮发电机绕组线棒数百至上千根,绝缘存在不止一类故障,同时存在局放信号传播衰减、交叉耦合等[23-25]。试验室数据获取相对容易,图谱清晰有较高的参考价值,但与运行发电机局放数据有差异。真机离线试验数据无外部干扰数据质量优于真机,但需要在停机试验中获取,获取难度大、数量少。本文样本数据来自运行发电机和发电机停机试验。
澜沧江流域目前已安装局部放电在线监测机组近30台,有一定数据积累,部分机组存在电晕问题、绕组表面脏污、外部母线间隙放电问题等。选择其中3个绝缘存在故障且通过检修处理已确定其故障类型的发电机绝缘局部放电样本数据,并对相应的局部放电样本数据进行故障类别标签,建立故障样本库。
(1)故障A,发电机定子线棒防晕失效(出槽口电晕)。发电机额定功率300MW,定子额定电压18kV,绝缘等级F级,环氧粉云母绝缘。故障现象定子绕组槽口、R弯部位有明显的电晕电腐蚀变色痕迹,检修中开展紫外成像检测确定电晕故障位置[26-27]、电晕严重程度光子数大小,检修后经电晕试验确认防晕性能恢复,对应局部放电数据故障图谱特征消失、放电幅值明显减小。收集故障处理前局部放电数据样本并对应标签为定子线棒防晕失效故障。故障及图谱如图2。
(a)防晕失效(a)Anti-halo failure
(b)紫外成像(b)Ultraviolet imagery
(c)局部放电图谱(c)Local dischargespectrum
(2)故障B,发电机定子绕组端部相间电晕故障(表面脏污、尖角、毛刺)。发电机额定功率700MW,定子额定电压18kV,绝缘等级F级,环氧云母主绝缘。故障现象定子绕组端部异相间集灰、变色、局部电腐蚀痕迹,检修中开展电晕试验紫外成像检测对应部位光子数较大且集中,确定主要局部放电位置为端部相间。检修中全面清洁、打磨处理清除导致电场畸变的尖角毛刺,后经电晕试验确认效果理想。收集故障处理前局部放电数据并对应标签为定子绕组端部相间电晕故障。故障及图谱如图3。
(a)端部相间电晕故障(a)End-phase halo failure
(b)局部放电图谱(b)Local discharge spectrum
(2)故障C,母线间隙放电故障(发电机定子外部故障)。与发电机连接离相封闭母线额定电压18kV,封闭母线盆式绝缘子与导体之间均压连接接触不良,存在间隙放电。发电机侧测量时局放数据正常,带母线测量或母线独立测量时局方数据间隙放电特征明显,确认故障为外部母线间隙放电故障。收集故障处理前局部放电数据并对应标签为外部母线间隙放电故障。故障及图谱如图4。
(a)母线间隙放电故障(a)Bus bar clearance discharge fault
(b)局部放电图谱(b)Local discharge spectrum
(4)建立绝缘局部放电故障数据库。从数据文件中逐一提样本取采集时间、样本号、测量状态、厂站、发电机相信息构成如表1所示a样本信息数据。从数据文件中逐一提样本取正负Qm、正负NQN数据构成如表1所示d样本局部放电综合数据。将发电机绝缘故障按0-9顺序标号形成故障代码表,将局放样本对应发电机绝缘故障编码按样本顺序逐一添加构成如表1所示b样本标签数据。将上述a、b、c、d数据打包构成绝缘局部放电故障数据集,后续根据发电机绝缘故障不同不断采集新的样本加入构成更丰富的绝缘局部放电故障数据库,如下表1。
表1 绝缘局部放电故障数据库Tab.1 Insulation local discharge fault database
人工智能深度学习逐步应用于电力行业设备状态评估局部放电分析诊断,文献[28]综述了聚类算法、神经网络、模糊分类、集成学习等不同人工智能算法在局部放电识别中应用成果的对比分析,卷积神经网络最高识别率达94%。文献[29]通过实验室典型缺陷模拟、现场带电检测获取局部放电数据样本训练深度卷积网络识别缺陷,准确度达86%优于传统的识别方法。文献[30]比较分析了反向传播神经网络、自编码神经网络和卷积神经网络在电缆局部放电数据上的应用效果。文献[31]介绍了通过深度信念网络提取电晕、表面和内部放电特征和放电分类,效果优于其人工神经网络、模糊逻辑分类器和支持向量机。文献[32]比较分析了支持向量机、反向传播神经网络和卷积神经网络在GIS局部放电数据上的应用。文献[33]通过比较分析认为GIS典型故障识别中支持向量机的识别效果优于BP神经网络。文献[34]通过试验建立4种绝缘油中典型放电故障,并通过概率神经网络对故障进行模式识别,识别率较高。文献[35]介绍了一种基于卷积神经网络(CNN)和试验室故障数据的高压电缆局部放电模式识别,识别精度高,对高相似故障图谱效果较好。目前针对水轮发电机绝缘局部放电故障诊断的算法模型应用相较主变、GIS、电缆少,但局部放电检测分析方法相似,不同点在于发电机绕组结构更复杂、槽数多、噪声和干扰严重,试验室模拟故障数据与现场数据有较大差异但在梯级流域电站中真机数据获取相对容易,现场采集局部放电图谱转化为灰度图后数据相对简单,为兼顾模型准确度、计算速度,采用现场采集数据加传统卷积神经网络算法构建诊断模型是可行的。
(1)模型算法选择。卷积神经网络CNN的卷积层由多个小尺寸卷积核组成,在网络训练过程中,卷积核通过多轮迭代更新自身参数,模型收敛后卷积核可自动提取样本的二维关键特征,在卷积与池化操作后,图谱中的特征信息将被全面提取。卷积神经网络CNN与支持向量机SVM 反馈神经网络BPNN相比,SVM和BPNN的输入向量为人工提取的特征向量,在构建特征向量过程中有信息损失,而卷积神经网络输入为局部放电原始数据对应的图谱且卷积操作能将图谱中的空间相关信息进行关联分析。水轮发电机绝缘局部放电样本数据已被构造为包含相位、幅值、放电脉冲数的30x100二维图谱数据,选择一通道卷积神经网络CNN构建诊断模型。
(2)本文采用python编程语言、keras深度学习库构建模型并训练。通过卷积神经网络构建的局放数据诊断模型,模型输入30×100×1图像数据,网络中2次卷积计算,第1次卷积核尺寸3×3卷积核个数32,第2次卷积核尺寸3×3卷积核个数64,4个防止过拟合概率层参数均为0.25 。结构依次为输入、卷积、概率、池化、卷积、概率、池化、转换、概率、全连接、概率、输出。目前使用3种故障类型数据输出为3分类概率。神经网络模型结构如图5。
图5 神经网络模型结构Fig.5 Structure of neural network model
(1)按图5所示结构参数建立诊断模型M,在故障样本库中抽取故障A数据样本1100个、故障C数据样本980个、故障B数据样本2400个,样本划分训练集70%,测试集30%,输入模型训练。将表1所示b标签数据转为onehot编码b1,将b1、c数据集输入M模型。模型训练,损失函数选择多分类损失函数(categorical_crossentropy),优化器选择自适应学习率优化算法(adam),监控指标选择准确率(accuracy),每批次40个样本训练30个循环。训练结果如图6,得到模型参数文件M.h5。从训练过程曲线看在训练的前5个循环准确度迅速提升,损失值快速收敛,往后继续收敛但相对缓慢,最终训练集上的准确度为99.19%,损失值4.05%;测试集测试准确度98.41%,损失值5.53%;不难看出存在一定的过拟合。提高训练批次至50个循环,准确度为99.81%,损失值1.57%;测试集测试准确度99.42%,损失值2.66%;增加训练批次可提高准确度,减低损失,但幅度有限。绝缘局部放电图谱数据相对简单,对于CNN提取特征较容易,收敛快,准确度高。
(a)准确率(a)Accuracy rate
(b)损失值(b)Loss value
(2)新样本测试,将在线监测装置中测试ID:8917样本,输入模型诊断结果为线棒防晕失效故障。其中,端部相间电晕故障概率:0.000000028;母线间隙放电故障概率:0.000005493;线棒防晕失效故障概率:0.999994516;满足现场诊断需要。
澜沧江流域某电厂650MW发电机,2013年3月投产,2021年大修中开展离线局部放电试验,将试验采集局部放电数据导入模型诊断,结果显示为线棒防晕失效故障(槽口电晕)、端部相间电晕故障。检修中外观检查部分高电压线棒槽口明显电晕变色,紫外成像试验18kV电压下端部相间电晕放电,现场检查结果与模型诊断一致。模型诊断分析记录如下表2。局部放电数据图谱如图7、图8。
表2 局部放电检测诊断分析记录Tab.2 Diagnostic analysis records of local discharge detection
图7 线棒防晕失效故障局部放电图谱Fig.7 Local discharge diagram of bar anti corona failure
图8 端部相间电晕故障局部放电图谱Fig.8 Local discharge diagram of terminal alternating corona fault
通过卷积神经网络训练的绝缘局部放电诊断模型,分类效果较好测试准确度达到95%以上,能通过局部放电数据快速诊断已知发电机绝缘故障。
(1)解决人工诊断由于技术人员经验差异诊断结果差异较大,不客观。
(2)以故障案例数据训练的故障识别模型,应用于运行机组局部放电图谱数据诊断,可靠性高。
(3)局部放电数据复杂,以模型诊断代替人工分析,效率高,符合水电厂数字化、智能化需要。
存在不足及改进。由于诊断模型是通过案例数据训练而来,故障数据库的种类和数量将直接影响诊断模型的诊断能力,目前案例数据库只有3种故障数据,相应只能诊断3种绝缘故障,而实际发电机绝缘故障远不止于此,只是目前发电机绝缘工艺较好,发生故障的概率不大。为提高模型诊断能力,后续应不断补充故障案例丰富故障案例数据库,重新训练模型。在绝缘故障发展过程中各阶段的图谱特征可能不一致[36-37],使用过程中同一故障各阶段样本收集很重要。不建议使用移动、翻转、旋转方式扩增样本数据,对于绝缘局部放电图谱来说上述操作可能导致扩增的数据类似其他故障数据,相对而言增加基础噪声扩增数据更好。