王博维, 刘爱莲, 杜景琦
(1.昆明理工大学 信息工程与自动化学院, 云南 昆明 650500;2.云南电网有限责任公司电力科学研究院, 云南 昆明 650504)
水轮机作为水电站中最重要的发电设备,一直以来都是水电研究的重点。随着状态监测在电力系统中的广泛应用,特别是近些年来状态监测在水利发电系统中的快速发展,越来越多的研究者将目光投入到水力发电状态监测[1~4]上来。文献[5]中,李辉等人使用的集合经验模态分解(Ensemble Empirical Mode Decomposition, EEMD)和 自组织特征映射网络(Self-organizing Feature Map, SOM)神经网络的水电机组故障诊断方法,该方法使用小波神经网络和自适应差分进化法对振动信号进行识别分析,能在网络运算中顾及全局并优化局部,可以准确地找到问题所在;但仅限于少量数据输入的预测,无法将大量的数据有效地利用起来。
水电机组振动特征和故障类型之间具有复杂的非线性关系,神经网络具有极强的非线性映射能力[6,7]。使用神经网络能够建立水电机组振动特征和故障类型之间的关系,很好地处理复杂系统中存在的问题。但神经网络的复杂度与输入数量有着紧密的关系,实际应用中往往是由于神经网络的输入太多而导致系统无法运行[8~12]。
针对上述问题,本文以水电机组的劣化速度和运行状态作为主要研究内容,使用并行神经网络来处理大数据,使系统的运行速度得到大幅度的提升,并在预测后给出检修建议。最后使用历史数据对模型进行验证,确定其可以准确有效地反映设备的情况。
目前大多数关于水电振动故障诊断均倾向于故障类型和故障定位,而忽视了检修的重要性,通过维护可以避免大多数故障[13~15]。针对水电设备所处的不同运行状态,需要进行的维护也不同。当水电设备运行到一定年限时,由于其设备自身的原因发出预警需要进行维护检修,此时需要一种快速、直观的诊断方法对此作出反应,而不是等发生故障时给出定性的分析诊断。
基于以上问题,本文设计了一种基于并行神经网络的状态监测方法,流程如图1所示。
图1 状态监测方法流程
传感器采集到数据后,首先对数据送入原始数据处理,在此进行异常值分析、对比分析、缺失值分析;然后将处理完的数据送入状态监测模型中进行预测,得到水电设备当前的运行状态和劣化速度,并给出状态检修参考建议。
传感器在使用的时候由于环境干扰、人为操作等经常出现数据不精确等问题,这些由于干扰产生的数据会使预测变的极为不准确。所以需要对数据进行筛选,再进行下一步的预测。首先对数据进行异常值分析,排除部分干扰造成的数据异常;其次进行缺失值分析,补充由于干扰造成的部分数据丢失;最后进行对比分析,减少数据量。
传感器在受到干扰时可能会出现突然急速增大到最大值或减小到最小值,即出现跳变,针对这样的数据需要进行删除。
设水电站某设备上传感器U在一段时间内采集到的数据为st1,st2,…,stn。
如果
|st2-st1|≤α|st3-st2|
(1)
|st3-st2|≤α|st4-st3|
(2)
…
|stn+1-stn|≤α|stn+2-stn+1|
(3)
不成立,则参照同组传感器在同一时间的数据进行判断,如果同组传感器在这一时间均不成立,则保留该数据;如果仅该组数据不成立,则删除不成立的那组数据并视情况决定是否补充数据,其中α为异常数据判断因子,由历史数据决定其取值。补充的数据为:
(4)
电厂在进行状态监测时经常会在重要的设备上安装多个传感器进行监控,以防止单个传感器出问题而导致监测异常。另外还有一些设备体积比较大,需要取多个点同时进行监测。如果将同一监测点的多个传感器同时输入到网络中,网络的复杂度将会呈指数增长,所以需要对这些数据进行对比分析,使用一组或几组代替更多组数据进行预测[16~18]。
设水电站某重要设备上安装有U组传感器(u1,u2,u3,…,uk),ui表示U组传感器中的一组。x(x1,x2,x3,…,xn)表示传感器ui在某一时间点T采集到的数据。
方差
(5)
式中:x为平均值;a为经验数据。如果这些数据的方差s2≤a,则用其平均值来代替这一组数据,否则根据具体设备决定使用几组数据进行代替。将相关性高的几组数据进行合并处理,删除了部分无用数据,提高系统的运行速度。
随着运行时间的增加,设备会逐步劣化,性能也会越来越差,直到产生故障损坏。设备的劣化遵循图2曲线,该曲线也可反映出设备的运行状态,根据不同的运行状态和劣化速度采用的应对措施也不尽相同。
图2 设备性能劣化曲线
针对设备的劣化,本文使用水电厂中各部位的传感器作为故障预警的基本条件,通过并行神经网络建立预测模型,为水电站提供更加可靠的预警方法。
神经网络可以实现复杂的映射,一般的神经网络包含有输入层、隐含层、输出层,这3层相互作用可以以任意精度来逼近连续函数,适用于非线性函数的拟合。神经网络的关键在于其隐含层的相互作用,但在使用神经网络的时候经常会出现输入过多的情况,针对某只需要单一输出问题的求解,其影响因素经常是十多条或者更多。而神经网络的复杂度是随着输入的增加呈指数级增长的,这会造成神经网络的建立变得极为复杂,具体表现为学习时间大大增加、网络不稳定,甚至在一些多输入上建立的网络甚至无法正确地拟合原有曲线,这就是所谓的过拟合现象。
针对这种多输入单一输出的问题,提出并行神经网络的方法[19~21]。并行神经网络可以从结构和数据两个方向来实现,由于数据量的庞大性,若要从结构上实现并行,所需运算量将会极为庞大,难以实现。当然,也可通过物理方法来实现结构上的并行神经网络,但这种方法需要建立专用的设备,实现起来不仅麻烦而且实用性差,费用也很大。另一方面,数据并行的神经网络可以通过算法来实现,其总体结构框架如图3所示。图中每组数据都有自己完整的神经网络,在各自达到收敛条件后产生多个中间量,对这些运行出的中间量进行汇总分析,判断是否再次进行分组重新训练,最终得出结果。相比之下,数据并行的方式更加容易实现。针对具体的神经网络而言,并行化处理之后,其泛化能力依然很好。
图3 并行神经网络结构图
水轮机的振动故障分为机械振动故障、水力振动故障、和电磁振动故障3大类。机械振动故障包含转动部分质量不平衡、轴线不对中、转动部分与固定部件发生碰磨及其他;水力振动故障包含导叶和导轮开口不均、水封间隙不等、转轮叶片断裂、尾水管产生的低频偏心涡带、转轮叶片出水边后的卡门旋涡等;电磁振动故障包含发电机转子不圆、绕组匝间短路、定子铁心松动、分辨机座合缝处铁心间隙大、定转子间隙不均匀、不平衡负载等。对这些故障,需要逐一建立相应的状态监测神经网络;除此之外还需要对正常运行状态和其没有提出的故障建立一个专门的神经网络来进行预测。
通常情况下大型水电站中所安置的监控测点有数千个,一些超大型的水电站其中监控测点更是有可能有上万个,对一个运行状态进行预测显然并不需要全部的监控测点,但某些必须的监控测点必不可少;其中可能含有不能用传感器直接进行测量的监控测点,这种重要的监测数据水电站一般会使用间接测量的方法进行监控。这些间接测量的测点数据必须放在同一组中进行学习。
并行神经网络训练步骤如下:
1)设某个故障状态大训练集为M,共有S(s1,s2,s3,…,sn)个关联数据测点。其中sa,…,sb个数据测点为间接测点,需将sa,…,sb每个单独分为一组。其他数据采用随机分组,每个分组数据包含3~5个测点,具体分组数据个数根据总体确定。用这样的方法将大训练集M分成t个子集,每个子集都是并行神经网络中的一个训练样本,子集的输出为中间值y1,y2,y3,…,yt。
2)在每个子集都训练完后,比较每个子集中的测点权值,若某个数据所占有的权值小于该子集其他任意数据权值的0.5%,即
(6)
则可认定该数据对应测点对该故障的影响因子可忽略,删除该测点并标记该子集为失败训练子集,执行第三步。
3)比较各个子集的误差值δ1,δ2,δ3,…,δt是否达到设定值。如果各个子集的训练均比较合适,达到预期误差标准且没有出现失败训练子集,则执行第五步;若某个子集不能正常进行预测,训练失败或无法达到预期的误差标准,则将该子集标记为失败训练子集,执行第四步。
4)检查失败训练子集,若失败训练子集中含有间接测量的子集,拆分为两个子集;然后将剩余失败训练子集分组进行合并,执行第一步。
5)子集的训练完成后,需要将子集输出的中间值进行合并,在此选用加权平均值的合并方式,按照
(7)
(8)
进行合并,其中fi为各子集所占权重,Y为最终的合并结果。
每个子集网络同步进行,对于已经训练好的子集将保持其原有的网络结构不变,只重复训练适应性不好的网络。
由图2可知,设备在使用中劣化程度随时间不断的增加,最终发生故障被替换。设备从使用到报废之间总共可以划分为4个阶段,正常运行阶段、轻微损伤运行阶段、中度损伤运行阶段、高损伤运行阶段。与之相对应,在正常运行阶段,设备可认定设备发生故障为极小概率事件;轻微损伤和中度损伤阶段,设备发生故障为小概率事件;到高损伤运行阶段,设备的使用寿命已经达到极限,继续使用将随时可能发生故障,需要马上进行停机维修。
当然,设备的风险不能仅仅通过当前运行状态来进行评估。假设设备在使用期间没有进行严重的违规操作,那么从安装开始,其在每一个运行状态都有着固定的时间范围。设备从前一个运行状态到下一个运行状态的时间也是作为风险评估的一个重要参考量,若设备从前一个状态加速劣化到达了下一个状态,则说明该设备一定存在问题,需要马上对其进行分析检查。
设备风险评估使用设备运行状态和设备当前劣化速度进行评估,具体评估方法参照图4进行。当处在无风险时,设备正常运行,无需进行检修;在低风险时,由具体故障来决定检修的紧急性;处于中风险和高风险时必须马上进行检修,查明原因,防止故障发生。
图4 评估方法
本文基于多数据并行神经网络,拟合劣化曲线进行预测诊断,结合水电站在运行过程中难以察觉的故障进行分析验证,具有较好的适用性。如转轮叶片断裂这种故障,通常情况下应力过于集中是主要原因,可通过对水轮机叶片进行有限元分析来进行诊断。但也存在其他一些情况,如某水电站因转轮叶片卡门涡共振,引起转轮叶片出现裂纹的现象。该故障很难在设备运行的时候进行准确监测,当监控发出预警时故障往往已经发生。
本节使用本文方法对转轮叶片断裂这一具体故障进行分析说明。取水电站6个月内每10分钟内收集到的温度、油位、摆度、振动、脉动数据来建立模型。图5(a),为发生转轮叶片损伤事故前1周前的水导X向摆度数据,图5(b)为按照异常值分析、缺失值分析、对比分析后的未归一化处理数据。
图5 传感器数据图
建立模型总共使用了43项数据,共30 000多组数据,表1给出模型构建中使用的部分数据集。建立的模型结构如图6所示。
表1 并行神经网络学习数据
续表1
图6 并行神经网络预测模型
基于本文所提出的预警模型对新采集到的数据进行预测,得到表2和图7的预测结果,表2为设备当前的运行状态预测,图7为设备劣化速度预测。预测的数值越大表示设备的劣化程度越严重。
表2 水轮机叶片状态预测
图7 水轮机劣化速度预测
通过对设备运行状态和劣化速度进行分析,现给出的检修建议如下:
从运行状态可以很明显地看出设备从基本无风险阶段转变到了中故障风险阶段;且劣化速度急剧增加,结合设备故障评估表来看,此时应马上组织紧急检修来查找故障的具体原因。检修时可将重点放在转轮叶片断裂这一故障上,首先对转轮相关设备进行查找故障出处。
本文选取水轮机正常运行时一周的1 000组数据和故障前一周的1 000组数据来进行预测,通过与真实的运行状态和劣化速度进行对比分析来进行验证。
取水电站正常运行时的1 000组数据进行预测,预测结果如图8所示,可见预测结果始终在真实值之间波动,仅仅有20组数据出现在误差范围外,准确率高达98%。取故障前一周的1 000组数据进行预测,出现234组数据预测不准确,预测不准确的数据多出现在状态转换期间。其总体的预测准确率为87.5%。
图8 劣化状态预测结果
取准确度验证中的数据,其劣化速度如图9所示,再根据实际的检修结果进行对比,预测的结果可较好地反映设备的劣化速度。
图9 劣化速度预测结果
本文以设备运行状态为重点研究对象,设计了一种通过并行神经网络进行诊断预测的方法,通过对某水电站振动状态的实际预测,可实现提前预警,再配合预测的结果给出设备检修建议,减少故障发生。该方法主要有以下几点优点:
1)通过有效的数据预处理,从输入层面上提高了数据可靠性,更加有效地使用传感器。
2)使用并行神经网络进行预测,这样水电站的大多数数据都可以使用到该方法中,从而提高了传感器的利用率,也提高了预测的准确率。
3)通过劣化速度的引入,对检修提出更好的建议,具有更加广泛的实用性,对缩短检修时间有着明显作用。
该方法在使用中有着较好的结果,但需要大量的历史数据来进行学习,而且针对某一具体故障需要一定量的故障历史数据。该方法仍然可以在预测时进行改进。