大数据分析技术在风电设备异常预测中的应用

2021-01-25 23:52酒泉职业技术学院甘肃酒泉市735000方占萍

石河子科技 2021年3期

（酒泉职业技术学院，甘肃酒泉市，735000）方占萍

为了改善风电场运维情况，就应通过大数据统计分析专业技术，来准确预测、评估机组设备的运行状态，并明确机组零部件的实际运行劣化趋势，再智能化预警风电机组后续可能的异常现象，帮助风电场运维者做好预防性维护，有效避免机组出现故障。

1 大数据分析专业技术概述

在大数据时代下，各个行业均发展得越来越快。在迅速发展中，会产生大量的数据。为了充分发挥数据的作用，便应注意分析、计算数据。而通过大数据分析专业技术，便可以从各个行业内部收集并存储下来的数据出发，按照各自的行业特征，以切实适合的方法，来科学地展开分析，并辅助提出正确决策。

大数据分析指的就是一个基于数据，来整理、转换、建模的整个过程，主要旨在找出有助于业务决策的信息。通过数据分析专业技术的应用，可提取出海量数据内的有用信息，并基于数据分析结果正确做出决策。相较于传统数据，大数据表现出很明显的数据量大、迅速响应、种类丰富多样、不易识别、价值高及密度低等方面的特点。而以上这些特点也属于大数据分析发展中的挑战，为了迎接这些挑战，大型互联网公司便陆续推出了类型各异的大数据分析处理技术系统。在进一步发展大数据行业之中，先进的大数据分析专业技术也获得了飞快的发展。而在风电行业，面临海量、复杂多变的机组设备数据监测，为了控制数据分析处理的速度及精度，也有应用大数据分析专业技术，来达到预测风电行业设备异常方面的要求。

2 建立模型框架

为了满足预测风电设备各种异常数据在处理速率及日常预测精度上的要求，文中建立了一个预测风电设备各种异常的模型。在模型当中，主要涉及分析层、应用层、采集层、存储层这些组成部分。

作为前馈多层网络之一，从反向传播误差的算法专业训练具有神经网络上的特征。因为神经网络可显示非线性整体映射关系，所以在各个领域均获得了很广泛的应用。在实际应用神经网络中，不必提前了解映射关系的描述方程。在BP神经的拓扑网络结构内，主要涉及输入输出层、隐层等，且学习算法就是最速下降法。为了最小化神经网络上的误差平方和，便应灵活调整好整个神经网络上的阈值及权值。据有关研究显示，如果在BP神经网络上的隐含层内，帮助充足的神经元，并且只含有唯一隐含层之类的BP神经网络，便可从任意精度，直接逼近一个连续不断的非线性函数。为此，文中选择的是只有一个隐含层类型的BP神经网络。就BP神经网络结构模型，为了缩短算法运行所耗时间，展开了并行运算。基于并行化方法MapReduce的大力支持，就各权值变化量，便可在Map环节顺利运算并输出来。针对权值各异的总变化量，便可在Reduce中完全统计，并科学地统一灵活调整配合权值，并可从批处理上展开训练。

3 预测异常运行的程序

在季节性天气变化及频繁更改风速的作用下，风电场内机组也应积极切换自己的运行工况。在反复切换风电机组工况的情况下，监测设备状态的数据也会经常大幅波动幅值。所以不能利用幅值大小，来准确判断风电机组的实际运行安全水平。为了顺应风电机组的这个运行特征，当前在风电行业一般都采用的是阈值报警法。也就是在判断风电机组的实际运行状态时，采用监测信号有没有上升至报警阈值的判断基础。但是，该阈值报警法，在实际应用的过程当中，极易发生误漏报等，所以预测风电设备的有关异常精确度较低。所以，文中通过残差分析法，来判断风电机组的实际运行状态。大致的程序如下所示：“监测历史数据→开始预处理→选出可用历史数据→做好归一化→搭建BP神经网络专业训练模型→设置网络权值、形成阈值矩阵→建立BP神经网络专业预测模型”“监测新数据→建立BP神经网络专业预测模型→算出残差→有没有超过残差阈值→有→算出RMSE→有没有超过RMSE阈值→有→异常状态”，倘若残差或RMSE未超过设定阈值，就表示风电设备在正常状态下。

实际预测风电设备出现异常的过程：①选出正常运行下风电机组内部的SCADA数据，并长期有针对性的预处理措施，以获得后续分析所需的监测数据。根据一定的比例展开划分环节，以才获得的监测数据作为测试及训练所需数据。②对训练数据，采取归一化处理，并选择六个状态参数当作模型输入所需参数，依次就是振动机舱的值、发电机转速值、风速大小、轮箱内部油温、振动传感器X与Y。从输入参数出发，展开BP神经网络专业模型训练，按照训练结束基础依据，来控制输出值误差位于允许范围。③从目标参数出发，通过预测模型展开预测，比较实际值和参数预测结果，并得到残差。一旦没有发现残差超过设定阈值，则可断定参数下的风机设备一切正常。④比较实际值和参数预测结果，一旦残差超过设定阈值，便应通过下式，来算出均方根RMSE误差：

其中，D—均方根误差；m—样本数；x—模型预测值；xi—实际值。以上的RMSE结果，还可用作衡量残差改变的剧烈水平。为了准确体现残差发展趋势，还应按滑动窗口技术，根据每天计算，来获得RMSE改变状况。⑤从计算中获得RMSE值，如果该值有超过设定阈值，便应判断该风电设备位于异常状态。

4 结果分析

为了证实文中所提方法的正确实用性，建立起Hadoop平台，并开始测试过程。其中使用的是两从节点和一主节点形成的集群Hadoop。这些节点具有2G内存，是基于Hyper-V应用管理器，建立的虚拟机。而内含200G硬盘，通过Eclipse、Hive、HBase等专业技术来开发。从某风电场2019年1月~2020年1月具体的运行数据开始，这些数据源自SCADA体系33台风电设备的数据。在测试中选出33台机组设备中的15台在2019年7月获得的监测数据。从监测的15组数据出发，选出训练样本，并执行模型训练。为了有效控制模型输出中的误差，设置各组训练1 000次，获得性能佳的BP神经网络专业预测模型。选择一台机组对应的2019年7月监测产生的15组数据当作测试样本，并预测下一时刻油温均值，获得比较模型预测值和监测值的结果。据比较显示，真实值大致吻合预测值，很好地证实了模型的有效性与精确度。

总之，在风电场，大数据分析专业技术能够用于准确预测设备异常。所以，文中提出了相应的预测模型，以预测异常运行流程等。为了利用好大数据分析这种技术，还应注意引进评价实时可靠性的公式，兼顾风速短时波动与监测数据信息的时序性，以确保预测的高可行性，进而有效促进风电行业的健康发展。