赵翰驰 姜凤敏 任妍
摘 要:针对传统的模型在风力发电机异常识别过程中存在识别准确率差的问题,本文提出基于CNN的异常识别方法。将输入的属性值数据转换为方阵生成许多大小相同的风机属性图片,通过训练海量图片,不断调整模型参数,得出CNN模型各层结构,通过图片的二分类问题实现风机状态的判断。
关键词:风力发电机;SCADA数据;识别;卷积神经网络(CNN)
中图分类号:TP0391.41 文献标识码:A 文章编号:1671-2064(2018)21-0128-03
1 引言
风机SCADA数据经过数据清洗和先聚类后类内降维的预处理后,可以作为本文异常识别模型的有效输入,但数据量仍然较为庞大,所以我们既需要解决因属性较多导致数据量庞大的问题,还要找寻有效的二分类方法实现正异常的准确分类[1-2]。卷积神经网络(CNN) 具有强大的非线性映射能力,在解决数据量大、属性多的问题有较好的应用性,同时也避免了需要特征提取的复杂性[3-4],亦可通过图片分类的形式实现二分类问题[5]。
卷积神经网络(CNN)是一种前馈人工神经网络,是一种广泛应用的深度学习算法[6-8]。CNN主要用来识别位移、缩放及其他形式扭曲不变性的二维图形。由于CNN的特征检测层通过训练数据进行学习,所以在使用CNN时,避免了显式的特征抽取,而隐式地从训练数据中进行学习[9-10]。CNN的这些特点符合我们的需求,可用于实现风机的异常识别。
2 卷积神经网络设计步骤
在使用CNN进行风机异常识别时,输入数据需要被组织为具有相同尺寸的归一化的图像以被馈送到CNN中。所提出的识别模型由归一化层,两个卷积层,两个池化层,完全连接的分类层组成。
2.1 归一化层
由于CNN的输入需要被标准化为相同的尺寸,特此引入归一化层。首先,找到输入到归一化层的图像最大值和最小值及其对应位置;然后使用下采样方法将其归一化为所需大小;最后更换最大值和最小值。在提出的模型中加入归一化层不仅可以带来很多方便,而且可以节省计算时间。
2.2 卷积层
卷积层是CNN的核心部分,主要起到特征提取的作用。卷积层包括卷积和非线性两个操作继而生成几个特征图。每个特征图是某些区域中输入风机属性图像的特定特征表示,卷积运算可以通过(2.1)表示。
(2.1)
其中,*代表卷积操作;是输出的第个特征图;是可训练的卷积核(也称过滤器);是第个输入。卷积运算用权值共享和稀疏连接这两个重要概念来提高网络的性能。
2.3 池化层
除了卷积操作之外,CNN的另一个重要操作是池化操作。该操作可以显着减少特征图的大小。最大池化操作和平均池化操作是两种常见的池化操作。首先将输入分成几个具有相同大小的非重叠矩形区域,最大池化操作得到矩形区域内的最大值。平均池化操作得到矩形区域内的平均值。
2.4 全连接层
经过两次卷积和池化操作,特征图显著变小,将特征图进行全连接转换为1-D矢量并馈送到全连接层。通常,全连接层由三个完全连接的层组成,本文采用的全连接层是一个包含三层的传统神经网络。
2.5 分类层
在本文中,分类层采用的激活函数为S型功能函数,这对于风机有无异常这个二分类问题是足够的,其中输出0代表风机异常,1代表风机正常,采用准则(2.2)判定风机状态,分类的准确率根据式(2.3)、(2.4)、(2.5)统计。
(2.2)
其中Y代表輸出的状态量。
(2.3)
(2.4)
(2.5)
其中,表示风机处于异常状态下分类的准确率,(true abnormal)是其正确分类的统计,(false abnormal)是其错误分类的统计;统计风机处于健康状态下的准确率,(true health)是其正确分类的统计,(false health)是其错误分类的统计;是综合的准确率。
本文的CNN模型结构图如图1所示。
2.6 总体模型结构
CNN的行输入是每个类别降维后的属性之和即X,列输入为采样点。输入数据均在标准化层归一化为许多大小为(X×X)的相同尺寸的图片作为模型的输入,每个输入图片代表风机(X×n)min内的属性特征,其中n代表采样间隔。首先,第一个卷积层卷积个大小为b×b的内核,且×b,表示输出特征图的数量,输出特征图的大小为(x-b+1)×(x-b+1)使用带有2×2的滤波器和步幅为2的最大池化层进行跟踪,使得该层输出个大小为的特征图;然后,第二个卷积层用c个大小为d×d的内核卷积上一层的结果,该层将输出c个尺寸为 的特征图,且保持激活次数(特征图的数目乘以像素位数)从一层到下一层不减少的原则来选择内核的数量。第二个池化层与第一个具有相同的结构,它将生成c个分辨率为的特征图;最后将这些图转换成矢量馈送到由三层组成1-D的全连接层,通过分类层实现状态判断。
3 仿真及结果
3.1 卷积神经网络参数配置
总体模型中设置如表1所示。
3.2 第一类属性发生单项异常
训练样本为2万个大小为的风机属性图片,其中包含多种异常,测试样本为100个大小为的风机属性图片,其中只包含齿轮箱后轴承温度过热这一种异常。且用于训练和测试的样本均含有大量地因包括因工况造成数据变化异常的样本。
图2(a)(b)中前三行是第一类属性的色彩显示,显而易见健康状态下的风机第一类属性值颜色较浅,只有小范围的波动或者个别时间点的跳动,而图2(c)(d)处于异常状态下的风机,如红虚线所标识的地方颜色明显变深,并且时间连续,与图2(a)(b)显著不同,异常明显。
3.3 第六類属性发生多项异常
训练样本与3.1中用到的样本相同完全一致,测试样本为100个大小为的风机属性图片,其中只包含同一时刻发电机转速和齿轮箱转速都显著降低这两种异常。
图3中第16~18行是第六类属性的色彩显示,如图中红虚线所示。等同于图2(a)(b),第六类属性健康状态下的风机属性值颜色较浅,只有小范围的波动或者个别时间点的跳动,而图3(c)(d)处于异常状态下的风机属性值前两行颜色明显变深,图3(c)(d)对比图3(c)(d)异常颜色值变化更加剧烈,范围更加广,异常程度可以明显在图中呈现。
4 结语
基于CNN的风力发电机的异常识别,首先确定输入CNN模型的图片大小,其次设置模型各个卷积层、池化层的大小与数目,以确定我们的模型结构,然后通过实验验证CNN模型可识别异常;于传统的基于某一属性建模,只能发现单类属性异常的局限性,CNN模型的输入样本由完整的风机图像片段提供,其中包含全面的异常信息,可有效实现多类属性的异常识别。
参考文献
[1]梁颖,方瑞明.基于SCADA和支持向量回归的风电机组状态在线评估方法[J].电力系统自动化,2013,37(14):7-12.
[2]Chehouri A,Younes R. Review of performance optimization techniques applied to wind turbines[J].Appl Energy,2015,142:361-88.
[3]赵洪山,胡庆春,李志为.基于统计过程控制的风机齿轮箱故障预测[J].电力系统保护与控制,2012,40(13):67-73.
[4]Meik S, Ilmar F.Wind turbine condition monitoring based on SCADA data using normal behavior models[J].Applied Soft Computing,2014,447-460.
[5]谢平,杨玉昕.基于局部均值分解的滚动轴承故障诊断新方法[J].计量学报,2014,35(1):73-773.
[6]Maaten L, Hinton G. Journal of Machine Learning Research[J].2008,9: 2579-2605.
[7]LeCun Y, Ranzato M. Deep learning tutorial[C].Tutorials in International Conference on Machine Learning,2013,14:11-19.
[8]Convolutional Neural Network[Online].Available at https://en.wikipedia.org wiki/Convolutional_neural_network.2016,10:24-29.
[9]Wang X,Zhang W,Qiang J I. A Kernel PCA Shape Prior and Edge Based MRF Image Segmentation[J]. Chinese Journal of Electronics,2016,25(5):892-900.
[10]Chen Y,Jiang H,Li C,Jia X.Deep feature extraction and classification of hyperspectral images based on convolutional neural networks.IEEE Trans Geosci. Remote Sens,2016,10:6232-6251.