吴江波,周 强,蒋 辉,刘智英,夏侯智聪,张家乐,石浩然,朱明皓,姜文兵
(国家电投集团江西电力有限公司新能源发电分公司,江西 南昌 330096)
风力发电机组是在野外严酷的自然环境下自主运行的,天长日久可能会因为极端天气、工作疲劳、叶片破损或其他因素的影响而使其发生损坏或工作故障。而风机叶片是风力发电机组的关键部分,其造价较高也容易出现各种故障,若不及时发现并采取措施就会造成叶片出现较大裂纹影响工作甚至断裂脱落以至于造成更严重的事故。目前,许多风电场最常用的诊断方法是人工检查,这种方法受到背景噪声和操作人员经验的强烈影响。叶片故障自动监测技术急需发展。
许多学者在此方面投入了大量研究,一些诊断技术包括声发射(Acoustic Emission,AE)、振动分析、超声波检测图像识别和光纤传感等等都可以用于风机叶片的实时损伤检测。这些方法推动无损检测技术的进步,具有一定的使用价值和研究意义。然而,这些方法有些要求传感器安装在风机叶片上,改变叶片原有结构且传感器安装难度较大,有些需要停机检查,耽误风电场风机运行,影响经济效益。
基于上述讨论,本文提出一套远程实时在线非接触式风机叶片故障监测系统,重点研究在复杂背景噪声下风机叶片故障信息的特征提取和基于此特征的故障识别算法。结合风电场实录声学数据,得到了较为满意的结果,验证了此方法的可行性。
有故障的风机叶片在运行时会发出有规律的啸叫声,区别于风机叶片扫风的声音。经验丰富的风场工作人员可以通过听取风机运转时的声音来判断此风机是否健康。该系统由声音信号采集前端、光网络、数据处理中心及系统软件组成,能够实现叶片健康诊断,可以广泛应用于风力发电场。
声信号采集前端采集到的声音通过光网络发送到数据处理中心,在数据处理中心对声信号进行处理,通过特征提取得到特征向量后送入到支持向量机分类器中分类,同时在数据监控中心可以听取原始声信号,看到信号的特征图与分类结果,工作人员可以对给出的故障信号进行再一次确认。
传声器选型首先应满足频率响应范围20 Hz~20 kHz,灵敏度高,尽可能清晰的录制现场声信号。其次要能适应野外恶劣环境,承担长期的户外工作。考虑到风机设有转向系统,会根据风向调转风机叶片所对方位,本次设计中在风机周围以圆形均匀放置3个前端采集设备,可以更好的采集不同方向下风机叶片运转的声音。
图1 远程实时在线非接触式故障监测系统示意图
此设计基于倍频程和支持向量机原理来监测风电机组的健康状况,在风机发生故障时软件会发出警报。算法有两大主要部分:特征提取部分和故障识别部分。为了更好的提取训练数据的特征,首先将数据进行预处理后采用1/6倍频程对风机运行时风机叶片产生的声学信号中的特征进行提取与分析,然后采用经典的支持向量机理论对进行了特征提取的声音信号进行二分类(分为正常类与故障类)。
图2 算法总体流程图
平均来说,山地风场的风速大致在4~10 m/s之间,年平均风速为6 m/s。风速过低时,风机无法工作,所以风电机组叶片转动必然伴随着高风速,有较大的风噪。此外,采集到的声信号还包括自然界背景噪声,风机自身机械噪声等等。但从风场实录信号来看,相比于其它的噪声,风机叶片扫风带来的风噪对叶片故障声信号的影响最为严重,且风噪大多集中在低频段。而故障种类较多,其声信号的频谱从几十Hz到几十kHz均有分布,范围较为广泛,难以直接提取。因而预处理主要是采用巴特沃斯高通滤波器去除低频风噪,对音频数据做一个初步的去噪处理。
人耳可听的声频范围为20 Hz~20 kHz,且人耳对声信号的灵敏度与其频率并非线性关系,对低频信号较为敏感。我国在1982年出台的国家标准GB 3240-82《声学测量中的常用频率》中明确提出在一般声学测量中应采用以恒定百分比增量为频率间隔的等比频率,其中频率间隔可以选择倍频程或其分数。这也就是说,对声音信号进行分析时,不需要详细了解每一个频率点上的能量情况。为了更加方便地分析观察不同声信号特征,把全频带按照某种关系分为一系列无重叠冗余的子频带,将每个子频带内的声能量看做平均分布的,需要分析的是不同子频带上的声能量。通常采用相对恒定带宽比的方法来划分频带,这种方法划分出的频带称为倍频程频带。倍频程段表示特定频率范围内的整体能量水平。其计算步骤大致分为以下两步:
(1)划分频带
每一个子频带都有自己的上限截止频率、下限截止频率和中心频率,三者间关系如式(1)所示:
其中,n=1时称作一倍频程,n=1/6时则为1/6倍频程。根据不同分析的需求,n值可以做出相应的调整,但如果想进行高精度分析,那么n应该取较小值。
(2)计算子频带功率谱
得到每一个子频带内的功率谱后再转化为声压级。设为第j个频带的能量,f为声信号的频谱幅值,则功率谱的计算公式为:
然后,再转化为声压级,转化公式如下:
其中,Pref为参考声压,大气中通常取2×10-5Pa。
统计学习理论的支持向量机(Support Vector Machine,SVM)方法能使结构风险最小化,具有易于推广和训练样本需求少的特点,为解决非线性分类问题提供了新的方法。
设待分类的样本集合为{xi,yi}。其中xi为m维向量,是待分类数据的特征向量。yi是数据对应标签,yi∈{-1,+1}。引入非负松弛因子εi,将线性可分与不可分的情况一并考虑,当εi=0时表示为线性可分,其他情况则为线性不可分。分类超平面需满足ωxi+b=0,这样的超平面有许多,而我们需要找最优分类超平面,设其满足以下约束条件:
式中ω为权向量,b为偏置项。此时分类间隔ρ=2/║ω║,当分类间隔最大时等价于║ω║2最小。符合公式(4)约束条件且满足║ω║2/2最小的分类超平面称为最优分类面,确定最优超平面的向量叫做支持向量[23]。
支持向量机通常又称为基于核的方法,例如我们要学习的模型的数据(输入空间)在同等维度上的特征空间是难以线性可分的。这时候,考虑到可以将数据映射到高维的特征空间,可能会在高维的特征空间内找到一个能够划分数据的超平面(数学上可证明:如果输入空间维度有限,那么一定存在高维特征空间使样本可分)。因此,通过引入核函数,可以将原始非线性关系转换为高维特征空间中的线性关系。
我们给出线性可分的表达式:
在本次设计中我们选用高斯核,高斯核函数为:
其中σ为核函数带宽,是SVM训练时有重要影响的超参数。
那么映射后的表达式为:
采集江西风场100台风机的声音数据,其中有故障风机和正常风机。通过人工标注得到带标签的数据,将正常风机标注为0,异常风机标注为1。
现场声音采集系统(采集频率为44.1 kHz)将采集到的声音信号发送到数据中心,采用上限截止频率为22 kHz,下限截止频率为0.2 kHz巴特沃斯高通滤波器,去除低频风噪,对音频数据做一个初步的去噪处理。
特征提取选用1/6倍频程,处理之后。一段声音信号形成一个64维的频带能量特征向量。得到频带能量后,为了后续更好分类,将特征向量做归一化处理。
图3 信号预处理流程图
图4 正常风机不同时间频带能量分布图(T=10 s)
图5 故障风机不同时间频带能量分布图(T=10 s)
由图4、图5可以看出故障风机和正常风机声音在频带能量的分布上有一定差异,正常风机声音的频带能量主要分布在低频,异常风机声音的频带能量主要在高频处,较正常风机来说频带能量更大,且频带能量值在高频处存在明显凸起。
最后得到的频带能量文件写入txt文本文档中(前66列代表频带能量,倒数第二列代表声信号所属类别,最后一列为声信号文件名),方便读取后送至支持向量机进行模型训练与分类。
图6 正常风机特征能量文件
在本次试验中共读取了特征样本2 632个,其中有缺陷样本181个。按照7∶3的比例随机划分训练集和测试集,训练集占比70%。
选用网格搜寻法自动寻参确定支持向量机的超参数,由于本试验中缺陷样本相较于正常样本来说数量过少,所以网格搜寻法的搜寻标准设置为F1,F1分数可以更好地反映数据不平衡模型的训练效果,F1值越接近于1,则模型分类效果更好。从sklearn.model_selection库 中 调 用GridSearchCV(网格搜索法) 自动选择最优的c,gamma值。设定好以上参数,再选择高斯核做为核函数后正式开始SVM的训练验证过程。
图7 训练过程学习曲线
通过样本训练得到的学习曲线,可以看到随着样本数增多,测试集的分数不断上升,最后和训练集分数相差无几。
图8 测试集正确率
图8中的识别结果包括声音信号的预测标签和真实标签,这样可以更清楚看到分类正确和分类有误的样本。把测试集样本完成迭代后的预测分类结果进行统计并写入文档保存下来,方便查看预测情况。其中横坐标表示实际类别,纵坐标表示模型预测类别。最后,保存训练好的SVM模型。
本文提出了将风机叶片扫风的声信号经过倍频程提取频带能量特征并结合SVM进行正常和故障风机分类。在预处理过程中采用巴特沃斯滤波器去除主要的干扰成分风噪,并利用1/6倍频程得到频带能量信息组成的特征向量。之后,采用带高斯核的SVM对非线性特征信号进行二分类。最后,通过试验验证了此法的可行性,此设计可以实现远程实时在线风机状态的监测,有较大工业实用使用价值。