基于数据挖掘风力发电设备故障远程诊断研究

2013-01-04 04:01南车株洲电力机车研究所有限公司风电事业部湖南株洲412001
风能 2013年7期
关键词:项集数据挖掘风电

(南车株洲电力机车研究所有限公司风电事业部,湖南 株洲 412001)

(南车株洲电力机车研究所有限公司风电事业部,湖南 株洲 412001)

为保证维护风电场大型风电机组安全、可靠、经济和优化运行,本文提出了一个基于数据挖掘技术的风电机组在线状态监测与故障远程诊断系统。介绍了数据挖掘故障诊断系统的硬件、软件体系结构、网络技术及特点,举实例说明应用的实用性和有效性。

风电机组;数据挖掘;故障远程诊断研究

0 引言

随着能源危机和环境污染问题的日益严重,世界各国争相发展可再生新兴能源,我国长期规划明确支持“研究开发大型风力发电设备”,风电装备由此得到了迅猛发展。在风电迅猛发展的同时,风电机组高额的运行维护成本影响了风场的经济效益。风场一般地处偏远、环境恶劣,并且机舱位于70m至90 m 以上的高空,给机组的维护维修工作造成了困难,增加了机组的运行维护成本。对于工作寿命为20 年的机组,运行维护成本估计占到风场收入的10%-15%;对于海上风场,用于风电机组运行维护的成本高达风场收入的20%-25%。高额的运行维护费用增加了风场的运营成本,降低了风电的经济效益。但随着投产的风电机组数量和容量的不断增加,风电机组的运行维护、故障检测、诊断技术的优化和改进已成为风力发电亟待解决的新课题。长期以来,风电机组一直采用计划维修与事后维修方式,计划维修即运行2500h和5000h 后的例行维护,如检查螺栓力矩,加注润滑脂等。该维修体制往往无法全面、及时地了解设备运行状况。而事后维修则因事前准备不足,从而造成维修工作持久,损失重大。并且由于近年来大型风电机组研究的快速发展,其机械结构日趋复杂,不同部件之间的相互联系、耦合也更加紧密,一个部件出现故障,将可能导致整个发电过程中断。因此,有必要对风电机组的运行状态进行检测跟踪,对其故障征兆进行分析处理,预测分析风电机组的故障趋势,减少事故发生造成的财产损失,也减少强迫停机的次数,降低发电机的维护费和提高发电机的可用性,指导风电机组的维护与维修[1]。

据有色金属报网报道,近日,从世界黄金协会获悉,该机构首次向用户推出市场权威的黄金数据、洞察和分析工具平台——GOLDHUB。该平台旨在帮助专业投资者更好地理解和体验黄金作为战略资产的价值。

1 研究背景

国外监测和故障诊断技术发展早而且比较成熟,有专门用于风电机组的监测设备,国内由于风电机组行业本身起步较晚,在线监测与故障诊断技术在国内风电机组上的运用还处于起步状态。目前,大型风电机组的就地控制器都有运行数据采集、故障报警和通信功能,配合风电场中央监控系统,可以实现风电场机群的集中监控,甚至异地监控。但中央监控系统信息量的采集十分有限,一般只采集功率、转速、电流、风速等参数,无振动量采集,造成故障预警功能欠缺。比如,当中央监控系统报“传动比错误”时,可能齿轮箱或发电机已经严重损坏或卡死[2]。

鉴于风电场独特的环境,以风电机组安全经济运行出发,以风电场风电机组为研究对象,利用小波多分辨率分析技术,对风电机组的振动和噪声信号进行处理,提取故障特征,实现风电机组早期显现故障的有效监测与识别。由于风电机组状态监测与故障诊断过程中产生的大规模数据信息(包括统计数据、试验数据) 可方便地被收集和存储在各种数据库中,具备了事务数据库特点和数据挖掘的基本要求,若采用传统的数据分析方法,对这些巨量的数据进行分析,不仅费时且难以有效地挖掘出隐含的知识;另一方面,尽管专家系统和智能诊断等方法在故障诊断中得到广泛应用,但专家系统的知识瓶颈和智能诊断方法所带来的推理过程困难等问题仍未得到很好地解决,将数据库、数据挖掘应用在风电机组故障诊断的基本思路,就是利用数据挖掘技术得到产生故障的特征数据、故障规则等,对故障进行检测和诊断,其诊断过程就是模式获取及模式匹配的过程,数据挖掘却可以有效地解决这些问题,将数据挖掘技术应用于故障诊断中是必然的也是可行的。因此,提出了以数据库、数据挖掘技术和网络技术为支撑的风电机组在线故障诊断方案,实现了风电机组故障诊断的网络化、信息化[3]。

where k is the fault joint label.Eq.(3)is subjected to singularvalue decomposition as

2 数据挖掘技术在故障诊断中的应用

课堂上,自学与合作不是并列关系,而是先后关系,每一部分的知识都要提倡自学,学生自学不会的可以通过小组合作来解决,小组合作不会的通过全班研讨来解决,大家都不会的才由教师来点拨。教师要退到最后一步,本着“先学后教、以学定教”的原则,只讲学生不会、不对的。这样,教师就会知道课堂上应该讲什么,讲多长时间。

3 远程故障诊断过程决策模型

风电机组远程在线诊断的主要内容是从大量的风电机组运行监测信息中发现潜在的规律,提取有用的知识,智能地判断当前风电机组运行状态,发现隐含的或已经存在的故障。数据挖掘是一个需要经过反复多次处理的过程,它可利用不断充实的诊断知识库和恰当的算法逐步挖掘真实的故障机理及诊断规则。其实现过程为:首先将原始数据整理为与挖掘主题相关的信息;然后根据挖掘主题以及各种学习算法的特点设计数据挖掘算法,并对指定数据集进行知识的提取。通过对挖掘结果进行一致性、合理性检查,与预期目标进行对比。如果结果与预期目标偏差较大,返回算法设计阶段,调整或重新设计挖掘算法;如果偏差较小,返回算法设计阶段,对挖掘算法进行调整;如果结果理想,返回数据阶段,扩大数据集,重新开始一次挖掘过程。重复上述步骤,直至达到最终目标。数据挖掘模型处理过程如图5所示。

在数据准备阶段,随时序变化的故障信息,采用时间分割法,把时序变量转化为实数变量进行考察。具体做法是:把t。到t 时刻的时间间隔T等分为N个At(At=T/N)时间间隔,T时间内的连续变量用t0=ta ,t1=ta + At,t2=ta+2At,……,tn=ta+ Nat,t6时刻的值来表征,在构建故障诊断模型时,要考虑这些值之间在时间上的先后序列关系。根据故障信息内在相互关联的特点,从诊断信息中抽取样本数据,采用关联规则挖掘有价值的知识,描述如下:规则项集I= ( i1,i2,i3,……im )是由m个不同故障规则组成的集合,故障事务x是I的一个子集,即TI,D是S的集合。设X 是I 的一个子集,如果XS,称故障事务S包含X。关联规则具有如下形式:XY,其中,XI,YI,且X∩Y=, X为条件,Y为结果[6]。

4 系统硬件结构

综上所述,可以认定裂缝产生的主要原因之一应为行车荷载,包括超限重载车、车流量过大、荷载的持续时间过长等。

风电机组故障诊断数据挖掘系统结构如图4所示。其中知识库是基于征兆事实库、传统专家经验诊断规则和数据挖掘诊断规则的混合系统,各诊断机制充分发挥各自的优点,征兆事实库用于存放经过数据库处理并提取的系统推理所需要的征兆事实。知识库的维护包括扩展、修改和删除3 种操作。授权用户可通过HTML 输入风电机组诊断信息,信息处理与诊断推理模块利用知识库中的知识,根据故障信息诊断设备故障,最后利用知识库对所有诊断方法得到的结果综合决策,判断具体的故障类型,并将诊断结论和维护参考信息在远端客户浏览器上显示。结论解释模块为用户提供诊断推理过程和结论的解释,同时将故障实例经过知识提取存放知识库中。知识库采用传统经验、专家经验、粗糙集知识及关联规则等数据挖掘方法来获取诊断知识。关联规则挖掘从特征数据中挖掘出特征变量间隐含的因果或关联关系,可用于故障趋势预测,基于粗糙集方法的规则挖掘可适用于离散型及连续型特征数据,它先约简知识,再根据知识约简挖掘规则[5]。

数据仓库是支持决策过程的、面向主题的、集成的、随时间变化的、持久的数据集合。系统中把故障类型、设备类型、设备使用状况作为数据仓库的主题,形成面向一个个特定主题的小规模的数据仓库,即数据集市。从数据挖掘的角度看,数据仓库是数据挖掘实施的平台。数据挖掘是一种分析和决策手段,主要根据人工智能、机器学习、统计学的原理,以数据仓库或数据集市为基础,分析和挖掘历史数据,找出隐藏在这些数据内的关系模式,反映数据的内在特性,对数据所包含的信息做更高层次的抽象。数据挖掘过程分为以下阶段:数据准备、数据选择、预处理、数据缩减、目标确定、算法确定、数据挖掘、模式识别和知识评价,前四个阶段完成数据仓库,为知识发现做准备;后五个阶段挖掘有用的知识。数据仓库和数据挖掘有着密不可分的联系。一个典型的数据仓库主要有数据导入、数据仓库和数据集市、访问工具。数据仓库和数据挖掘技术在远程监测和故障诊断领域的应用,大大提高了数据分析的效率和深度,为智能化故障诊断,特别是故障预测提供了有力的手段,从而使设备享有远程专家级的诊断[4]。

本地数据库服务器将诊断下位机数据采集站上传的数据写入数据库中,备份风电机组的故障征兆信息;同时,为诊断中心的WEB 应用服务器和推理诊断服务器提供数据支撑,诊断服务器通过使用监测分析软件和故障诊断软件提取本地数据库服务器数据,对机组故障进行诊断,并将结果返回给现场用户。若故障类型比较复杂,本地中心还可以向远程诊断中心求助,专家可远程通过互联网登录到WEB,应用服务器使用自己的知识进行诊断,将结果返回诊断中心,并由诊断中心反馈给现场用户,指导现场运行。在诊断服务器根据征兆信息进行诊断推理,得到推理结果以后,将信息传给WEB服务器,并组成诊断结果HTML页面,供授权用户进行访问。同时,作为局域网WEB 服务器,直接面向风电厂局域网,使局域网内用户通过WEB 浏览器监测机组的振动及相关状态量变化情况。远程故障诊断中心各服务器功能类同本地诊断中心服务器,在远程故障诊断中心,数据库服务器里面存放着不同风电场的不同型号的风电机组运行数据,由此实现风电机组运行参数共享。推理机可以将这些共享的数据进行诊断推理分析,使每个风电机组都可以享受到专家级诊断,从而提高诊断效率,减少误判率。若本地诊断中心出现不能解决的故障推理问题,还可以通过Internet 向远程故障诊断中心求助。

图1 过程决策模型示意图

图2 风电机组智能故障诊断系统原理图

5 软件设计

5.1 平台数据挖掘结构

下位机系统结构如图3所示,利用各种传感器将风电机组状态参数进行提取,利用数据采集模块进行放大、滤波、补偿和A/D 转换等处理以后,通过小波分析、Fourier 变换等信号分析等技术处理,根据信号的特征由下位机对风电机组初步故障进行诊断。并将风电机组运行参数上传至本地诊断中心,供上位机分析处理。

从大量的设备监测信息中发现潜在的规律,提取有用的知识,智能地判断机器当前运行状态,发现隐含的或已经存在的故障,是远程故障诊断的主要内容。它是一个基于现有知识的决策过程,远程故障诊断决策模型可以描述为RDDM={M,K,D,E,P)。其中,诊断技术方法集合为M,诊断所需的知识集合为K,设备原始信息数据集合为D,实验设施为E,专家知识的集合为P,设C为诊断效益,L为故障所造成的损失,则诊断决策的目标为:

5.2 关联规则挖掘风电机组故障知识的算法

RDDM 的目标是合理地配置M,K,D,E,P 等资源,以获得最大的诊断效益或使故障的损失最小。数据挖掘技术利用不断完善的诊断知识、技术方法逐步挖掘接近真实的故障原因和诊断方法,这是一个多次反复的过程。首先根据挖掘目标收集、整理与决策有关的有用信息和知识,建立模型,分析对决策有影响的关键因素,归纳、提炼出有关的满足系统约束的控制规则。在此基础上针对学习算法的特点设计挖掘算法的详细步骤,进行数据挖掘,并对挖掘结果进行合理性、一致性检查。通过评价体系与预期目标进行比较,若结果与预期目标偏差较大,重新优化系统模型,调整或重新设计算法,重复上述步骤,直至达到最终目标。过程决策模型如图1所示。

规则项集A 的支持度是D 中包含A 的故障事务数量与D 的总故障事务数量之比。置信度是在规则的先决条件发生的前提下,规则结果发生的条件概率,求解关联规则,可以分解成两个子问题:(1)找出D 中所有大于最小支持度的事件子集X,XS,即“频繁”出现的事件子集一频繁项集。本文采用了基于频集理论的递推方法,即Apriori算法。Apriori使用一种称作逐层搜索的迭代方法,K项集用于探索(K+1)项集。首先,找出频繁1项集的集合。该集合记作L1 。L1 用于找频繁2项集的集合L2 ,而L2用于找L3,如此下去,直到不能找到频繁K项集。每次找LK 需要一次数据库扫描。(2)从“频繁”出现的事件子集中找出关联规则。一旦由数据库中的事务找出频繁项集,由此产生关联规则。关联规则满足最小支持度和最小置信度,其置信度如下:con fi dence(AB)=support(AUB)/supprot(A)。其中,support(AUB)是包含项集AUB的支持度,support(A)是包含项集A的支持度。根据该公式,关联规则产生如下:① 对于每个频繁项集z,产生z的所有非空子集;② 对于z的每个非空子集S,如果support(z)/supprot(s)≥ min-conf,则输出规则“S(L-s)”。其中,min-conf是最小置信度阈值[7]。在远程故障诊断系统中,该算法用于发现故障信息间内在的联系,挖掘风电机组设备故障的产生原因(知识),对风电机组设备运行状况进行预报。以南车1.65MW级风电设备的运行为例,采集故障信号,该算法基于如表1所示故障事务数据库,其中故障事务中的项按顺序存放[7]。

图3 风电机组故障诊断系统框图

图4 风电机组故障诊断数据挖掘系统结构图

图5 数据挖掘模型处理过程图

图6 风电机组远程监测诊断系统的软件体系

其中I1—I5表示从故障事务中抽取出的几个不同的项,I1主机过电流停机,I2主机风电机组故障,I3主机调速器故障,I4主机急停,I5主机通讯故障。在寻找频繁项集的过程中,取最小支持度为0.22。算法的第一次迭代扫描数据库中的所有事务,统计每个项的出现次数,确定满足最小支持度的频繁1项集L1 集合,算法使用L1 产生候选2项集的集合C2 ,C2 由(I L1 I/2)个2项集组成,计算C2 中每个候选项集的支持度,确定频繁2项集的集合L2 。根据Apriori的逐层搜索技术,直到产生的候选项集为空,算法结束。找到满足最小支持度的所有频繁项集,然后调用一个过程,由频繁项集产生关联规则。本系统中取最小置信度0.7以基于以上事务数据库产生的频繁项集L={I1,I2,I5}为例,由L产生关联规则,L的非空子集有{I1,I2},{I1,I5},{I2,I5},{I1},{I2}和{I5}。实验结果如表2所示。

风电机组智能故障诊断系统总体结构如图2所示,系统由现场的下位机、本地故障诊断中心和远程故障诊断中心组成。现场下位机由用于风电机组状态参数提取的诊断下位机和其他数据采集工作站组成;本地、远程诊断中心均由数据库服务器、WEB 服务器和推理诊断服务器组成。

表2中第2、3、6条规则的置信度大于预先给定最小置信度阈值,对满足条件规则进行基于知识的模糊评价,对达到精确度要求,从数据集市中删除样本数据,规则存人知识库,样本数据蕴涵的知识,在智能诊断中用规则表达。新的数据集作为训练样本集,构造诊断神经网络模型,经测试,凡诊断结果误差小于给定阈值的数据样本从数据集中删除,数据隐含的知识由该诊断模型表达。领域专家对剩余数据进行去噪、检验后存放到实例库中,用于基于实例的故障诊断。

5.3 系统软件体系结构

风电机组远程监测诊断软件系统采用浏览器/ 服务器(B/S)模式,如图6所示,这种模式是一种3 层的结构,它们分别是表示层、功能层和数据层。表示层是应用系统的用户接口,即客户浏览器;功能层是应用的主体,即推理服务器和WEB 应用服务器,其主要功能是连接用户和数据库,当用户提出请求时,由它执行相应的应用程序与数据库进行连接,并按照用户需求向数据库提出数据处理申请, 最后将数据以HTML 的形式返回给客户浏览器;数据层就是数据库管理系统,负责处理数据的存取[8]。

线粒体自噬机制、相关疾病及中药对其调节作用的研究进展 ……………………………………………… 李凤娇等(20):2865

软件系统采用现场运行实时分析系统和远程诊断系统相结合的形式。现场运行分析系统位于电场本地服务器上,只允许场内授权用户访问。直接面向运行人员、生产管理人员,系统实时监测机组的振动数据及相关的运行参数,并对振动数据进行波形、频谱等分析处理。远程监测诊断系统运行于监测诊断应用服务器上,面向互联网授权用户。它具有远程监测、历史查询、故障诊断和数据管理等功能。当用户经过授权后,通过网页浏览器登录到服务器,可以对机组的运行状态进行远程监测,也可以查看机组的历史状态和趋势。当发现机组异常时,启动基于数据挖掘的故障诊断软件,结合专家的知识对机组进行诊断并将诊断结果反馈给现场。

表1 故障事务数据库(部分)

表2 实验结果表

6 结语

本系统将数据库技术和数据挖掘技术引入风电机组故障诊断领域,可有效地解决专家系统的知识瓶颈和智能诊断方法所带来的推理过程困难问题,使生产现场大规模“数据资料”得到有效利用。系统面向领域专家和专业工程师。除了在线实时监测之外,更强调网络化、数据完备性和具有高水平的分析与诊断功能。且系统采用B/S 三层开放模式,于软件复用技术的编程模式,使该系统具有良好的集成性和安全性。远程技术服务与故障诊断系统是其重要内容之一。制造业的全球化发展,必将对设备的远程监测与故障诊断提出更高的要求。对推动我国远程监测、预报、故障诊断技术的发展,具有一定的参考价值。

[1]贺娇. 风能资源详查将推动产业发展[N].中国能源报,2010-02-01(15).

[2]王哲.关于风电机组组组状态监测的思考[J].中国设备程,2007,23(4):43-44.

[3]李俊峰,高虎,王仲颖,等. 2008 年中国风电发展报告[R].北京:中国环境科学出版社,2008.

[4]时轶,崔新维,李春兰,等.在线监测系统在风电机组组上的应用[J].风机技术,2007(4):74- 76.

[5]YANG Jie,YE Chenzhou.Data mining used in modeling,opti—mization and fault diagnosis[J].Computer Integrated Manu—facturing Systems CIMS,2000,6(5):72-76.

[6] 邓亮.基于关联规则的数据挖掘技术在火电厂运行优化中的应用[D].华北电力大学硕士论文,2006.

[7]郭庆琳, 郑玲. 基于粗糙集数据挖掘的汽轮机故障预报及诊断研究[J].现代电力,2006.23(3): 64- 69.

[8]张积坚. 基于B/S模式的风电机组组远程状态监测系统研究与开发[D] .大连理工大学. 硕士论文, 2009.

基于数据挖掘风力发电设备故障远程诊断研究

叶盛,李龙,胡旭馗

Remote Diagnosis Research of Wind Power Generation Equipment Faults Based on Data Mining

Ye Sheng, Li Long, Hu Xukui
(CSR Zhuzhou Electric Locomotive Research Institute Co., Ltd., Wind Power Business Unit, Zhuzhou, Hunan 412001, China)

In order to maintain the security, reliability, economy and optimal operation of the large-scale wind turbine, this paper proposed a condition monitoring and fault remote diagnostic system based on data mining technology. It also introduced the hardware of Data mining fault diagnosis system, software architecture, network technology and features practical examples . Meanwhile, it explained the practicality and eff ectiveness of the application.

wind turbine; data mining; remote fault diagnosis research

TM614

A

1674-9219(2013)07-0076-07

2013-04-23。

叶盛(1975-),男,硕士,工程师,主要从事风电设备管理与维修工作。

猜你喜欢
项集数据挖掘风电
探讨人工智能与数据挖掘发展趋势
海上风电跃进隐忧
分散式风电破“局”
风电:弃风限电明显改善 海上风电如火如荼
基于并行计算的大数据挖掘在电网中的应用
重齿风电
一种基于Hadoop的大数据挖掘云服务及应用
一种频繁核心项集的快速挖掘算法
基于GPGPU的离散数据挖掘研究
一种新的改进Apriori算法*