基于海量数据挖掘的光伏逆变器故障检测方法

2018-09-20 06:41:56丁明昌李春来李红涛甘嘉田张双庆
电气自动化 2018年3期
关键词:青海省电站样本

丁明昌, 李春来, 李红涛, 甘嘉田, 张双庆

(1.新能源与储能运行控制国家重点实验室(中国电力科学研究院有限公司),北京 100192;2.青海省光伏发电并网技术重点实验室(国网青海省电力公司电力科学研究院),青海 西宁 810000)

基金项目:国家科技支撑计划(2015BAA09B01),国网公司科技项目(NY71-16-027),青海省重点实验室建设专项(2015-Z-Y24),青海省电力公司科技项目(52280716000D),中国电科院青年基金项目(5242001600FG)

0 引 言

光伏逆变器是光伏直流电源和交流电源之间的纽带,其可靠性和稳定性直接影响光伏并网发电系统的运行状态[1]。光伏并网逆变器故障的诊断对于发电系统的稳定运行具有重要意义[2]。同时,由于光伏电站多处于偏远地区,占地面积大,运行环境恶劣,设备数量多,特别是随着电站运行年份增长,在电站25 年生命周期内,由于设计局限性、工程隐患、设备老化和环境影响等原因导致的故障越来越频繁,故障实时定位困难,运维工作难度增大。在现有人工运维模式下,故障很难及时被发现,进而可能影响设备寿命,发电量隐性损失增大,电站运维成本高[3]。因此,目前光伏电站设备,尤其是逆变器设备的诊断正在逐步远程化、数字化,通过在线诊断系统降低人工需求,提高诊断实时性[4]。

常见的自动诊断方法主要是针对几个特定的变量进行实时监测,并设置阈值,通过判断实际值是否超限来判断设备是否发生故障,如电池温度、输出功率。而该类方法存在两大挑战,一是阈值的自适应调节:光伏系统的物理特性会伴随气温、辐照度发生变化,诊断系统的阈值设定应伴随外界条件的变化进行有效的自我调节;二是采样数据的质量提升:要确保采样数据的精度,同时还要匹配不同部件的同步采样。

为避免上述问题对逆变器诊断带来的影响,本文引进大数据分析的方法进行故障诊断系统设计。该方法不为设备指定特定的物理量阈值,而是通过k近邻算法(knearest neighbor,kNN)在设备集群中寻找相似的设备,然后通过支持向量数据描述方法对设备性能进行比较,判断目标设备是否发生故障。

1 背景知识

1.1 支持向量数据描述

(1)

图1 支持向量数据描述

式中:a为球心;R为超球半径;C为给定的惩罚因子;ξ为误判损失。

问题可通过式(2)所示的Lagrangian式进行求解:

(2)

其中αi≥0,βi≥0为拉格朗日乘子。式(2)可化为如下对偶问题:

(3)

该问题可采用经典的二次规划(Quadratic Programming)常用方法进行求解,计算出a和R的取值。对于任意测试样本Z,若满足式(4),则该测试样本属于目标类别。

(4)

1.2 k近邻算法

dist(xt,x′)≤dist(xt,y)

(5)

(6)

通过上述方法,可为测试样本Xt在训练集中寻找最为相似的k个样本[7-8]。

2 基于KNN-SVDD的逆变器故障检测流程

本文首先采用KNN方法根据特定特征在全局数据中找到k个最相似样本,然后采用支持向量数据描述方法对该k个数据进行学习,做出能包含全部样本在内的最小超球,构建单分类器。

当测试样本落入所建超球范围内,则样本为正常类别,反之,样本异常,设备处于故障状态。其诊断流程如图2所示,可分4步实现:

Step 1.样本生成:大数据平台中记录了各台设备中各个参数的取值,本文对各设备的输出功率、输入功率、温度、生产厂家、型号、海拔和电站平均辐照度数据进行提取,构建出训练样本集X和测试样本集xt;

Step 2.相似样本选择:采用KNN方法寻找xt中最接近的k个样本(本文中取k=5),形成相似样本集X′;具体而言,根据式(6)计算训练样本集中所有样本点与xt的距离,取距离值最小的前5个样本构建相似样本集X′;

Step 3.构建SVDD单分类器:采用式(1)~式(3)对相似样本集X′进行学习,构建出超球Ω=(a,R),其中a为超球球心,R为超球半径;

Step 4.测试:计算测试样本与超球球心之间的距离,若距离大于半径,则测试样本不落于超球内,测试样本对应设备处于故障状态;反之,设备正常。

图2 基于KNN-SVDD的光伏逆变器故障检测流程

3 试验验证

试验数据来源于光伏电站的实时运行参数,表1为青海省某电站9月26日上午11点16分的部分逆变器实时数据。在电站数据中,632 523 512号逆变器被人为设置开路故障,数据大多为0。

表1 逆变器实时运行数据

同时,为进一步验证诊断系统在逆变器发生缓变故障时的诊断性能,试验中对632523505数据进行修改,将其输出功率降为80 kW,模拟其转换效率因未知原因显著下降。

试验采用KNN方法分别寻找测试样本632523512和测试样本632523505的最相似样本。同时采用主元分析法(Principal Component Analysis,PCA)对数据进行降维,用于二维可视化。图3为全部样本集降纬后的两个主元(即最重要因素和次重要因素,无物理量纲)分布示意图,测试样本所对应的最相似样本用直线进行连接。采用SVDD方法分别对两组最相似样本集进行单分类器学习,构建最小超球,得到如图3中圆形1和圆形2的分类超平面。测试样本632523512和632523505均处于最小超球外部,故而均发生故障。同时,632523512极度远离球心,故而故障程度较为严重。而632523505仅越出超球一小部分距离,故而故障程度较小。算法分析结果与实际完全吻合。

图3 KNN-SVDD诊断示意图

此外,试验同时采用青海省另一电站的实时数据进行故障诊断性能测试,该电站中逆变器与上述电站的区别在于采用了组串式逆变器。该电站9月27日9点30分的部分运行数据如表2所示。

表2 逆变器部分实时运行数据(组串式逆变器)

在表2中,输入功率均小于输出功率,该现象不符合正常物理规律,常规基于机理的故障诊断方法无法进行有效判断,或会将该类样本均判为故障。而基于大数据平台进行分析,可得到如图4空间分布,采用所提KNN-SVDD方法对样本进行逐个分析,判断该电站无逆变器故障,与实际情形相符。

图4 电站2中逆变器数据分布示意图

4 结束语

逆变器为光伏发电的关键环节之一,对其进行有效诊断具有重要意义。本文基于大数据平台提出了一种远程实时智能诊断算法。该方法首先采用k近邻方法寻找训练样本集中与待测样本最接近的5个样本,然后采用支持向量数据描述方法对该5个样本进行学习,给出分类超平面,判断待测样本与该5个样本是否属于同一类,进而通过样本的一致性判断待测样本是否异常,检测其对应的逆变器是否故障。所提方法均采用青海省光伏电站实际运行数据进行试验验证,在试验中,不仅能够有效识别出故障样本,而且在部分试验中有效避免了传感器采样不精准带来的误判,诊断性能优良。

猜你喜欢
青海省电站样本
三峡电站再创新高
用样本估计总体复习点拨
低影响开发(LID)在光伏电站中的应用
推动医改的“直销样本”
落实“四个扎扎实实”展现开行使命担当——国家开发银行青海省分行
青海政报(2017年20期)2017-03-16 02:38:19
随机微分方程的样本Lyapunov二次型估计
青海省交通运输行业数据中心节能探索
青海省人民政府办公厅关于转发省科协青海省自然科学优犁匆圈独砰审和勤加祛的通知
青海政报(2016年21期)2016-02-28 12:26:23
青海省人民政府关于第二届青海省质量奖的授奖决定
青海政报(2016年21期)2016-02-28 12:26:21
村企共赢的样本