一种基于3σ准则与FCM算法相结合的光伏电站直流侧故障定位方法

2019-04-15 11:03于航刘阳王海政胡阳朱红路
太阳能 2019年2期
关键词:汇流支路电站

■ 于航 刘阳 王海政 胡阳 朱红路*

(1.龙源(北京)太阳能技术有限公司;2.华北电力大学可再生能源学院;3.华北电力大学控制与计算机工程学院)

0 引言

近年来,随着太阳电池生产技术的提高和成本的降低,国内的光伏产业发展迅速,光伏电站装机容量不断增长。但是由于光伏组件长期在环境相对恶劣的户外运行,经常会出现各种故障问题,若不能及时排除故障,电站受其影响运行效率将会大幅降低[1],因此,实时监控光伏阵列的运行状态,并及时发现故障、定位故障对光伏电站的安全运行十分重要。光伏发电功率密度低的特点导致光伏电站占地面积大、发电单元数量庞大且电站结构配置复杂,因此,光伏电站运行过程中产生的数据量庞大,如何从海量的运行数据中快速发现光伏电站运行过程中的故障,就成为光伏电站故障诊断中亟待解决的问题。

目前,光伏电站的故障检测受到了国内外学者的广泛关注[2]。文献[3-4]提出,正常工作状态与故障状态的光伏组件之间存在温差,因此,可利用其红外图像的差异检测出故障组件。但该方法检测精度低、设备成本高、实时性差,难以运用到实际光伏系统中。通过在光伏阵列布置大量传感设备,以对传感设备的电信号进行分析来定位故障组件是一种有效的途径[5]。但是此方法中光伏系统的安装过程复杂,对于大型光伏电站而言,所需要的传感器数量庞大,大幅增加了系统成本。文献[6]利用功率、电压和填充因子这3个指标对组件故障进行在线诊断。文献[7]也提出了以实测的直流侧电流、电压、功率值与模型得到的理论值之间的差值作为故障诊断依据。虽然该类方法可以通过偏差分析确定故障的发生,但是阈值设置不客观;同时电站性能退化等因素也会使阈值需要频繁校正。还有学者利用BP神经网络及粒子群算法等智能算法对光伏系统进行故障诊断[8-9],但该类方法故障诊断模型需要故障样本训练,存在故障样本获取困难及模型泛化能力差的缺点。

针对光伏电站故障组串定位困难、故障诊断过程成本高、故障误判率高的问题,本文提出了一种基于3σ准则与FCM算法相结合的光伏电站直流侧故障诊断方法。首先,根据光伏电站组串电流信号的统计特性,基于3σ准则对组串的电流信号进行统计分析,计算各个组串的故障因子;其次,采用FCM算法对同一逆变器范围内不同组串的故障因子进行聚类;最后,根据聚类结果的差分序列的分布尖峰来定位故障组串。

1 光伏电站运行数据特性分析

本文使用的数据样本采集于华东平原地区的某40MW光伏发电系统。该光伏系统包括74台逆变器和553个汇流箱,每个汇流箱包含16个光伏组串,每个组串由16块光伏组件串联组成。由数据采集与监视控制(SCADA)系统对组串的电流数据进行采集,但是组串运行数据受天气、逆变器最大功率跟踪效果及组串的实际性能等因素的影响波动剧烈,海量数据的并发及噪声的干扰给光伏电站性能分析和故障诊断带来极大难度。

对光伏电站组串、汇流箱、逆变器3个层级的运行数据进行比较,每个层级随机选取了3个组串在5天内的电流数据。图1a为同一汇流箱的3个不同组串的电流数据,图1b为同一逆变器但是属于不同汇流箱的3个不同组串的电流数据,图1c为不同逆变器的3个组串的电流数据。

图1 电站不同层级的3条支路电流数据

由图1可知,不管是从同一汇流箱还是不同汇流箱,亦或是不同逆变器的层级,组串的电流数据相似度都很高。其中,汇流箱层级组串间的数据重合度最高,逆变器层级、电站层级组串间的数据重合度依次降低,但是数据间仍有很高的相似度。此外,由于组串间的数据相似度较高,一些正常组串的电流数据与故障组串的十分相近,无明显差异特征,故障辨识困难;即便出现了细微的差异也难以确定组串是否发生故障。光伏电站不同组串之间的出力紧密耦合,外部因素导致的光伏出力的波动会带来基于偏差分析的故障诊断算法的误判[7]。而这些误判多由短暂的局部阴影、天气波动等可恢复故障造成,但频繁的误判会掩盖组件的短路、开路、持续的阴影遮挡等不可恢复故障的判断。

为说明常规偏差分析带来的误判现象,从某一汇流箱中随机选取2天的组串电流数据(其中包含1个故障组串)进行分析,如图2所示。

图2 对同一汇流箱的不同组串进行故障辨识

从图2可以看出,基于偏差分析的故障诊断方法出现了2个误判周期。出现故障的组串在这2天中出现了持续的组串电流过低,表现为不可恢复的故障;而误判组串只是在2个时间段出现了电流低于正常组串的情况,除此之外的电流数据都保持在正常范围内,属于可自行恢复的故障。

2 算法的提出

为实现光伏电站的故障快速定位并避免误判现象的发生,本文首先基于3σ准则对组串的电流分布特性进行分析,进而利用FCM算法实现光伏电站直流侧的故障定位。

2.1 3σ准则

假设数据样本符合正态或近似正态分布,并且这组数据只含有随机误差,对其进行计算后得到样本均值与标准偏差σ,进而得出概率区间(-3σ,+3σ),超过这个区间的数据为异常数据[10]。3σ准则可表示为:

式中,Xi为第i个数据样本;n为数据样本个数。

当光伏电站中的组串处于正常运行状态时,该组串与同一汇流箱的其他正常组串数据特征基本一致。此时,组串每个时刻的运行数据基本都在3σ的概率区间内;当组串发生故障时,故障组串与同一汇流箱中的正常组串的运行状态相比会出现较大差异,运行数据超出3σ的概率区间。因此,可对同一汇流箱各组串的电流数据进行数学统计,并将其利用故障因子这个指标进行量化[11],组串的故障因子越大则该组串发生故障的可能性就越大。

2.2 FCM算法

FCM算法作为无监督机器学习的主要技术之一,是用模糊理论对重要数据分析和建模的方法。它通过优化目标函数得到每个样本点对所有类中心的隶属度,决定样本点的类属,以达到自动对样本数据进行分类的目的,能较为客观地反映数据的分布特征[12]。

FCM算法将n个向量xi(i=1,2,…,n)分为c个模糊组,求出每组的聚类中心,使得非相似性指标的价值函数达到最小。FCM算法采用模糊划分,根据每个给定数据点值在[0,1]间的隶属度来确定其属于各个组的程度。与引入模糊划分相适应,隶属矩阵U允许有取值在[0,1]间的元素。不过,加上归一化规定,一个数据集的隶属度ui,j的总和等于1[13]。

式中,ui,j∈[0,1]。

FCM算法的目标函数为:

式中,J是FCM的目标函数;ci为模糊组I的聚类中心;di,j=||ci-Xj||为第I个聚类中心与第j个数据点间的欧几里德距离;m为一个加权指数,m∈[1,∞)。

构造如下新的目标函数,可求得使式(5)达到最小值的必要条件:

式中,λi为式中n个约束式的拉格朗日乘子。对所有输入参量求导,使式(5)达到最小的必要条件为:

式中,dk,j=||ck-Xj||为第K个聚类中心与第j个数据点间的欧几里德距离。

由上述两个必要条件可知,FCM算法的运算过程是一个简单的迭代过程。

2.3 基于3σ准则和FCM算法的光伏故障定位方法

本文提出的故障诊断方法流程如图3所示。

图3 故障诊断流程图

2.3.1 统计特性分析及故障因子的提取

首先对采集到的组串电流数据进行筛选和平滑滤波等数据预处理。

基于3σ准则,正常组串间的数据特征基本一致,组串的运行数据落在3σ的概率区间内;而故障组串的运行数据则落在3σ的概率区间外。

式中,Ii,j为组串j在i时刻的电流数据;Ij为j时刻各组串的电流平均值。

对各组串一段时间的电流数据进行数学统计,并利用故障因子对组串的故障程度进行量化表征:

式中,Kj为第j个组串的故障因子 ;M为该组串电流数据的个数;fi为表征组串电流状态的量。fi可表示为:

2.3.2 聚类过程与阈值的设定

得到各组串的故障因子后,可诊断出存在故障倾向的组串。为了确定故障组串的故障因子阈值,本文考虑了同一逆变器范围内所有组串的故障因子。故障组串的故障因子之间存在一定的相似性,而与正常组串之间存在差异性,据此利用FCM算法将所有故障因子(大于100个)划分为N个群集。

对得到的N个聚类中心进行二阶差分计算,进一步增强故障组串与正常组串的差异性,这时得到的差分曲线的第一个峰对应的值即故障组串的故障因子阈值。故障因子高于阈值的组串被诊断为故障组串。

式中,δ1为二阶差分曲线第一个尖锐峰处的故障因子;δ2为紧邻δ1左侧的故障因子。

3 实际算例分析

利用实际的光伏电站数据对本文方法进行验证。此处选取了一个包含有112个组串的逆变器数据,该逆变器共连接了7个汇流箱,每个汇流箱包含16个组串。根据电站的故障维修记录显示,该逆变器中的1#汇流箱的第1支路出现了组件破碎的故障,并于11月11日进行了组件更换,排除了故障。选取了10月24-26日的数据,作为待辨识的逆变器数据样本,并利用以上的数据筛选规则,对电站各组串的电流数据进行了预处理。

根据第一步的故障辨识,利用3σ准则对同一汇流箱的不同组串进行对比,计算出同一汇流箱的各组串故障因子:组串的故障因子值越大,出现故障的可能性越大。 图4为两个不同的逆变器中的32个组串的故障因子在3天(10月24-26日)内的值,并辨识出2个潜在的故障组串。

图4 两个不同汇流箱的32个支路的故障因子

之后根据以上的方法计算出了整个逆变器共112条组串的故障因子值。其中,5#汇流箱第9支路故障因子的值最高,为0.5667,其次为1#汇流箱第1支路;此外,故障因子较大的还有1#汇流箱第15支路。逆变器各支路故障因子值如表1所示。

根据第二层级的故障辨识,将第一步所得的所有组串故障因子值进行聚类,利用各聚类中心的二阶差分曲线的第一个尖锐峰的位置,该位置对应的故障因子值的大小即为故障因子的阈值。表2为故障因子二阶差分表。

表1 同一逆变器各汇流箱支路的故障因子

表2 故障因子二阶差分表

通过表2中的二阶差分结果可以发现,正常情况下故障因子的二阶差分变化不大,若出现突变点,则该点所对应的值就是故障因子的阈值。

从图5可以看出,故障因子聚类中心二阶差分的第一个尖锐峰对应的位置为第9个聚类中心,该处的故障因子大小为0.3546,所以故障因子大于等于0.3546的组串为故障组串;所以结合表1的各组串故障因子得出结论为,1#汇流箱的第1支路和5#汇流箱的第9支路为故障支路;同时1#汇流箱的第15支路的故障因子与其他正常支路相比和阈值最为接近,因此该支路为预警状态。

以上诊断结果与现实中电站的实际故障状态一致。

4 结论

本文提出的基于3σ准则与FCM算法的直流侧故障辨识方法,通过对实际光伏电站的SCADA数据的全面分析,能准确地对光伏电站直流侧故障组串进行定位;同时基于统计分析方法,利用故障因子对电站实际运行数据的分布特征进行定量描述;并利用FCM算法对同一逆变器的组串故障因子进行聚类,通过对其进行差分处理客观地设定了故障因子阈值。使用该方法实现了对实际的40MW光伏系统的故障组串进行评估,实验结果显示,该方法可以有效地检测出故障组串,并提供异常组串的预警报告;而且该方法原理简单、有效,不需要复杂的计算平台,便于推广到其他光伏系统。由于数据的局限性,文中所提出的方法的准确性和普适性有待验证;其次对于光伏电站的故障辨识的故障类型诊断方法有待深入研究。

猜你喜欢
汇流支路电站
一种新的生成树组随机求取算法
三峡电站再创新高
Cessna 172R G1000型飞机汇流条和断路器研究
低影响开发(LID)在光伏电站中的应用
支路不对称发电机故障下定子电磁力仿真分析
抽水蓄能机组定子支路数应用与研究
宝马加装Click和Drive系统
一种球载雷达汇流环设计
滚动汇流环技术的发展和应用综述
中频信号汇流环的研究