吕斌斌,方勤斌,王国帮
(国网浙江长兴县供电公司,浙江省湖州市313100)
随着人类对化石能源枯竭、能源安全和环境恶化等问题的关注,清洁、可再生能源正受到越来越多的重视,而太阳能以其资源无限、清洁及可持续性等优点成为新能源中的佼佼者[1]。户用光伏发电系统的应用,在国内外越来越普及,对户用光伏发电系统的研究业已成为当下分布式光伏电站研究热点之一。其中,光伏数据监测就是一个重要研究点。由于户用光伏电站设备故障、通信中断及误码等原因,监控系统存储的光伏发电运行数据常常存在异常。因此,有必要对光伏异常数据进行识别修正,从而保证户用光伏发电行业的有序健康发展。
目前,针对新能源发电数据监测的相关研究主要侧重于风力发电数据监测,对于光伏数据监测的相关研究较少。文献[2]分析了风电场历史运行数据中存在的异常数据的主要来源,并针对该实际问题,采用基于四分位算法的数学模型对异常数据进行识别。文献[3]则提取了不良数据的时序特性,采用分段判定方法进行识别,并基于历史数据利用自回归滑动平均模型对不良数据进行了修复。文献[4]则提出一种考虑天气和空间相关性的光伏电站输出功率数据修复方法,将自身相似数据与空间相关数据结合,扩展了光伏电站输出功率数据修复的应用场景。文献[5]提出采用数据挖掘方法(包括模糊聚类、神经网络法、k最邻近算法等)来模拟风电曲线模型,并通过有效性检查、数据范围检查和缺失数据检查3个步骤来对原始数据中的异常情况进行筛选。
本文针对现有屋顶光伏发电装置数据异常情况,将屋顶光伏异常数据类别划分为三类,并提出各类数据识别方法;然后,提出利用历史数据和相邻用户数据相结合的方法对异常数据进行修复;最后,基于所提光伏异常数据识别与修复方法,搭建了屋顶光伏运行数据监测系统。
在分布式家庭屋顶光伏运行数据中,无论是在数据采集、测量过程中引起的数据缺失,还是因一些管理问题,如用户伪装发电骗取补贴、分布式光伏设备发电效率低下等造成的数据异常,针对这些数据异常问题都需要对其进行识别处理,丢失的数据进行补充,伪装发电骗取补贴的数据进行校正,光伏设备发电效率低下造成数据异常的给予用户整修意见。针对以上分析,本文主要将屋顶光伏异常数据类别划分为三类,分别为:
(1)数据丢失(如图1所示),表现为数据空缺,主要由光伏数据采集装置或由通信中断引起。
(2)数据高于正常范围(如图2所示),表现为明显超出具有相近安装容量的相邻用户发电量,主要由于用户利用其它发电手段(如柴油机发电)伪装光伏发电骗取补贴引起。
图2 第二类异常数据
(3)数据低于正常范围(如图3所示),表现为明显低于具有相近安装容量的相邻用户发电量,主要原因为是光伏设备老化或者光伏板表面灰尘积压过多引起的发电效率低下。
图3 第三类异常数据
(1)第一类异常数据识别
则表明t时段的输出功率存在丢失情况。
(2)第二类异常数据识别
假设用户n的具有相近光伏安装容量的相邻用户m在T个时段内的发电输出功率为Xm={x1m,x2mL xTm},归一化后可得
其中,kup为常系数;M为相邻用户的个数。
(3)第三类异常数据识别
当用户n数据满足式(6)条件时,则表明数据低于正常值
其中,klow为常系数。此处需要说明的是,kup和klow一般根据实际情况设定。
本文所提三类异常数据中,第三类数据由于是用户光伏设备老化或者管理不当造成的发电效率低下引起的数据异常不在数据修复范围之内,这类数据异常可以通过指导用户对光伏板进行除尘更换等措施来得以解决。鉴于此,本章节主要针对第一、二类异常数据进行修复处理。
针对本文所述第一、二类异常数据,具体修复流程如图4所示,主要步骤如下:
(1)输入当前用户光伏数据;
(2)依据第一类异常数据识别方法筛选出数据中空缺数据;
(3)依据第二、三类异常数据识别方法筛选出另外两类数据;
(4)依据历史用户光伏数据以及当前相邻用户数据对第一、二类数据进行修复;同时,针对第三类数据异常情况给予用户相应的建议。
其中,步骤(4)中异常数据修复涉及方法主要是将历史数据和相邻用户数据作为训练样本输入BP神经网络模型进行模型训练[6],从而能够得到异常数据的修复值。
图4 屋顶光伏数据监测与修复流程
在一定区域范围内的居民用户可以视为具有相同的光照条件,因此当相邻用户具有相近光伏安装容量时,其光伏发电功率也具有相似性。鉴于此,首先需要对区域内相邻用户进行筛选,选取出和需要进行数据修复用户相似度较高的用户,并以这些用户数据为基础可以提高数据修复的准确度。本文采用皮尔逊积矩相关系数来衡量用户数据的相似度[7]。以用户n和m归一化后的光伏数据为例,两个用户的相似度为:
为验证本文所提出的异常数据识别、异常数据修复方法的有效性,以浙江长兴某光伏村用户屋顶光伏实测数据作为研究对象,数据采样间隔为1个小时。
为了对三类异常数据进行辨识,本节以6个相邻用户屋顶光伏数据为例进行说明,具体如表1所示。此处需要交代的是,为了能够同时对三类异常数据进行识别,对表1中用户1-3数据进行了部分改动。表1中用户1-6光伏安装容量分别是7.42kW,7.02kW,7.8kW,7.68kW,7.42kW,7.56kW;kup和 klow分别设为 1.4 和 0.6。
采用1.2节异常数据识别方法,可得如下结果:
(2)相邻用户4-6在各时段光伏发电量归一化后的均值为[0.01 0.08 0.33 0.50 0.63 0.69 0.71 0.54 0.51 0.40 0.17 0.04 0.01],而用户 2 光伏数据归一化后的值为 [0.16 0.37 0.52 0.88 1.00 1.09 1.12 1.03 0.95 0.80 0.56 0.33 0.14]。经计算可得,用户2在时段6-18的发电量均超过平均水平的1.3倍以上。因此,用户2数据属于第二类异常数据,表明该用户存在伪装光伏发电骗取补贴的嫌疑。
(3)用户 3 光伏数据归一化后的值为[0 0.01 0.06 0.15 0.16 0.26 0.33 0.27 0.24 0.16 0.11 0.02 0]。经计算可得,用户3在时段7-17的发电量均低于平均水平的0.6倍以下。因此,用户2数据属于第三类异常数据,表明该用户光伏设备发电效率低下。
表1 用户屋顶光伏数据(kW)
本节内容主要针对3.1节中用户1和2的异常数据进行修复。为了提升异常数据修复精度,在数据修复之前首先需要对相邻用户和历史相似日进行选取。根据式(7)计算可得,用户1和用户2-6的相关系数分别为:0.94,0.93,0.97,0.96,0.95;而用户2和用户1以及3-6的相关系数分别为:0.94,0.92,0.98,0.95,0.95。因此,用户 1 和 2 的相邻用户均选择用户4-6。同理可得,相似度最高的3个历史相似日。以上述用户以及相似日数据作为样本输入,对BP神经网络模型进行训练,同时对异常数据进行修复。用户1和2异常数据修复结果分别如图5和图6所示。从图中可以看出,用户1在时段10和11缺失的数据已被修正;用户2修正后数据均低于原始数据。因此,通过本文所提数据修复方法后,可以有效堵截用户伪装发电骗取补贴问题,及时发现漏洞,提升光伏发电管理水平。
图5 第一类异常数据修复
图6 第二类异常数据修复
本文基于MATLAB GUI平台,搭建了屋顶光伏运行数据监测系统,其主要包含分布式电源负荷监测和设备故障检测两个界面,如图8-10所示。分布式电源负荷监测界面主要完成数据的修正以及绘图;分布式电源设备故障检测主要用于检测用户光伏设备是否异常。
图7 屋顶光伏运行数据监测系统
图8 分布式电源负荷监测界面
图9 分布式电源设备检测界面
本文分析了户用屋顶光伏发电数据3种常见的异常数据类型及其可能产生的原因,并将历史相似日和相邻相似用户数据作为BP神经网络的训练样本,对神经网络进行训练从而可以用于异常数据的修复工作。在算例分析中,利用浙江长兴某光伏村用户屋顶光伏实测数据作为研究对象,对本文所提方法进行了验证,结果表明具有较好异常数据识别与修复功能。