吴 宁,汤程烨,吴含青
(1.国网江苏省电力有限公司 镇江供电分公司,江苏 镇江 212013;2.江苏大学 电气信息工程学院,江苏 镇江 212013)
目前,全球配电网的发展都面临着提高可再生能源供电可靠性等一系列问题。2020年我国提出“碳达峰、碳中和”的发展目标,大力推动可再生资源发展,持续扩大清洁能源消费占比。在配电网中大规模接入分布式电源已成为未来发展的主要方向,分布式光伏发电发展前景广阔。但是目前光伏发电也存在着一些问题,光伏发电受气候影响较为严重,其本身具有的局限性通常导致电压波动性较高,并且光伏高占比配电网在光伏并网后容易出现配网电压谐波分量增加、配网电压导致的光伏消纳减小和配电网保护误动作等诸多问题。
当前配电网主要依靠传感器实现其相关控制和监控功能,传感器所收集的数据量庞大,因此需要运用大数据技术分析处理电力数据从而使智能电网发挥最大作用。文献[1-4]阐述了随着配电网智能化程度不断提高,出现大规模电压检测不准确等问题。当配电网出现低电压时,会给电网的安全运行带来巨大挑战,因此需要合理利用大数据技术,通过分析处理来保证配电网的安全。文献[5]和文献[6]对智能电网大数据技术的发展现状进行综述,并通过大数据分析技术,提高了管理手段和技术措施,有效减少了无功电压的波动,实现了无功电压的精准控制。
目前,有不少文献以及报告对光伏高占比配网电压进行详细的分析并提出了许多针对性的措施。文献[7-9]将大数据技术运用到电压检测评估当中,详细分析了电压检测系统中导致电压不稳定和限制电压消纳的原因,为后续电压评估工作打下基础。文献[10]提出一种融合模糊识别和动态时间弯曲的模糊动态时间弯曲评估算法,可以反映关键节点的电压控制能力,评估配电网全局的无功平衡水平。文献[11]针对光伏高占比配电网电压越限问题,提出一种分布式优化策略,可有效评估电压越限问题,并降低网络损耗。文献[12]提出一种光伏高占比配电网接纳能力评估方法,解决了以往评估较为保守的问题,可以有效量化导致配电网过电压风险的不确定性因素。文献[13]提出一种快速评估光伏接入对配电网供电可靠性影响程度的方法,引入光伏高占比配网贡献因子这一指标,并阐述贡献因子与系统供电可靠性成正比例关系。文献[14]提出基于图论的配电网电压评估方法,利用网络等值降低配电网网架的空间复杂度,可有效评估配电网电压,具有良好的实际应用价值。
综上,本文综合考虑光伏高占比配网电压出现的问题,提出一种基于大数据挖掘的光伏高占比配网电压时空多维评估方法,主要特色工作及创新如下:
(1)针对光伏高占比配网数据量大,维数多,复杂难处理的情况,提出基于K均值聚类算法(K-means clustering algorithm,K-means)的配网电压大数据时空多维挖掘及特征提取方法,可有效降低数据处理难度,为时空多维评估奠定基础。
(2)针对常规灰关联度法无法突出数据差异性的问题,提出一种改进模糊灰关联度评估法,可有效评估配网电压状态,提高评估结果的客观性。
1.1.1 大数据预处理
随着现代信息技术的发展,电力信息系统与电力系统的连接愈加紧密,配电网面临着处理海量数据的困难和需求。当前配电系统整体数据价值密度较低,因此对配网数据的挖掘处理是顺应大数据发展[15]和推动配网更新升级的必然要求[16]。然而,不同的配网运行处理所需的相关数据种类不同,尤其在光伏高占比配网中面对大量的数据必须要提取出其中蕴含价值的信息,因此在光伏高占比配网的大数据挖掘工作前对大数据进行预处理就显得尤为重要。常规大数据预处理主要包含3个环节:数据统一、数据压缩和数据清洗[17,18]。本文主要在数据清洗环节对配网大数据进行预处理,其主要包括3个步骤:
(1)数据标准化。
将配网直接采集获取的数据进行统一归一化处理。
(2)异常数据辨识。
对于配网中采集的异常数据,从下面3个维度进行辨识分析:
①从数学维度,使用工程化的技术对缺失值、越限值等异常数据进行辨识;
②从时间维度,采用时间序列分析的方法辨析配网在单位时间尺度内波动较大的异常数据;
③从空间维度,基于配网的“点-区-网”结构,从空间维度使用多源数据相关性来辨析异常数据。
(3)异常数据重构。
在辨识异常数据之后需要对数据进行重构,主要包含以下3种情形:
①出现单点数据异常时,对数据采用样条插值方法进行填充;
②出现多点数据异常时,使用时间序列拟合或回归拟合的方法进行填充;
③出现大片连续数据异常时,利用多源数据相关性的方法进行填充。
1.1.2 基于K-means的大数据挖掘与特征提取方法
设定样本数据集D={a1,a2,…,am},想要把这些数据分成k个簇,因为这些数据没有任何标签信息,所以必须挑选一个作为标准。本文选择最简单的距离平方作为标准‖·‖2。使用K-means算法对聚类得出的簇划分C={C1,C2,…,Ck}最小化平方误差
(1)
对于此处的最小化平方误差,需要通过遍历D中所有可能的划分情况,来获取其最优解。在K-means算法中采用迭代优化的方法来求取近似值,当选择数据的质心不再大幅度变化或达到预设迭代次数时停止。
本文提出一种配网电压大数据时空维度挖掘方法来解决电压状态评估问题,具体实施流程如图1所示。配网电压大数据时空维度挖掘方法的具体步骤如下。
图1 配网电压时空维度挖掘方法流程图
步骤1通过获取光伏高占比配网数据,对数据进行预处理,包括数据标准化处理、异常数据辨识、异常数据重构等,为保证数据处理的准确性对数据重复一次上述处理过程,从而获取标准化样本数据。
步骤2使用基于K-means的大数据挖掘与特征提取技术,针对聚类目标和要求计算样本点与各簇中心间距离,并设定迭代次数,在达到迭代次数后即可获得样本特征。
步骤3根据样本的时间特性和空间特性分别计算并获得时间维度和空间维度的特征数据,这些数据将为后续评估奠定基础。
现有电压评估指标体系大多由大量的统计量组成,时间尺度长,不能体现运行状态的实时评估需求。为了应对不同分区的差异化运行控制需求和关键节点的靶向控制,提出了由时间维度“日-月-年”和空间维度“点-区-网”相结合的光伏高占比配网电压时空多维评估指标体系。这一电压时空多维评估指标体系能够直观展示电网的实时电压运行状态,并指导电网的运维管控。时间维度上,通过“日-月-年”3个层级对配网电压在全年内特定时间节点进行评估,寻找出配网电压薄弱时间段。空间维度上,节点评估注重于关键节点的电压控制能力,分区评估注重于分区的调控能力以及互联分区间的互动支撑能力,全网评估注重于电网整体的电压状态。结合时空维度,配网电压评估从无功裕度、功率因数和电压偏移3个角度来构建光伏高占比配网电压时空多维评估指标体系。评估指标体系如图2所示。
图2 光伏高占比配网电压时空多维评估指标体系
2.1.1 空间维度指标体系
(1)关键点电压评估指标体系。
选取具备无功调节能力的并网点作为关键节点。详细分析光伏高占比配网并网点无功电压状态,建立关键点电压运行状态评估指标体系。
①关键点无功裕度指标。
分布式电源在满足额定容量、功率因数等限制的同时,还能够发出无功以保障配网电压状态。关键点无功裕度指标PQM如下
(2)
式中:φ为分布式电源的功率因数角,φg为功率因数角阈值,QG、PG分别表示分布式电源的无功输出和有功输出,SN表示分布式电源的额定容量。
②关键点功率因数指标。
无功电源并网点的功率输出受限于cosφg。关键点功率因数指标PPF如下
(3)
③关键点电压偏移指标。
对于220 V电压等级的配电网,负荷节点电压需满足[0.9UN,1.07UN],光伏并网点电压需满足[0.85UN,1.1UN]方可连续运行。关键点电压偏移指标PVE如下
(4)
式中:UN表示关键点额定电压,UPCC表示并网点电压,φ表示惩罚系数,φ>0。
(2)分区电压评估指标体系。
配网分区控制能够有效降低配网的控制难度,并以孤岛形式满足配网关键分区的用电需求。利用配网分区控制与无功功率就地平衡的特点,建立配网分区电压评估指标体系。
①分区无功平衡度指标。
分区的无功平衡状态直接体现了分区的电压水平,无功缺额越大,电压水平越低。分布式电源能够发出的最大无功功率为
(5)
则分区无功平衡度指标AQB为
AQB=min{exp(ε1BS-ε1),1}
(6)
式中:
(7)
式中:ε1表示惩罚系数,其值影响了AQB的灵敏性,ε1>0;ωl表示第l个负载的无功功率需求,χi、λj和γk分别表示第i个分布式发电装置、第j个储能装置、第k个无功补偿装置的无功功率输出;ϖg、ϖe、ϖc和ϖb分别表示分布式电源、储能装置、无功补偿装置和无功负荷的数量。
②分区电压合格统计率指标。
分区电压合格统计率指标AVA如下
(8)
式中:
(9)
式中:NP为单个分区的节点总数;Ui为第i个节点的电压,Ui,MIN和Ui,MAX分别为第i个节点下限电压和上限电压。
③分区功率因数合格统计率指标。
功率因数合格统计率指标APF如下
(10)
式中:
(11)
式中:NS为分区的节点数量,cosφi为分区第i个节点的功率因数,cosφi,g为分区第i个节点功率因数阈值。
(3)全网电压评估指标体系。
全网电压评估注重于配网全局的无功平衡能力。所构建的指标能够客观反应全网的运行特性,反应潜在的电压风险,其指标体系大致与分区评估指标体系类似。
①全网无功平衡度指标。
全网无功平衡能够直接体现整个配网的电压水平。全网无功平衡度指标NQB如下
NQB=min{exp(ε3BD-ε3),1}
(12)
式中:
(13)
式中:r表示整个配网中的分区数量;ε3表示惩罚系数,ε3>0。
②全网电压合格统计率指标。
全网电压合格统计率指标NVA如下
(14)
式中:ND为配网的节点总数。
③全网功率因数合格统计率指标。
提高节点功率因数对于降低网损、提高电能质量具有重要意义。全网功率因数合格统计率指标NPF如下
(15)
2.1.2 时间维度电压评估指标体系
从时间维度上构建配网电压评估指标体系,能够对配网在时间尺度上进行有效分析,即通过不同时间刻度下的指标来评估对应时刻下配网电压状态,进而对整个配网电压在多时间尺度下进行分析。这一指标体系在通过空间维度“点-区-网”结构对配网电压状态构建评估指标体系的基础上,再对此指标体系在时间维度“日-月-年”上进行重构。时间维度电压评估指标体系各指标与空间维度电压评估指标体系一致。
以全网电压评估指标体系为例,为分析某一年当中配网在全年时间中的电压状态,通过配网电压大数据时空维度挖掘方法提取配网在“日-月-年”维度下的电压特征数据,基于特征数据寻找出全年配网电压薄弱时间节点。以全网电压合格统计率指标为例,通过基于K-means的大数据挖掘与特征提取技术对这一指标在时间维度“日-月-年”下进行数据挖掘和特征分析。分别对单日、整月、全年内统计到的全网电压数据进行聚类分析,得到日度全网电压合格统计率、月度全网电压合格统计率和年度全网电压合格统计率。
(1)日度全网电压合格统计率
(16)
(2)月度全网电压合格统计率
(17)
(3)年度全网电压合格统计率
(18)
其他指标可采用相同的方法进行时间维度“日-月-年”的数据挖掘和特征提取,不再赘述。
根据配网电压时空多维评估指标在全局无功电压中发挥的作用,研究确定各关键指标的重要性分级,为提高评估指标体系中指标权重赋值的客观性和科学性,研究主客观赋值法相结合的权重制定方法。本文采用熵值法和有序二元比较量化法主客观相结合的指标赋权法对指标进行权重赋值。
2.2.1 熵值法
熵值法是通过判断某一个指标的离散程度,来确定此指标在整个体系中所占权重大小的方法。设有m个评价指标,n个评价对象所形成的原始指标数据矩阵A=(Xij)m×n,其中i=1,2,…,n。对其进行标准化处理后得到标准指标数据矩阵B=(bij)m×n,对于指标Xj,指标值Xij的相差越小,则此指标在综合评价中权重值越小。熵值法确定指标权重的过程如下:
(1)对指标进行归一化处理;
(2)计算第i个指标在第j个待评估目标中的占比
(19)
(3)定义熵。第i个评价指标的熵值定义为
(20)
第i个熵权重指数定义为
(21)
2.2.2 有序二元比较量化法
将m个评估对象进行二元比较重要性排序,经过一致性检验判断与调整得到排序一致性二元对比标度矩阵E。根据标度矩阵E各行元素值之和,对各元素进行大小排序,把排序为首位的目标作为基准,通过对其他目标进行重要性程度的比较,可得非归一化目标权向量为
w′=(w′1,w′2,…,w′m)
(22)
然后进行归一化计算,即可得目标权向量式为
w=(w1,w2,…,wm)
(23)
2.2.3 组合赋权法
采用“加法”集成法进行组合赋权,计算公式为
qi=αai+(1-α)bi0≤α≤1
(24)
α通过历史数据和经验来确定。
灰关联度法[19]通过比较不同序列之间的数值分布特性,反映各评价目标与参考目标的相似度,从而获得各目标的重要性排序。但是常规灰关联度法存在平权化处理指标使得难以突出各指标之间的差异性,分辨系数主观化取值容易导致结果趋于平均化且缺乏客观性等诸多缺点。针对常规灰关联度法的缺点以及评估问题本身具有模糊性和主观性的特点,提出一种改进模糊灰关联度评估法。区别于常规灰关联度法,本文引入模糊隶属度函数,通过计算评估系统的参考序列和样本序列间的模糊隶属度对灰关联度进行改进,再设定动态模糊系数求出模糊灰关联度,最后基于模糊灰关联度对电压状态进行等级划分。
(1)参考序列与比较序列。
确定反映系统行为特征的参考序列x0=(x0(1),x′0(2),…,x′0(m)),以及影响系统行为特征的样本序列x1,x2,…,xn,并标准化处理为x′0,x′1,…,x′n。
(2)计算模糊隶属度。
(25)
(3)计算关联系数。
假设某个标准化处理后的指标数据作为参考序列x′0=(x0(1),x′0(2),…,x′0(m)),其他若干标准化处理后的指标数据作为样本序列x′0,x′1,…,x′n与x′1,(i=1,2.,n)在k点时的关联系数为
ξ(x′0(k),x′i(k))=
(26)
式中:ρ为分辨系数,取值范围为(0,1);x′0(k)和x′i(k)分别为参考数列第k个点的值与第i个比较数列第k个点的值。
(4)计算关联度。
对所求的关联系数取平均值,作为比较序列与参考序列间的关联度。标准化后的指标数据序列x′0与x′i的关联度公式如下
(27)
(5)计算模糊灰关联度
R0i=λ(r(x0,xi)+r(x′0,x′i))
(28)
式中:λ为动态模糊系数,取值范围为(0,1)。
为验证本文所提出的基于大数据挖掘的光伏高占比配网电压时空多维评估方法的有效性,选取某地区光伏高占比配网作为评估对象。其拓扑结构见图3。
图3 光伏高占比配网拓扑图
选取此配网2019-2020年的历史数据作为原始数据,同时将此配网分成4个区进行分析。采用配网电压时空维度挖掘方法,首先对原始样本数据进行数据预处理,然后采用大数据挖掘和特征提取方法,从时间维度和空间维度进行剖析。以电压幅值为例,通过K-means聚类算法获得300个时间戳数据,分别从日-月-年的时间维度进行分析和特征提取,结果见图4。类似地,以分区2和节点11为例,对此配网进行关键点-分区-全网的空间维度进行分析和特征提取,结果见图5。由图4和图5可见,在对配网进行大数据分析时,通过时空维度挖掘能够有效降低数据维度,减少冗余无效数据的处理,同时可以根据评估目标的不同选择性地提取对应特征和维度。
图4 时间维度电压幅值图
图5 空间维度电压幅值图
根据本文所建立的光伏高占比配网电压时空多维评估指标体系,通过熵值法和有序二元比较量化法分别求出权重,最后用主客观相结合的组合赋权法对权重进行计算。各指标权重结果见图6。由图6可知,熵值法和有序二元比较量化法对各指标赋权存在不小的差异,采用组合赋权法能够减少这种差异对评估结果带来的不稳定影响,进一步提高评估结果的可靠性和稳定性。
图6 各指标权重赋值
通过模糊灰关联度来衡量配网电压状态,为了从时空维度对配网电压状态进行准确评估,本文基于实测数据,通过对数据的聚类分析结合聚类点和历史经验,对电压状态进行等级划分,划分标准见表1。配网电压状态的优、良、中、差分别对应等级A、B、C、D。选取2020年此配网数据作为原始数据。
表1 配网电压状态等级划分
3.3.1 电压时空多维评估结果分析
在时间维度,将12个月作为时间节点进行分析计算;在空间维度,对配网24个节点进行分析计算,计算结果见图7和表2。由图7和表2可知,从时间维度上来看,1月、2月、7月、8月和12月的电压状态C和D等级较多,说明这几个月份中此配网电压状态较差,为薄弱时间段。从空间维度上来看,分区3和分区4的全年电压状态多为等级C和D,其中节点19、20、21、22和23的电压状态多为等级D,而这些节点都隶属于分区4,由此可见分区4的电压状态较差,为此配网的薄弱环节。
表2 各分区全年电压状态等级
图7 时空维度下的模糊灰关联度
为对此配网薄弱环节进一步溯源分析,对分区4从多时间尺度、多颗粒度空间尺度进行挖掘,给出该分区下各节点在全年每月的电压状态等级,结果见表3。由表3可知:节点19、20、21、22、23在全年有至少3个月为等级D,说明在该分区中这5个节点的电压状态普遍较差;而在这5个节点当中电压状态等级D普遍集中在1月、2月、7月和12月,说明在冬夏两季当中此配网受到光伏出力和负荷波动的影响较大,从而导致节点电压状态较差。节点24在大部分月份电压状态等级均为A,从图3可知节点24作为并网点安装了储能装置,一定程度上能够发挥调节电压能力,保障电压状态稳定,故此节点整体电压状态较优。
表3 分区4全年电压状态等级
3.3.2 改进模糊灰关联度法评估结果分析
为了进一步验证本文所提方法的有效性,将灰关联度法和改进模糊灰关联度法进行对比,以时间维度为例,选取10个典型时间节点的场景分别进行灰关联度和模糊灰关联度计算,结果见图8。由图8可知,灰关联度法因为采取对指标的平权处理方式,使得各时间节点处的灰关联度趋于相对平均;而采用改进模糊灰关联度法更好的突出了主次,有利于电压状态等级划分,显著提高了光伏高占比配网电压状态评估的准确性。图8中最大和最小的模糊灰关联度分别是时间节点3和时间节点7,对照表1的等级划分标准可知,节点3的电压状态等级为A,而节点7的电压状态等级为D。
图8 灰关联度与模糊灰关联度对比
本文提出一种基于大数据挖掘的光伏高占比配网电压时空多维评估方法,为相关技术人员提供全面、客观和准确的评估给予新的思路。针对目前配网数据量大、维数多、复杂难处理的情况,采用基于K-means的大数据挖掘和特征提取技术能够有效对数据进行降维并提取有价值的特征信息。从配网多时间尺度、多颗粒度空间尺度提出光伏高占比配网电压时空多维评估指标体系,不仅能够直观展示配网整体的电压状态,而且还能从时空多维角度对配网电压进行针对性分析,从而提高对配网电压评估的科学性和准确性。相较于灰关联度法,通过引入模糊隶属度提出改进模糊灰关联度法,能够有效避免因传统灰关联度法的平权处理无法突出各指标差异性等缺点,进而提高评估结果的客观性。算例结果表明,本文所提的方法可以对光伏高占比配网电压状态进行准确评估,为建设可持续发展的配网系统提供解决思路和数据支撑。