基于欧氏形态距离与AP 聚类分析的配电台区拓扑结构辨识方法

2023-10-07 03:41:12梁海深顾志成高志伟尹海丞
电力系统及其自动化学报 2023年9期
关键词:欧氏台区配电

尹 鹏,梁海深,顾志成,吕 根,高志伟,尹海丞

(1.国网天津市电力公司宝坻供电分公司,天津 301800;2.天津大学电气自动化与信息工程学院,天津 300072)

随着智能监测装置在配电网的普及,配电台区总表、负荷端智能电表采集海量用电数据,并通过线路、云端等方式上传到电力系统数据库,实现对配电台区的监测,为运行调度提供数据基础。但是在老旧网络改造过程中,变压器变动、负荷重分配会使得负荷与变压器的接线关系发生变化,这些变化如果没有及时上传更新,会导致实际户变关系与数据库不符,进而影响到后续的管理控制[1]。因此,需要对配电台区的变压器与用电用户拓扑关系进行辨识,以校验相关信息更新数据库[2-4]。

台区变压器与相连负荷在电气量上的相关性是识别户变关系的关键[5-7]。文献[8]通过皮尔逊相关系数法衡量配电变压器与负荷电压曲线的相关程度,但户变关系划分的阈值难以确定。文献[9]利用主成分分析法对测量数据进行降维压缩,保留原始数据间的本质信息。文献[10]采用T型灰色关联度判断阈值内可疑用户,实现户变关系校验。文献[11]采用离散弗雷歇距离量化配变电压曲线与负荷曲线间的关系,并给出了划分方法,但需要多样本进行重复验证。文献[12]利用调频特征信号基于离散弗雷歇距离实现户变关系识别,但对硬件设备和通信条件要求较为苛刻。文献[13]阐述了基于高级量测体系的数据分析方法,但没有对数据缺失异常问题进行分析。当监测设备获取的电力数据出现缺失或异常问题时,皮尔逊相关系数法等传统方法需要先对异常的电压曲线进行数据清洗和补全,但采用不同的插值算法会使数据补全结果存在差异,而这种差异很有可能会成为导致户变关系识别错误的关键原因。

另一些研究则是通过聚类算法来进行辨识划分。文献[14]利用K-means 聚类方法,实现台区户变关系的智能识别,但K-means 算法对初始聚类中心敏感,聚类数与聚类中心的选取会产生结果差异,难以保障准确性。文献[15]利用自组织映射网络SOM(self-organizing map)算法弥补K-means 算法缺陷进行辨识,但依然无法解决初值与聚类数的问题。文献[16]采用核模糊聚类方法,并应用量子遗传算法对聚类中心和核参数进行优化,提升了聚类效果,但方法复杂度较高。

为应对户变关系复杂、数据丢失,以及相似性度量不准确、聚类算法参数复杂、容错性低的问题,本文提出一种基于欧氏形态距离和近邻传播AP(affinity propagation)聚类算法的台区拓扑结构辨识方法。该方法通过欧氏形态距离度量电压曲线间的相似程度,结合欧氏距离与形态距离概括曲线整体分布特征与形态变化特征,使得相似性度量全面概括用户时间特征,解决数据采集误差及拓扑关系导致的特征时间偏移问题。进一步,根据欧氏形态距离进行聚类分析,应用AP聚类算法实现变压器与用电用户关系辨识。AP聚类算法避免了传统聚类算法初值选择与聚类数选择的难题且结果唯一,有效应对数据缺少导致的结果差异,使得辨识准确率及效率更高。

1 低压配电网拓扑识别原理

1.1 户变关系辨识

户变关系辨识是指识别不同用户负荷与配电台区变压器间的连接关系。不同用户用电负荷随时间变化规律不同,但在同一配电台区内的用户与同一变压器连接,用户电压间存在相似的变化规律,而不同配电台区间的负荷非直接连接,电压变化规律没有关联性,因此可以根据这一特点实现户变关系辨识。

为了通过上述电压变化特点进行户变关系辨识,首先需要对电压曲线变化规律进行描述,度量不同曲线变化规律的差异大小。因此,本文从以下两个角度出发对电压曲线变化规律的差异进行描述:

(1)整体分布差异用来描述不同曲线间同一时刻电压的差异,表现为整体数值差异;

(2)形态变化差异用来描述不同曲线间电压形态变化的差异,表现为曲线走势差异。

1.2 用户电压曲线整体分布差异

欧氏距离是常见的距离度量,可以通过计算同一时刻曲线间点的距离来对整体分布特征进行衡量。本文采用的曲线欧氏距离定义如下。

对于曲线X=[x1,x2,…,xn] 和Y=[y1,y2,…,yn] ,曲线X与Y之间的欧氏距离Ded(X,Y)为

式中:xt、yt分别为电压曲线X与Y的第t个电压值;n为电压曲线维度。

1.3 用户电压曲线形态变化差异

1.3.1 曲线形态变化特征提取

为了度量不同电压曲线走势的差异性,需要排除不同曲线间量级差异的影响。因此,对曲线进行形态变化特征提取,将电压曲线转换为描述曲线走势的特征序列。本文利用差分算法结合分位数表达曲线变化走势,将曲线形态变化特征转化为离散型数值表达。

首先,通过差分算法量化曲线走势,对于电压曲线U=[u1,u2,…,un]T,将其转化为表示电压数值变化量的差分矩阵Udm,即

然后,采用分位数来表示曲线变化,分别选取10%、50%、90%进行划分。由于差分矩阵中的元素表示曲线变化量,相同幅值下有正负之分,即增加与减少,因此各元素按正负分类,单独进行分位数划分。按正负划分后采用四分位会获得8组结果,将中间两组合并,最终得到7 组结果,对其赋值获得形态变化特征序列V,即

形态变化特征序列V由-3~3的整数组成,正值表示曲线的上升趋势,负值表示曲线的下降趋势,0表示曲线的稳定趋势,绝对值越大表示变化程度越大。通过这种方式,将原始用户电压曲线的变化走势离散化表达,消除量级差异对聚类结果的影响。用户电压曲线形态变化特征提取结果如图1所示,可以看出,电压曲线被转化为7 类离散点,即通过形态变化特征矩阵表达了曲线的走势特征。

图1 电压曲线形态变化特征提取Fig.1 Morphological characteristic extraction of voltage curves

1.3.2 曲线形态变化差异度量

最长公共子序列LCS(longest common subsequence)的基本原理是搜索两个序列间的最长公共子序列,在应对噪声和失真时效果明显。

通过对曲线形态变化特征的提取,将原始用户电压曲线的变化走势离散化表达,获取形态变化特征矩阵作为一种序列。进一步,可以基于用户电压曲线获得的序列进行最长公共子序列提取,并用最长公共子序列长度来表达用户电压曲线形态变化差异程度。

为最大程度地保留序列有效信息,对序列中不同点的关系进行表达,使用序列匹配距离衡量序列间的相似性。序列匹配距离定义为

式中:ai、bi分别为序列A、B的两个点;dmode(ai,bi)为ai和bi之间的序列匹配距离,即若两序列的点相同,则dmode为0,否则dmode为1。

对于序列A和B,构建序列差异矩阵D∈Rm×n。矩阵D的元素dij为子序列Ai与子序列Bj的最大公共子序列长度,通过以下规则获取:

(1)当dmode(ai,bi)=0 时,其公共子序列长度为dij=di-1,j-1+1;

(2)当dmode(ai,bi)=1 时,dij为di-1,j和di,j-1的最大值;

(3)为防止子序列之间的时间差异过大,利用阈值参数ε限制最大时间差,即dmode(ai,bi)<ε。

改进LCS算法的数学表达式为

式中:fLCS为两个序列的LCS的长度;m和n分别为序列A和B的时间长度,本文A和B取同一时间长度,即m=n;Ai-1(Bj-1)为前i-1 个元素构成的A(B)的子序列。阈值ε取值范围为[0,m],两个序列参与对比的点的时间先后不能大于ε。当ε取0时,该方法退化为只对两序列同一时刻的点进行比较,时间复杂度为O(n);当ε取最大值m时,该方法为基于动态规划的最长公共子序列算法,时间复杂度为O(n2)。

本文选取的智能电表电压数据每天采样48 个点,ε取4。设电压曲线X、Y提取出的形态变化特征序列分别为A、B,曲线的形态变化差异度用形态距离Dmd(X,Y)表示,即

式中,len(A)为电压曲线形态变化特征序列A的时间长度。形态距离越小说明电压曲线的形态变化差异越小,变化规律越相似。

2 采用欧氏形态距离的AP 聚类算法

传统的聚类方法需要选取合理的用户关系设定初值,以保证结果的准确性,但低压配电台区户变关系复杂,存在数据缺失问题,难以保证所选初值的有效性,而AP 聚类算法不需要进行随机选取初值。多次执行得到的结果完全一致,可有效应对这一问题。此外,同一台区用户间由于拓扑关系、测量误差等因素存在时间偏差或者峰值宽度不一致的情况,传统欧氏距离也不再适用。因此,本文采用基于欧氏形态距离的AP聚类算法,以提升聚类准确性。

2.1 引入形态距离的必要性

传统的基于欧氏距离的度量方案只能表达曲线间同一时刻点之间的相似性,但无法解决时移偏差问题,使得聚类结果不准确,造成匹配错误,甚至影响到聚类数的选择。而形态距离通过动态方式实现时移特征匹配,有效解决曲线间存在的时移偏差和峰值宽度不一致问题。

动态时间规整算法能够对序列进行拉伸或收缩,因此能够识别曲线的时间偏移,找到曲线变化的共性,但是该算法依赖于欧氏距离,在物理量大小有一定幅度变化的情况下,无法体现变化规律的相似性,同时该方法计算效率也较低。而形态距离方案能够提取曲线的变化走势特征,通过电压序列有效避免曲线尺度差异带来的影响。

2.2 欧氏形态距离

由于欧氏距离能够有效量化电压曲线的整体分布差异、形态距离能够有效量化电压曲线的形态变化差异,同时根据属性值的对应关系可获得相应的趋势信息,因此本文结合欧氏距离与形态距离,提出一种有效度量曲线整体分布差异与形态变化差异的欧氏形态距离。

电压曲线X与Y之间的欧氏形态距离Demd(X,Y)可表示为

式中:α为形态距离的权重系数;β为欧氏距离的权重系数,通过改进熵权法对其进行赋值。由于形态距离与欧氏距离的大小形式不统一,因此引入比例系数rm,e,其计算公式为

式中:max(Dmd)为电压曲线形态距离的最大值;max(Ded)为欧氏距离的最大值。

2.3 聚类评价指标

聚类结果选用戴维森堡丁DB(Davies-Bouldin)指标进行评价。聚类结果的类内相似度越大,类间差异度越大,说明聚类结果越好,而DB指标能够有效体现这两方面。DB指标IDB的计算公式为

式中:K为聚类数;Sk和Sj分别为类Ck和类Cj中数据点到该类中心点的欧氏距离平均值,代表某一类内数据点的相似程度;d(Ck,Cj)为类Ck和类Cj之间中心点的欧氏距离,表示两个类之间的差异程度。

由于传统欧氏距离采用的指标IDB不再适用,因此提出基于欧氏形态距离的改进戴维森堡丁MDB(modified Davies-Bouldin)指标IMDB,其计算公式为

式中:Semd,k和Semd,j分别为类Ck和类Cj数据点到该类中心点的欧氏形态距离平均值;demd(Ck,Cj)为类Ck和类Cj之间中心点的平均欧氏形态距离。

IDB和IMDB与类内相似度呈正相关,与类间差异度呈负相关,因此聚类结果的指标值越小说明聚类效果越好。

2.4 AP 聚类算法

AP聚类算法将所有数据点都视为可能的聚类中心,通过在不同点之间不断地传递信息做出选择,从而最终选出聚类中心。

2.4.1 算法设定

AP聚类算法的输入为相似度矩阵S,表示不同数据之间的距离,通常相似度矩阵S元素sij取欧氏距离的负值,即序列A和B越相似,sij越大。本文采用欧氏形态距离的负值,即

AP聚类算法的参考度pi表示样本数据作为聚类中心的可靠程度,pi取值会影响最终聚类数,pi越大则聚类数越多,本文取矩阵S的元素最小值为pi初值,之后根据MDB 指标进行修改。此外,为了避免震荡问题,将衰减系数λ设为0.9。

2.4.2 算法实现

算法具体步骤如下。

步骤1数据预处理。首先对原始数据进行数据清洗,对失真数据采用高斯滤波进行平滑处理,对缺失数据采用三次样条插值算法进行补全,避免异常值的影响。

步骤2参数初始化。设定AP 聚类的参考度pi、衰减系数λ和最大迭代次数Gmax。根据式(8)计算欧氏形态距离,给出输入矩阵S。

步骤3AP 聚类。应用AP 算法迭代,直至矩阵S稳定或达到最大迭代次数Gmax。

步骤4判断聚类数是否达到Nmax,若达到Nmax,则转至步骤5,否则调整pi,转至步骤3。

步骤5确定最优聚类结果。计算聚类评价指标MDB,选择MDB 最小值对应的聚类结果作为最优聚类数。

3 算例分析

以天津市某配电台区为例进行分析,其拓扑结构如图3所示。图3中,安装有18个智能电表。节点1~3 分别为3 台变压器低压侧接头处,此处电表测得三相电压,以电表1 为例,三相电压表示为1A、1B、1C;节点4~18 为15 个用户负荷处,负荷与变压器间均为单相连接,即此处电表测得负荷所在相电压。

表1 配电台区1 中智能电表的电压曲线间的欧氏形态距离Tab.1 Euclidean morphological distance between voltage curves of smart meter in distribution station area 1

表2 配电台区2 中智能电表的电压曲线间的欧氏形态距离Tab.2 Euclidean morphological distance between voltage curves of smart meter in distribution station area 2

图3 配电台区拓扑结构Fig.3 Topology of distribution station area

3.1 欧氏形态距离分析

利用智能电表获取的某日24 h电压数据,分析各电压曲线间的欧氏形态距离以验证其表征曲线特征的有效性。电压曲线如图4所示,其中变压器采用三相电压的平均值,例如电表1为电表1A、1B、1C三相的平均值。

图4 电压曲线Fig.4 Voltage curves

从表1~表3可以看出,配电台区内的电压曲线间欧氏形态距离均较小,最大值出现在配电台区1的电表6 与电表8 所测的电压之间,欧氏形态距离达到2.489,最小值出现在配电台区3 的电表15 与电表18所测的电压之间,欧氏形态距离为0.232。

表3 配电台区3 中智能电表的电压曲线间的欧氏形态距离Tab.3 Euclidean morphological distance between voltage curves of smart meter in distribution station area 3

不同配电台区的节点电压曲线间的欧氏形态距离计算结果如表4~表6所示。

表4 配电台区1 与台区2 的电压曲线间的欧氏形态距离Tab.4 Euclidean morphological distance between voltage curves in distribution station areas 1 and 2

表5 配电台区1 与台区3 的电压曲线间的欧氏形态距离Tab.5 Euclidean morphological distance between voltage curves in distribution station areas 1 and 3

表6 配电台区2 与台区3 的电压曲线间的欧氏形态距离Tab.6 Euclidean morphological distance between voltage curves in distribution station areas 2 and 3

从表4~表6可以看出,不同配电台区的电压曲线间的欧氏形态距离较大,最小值出现在配电台区1的电表1所测电压与配电台区3的电表17所测电压之间,欧氏形态距离为4.105,最大值出现在配电台区1的电表1所测电压与配电台区2的电表11所测电压之间,欧氏形态距离达到9.222。

对比上述数据可以看出,同一配电台区内的欧氏形态距离远小于不同配电台区间的欧氏形态距离,这表明根据不同电压曲线间的欧氏形态距离进行户变关系识别是可行的。

3.2 用户聚类分析

应用AP 聚类算法对15 条电压曲线进行聚类,迭代20次获取MDB指标最小对应的聚类结果如表7所示。

表7 用户聚类分析结果Tab.7 Results of clustering analysis for users

从聚类结果可以看出,电压曲线被分为3类,分别对应配电台区1、2、3 的电表编号,即与第3.1 节中户变关系相符,验证了所提方法的有效性。

3.3 台区用户相别辨识

在确定配电台区的划分结果后,再进行配电台区内用户的相别辨识。3个配电台区的电压曲线如图5~图7 所示,其中包括低压侧A、B、C 三相电压。各配电台区内三相电压至用户侧电压曲线间的欧氏形态距离如表8~表10所示。根据欧氏形态距离最小原则确定用户所属相序,各配电台区电力用户相线连接关系辨识结果如表11~表13所示。其中,“√”表示电表属于该相,“―”表示电表与该相无关。

表8 配电台区1 相电压曲线与用户电压曲线间欧氏形态距离Tab.8 Euclidean morphological distance between phase voltage curve and user voltage curve in distribution station area 1

表9 配电台区2 相电压曲线与用户电压曲线间欧氏形态距离Tab.9 Euclidean morphological distance between phase voltage curve and user voltage curve in distribution station area 2

表10 配电台区3 相电压曲线与用户电压曲线间欧氏形态距离Tab.10 Euclidean morphological distance between phase voltage curve and user voltage curve in distribution station area 3

表11 配电台区1 的用户相别辨识结果Tab.11 Phase identification results of users in distribution station area 1

表12 配电台区2 的用户相别辨识结果Tab.12 Phase identification results of users in distribution station area 2

表13 配电台区3 的用户相别辨识结果Tab.13 Phase identification results of users in distribution station area 3

图5 配电台区1 的电压曲线Fig.5 Voltage curves in distribution station area 1

图6 配电台区2 的电压曲线Fig.6 Voltage curves in distribution station area 2

图7 配电台区3 的电压曲线Fig.7 Voltage curves in distribution station area 3

对表9~表13 的用户相别辨识结果进行验证,辨识结果与实际拓扑关系一致,验证了本文基于欧氏形态距离进行台区用户相别辨识方法的有效性。

4 结 论

本文提出了一种基于欧氏形态距离与AP聚类分析的配电台区拓扑结构辨识方法,实现了用户所属台区辨识与台区内相别的有效辨识,主要结论如下。

(1)本文利用差分算法结合分位数表达电压曲线变化走势,将曲线形态变化特征转化为离散型电压序列,进一步利用改进LCS 方法,给出了不同电压序列之间的形态距离。

(2)结合欧氏距离与形态距离概括曲线整体分布特征与形态变化特征,通过熵权法构造了欧氏形态距离,算例验证了作为配电台区拓扑结构辨识中电压曲线相似性度量的有效性。

(3)通过AP 聚类算法给出了拓扑结构辨识方法,所提方法利用低压配电台区的智能监测设备采集数据,无需增加专用识别设备与人工检测成本,提高了配电网运检效率和准确性。

猜你喜欢
欧氏台区配电
配电自动化的应用及其发展趋势
10kV及以下配电线路运行维护
电子制作(2018年18期)2018-11-14 01:48:20
配电自动化技术在配电系统中的应用分析
降低台区实时线损整治工作方法
电子制作(2017年2期)2017-05-17 03:55:22
三合一集中器作为台区线损考核表计的探讨
多功能低压台区识别设备的研制
提升台区线损正确可算率的措施与实践
IP网络在配电自动化中的应用
河南科技(2014年16期)2014-02-27 14:13:18
基于多维欧氏空间相似度的激光点云分割方法
丽江“思奔记”(上)
探索地理(2013年5期)2014-01-09 06:40:44