基于改进数据驱动模型的低压台区拓扑关系自动识别技术研究

2022-12-03 08:44温立超杨震一王蒙蒙
能源与环保 2022年11期
关键词:自动识别降维台区

周 慷,温立超,杨震一,廖 旻,王蒙蒙

(国网上海市松江供电公司,上海 201600)

目前,国内对于台区内的用户拓扑关系没有形成统一的执行标准[1]。大部分的台区网络没有对拓扑关系进行记录和识别的技术,还有部分网络档案中记录的拓扑关系是错误的,或者遗漏了部分关键信息[2]。除此之外,配电网台区正常运行时,用户的数量不断地发生变化,网架结构不断地进行调整,造成相关的拓扑关系更新不及时,导致用户的档案记录内容出现偏差。

低压台区的拓扑关系属于整个供电网络的末端,直接与用户对接,单点对多面,面对海量多变的用户信息和配网结构,导致低台区的拓扑关系管理难度非常大,日常校验工作量也日益增多[3]。对低压台区拓扑关系自动识别技术进行研究,可以解决目前供电服务难题,提高供电的可靠性和服务能力。

高泽璞等[4]提出了一种基于知识图谱技术的拓扑关系辨识技术,用来解决配电网信息拓扑关系更新不及时和准确性差等问题。该技术首先利用知识图谱原理对低压配电网中的数据进行进行整合处理,利用挖掘技术计算出数据之间的关联关系,再结合语义识别技术实现了对低压台区配电网实际拓扑结构的辨识。杨志淳等[5]为了对每类台区的电压序列特征进行有效识别,将数据关联分析应用到了低压配电网拓扑识别过程中。该技术首先利用相似度函数,构建配电网中该变压器和各分支表箱之间的关联关系,识别了低压台区拓扑关系。然而,上述传统技术在识别低压台区拓扑关系时存在用户相位识别精度和接入表箱识别精度低的问题。为此,本文利用改进数据驱动模型,设计了一种新的低压台区拓扑关系识别技术。

1 低压台区拓扑关系自动识别技术设计

研究设计的低压台区拓扑关系自动识别技术整体框架如图1所示。

图1 低压台区拓扑关系自动识别技术整体框架Fig.1 Overall frame diagram of automatic topological relationship identification technology in low-voltage substation area

1.1 标准化处理低压台区用户的电压数据

为了对低压台区用户的电压数据进行标准化处理,首先从历史用电数据中采集低压台区用户的电压数据Y=[yNuser,tj],其中,Nuser为选定区域内低压台区的用户数量,D选定时间段内低压台区电压数据的采样数。

假设共有O个低压台区关系需要识别,且识别的内容都有关联,则可利用数据驱动模型表示低压台区的拓扑关系[6-7],那么低压台区拓扑关系的电压矩阵方程式为:

(1)

为了保证方程得出准确的解,使T≥0;yo为低压台区拓扑关系的二进制变量,当yo=1时,表示低压台区拓扑关系与档案内记载一致;当yo=0时,说明低压台区拓扑关系与档案内记载不一致。

根据对低压台区用户在拓扑关系中的相位信息和接入表箱的电压信息,实现对低压台区用户电压数据的标准化处理,在保留原始低压台区电压数据的原始分布特性的前提下,再根据不同电压波动的特性计算出它们之间的方差,因此,结合Z-Score标准化方法[8-9],得到标准化处理低压台区用户的电压数据的表达式为:

(2)

式中,Ytj为所有低压台区用户在tj时的标准电压数据值;δmean(Ytj)为tj时低压台区用户电压数据的均值;δstd(Ytj)为tj时低压台区用户电压数据的标准方差[10]。根据原始特征分析出具体差异性,以便对其拓扑关系的有效识别。

1.2 纠错低压台区配电器与用户关系

为了防止拓扑关系识别的过程中,随机性对结果造成影响,在迭代过程中,对低压台区配电器与用户进行纠错,降低用户系数收敛的速度,使方程的最终解最优。基于纠错低压台区配电器与用户关系的方程组求解方式如下:

Step1:输入电压数据,将参数初始化,并将迭代参数设置为10-9,迭代的约束为106,迭代次数最高值为5。

Step2:在求解用户关系方程的基础上,根据迭代函数(即用户用电量关系方程组的平方和[11])求解用户关系之间梯度的方程式,过程如下:

(3)

式中,yt为第t天用户的实际用电量;u(j)为第j次迭代过程中用户与用电量之间的关系系数[12-13]。

令j=j+1,当j≤L时,则重新计算用户用电量关系方程组的平方和,进行下一次迭代处理。

假设j>L,则r=r+1,假设r≤R,则j=1,为了降低用户系数收敛的速度,提高u(j)的整体求解精准度,在进行每次求解后,需给定u(j)为下一次迭代计算的初始值[14]。

如果用户系数的收敛都接近1,说明该地区用户关系的用电量贡献,与档案内记载的数据不匹配。

当部分用户关系的收敛系数达到0时,说明这类用户的用户关系不属于本台区的拓扑,可安排人们现场排查,确定异常用户关系,并对其档案进行校验。

当部分用户关系系数大于1时,说明求解陷入局部最优,需要对相关参数进行调整,重新u(j)对进行迭代处理。

根据以上步骤,完成低压台区配电器与用户关系的纠错。

1.3 构建低压台区拓扑关系识别模型

在不考虑等效电容窃电行为的基础上,根据改进数据驱动模型,构建低压台区拓扑关系识别模型,保证每台低压变压器的拓扑关系与档案记录中的拓扑关系相同[16-17]。首先,对低压台区拓扑关系进行校验,公式为:

(4)

对待分析的低压台区变压器数据进行采集,并对y个用户E天的用电总数据进行分析,利用总表数的电压数据构成低压台区的电压数据矩阵[18],根据用户的用电量构成E×y阶用户的用电量矩阵M。

对低压台区配电器参数进行初始化处理,得到用电系数u为一个x×1阶的全新向量,再利用加权方程式N=Mu表示。

假设低压台区的电流矩阵为E,二进制变量为Y,电流向量为W,则低压台区拓扑关系可简单地描述为EY=W。

间接征收概念的根源在于国家的征收行为与政府合法管理经济与社会事务的行为之间,客观地存在着一个灰色的区域。如何对这个灰色区域内的行为进行定性,将直接关系到一国政府基于公共利益实施其管理职能的行使和对外国投资者的保护。从利益角度考虑,资本输出国和投资者大多倾向于扩大“间接征收”的范围,从而将所有影响本国投资的政府规制行为均视为间接征收而要求东道国加以补偿,而资本输入国则倾向于缩小“间接征收”的范围,并以国家行使规制权的正当性为由拒绝补偿。[注]参见彭岳:《国际投资中的间接征收及其认定》,《复旦学报》2009年2期。

为对低压台区的拓扑关系进行有效识别,首先应利用改进数据驱动模型确定差值向量的取值范围,计算过程如下:

minf=MTETEM-2KTEM+KTK

(5)

式中,f为拓扑关系自变量M的二次函数。

式(5)的低压台区拓扑关系自动识别模型即为二次规划模型。根据式(5)进行转置处理,得到f的改进数据驱动向量,其最优解要满足的条件是梯度向量的结果为0,得到式(6):

M=(ETE)-1ETK

(6)

当矩阵E与改进数据驱动向量K之间存在误差时,可能会导致识别不准确的现象,因此利用改进数据驱动模型将小数转化为整数变量[19-20],提高识别的准确率。根据以上步骤,在低压台区构建了拓扑关系识别模型,实现了低压台区拓扑关系的识别,具体的实现流程如图2所示。

图2 低压台区拓扑关系自动识别流程Fig.2 Flow chart of automatic identification of topological relationship in low-voltage substation area

2 现场应用

为了验证上述设计的基于改进数据驱动模型的低压台区拓扑关系自动识别技术的实际应用性能,将某一低压台区的用户数据作为计算的输入,对用户相位和接入表箱进行识别。该低压台区用户配电线路如图3所示。

图3 低压台区用户配电线路Fig.3 Distribution line diagram in low-voltage substation area user

该低压台区用电监控中心现场如图4所示。

图4 低压台区用电监控中心现场Fig.4 Scene diagram of electricity monitoring center in low-voltage substation area

2.1 用户电压数据的降维

采用改进数据驱动模型的低压台区拓扑关系自动识别技术对用户相位和接入表箱进行识别时,利用数据归一化方法降维处理用户电压数据集,设置降维过程的最大迭代次数为2 000次,终止迭代的阈值为0.000 2。用户电压数据在降维过程中的误差变化情况如图5所示。由图5可知,随着迭代次数的增加,用户电压数据的散度达到了收敛状态,说明用户电压数据的降维过程是有效的。

图5 用户电压数据的降维误差变化情况Fig.5 Change of dimension reduction error of user voltage data

2.2 统计低压台区用户特征

用户电压数据经过降维处理之后,得到该低压台区用户电压特征矩阵,那么低压台区用户经过降维处理后的特征见表1。由表1可知,该低压台区用户电压数据经过降维处理之后,用户特征之间的相关性逐渐下降,在相同维度下,低压台区用户特征分布方差出现了大幅度上升的趋势。

表1 降维前后用户电压数据集的特征变化Tab.1 Characteristic changes of user voltage data sets before and after dimensionality reduction

2.3 识别效果分析

在用户相位识别中,将聚类的近邻数设置为20,将该低压台区的用户划分为2类,与现场结果对比,统计相同相位用户被划分为一类的情况,确定识别精度;在接入表箱识别中,假设聚类数与接入表箱数相同,将聚类数调整为18,统计接入表箱相同的条件下用户被划分为一类的情况,确定识别精度。

以降维后用户电压数据和降维前用户电压数据为对象,对比了用户接入表箱的识别精度,结果见表2。由表2可以看出,用户电压数据经过降维处理之后,改进数据驱动模型的低压台区拓扑关系自动识别技术可以提高识别精度,说明降维处理后,可以将低压台区用户特征保留下来,降低了高维用户电压数据冗余信息的干扰。

表2 用户接入表箱的识别精度对比结果Tab.2 Identification accuracy comparison results of user access meter box

为了进一步验证本文识别技术的应用效果,测试本文技术的用户相位识别精度和接入表箱识别精度,结果如图6所示。

图6 测试结果分析Fig.6 Analysis of test results

图6所示的结果表明,本文设计的改进数据驱动模型的低压台区拓扑关系自动识别技术在用户相位识别精度和接入表箱识别精度方面都得到了大幅度提升,二者的数值始终保持在90%以上,证明本文技术具有更高的识别精度。

3 结语

本文提出了改进数据驱动模型的低压台区拓扑关系自动识别技术,经测试发现,该识别技术在用户相位识别精度和接入表箱识别精度方面都具有一定优势。但是本文的研究还存在很多不足,在今后的研究中,希望可以重点考虑在可用电量数据较少时低压台区拓扑关系的识别率。

猜你喜欢
自动识别降维台区
混动成为降维打击的实力 东风风神皓极
基于数据挖掘的船舶航迹自动识别系统
降维打击
基于卫星遥感图像的收费站位置自动识别与校核
自动识别系统
降低台区实时线损整治工作方法
10kV变压器台区设计安装技术研究
低压台区载波抄表技术研究
基于IEC61850的配网终端自动识别技术
一种改进的稀疏保持投影算法在高光谱数据降维中的应用