基于高维随机矩阵的配电网用户侧用电行为分析

2019-12-06 08:42郝方舟孙奇珍沈超黄勇吴雨沼马国龙
广东电力 2019年11期
关键词:高维低压配电台区

郝方舟,孙奇珍,沈超,黄勇,吴雨沼,马国龙

(1.广州供电局有限公司,广东 广州 510620;2.广州穗华能源科技有限公司,广东 广州 510530)

低压配电网作为向用户直接供电的一环,其正常运行影响着用户的用电行为及用电质量。现阶段,随着智能电表的推广以及电力用户用电信息采集系统的完善,电力数据资源急剧增长。目前,利用用电信息采集系统的线损管理功能等可以在一定程度上识别用户侧异常用电行为,但该方法无法定位至具体用户以及用户异常用电具体时刻;因此,如何利用分布广泛的智能电表数据信息以及用电信息采集系统的用电信息进行数据挖掘,从而实现全面、智能且准确的用户异常用电行为分析,是大数据时代下用户侧异常用电行为管理极具现实意义的研究课题[1-5]。

随着智能电网建设的不断深入以及用户侧用电信息的广泛采集,基于用户侧用电数据特征信息提取及数据挖掘的分析研究越来越受到重视。其中,文献[6-7]分别阐述了面向智能配电网运行量测数据的存储、压缩、清洗与修复、集成及分析计算等大数据技术。文献[8-10]提出了基于数据融合的配电网状态监测及故障分析方法。文献[11-14]结合了机器学习技术,挖掘量测数据中的数据价值,对配电网侧的线路、智能电能表等设备进行故障诊断。文献[15-17]利用大数据分析技术,通过智能表计采集得到的用户侧用电信息对用户的用电行为进行刻画,但是该方法只能够对正常用电情况进行用户画像,不能很好地处理异常用电情况下的用户数据。此外,由于低压配电网用户侧数据具有采样频率高、数据存储容量大等特点,且在分析过程中存在异常数据干扰,因此短时间内对全网全部用户节点数据进行快速分析并作出决策是相当困难的;同时,如何对用户的异常用电情况进行及时有效的挖掘与发现,对于电网公司的计量与营销业务同样至关重要。

随机矩阵理论起源于量子物理的发展和研究,Wigner等人最早将随机矩阵与量子物理结合起来,并引入到多维数学统计与分析中。特别地,针对高维随机矩阵极限谱的分析得到了许多数学家和统计学家的广泛关注[18]。与传统的数学统计分析工具相比,随机矩阵理论在大数据分析与重构、异常数据分析、检测与定位[19-21]等方面具有较好的性能。

本文针对用户侧智能电表量测数据信息以及高维随机矩阵的特点,提出一种基于高维随机矩阵的用户侧用电特征数据建模及异常检测方法。在对智能电表采集数据特征进行分析的基础上,引入高维随机矩阵理论,提出智能电表量测数据的高维矩阵表示方法,完成系统大数据模型的构建及异常检测方法的推导。最后,对某一实验台区智能电表历史与实时量测数据进行分析,分别在不同采样时刻点与不同用户处设置用户窃电与电表损坏等异常类型,以验证本文所提方法的有效性与适用性。

1 基于高维随机矩阵的量测数据建模

1.1 低压配电网量测数据概述及分类

低压配电网设备繁多且类型复杂,导致数据采集来源广泛,类型众多。其中,低压配电网用电信息采集系统、生产实时管控系统、“量、价、费、损”在线监测系统为三大专业信息系统,涵盖低压配电网公用配电变压器出口侧每个时点的电压和电流、持续时间、发生相别、从属线路、供电区域等信息,拥有海量数据。主要采集数据的来源、特征以及采集数据的类型见表1。

表1 低压配电网采集数据来源与特征Tab.1 Sources and characteristics of data collected by ow voltage distribution network

通过对不同来源、不同类型的数据进行采集、传输与存储,可以利用高维随机矩阵对低压配电网侧的运行数据进行表征,并挖掘用户侧运行情况等信息。

1.2 采集量测数据预处理

1.2.1 K-means的聚类分析

针对低压配电网用户侧的用电数据,本文选取用户侧智能电表采集得到的用户侧负荷数据信息(有功功率),建立用户侧用电异常分析模型。可以建立数据集合

D={D1,D2,…,Dj,…,DF},
Dj=(xj1,xj2,…,xjn).

(1)

式中:F为数据集合中的数据类型数;n为某一数据类型的采样点个数;xji(j=1,2,…,F,i=1,2,…,n)为第j类数据第i个采样点的值。

根据K-means数据聚类的思想可以得到相关样本Ds、Dj的欧式距离[22-23]

(2)

其平方误差准则函数最小为

(3)

式中:k为聚类族数;ni为第i族数据均值;qi为第i族数据个数;xij为第i族第j个数据的值。

1.2.2 异常数据检测与修复

在聚类数据族群的基础上进行异常数据的检测、修复与清洗。针对异常数据的检测,本文考虑基于统计学的异常数据检测方法(Pearson-Stephens法),具体步骤如下:

步骤1,将聚类族群中的一组数据按照由大到小顺序排列为(y1,y2,…,yn);

步骤2,按照式(4)计算极差与标准偏差比值,并将该值与某一显著性水平α进行比较,从而判断其是否为异常值。

(4)

本文利用同一族群、不同数据集、同一位置以及其邻域数据进行异常数据的修复,修复值

(5)

式中nnum聚类族群中所含有的数据组数。

1.3 高维随机矩阵的表征

1.3.1 表征要求与方式

在实际工程应用过程中,一般将行数和列数均超过100的矩阵视作高维矩阵[24]。假设低压配电网共含有n个观测点(n台智能电表),每一个观测点均可以得到该观测点下用户的实际用电数据信息,并能够存储一段时间内用户历史用电数据信息。在观测时间点t存在一个时间序列向量zi(i=1,2,…,n),于是在观测时段[0,t]内采集到的用户侧智能电表数据信息可以构成一个n×t维的时间序列矩阵

(6)

(7)

1.3.2 归一化处理

在对用户侧智能电表采集所得数据进行高维矩阵表征之后,需要对高维矩阵进行归一化处理。

对每一维的数据进行归一化处理,即

(8)

2 基于高维随机矩阵的低压配电网运行分析

2.1 运行分析评价指标

2.1.1 单环定理

(9)

2.1.2 M-P定理

根据Marchenko-Pastur定理可知,对于N×T阶非Hermitian矩阵X,其协方差矩阵为SN×N。假设N×T阶非Hermitian矩阵X满足矩阵中元素为独立同分布,且均值μ=0,方差σ<∞。当N,T→∞且N/T=c∈(0,1]时,X协方差矩阵SN×N的经验谱分布非随机的收敛于密度函数[23]

(10)

2.1.3 线性特征值统计量

线性特征值统计量(linear eigenvalue statistic,LES)反映高维随机矩阵特征值分布情况。对某一随机矩阵X,其特征值统计量

(11)

式中:λi(i=1,2,…,N)为X的特征根;φ(λi)为测试函数。

由大数定律可知

(12)

式中ρ(λ)为特征根λ的概率密度函数(probability distribution function,PDF)。

特别地,不同的测试函数对应不同的LES,由文献[19]可知,测试函数中平均谱半径(mean spectral radius,MSR)的效果最好。其中MSR的值

(13)

2.2 运行分析原理与框架

2.2.1 运行分析原理

本文主要通过智能表计采集用户侧的用电数据信息,并对该台区内不同用户历史正常用电数据以及实时用电数据信息进行归一化处理,从而得到表征该台区用户用电情况的高维随机矩阵,矩阵特征根的变化可以直接反映用户用电情况(智能电表采集数据)的变化。显然,当用户侧用电数据出现负荷突变等情况时,智能电表得到的量测数据也将发生突变,此时由历史与实时量测数据(经过数据清洗、高维表征以及归一化处理)构成的高维随机矩阵将不再符合随机矩阵原理,通过单环定理与M-P定理的验证可以判断用户侧异常用电行为的发生。通过计算矩阵的相关指标(例如本文中采用的MSR变化趋势情况),可以对采集时间窗内用户侧用电情况进行分析和评估,同时实现异常/故障时刻定位,从而得以对用户侧用电情况进行认知。

2.2.2 运行分析框架

本文所建立的基于高维随机矩阵理论的低压配电网用户侧运行状态与异常/故障定位分析的流程如图1所示。

系统运行与分析具体步骤如下:

步骤1,采集多源数据,并按照时序逻辑对多源数据进行分台区存储。

步骤2,对采集数据进行预处理,主要包括异常数据检测与修复,并对实时采集得到的高维随机矩阵进行归一化表征,为低压配电网用户侧运行状态与异常定位分析提供数据基础。

步骤3,采集设定时间窗(1 d)内每个台区下各用户节点的运行参数信息,如电流、电压、有功功率、无功功率等。选取适当的运行参数,将该参数数据按第1.3节构建高维随机矩阵,并利用单环定理与M-P定理,通过谱分布规律,对台区用电异常/故障状态进行判定。

图1 运行分析流程Fig.1 System operation and analysis chart

步骤4,按照“台区→供电台变→用户侧节点集”由大区到小区的思路分别形成时间窗内的高维随机矩阵,根据特征根的变化情况进行异常/故障定位。

步骤5,结合时间窗与采集时间步长等信息,通过MSR变化趋势情况对采集时间窗内用户侧用电情况进行分析和评估,同时实现异常/故障时刻定位。

步骤6,结合95598客服信息,制订运维检修策略。

3 算例分析

本文选择某小区低压配电拓扑结构(图2)进行分析,该小区内有3个居民区,每个居民区连接低压配电台区(分别标记为1号、2号、3号),分析数据主要来源于每户人家的智能表计,共计225户人家。为证明本文所提方法的有效性,同时简化计算,本文考虑智能电表采集数据为有功功率,采样步长为1 min,采样时间窗为2 d,于是针对每一用户可以得到1 440×2维的用电数据信息。

3.1 不同算例场景设置

针对以上的实际低压配电网络拓扑,结合不同运行场景下的特征,利用高维随机矩阵理论进行分析。对具体运行场景进行条件设置,见表2。

表2 不同算例条件设置Tab.2 Condition settings for different examples

3.2 配电网用户侧异常用电定位分析

采用单环定理与M-P定理进行验证,确定电网事件发生后,依据节点拓扑,通过合理的矩阵分块分别计算相应的特征根分布,并在图形中以对比的方式进行配电网用户侧异常状态点的定位。算例1中不同台区的谱分布与特征根分布计算结果如图3—5所示,算例3中1号台区的谱分布与特征根分布计算结果如图6所示。

在算例1条件设置下,分析图3、图4与图5可知:当系统1号台区异常时,由1号台区形成的有功功率协方差矩阵的特征值集中分布在圆环环心,且特征值谱半径平均值小于内环半径;同时,当1号台区用户侧用电数据发生异常后,由于构成高维随机矩阵的数据出现异常,不再满足独立同分布,故矩阵的特征值谱密度函数偏离M-P律;当2号台区与3号台区正常运行时,用户侧用电有功功率表征的高维协方差矩阵的特征值集中分布在圆环内,且特征值谱半径平均值介于内环半径和外环半径之间。于是,在算例1设定条件下,当1号台区存在用户用电行为异常时,由该台区形成的高维随机矩阵特征根存在明显异常,其余台区(2号、3号)特征根均满足单环定理与M-P定理。

图2 某居民小区配电拓扑结构Fig.2 Distribution topology of a residential area

图3 算例1中1号台区的谱分布与特征根分布Fig.3 Spectral and characteristic root distribution of No.1 in example 1

图4 算例1中2号台区的谱分布与特征根分布Fig.4 Spectral andcharacteristic root distribution of No.2 in example 1

图5 算例1中3号台区的谱分布与特征根分布Fig.5 Spectral andcharacteristic root distribution of No.3 in example 1

对比算例1与算例3的结果(图3与图6)可知,图3与图6均存在异常特征值,表明1号台区用户侧用电行为关键性能矩阵的数据偏离正常值;但是两者异常特征值的概率密度存在不同,即关键性能矩阵偏离正常值的程度不同,图3异常特征值的概率密度明显高于图6。另外,由于谱半径平均值反映数据偏离正常值的程度大小,谱半径平均值越小,数据偏离正常值的程度越大。图3与图6均存在特征值分布在内环,表明表征两者用户用电行为关键性能矩阵的数据偏离正常值,图3特征根绝大部分处于内环,并且图3的内环半径明显小于图6内环半径,因此可以得出算例1用户用电行为异常情况比较严重的结论。

图6 算例3中1号台区的谱分布与特征根分布Fig.6 Spectral andcharacteristic root distribution of No.1 in example 3

接着,需要针对1号台区的具体分区,通过合理的矩阵分块形成新的随机矩阵进行特征根分析,从而得到具体用户侧用电异常情况,为运维检修人员提供检修指导。

由于1号台区由单元1到单元6共6栋单元楼组成,而每栋单元楼所含用户数量不同,因此可以针对每栋单元楼采集到的有功时间序列数据所形成的高维矩阵,经转换与归一化后,对不同单元楼矩阵的有功协方差特征值分布情况进行分析,6号单元特征根分布的结果如图7所示。

MSR反映数据偏离正常值的程度大小,MSR值越小,数据偏离正常值的程度越大。从图7分析可知,存在较多特征值分布在内环,表明表征1号台区6号单元楼用户的用电行为的高维随机矩阵的数据偏离正常值,进一步对6号单元楼内具体的用户建立高维随机矩阵进行用电行为分析,从而确定异常用电位置。

3.3 配电网用户侧异常用电时刻确定

针对用户智能表计采集得到的数据进行分析,选取连续2 d的数据形成高维随机矩阵,并分析在不同算例条件设置下不同台区得到的MSR的变化,从而确定配电网用户侧用电异常采集时刻,计算结果如图8、9所示。

图7 算例1中1号台区6号单元的特征根分布Fig.7 Characteristicroot distribution of apartment 6 of No.1 in example 1

图8 算例1中不同台区基于时间序列的MSRFig.8 Time series based MSR for different stations inexample 1

图9 算例2中不同台区基于时间序列的MSRFig.9 Time series based MSR for different stations inexample 2

算例1选取采样异常点860—2 880,在该异常点下1号台区内用户701发生窃电行为,用户侧智能表计测量数据突变为0;由图8的计算结果可知,在对应采样点下1号协方差矩阵特征根的MSR发生较大变化,而2号与3号未发生明显变化。算例2选取采样异常点75—960,在该异常点下3号台区内用户402智能电表损坏,测量数据突变为0;由图9的计算结果可知,在对应采样点下3号协方差矩阵特征根的MSR发生较大变化,而2号与3号未发生明显变化。由以上分析可知,利用用户侧智能表计的测量数据,结合高维随机矩阵MSR指标,可以快速准确地辨识出用电异常时刻点。

4 结论

本文考虑电网公司通过收集智能表计采集的数据信息,结合高维随机矩阵理论,解决用户侧用电异常/故障情况下异常区域划分以及故障定位。本文讨论的结果主要用来为电网公司运维检修人员提供指导,从而减少用户侧的停电时间,提升用户用电满意度。主要得出以下结论:

a)采用用户侧智能电表采集数据信息,再利用高维随机矩阵理论构建表征用户用电行为模型,能够有效地对用户侧异常用电行为进行分析与诊断。

b)利用单环定理与M-P定理对随机矩阵特征根分步进行分析,可实现用户侧用电异常区域的确定,有助于及时发现用户用电异常位置。

c)基于MSR指标的确定故障时刻方法,利用单环定理及对应的MSR计算分析,可实现用户侧异常用电时刻的确定,有助于及时发现用户异常用电。

猜你喜欢
高维低压配电台区
有向图上高维时间序列模型及其在交通网络中的应用
配电台区变-户拓扑关系异常辨识方法
高层建筑电气设计中低压配电系统的安全性浅析
高层建筑电气设计中低压配电系统安全性分析
低压配电网接地方式及与剩余电流保护的配置探究
一种改进的GP-CLIQUE自适应高维子空间聚类算法
降低台区实时线损整治工作方法
10kV变压器台区设计安装技术研究
低压台区载波抄表技术研究
工厂供电系统低压配电保护电器的选择研究