用户用电负荷变化的异常检测与识别

2024-09-16 00:00:00李晗轲李璟王颖邹国平陈倩楠蔡慧
现代电子技术 2024年10期
关键词:皮尔逊欧氏用电

摘" 要: 在智能电网时代,大部分用电异常行为都会伴随用电负荷的变化,研究用户用电行为对于电力系统的运行和管理都至关重要。为此,提出一种直接利用负荷数据进行计算,通过计算特征用电负荷曲线与日用电负荷曲线之间的相关度来判断用户是否存在异常用电行为的方法。在相关度计算过程中,将欧氏距离与皮尔逊相关系数相结合,以更准确地判断用户的用电负荷是否发生重大变化。此外,为提高判断的准确性和灵活性,采用自适应阈值策略对500组数据进行实验研究。相关度计算的结果表明,其中122组被判断为负荷变化过大,99组数据存在负荷异常事件,该方法的判断准确率达到了81.1%。

关键词: 异常用电行为; 负荷检测; 日用电负荷曲线; 特征负荷曲线; 相关度; 皮尔逊相关系数; 欧氏距离; 阈值判断

中图分类号: TN915.12⁃34" " " " " " " " " " " " " 文献标识码: A" " " " " " " " " " "文章编号: 1004⁃373X(2024)10⁃0001⁃05

Abnormal detection and identification of changes in user electricity load

Abstract: In the era of smart grids, most abnormal electricity consumption behaviors will be accompanied by the changes in electricity load. The research on user electricity consumption behavior is crucial for the operation and management of the power system. On this basis, a method of directly using load data for calculation is proposed to determine whether users have abnormal electricity consumption behavior, which can be realized by the correlation between the characteristic electricity consumption load curve and the daily electricity consumption load curve. In the process of correlation calculation, the Euclidean distance is combined with the Pearson correlation coefficient to more accurately determine whether the user's electricity load has undergone significant changes. An adaptive threshold strategy is adopted for the experimental research on 500 sets of data to improve the accuracy and flexibility of judgment. The correlation calculation results show that 122 groups’ data have excessive load changes, and 99 groups’ data have abnormal load events. The accuracy of this method can reach 81.1%.

Keywords: abnormal electricity consumption behavior; load detection; daily electricity load curve; characteristic load curve; correlation; Pearson correlation coefficient; Euclidean distance; threshold judgment

0" 引" 言

21世纪以来,随着智能电网的迅猛发展,电力系统成为了人们日常生活中不可或缺的一部分。智能电网不仅直接关联着人们的用电需求,还对经济发展和国家安全具有重要影响。在智能电网中,大量涉及用户用电数据的信息可以通过数据分析方法得以挖掘,这对于理解用户用电行为规律、用电负荷预测和防窃电检测等具有重要意义[1]。

研究用户用电行为规律对于电力系统运行和管理至关重要。通过深入分析用户用电数据,可以揭示出不同时间段的用电负荷特征、高负荷时段以及用电行为的异常变化等信息。这些分析结果为电力系统规划、电力调度和资源优化提供了宝贵的参考,有助于优化电力供应和提高电网运行的效率和稳定性[2]。此外,利用用户用电数据进行负荷预测可以帮助电力系统工作人员做出准确的负荷调度安排,提前预测和应对高负荷时段的能源需求。这对于实现电力系统的高效运行、优化能源资源利用以及提升供电质量都具有重要意义[3]。因此,对用户用电行为规律的研究以及利用数据分析方法来挖掘和分析用户用电数据,在智能电网中具有重要的研究意义和实际应用价值。这将为电力系统的可持续发展和高效运行提供有力支持,同时也有助于推动能源领域的创新和进步[4]。

目前对用户异常用电行为检测主要采用机器学习的方法。其中,聚类方法[5⁃8]和深度学习方法[9⁃10]运用最为广泛。但是这些利用机器学习的检测方法一般都需要大量的人工标记数据,且离散型数据需要进行类型转换,因而容易导致重要信息的丢失。本文提出一种直接利用负荷数据进行计算,从而判断用户是否存在异常用电行为的方法。

1" 异常用电行为

目前电力部门所记录的异常事件为26类,并将导致异常的原因分为6类,其中与用电负荷变化有关的异常事件有10类,导致发生负荷变化的异常原因[11]有5类。某省某县一年所有异常事件的统计结果如表1所示。

负荷类异常分为用电负荷异常和用电量异常两种类型。在实际情况中,当用电负荷增加时,即单位时间内消耗电能的能力或需求增加,将导致用电量增加;同样,当用电负荷减少时,即单位时间内消耗电能的能力或需求减少,将导致用电量减少。由表1可见,低压非居民和低压居民类型的用户负荷异常事件占比超过95%。因此,研究低压用户的用电负荷是否发生重大变化具有非常重要的意义。该研究有助于更好地了解和识别用户用电负荷的异常情况,从而提供有效的异常检测和监测手段,确保电力系统的稳定运行和资源的合理利用。

2" 研究方法

本文提出了一种组合模型,旨在通过计算特征用电负荷曲线与日用电负荷曲线之间的相关度来判断用户用电负荷是否发生重大变化。该模型综合运用了皮尔逊相关系数和欧氏距离两种方法,以便更全面地评估用户用电负荷的变化情况。

首先,使用皮尔逊相关系数计算特征用电负荷曲线与日用电负荷曲线之间的线性相关程度。皮尔逊相关系数是一种常用的统计指标,用于衡量两个变量之间的线性关系程度。通过计算这一系数可以获取两条曲线之间的相关性程度。

然而,当2天的负荷变化曲线相似性较高,但总量变化较大时,仅通过皮尔逊相关系数可能无法准确地反映出这种变化。为了解决这个问题,本文引入了欧氏距离,通过计算特征用电负荷曲线与日用电负荷曲线之间的欧氏距离,综合考虑线性关系和总量变化,衡量两者的整体差异。将皮尔逊相关系数和欧氏距离相结合,得到的相关度指标更全面。再通过自适应阈值的确定方法获得相关度大小的判断阈值,从而识别用户是否发生了重大用电负荷变化。该组合模型算法思路如图1所示。

2.1" 欧氏距离

欧氏距离[12]是一种常用的度量方法,用于计算两个向量或数据点之间的距离。它是基于向量空间的概念,通过计算两个向量中对应元素差值的平方和的平方根来衡量它们之间的距离。欧氏距离的计算方法简单直观,可以用于度量数值型特征或数据之间的差异性或相似性。其计算结果是一个非负实数,数值越小表示两个向量越相似,数值越大表示两个向量越不相似。欧氏距离在数据挖掘、模式识别、聚类分析等领域中得到广泛应用,可以帮助大家比较和理解不同数据点之间的距离关系,从而进行数据分析和决策。对于两个向量[x]和[y],它们的欧氏距离可以通过公式(1)计算得到。

式中:[x1,x2,…,xn]和[y1,y2,…,yn]是向量中对应的元素。

2.2" 皮尔逊相关系数

皮尔逊相关系数[13]是一种用于衡量两组数据之间线性相关程度的统计量,衡量的是两组数据之间的线性关系的强度和方向,取值范围在-1~1之间。皮尔逊相关系数通过计算两组数据之间的协方差和它们各自标准差的乘积来计算,体现的是两个变量的变化趋势是否一致,以及变化的幅度是否相似。皮尔逊相关系数计算公式如下:

为了减少皮尔逊相关系数的误差,采用滑动窗口取值法对两组数据计算的皮尔逊相关系数取均值,计算公式如下:

式中:[s]为每组数据个数;[n]为窗口大小。

2.3" 相关度组合模型

结合式(1)和式(3)建立相关度计算的组合模型。将用滑动窗口取值法计算得到的皮尔逊相关系数与欧氏距离相除,最后对结果进行处理,得到相关度[c]的计算模型,计算公式为:

由于皮尔逊相关系数的取值范围为[-1,1],为了确保得到的相关度为正值,因此将[ρ]的取值范围通过[ρ+1]的操作平移至[0,2]。为了放大皮尔逊相关系数的影响,将其乘以放大系数k,从而保证其在最终的相关度[c]中具有足够的权重,以便在后续的分析和比较中更为直观。

2.4" 自适应阈值计算方法

为了准确评估不同用户的相关性,需要设定一种适用于各个用户的自适应阈值。自适应阈值的计算包括以下3个步骤。

1) 通过分析用户历史日用电负荷曲线与特征用电负荷曲线的皮尔逊相关系数得到,当涵盖超过300个数据点,确定大约90%以上的相关系数小于某一特定值[ρx]时,将[ρx]作为皮尔逊相关系数的阈值系数。

2) 基于电力部门专家经验,当用户的日用电负荷总和与特征用电负荷总和之间的差距超过特征用电负荷总和的[15]时,将此视为潜在的负荷变化异常情况。

3) 将皮尔逊相关系数的阈值[ρx]与负荷差值的[15]相除,同样为了放大皮尔逊相关系数的作用,乘以一个放大因子[k](同式(4)),得到最终的自适应阈值。具体的计算公式如下:

式中:[cx]为自适应阈值;[sa]为特征用电总负荷;[sx]为日用电总负荷。

3" 算例分析

3.1" 数据预处理

本文针对某省某低压工厂一年期间的瞬时有功功率数据缺失问题进行研究,数据包括每天96个时刻的数据点。为了填补缺失的瞬时有功功率值,本文采用均值法进行补齐,并引入了月均值法来填充特定时刻的缺失数据。此外,由于在瞬时有功功率数据分析中,完整性是非常关键的,缺失太多的数据点可能会导致那一天的数据失去代表性,而当缺失点超过3个时刻,这种失真可能会对整体分析产生不良影响。因此当某一天的用电负荷数据中缺失超过3个时刻点时,将该天的数据从数据集中移除。

3.2" 负荷曲线提取

用电日负荷曲线是根据处理后的数据按每日96个时刻绘制的曲线,用来表示该用户在不同时刻的瞬时有功功率。该曲线展示了用户在一天内不同时间点的能量需求情况。通过观察用电日负荷曲线,可以获得用户用电行为的一些关键信息,例如高负荷时段、低负荷时段以及负荷的峰值和谷值。这些信息对于电力系统规划、能源管理和负荷优化等方面具有重要的参考价值。通过绘制用电日负荷曲线,能够直观地了解用户在不同时间点的用电需求,从而更好地进行用电行为分析。

从每日用电负荷曲线中提取出特征用电负荷曲线,提取的方法为将日用电负荷曲线前面正常的10日对应时刻负荷取平均值,构成特征用电负荷曲线[14]。图2和图3分别为该工厂5月24日和5月25日的特征用电负荷曲线与该日的日用电负荷曲线。

由图2可知,5月24日的特征用电负荷曲线与日负荷曲线的趋势相似,且在每个时间段内功率差异较小,反映了该日期的正常用电情况。由图3可知,5月25日的特征用电负荷曲线与日负荷曲线存在明显的差异。经证实该日发生了工厂窃电事件,导致用电负荷出现了明显的下降趋势。

3.3" 相关度计算

按上述方法,将每天的日用电负荷曲线与对应的特征用电负荷曲线利用式(1)~式(4)进行相关度计算。式(3)中的[n]取值为10,式(4)中的系数[k]取值为50。部分计算结果如表2所示。

由表2可得,5月17日—24日平均相关度为0.889,与5月25日和5月26日差异较大。这是由于该厂在5月25日和5月26日发生了窃电事件,导致这两日的用电负荷曲线与特征用电负荷曲线的相关度远远小于之前正常时期的相关度。

3.4" 阈值确定及判定结果

根据上述相关度计算流程,将包括正常用电用户、设备故障、疑似窃电等可能导致负荷发生不正常变化的用户共计1 000组日用电负荷曲线与特征用电负荷曲线作为训练组,对其进行了相关度计算。通过分析这些数据,并结合第2.4节的自适应阈值计算方法,确定判断阈值。首先取这1 000组数据中231组异常事件取正后的皮尔逊相关系数,超过90%的负荷异常事件皮尔逊相关系数小于0.2,因此皮尔逊相关系数取0.2;然后,将皮尔逊相关系数取0.2与负荷差值的[15]相除,并对结果取相同的放大系数[k],即[k]=50,代入式(5),得到最后的阈值。

通过这个计算方法确定自适应变化的阈值,对上述1 000组训练组数据用户是否发生负荷变化过大的情况进行判断,其中256组被判断为负荷变化过大情况,实际情况下在这256组中有231组存在负荷异常事件,判断准确率达到90.2%。取500组测试组数据进行测试,122组被判断为负荷变化过大,其中99组为存在负荷异常事件,判断准确率达到81.1%;但有两组存在负荷异常事件未被判断为负荷变化过大,召回率为98%。判定结果如表3所示。

4" 结" 语

本文提出了一种用于判断用户每日用电负荷是否存在变化过大的方法。通过对用户的日用电负荷曲线与特征用电负荷曲线的相关度计算,能够获得一个量化指标,用于判断负荷变化的程度。通过引入自适应阈值的判断机制,能够根据具体情况动态调整阈值,提高判断的准确性和灵活性。

本文利用实际数据对所提方法进行了实验验证,判断准确率可以达到80%以上。可见应用该方法能够及时发现负荷变化异常的用户,为后续的异常事件研究提供有力支持。同时,该方法具有一定的实用性和可操作性,在智能电网时代,准确判断用户用电负荷是否发生重大变化对于能源管理、窃电检测以及设备故障预警等方面都具有重要意义。

然而,本文所提方法仍存在一定的局限性和待改进之处。例如,自适应阈值确定中仍存在一定的主观性,需要进一步探索更客观和可靠的确定方法。此外,本文仅针对特定领域的数据进行了分析,未考虑其他因素的影响,因此在应用到其他领域时需要进一步的验证和调整。

参考文献

[1] 穆晨宇,薛文斌,穆羡瑛,等.基于VMD⁃LSTM⁃Attention模型的短期负荷预测研究[J].现代电子技术,2023,46(17):174⁃178.

[2] 万伟,刘红旗,杜单单,等.考虑负荷季节特性的电力用户用电行为画像[J].哈尔滨理工大学学报,2023,28(3):45⁃55.

[3] 李坤奇,孟润泉,李凤莲.融合聚类⁃卷积⁃门循环的居民用电短期负荷预测方法[J].太原理工大学学报,2023,54(1):203⁃210.

[4] 何宗泽.基于数据挖掘的用户用电行为分析研究[D].长春:吉林大学,2022.

[5] 王莹,项雯,张群,等.泛在电力物联网下基于DPSO⁃Kmeans的客户用电行为分析[J].哈尔滨理工大学学报,2022,27(2):106⁃113.

[6] 武灵耀,郭贺宏,赵庆生,等.基于MACD指标与聚类算法的电力用户用电行为分析[J].上海电力大学学报,2023,39(2):105⁃111.

[7] 郑思达,梁琪琳,彭鑫霞,等.基于模糊聚类的异常用电行为识别研究[J].电测与仪表,2020,57(19):40⁃44.

[8] 毛源军,陈超强,舒一飞,等.基于居民用户用电行为分析的室内大麻种植检测[J].电力科学与技术学报,2022,37(4):198⁃208.

[9] 邹念,张颖,苏盛,等.基于小时尺度周期特征LSTM⁃Transformer的用户窃电识别方法[J/OL].电网技术:1⁃11[2023⁃01⁃06].https://doi.org/ 10.13335/j.1000⁃3673.pst.2022.1531.

[10] 夏睿,高云鹏,朱彦卿,等.基于SE⁃CNN模型的窃电检测方法研究[J].电力系统保护与控制,2022,50(20):117⁃126.

[11] 杨培.用电信息采集系统中计量异常事件分析方法与应用研究[D].杭州:中国计量大学,2019.

[12] 孙林,张一曼,张辰珂,等.基于改进粒子群和K⁃means聚类的优化算法[J].江苏科技大学学报(自然科学版),2023,37(3):81⁃90.

[13] 赵源上,林伟芳.基于皮尔逊相关系数融合密度峰值和熵权法的典型新能 源出力场景研究[J/OL].中国电力:1⁃10[2023⁃02⁃27].http://kns. cnki.net/kcms/detail/11.3265.TM.20230227.0856.006.html.

[14] 于小青.基于Storm流数据聚类算法的用电异常行为在线监测研究[D].北京:华北电力大学(北京),2021.

猜你喜欢
皮尔逊欧氏用电
用电安全
经营者(2023年10期)2023-11-02 13:24:48
用煤用电用气保障工作的通知
安全用电知识多
现代统计学之父:卡尔·皮尔逊
现代统计学之父:卡尔·皮尔逊
Excel在水文学教学中的应用
用电安全要注意
卡方分布的探源
基于多维欧氏空间相似度的激光点云分割方法
丽江“思奔记”(上)
探索地理(2013年5期)2014-01-09 06:40:44