基于用电信息采集系统的窃电行为定位及分析技术研究

2023-12-06 14:20程兴亮
电气技术与经济 2023年9期
关键词:用电聚类定位

程兴亮

(国网泸州供电公司)

0 引言

随着社会的发展,电力在现代社会中变得越来越重要。窃电行为不仅会给用电企业带来经济损失,而且还会给用户造成电器损坏等不良影响。针对传统的人工巡检窃电检测方法存在效率低、无法全面覆盖和易出现漏检情况,研究者们提出了许多对窃电行为进行检测的方法和装置[1-2],并取得一定的效果。

文献[3]提出了一种基于用电信息采集系统的窃电行为定位方案,该方案对用电数据进行分析,发现数据的异常状况,结合相关窃电行为,可实现对主站监控盲区时段的窃电行为定位,但是该方法定位精确度不高,存在漏检情况。

文献[1]提出了一种采用稠密度聚类方法对低电压台区的窃电行为进行识别。该方法通过及时更新用电窃电行为的数据,建立非负矩阵,计算综合分值,以此实现对用电窃电行为的识别。虽然该方法能对窃电行为进行识别,但定位性不高,只能识别出是否有窃电行为,不能对其进行定位。

文献[4]提出采用双向深度循环神经网络模型对窃电行为进行检测的方法。该方法利用门控循环单元和长短时记忆网络建立模型,通过采集到的用电量数据,利用网络提取数据的时序特性,并进行分类,以实现对窃电的检测。虽然该方法对窃电行为检测的准确度较高,但不能对窃电行为进行定位。

基于此,本文针对现有文献存在的准确度不高、漏检和不能实现对窃电行为准确定位等问题,提出了改进的K-means聚类算法,主要是通过平均密度与最远距离确定初始聚类中心[5];将处理后的用电信息采集系统中采集的与窃电行为相关的特征参数作为自变量,建立以定位窃电用户为目的的三维特征因子关联模型,与电压和电流不平衡率的波动情况相结合[6],实现对窃电行为定位。

1 用电信息采集系统及窃电手段分析

1.1 用电信息采集系统

窃电行为定位是指利用遥感技术、电磁波定位技术、GPS定位技术等方式,对窃电行为进行定位和监控,以保障电力系统的稳定运行和公共安全。本研究中用电信息采集系统主要包含电能计量装置、数据采集装置、数据处理软件和数据中心或云平台等部分[7]。电能计量装置用于实时测量电力系统的电能消耗情况,通常包括电能表、智能电表等。通过用电信息采集系统,可以帮助用户实时监测和管理电力消耗情况,优化能源使用效率,降低用电成本。用电信息采集系统的结构图如图1所示。

图1 用电信息采集系统结构

1.2 窃电手段分析

窃电技术是一种非法获取电力的手段,具有隐蔽性强、技术要求高、危害性大和社会普遍性等特点[8]。新型的窃电手段通常包括对电表计量设备进行修改和破坏、利用磁场对电表进行计量干扰、破坏电表和供电回路等类型,窃电技术分析如图2所示。

图2 窃电技术分析图

通过图2可知,窃电技术通常是围绕电能计量进行展开的,因此对窃电行为进行定位分析时,以线损、电量、电压、电流和功率因数等数据为主要研究对象是必要的。在窃电行为定位中,遥感技术是常用的一种技术。该技术可以通过发送电磁波来探测目标物体的位置、大小等信息,从而实现对窃电行为的实时监测。

2 K-means聚类算法

K-means算法是一种常用的聚类算法。该算法的目标是将样本分为k个不同的簇,使得同一个簇内的数据相似度较高,而不同簇之间的数据点相似度较低[9]。具体流程如下:

(1)初始化:随机选择k个用电信息数据样本点作为初始的聚类中心,即确定类别数目k和初始质心。

(2)计算距离:对于每个数据样本点,统计其与k个中心的距离,将该数据样本点划分到最近的簇中。对其进行相似度测试:

式(1)是欧式距离表达式。其中,Lij是各个数据点到不同初始聚类中心的距离;Zik是数据的归一值;Zjk是步骤(1)中的初始质心;μ为参数,用于调整相似度;n是常数。

(3)更新聚类中心:对于每个簇,再一次计算簇内数据样本点的均值,将其作为新的聚类中心。

(4)重复步骤(2)和(3),直到收敛(即聚类中心不再变化)为止。其收敛性判断公式为:

式中,E为收敛性判断;Zε为聚类Ci中的数据样本;mi为步骤(3)中确定的新的聚类中心。

此算法是一种经典的聚类算法,优点在于简单易懂、计算速度快。在对窃电行为进行定位分析时,需要处理用电信息采集系统采集到的大量的数据,算法相对来说可伸缩性强且高效。

但是K-means算法的缺点也较为明显,如对初始聚类中心的选择较为敏感,对数据点分布不均匀的情况容易出现聚类效果不佳等问题。基于此,通过利用平均密度与最远距离的变异加权改进K-means算法,实现对初始聚类中心的稳定选择;对用电信息采集系统中采集的样本数据进行降维、降噪和归一化处理,用于解决数据点分布不均匀等问题。

本研究将上述方法应用到全球定位系统(GPS)技术中,对窃电行为进行精确定位。该技术可以确定目标物体的位置和方向,并且不受地形地貌的影响,因此可以实现对窃电行为的高精度定位。通过在GPS定位中加入数字定位以提高用电信息采集系统窃电定位能力。

3 改进的K-means聚类算法及数据处理

3.1 改进的K-means聚类算法

在进行窃电技术分析时,例如私自接线、窃用电、电力盗窃等违反电力法规行为、硬件破坏行为、以及数据变更行为等,在定位这些行为时,不仅需要进行位置定位,也需要数据定位和分析。由于初始聚类中心的选取较为敏感且对聚类结果有较大影响,本文提出对K-means算法进行改进。设样本数据集为X={xi|xi∈Rw,i=1,2,…,n},其中,w为维数;xi为样本数据;Rw为w维的实数。

在对窃电行为特征权重的改进上,采用变异系数的欧式距离实现对数据特征的加权。变异系数 =(标准差 ÷平均值)×100%。当变异系数较低时,说明数据较为集中,反之则说明数据更加分散。因此,变异系数可用来比较不同数据集或样本的离散程度大小。

定义样本中每个维度的特征加权系数为vj:

本文采用平均密度与最远距离方法对初始聚类中心进行选取。

根据式(1)计算出平均距离:

式(4)中,Avg Dist是平均距离。

密度参数计算公式如下:

式中,Dens(xi)是密度参数平均密度表达式如下:

式中,Avg Dens(D)是平均密度。孤立点判定式如下:

式中,α是倍数。将满足式(7)的样本数据点集合到数据集N中,其余数据点放入集合S中,在S中选取平均密度最大的视为初始聚类中心,将大于Avg Dens(D)的β倍的数据点且离初始质心最远的点作为下一个聚类中心。从而实现对算法的初始聚类中心的确定,即K的确定。

通过上述方法,对不同类型的数据信息进行分类、定位和分析,以提高不同类型用电信息采集或窃电行为分析效率。

3.2 数据处理

从用电信息采集系统获取的数据,存在一定的异常值,采用格拉布斯准则对其进行判别[10]。判别公式为:

式中,M(α,n)是准则的临界值,可查表获得;α是显著性水平,当α=0.01或0.05时,数据满足式(8),即为异常值;n是重复观测次数;是数据的算术平均值;s是标准偏差;xd是重复观测值;xi是最大残差绝对值。

本文采用改进的K-means聚类算法,需要对多个簇同时进行,对于不同的采样参数,其值有较大差异,若直接对其进行聚类,会对精度造成影响。因此需要对各采样参数进行归一化处理。

对电压数据进行归一化处理:

式中,U′是归一化后的采样电压值;U是采样值;Uε是采样额定值。

对A相、C相电流不平衡率的绝对值进行归一化处理:

式中,θAC是AC两相的电流不平衡率;IA是A相电流;IC是C相电流;λ是补偿参数。

对其他量纲不同的用电信息参数进行归一化处理如下:

4 窃电行为定位及分析技术的实现

在对窃电行为定位实现上,本文构建三维特征因子关联数学模型,通过分析电压、电流和功率等数据的关联性,建立关联模型,通过模型计算值判断该用户是否存在窃电行为,从而实现对窃电行为的定位。

将电流、电压和功率作为窃电评估的主要对象,对用电信息采集系统提供的数据经过降噪和归一化处理后,利用K-means算法对此三类参数进行分析,选择出每一类的离散值,采用关联模型对离散值综合评判,确定是否属于窃电用户。定位窃电用户流程图如图3所示。

图3 定位窃电用户流程图

结合上述流程图,现在对上述定位窃电用户数据信息进行分析,其中三维关联模型如下:

式中,P是关联模型的计算值;eωi是不同参数的补偿值;ωi是三种参数的不同权值,其大小需要根据窃电行为发生与实际用电之间关联程度设定。当关联模型值P大于阈值时,可判定该用电用户处存在窃电。

5 实验分析

以某市窃电现象较为严重的5个台区中的400户用户作为分析对象,使用1~400的编号代表用户名称,构成实验样本。通过定位窃电用户流程对用电信息采集系统中采集到的数据样本进行筛选,采用大数据分析软件Orange对样本数据进行聚类分析,其中离散点是需要重点关注的对象。K-means聚类算法对处理后的数据样本进行聚类的结果如图4所示,其中△表示电压数据样本的聚类结果;表示电流数据样本的聚类结果;○表示功率数据样本的聚类结果。

图4 K-means聚类结果

从图4中可以看出,数据样本分布的较为广泛,不利于对个别特殊离散点进行判断。为了使窃电用户定位的更加准确,本文在试验部分采用逻辑回归对聚类结果进行处理,提高对离散点判断的准确性。逻辑回归分析结果如图5所示。

图5 逻辑回归分析结果

由图5可知,离散点多处在不同聚类间的临界处,将图4和图5中共同存在的离散点选取出来,利用三维特征因子关联模型对其进行综合评判,从而实现对窃电行为的发现。

单纯利用关联模型对算法聚类结果进行综合评判,会出现一定的误判现象。为了提高定位窃电用户的准确性,本文结合用电信息采集系统中检测的用户电压、电流变化趋势进行分析。当用户存在窃电行为时,其电压和电流的不平衡率会发生一定的变化波动[11],且电压不平衡率允许波动值为40%。

电压不平衡率的计算公式如下:

式中,f是电压不平衡率;fl是额定电压;fs是电压实际值。电流不平衡率的计算公式如下:

式中,i是电流的实际测试值。

根据用电信息采集系统采集到的电压、电流数据值,经过数据处理后,对某窃电用户分析其在窃电时间内的电压和电流不平衡率的波动情况,如图6所示。

图6 电压、电流不平衡率波动情况

由图6可知,电压不平衡率在一定时间内波动较大,超过正常值较多;电流不平衡率在一定时间内出现异常情况。由此可识别出用户存在窃电行为。

将关联模型对改进的K-means聚类算法得出的离散点进行综合评判后的结果,与电压、电流不平衡率的波动情况进行结合,用来定位对窃电行为。

为确定本文方案的有效性和准确性,稽查工作人员对这400户用户进行逐个筛选排查,得出有8户存在窃电行为,其中有7户是本文方案筛选出的,另外1户因窃电量较少而未被本文方案筛选出,见下表。

表本文方案检测窃电行为及现场核实情况

本文方案针对400户用户进行窃电行为的筛查,只有1户用户的窃电行为未被筛选出,且没有出现误判现象,其准确率能达到99%,可满足供电公司对窃电行为定位的需求,具有一定的实用价值。

6 结束语

本文针对当前窃电手段技术,明确了定位窃电行为是一种聚类问题,将用户分为窃电用户和正常用电用户。基于用电信息采集系统采集到的数据参数,提出采用改进的K-means聚类算法对数据样本进行分析,与三维特征因子关联模型和电压、电流不平衡率的波动情况相结合,实现对窃电用户的准确定位。通过实验也验证了该方案对窃电行为的判断准确率能达到99%,且不会将正常用电用户误判为窃电用户,保障了用电企业和用电用户的经济利益,具有较强的实用价值。

本文方案对窃电行为定位的准确率较高是建立在实验用户较少的基础上进行的,对较多、较复杂的用户进行判定,其准确率不能保障。且本文所提方案不具有自主学习优化能力,后续还需进一步研究。

猜你喜欢
用电聚类定位
用电安全
用煤用电用气保障工作的通知
安全用电知识多
《导航定位与授时》征稿简则
Smartrail4.0定位和控制
用电安全要注意
找准定位 砥砺前行
基于DBSACN聚类算法的XML文档聚类
基于高斯混合聚类的阵列干涉SAR三维成像
青年择业要有准确定位