多维特征向量相似度比较算法在电能计量异常筛查中的应用

2022-05-19 13:23张轶晖夏海燕
重庆电力高等专科学校学报 2022年2期
关键词:余弦特征向量夹角

张轶晖,夏海燕

(1.国网重庆市电力公司市北供电分公司,重庆 400015;2.国网重庆营销服务中心,重庆 400015)

随着电网企业数字化建设不断深入,电网企业建成了用电信息采集、采集运维闭环、一体化线损平台等一系列信息系统,以支撑计量业务开展。在提升业务自动化、数字化水平的同时,也对计量异常分析提出了新的挑战。

如表1所示,在整个计量异常处置过程中,异常发现环节耗时较长,甚是接近异常处理时长,分析发现,导致此现象的原因如下。

表1 计量装置异常恢复过程各环节用时统计表 d

电能计量技术链条长,故障种类复杂,分析定位难。随着智能电能表的全面推广应用,电能计量业务已经由传统的计量单一专业向计量技术、通信采集、数据分析等多专业融合方向转变。完整的电能计量业务包含了本地计量设备计量,从表计到集中器的本地数据通信,从集中器到采集主站远程数据回传,主站前置的数据解码,主站侧数据校验和存储等多个技术环节。由于各技术环节涉及不同专业,需要综合多专业数据进行分析,所以快速准确定位异常环节有难度。

计量数字化水平提升,数据维度增多,人工分析难。在电能计量已经实现全数字化、远程化的今天,用电信息采集系统、统一线损管理平台等相关信息系统已经全面投入应用,电能计量已经不限于每月的电量数据,而是覆盖了电压、电量、功率、需量、功率因数、电表事件等多种数据维度。且随着高速载波(HPLC)技术的应用,数据采集频率由原来的每月向分钟级提高。以重庆电力为例,每天会产生30 GB以上的计量数据,要从中分析定位出计量异常问题,仅靠人工是不可行的,需要采用信息化、智能化手段对计量异常进行监测。

1 算法选择

1.1 传统计量异常算法

传统的计量异常筛查采用的是对各类计量异常进行分类、并针对每种异常分别设置指标的方式,其中各项指标阈值主要靠人工经验设置,各项异常筛查逻辑相互独立。表2展示了集中典型的计量异常及其筛查算法。

1.2 多维向量相似度计算算法

几何中夹角余弦可用来衡量两个向量方向的差异,机器学习中可借用这一概念来衡量样本向量之间的差异。

1)在二维空间中向量A(x1y1)和向量B(x2y2)的夹角余弦公式:

2)对于两个n维样本点a(x11,x12,…,x1n)和b(x21,x22,…,x2n)的夹角余弦类似的,可以使用类似于夹角余弦的概念来衡量它们间的相似程度

表2 典型计量异常判断逻辑

即:

夹角余弦取值范围为[-1,1]。夹角余弦越大,表示两个向量的夹角越小;夹角余弦越小,表示两向量的夹角越大。当两个向量的方向重合时,夹角余弦取最大值1;当两个向量的方向完全相反时,夹角余弦取最小值-1[1]。

此种算法适用于多特征因子的综合比较,具体到电量异常筛查的应用场景。将各种异常因子作为样本点,在此基础上构建衡量异常特征的样本向量,能够综合平衡各种异常因子产生的影响。

1.3 两种算法比较

传统算法简单易搭建,但是存在以下不足:阈值设置靠经验,各类型异常判断逻辑高度独立,综合平衡各种影响因子的能力弱,在处理多维度海量计量数据时存在局限,在实际应用中容易出现海量异常错报问题。与传统方法相比,基于多维度向量相似度计算的算法能更适应海量计量数据处理分析,虽然算法建模难度明显增大,实际分析计算过程需要计算机介入。

综上,在电能计量已经实现数据化、智能化的背景下,选择多维向量相似度计算算法更具可行性。

2 算法模型搭建

2.1 总体情况

建立多维向量相似度计算模型,按照设计特征分量、计算计量异常特征、分类判定3个步骤计算分析结果,利用特征向量相似度比较公式,当相似度大于80%时自动生成计量装置异常工单[2]。其流程如图1所示。

图1 特征向量相似度比较模型计算分析流程图

2.2 原始数据处理

从多个系统选取计量相关的原始数据,数据来源主要有营销业务应用系统、用电信息系统和一体化线损平台。根据数据类型,可将原始数据按计量档案、量测数据、运行评价数据3类进行整理,具体如图2所示。

图2 原始数据分类图

2.3 特征分量选定

在以上数据处理基础上设置了若干特征分量,即向量样本的各维度,这些维度共同组合成一组向量,完成了计量现象的特征提取和数据化,实现了由一组多位向量承载计量特征信息的过程,为了快速筛查做了数据准备。表3展示了部分特征分量的构建过程。

表3 特征分量计量表

该步骤借鉴了传统的计量异常分析算法[3]的特征提取及阈值设定。同时新增了一些全局性的特征分量,如“故障同时率”,该特征分量衡量了同台区/同线路其他用户的故障情况,有利于发挥多维向量相似度识别的优势,识别故障是供电侧故障引发还是计量侧故障引发[4]。

2.4 计量异常分类

为实现异常精准识别,将常见电能计量异常分为5大类16个小类,具体分类结果如表4所示。

表4 计量异常分类表

针对表4展示的每种异常,逐个设置了“筛查目标向量样本”,即出现此类异常的标准特征向量,这里以“电压断相”类计量异常为例[5],表5是此类异常的一个“筛查目标向量样本”。

表5中的电压断相的特征可通过以下3类体现:一是“影响类”的特征,表现为线路线损突降、该用户用电量突降;二是“客观表象”类特征,即B相欠压;三是“环境类”特征,即同台区(线路)无相同故障用户。根据3类特征同时判断,可有效避免误判,提升精准度。

表5 “电压断相”的筛查目标向量样本节选

3 应用效果

3.1 提升效率,减少计量损失

国网重庆市北电力公司在应用多维特征向量相似度比较算法的过程中,能有效及时地发现计量异常故障,使得计量装置异常处理时间由原来的22.5 d缩短至8.8 d,大幅提升了工作效率。另一方面,该算法引入的线损分析维度对导致电量漏计的计量异常敏感度高,通过对此类计量异常及时处理,能有效挽回因计量差错导致的经济损失。

3.2 提高精度,减少资源消耗

多维特征向量相似度比较算法通过综合考虑计量异常表象特征、对外影响特征和环境特征等多维度信息,可以有效过滤非故障类的供电侧故障,即无须处置的计量异常数据,使综合判断准确率超过75%,较传统算法有大幅提升,能有效减少无效计量异常工单任务。国网重庆市北电力公司在应用该算法的过程中,平均每月减少无效计量异常排查现场派工1 600余次,按现场派工成本80元/次估算,每年可节约成本153.6万元。

4 结论

在国网重庆市北电力公司的计量异常筛查实践中,检验了多维特征向量相似度比较算法的有效性,与传统的异常筛查方式相比,该方法在提升筛查效率、减少无效工作量、降低系统资源投入等方面成效显著。2020年1~6月累计追补电量91.28万kW·h;同时计量装置异常恢复时间的缩短,对降低企业线损、提高采集成功率及电费回收率等工作提供了有力支撑。

猜你喜欢
余弦特征向量夹角
克罗内克积的特征向量
高中数学特征值和特征向量解题策略
求解异面直线夹角问题的两个路径
向量夹角的风波
向量夹角的风波
三个高阶微分方程的解法研究
椭圆余弦波的位移法分析
平面向量夹角问题的易错剖析
两个含余弦函数的三角母不等式及其推论
实施正、余弦函数代换破解一类代数问题