基于KNN-SVM算法的输电线路杆塔雷击预警模型

2020-05-13 08:22仝瑞宁聂海福李鹏
云南电力技术 2020年2期
关键词:训练样本杆塔雷电

仝瑞宁,聂海福,李鹏

(云南大学信息与人工智能学院,昆明650091)

0 前言

随着电网建设规模的日益庞大,输电线路跨度、电压等级也相应提高,线路遭受雷击的风险也越来越大。雷电灾害对电网产生的经济损失和安全隐患愈加严重[1]。因此对雷击做到提前预警,能有效地减少雷击带来的危害[2]。

国内外学者对于输电线路杆塔雷击预警进行了广泛的研究。文献[3]利用多普勒效应进行雷云定位、轨迹预测,实现了输电线路的雷击预警;文献[4]对输电线路走廊进行网格化,计算气象站给出的雷电预报范围与输电线路网格之间的距离以实现输电线路雷击预警;文献[5]提出一种基于大气电场、雷电位置信息和雷电灾害风险评估技术的多信息融合雷电预警方法;文献[6]提出结合雷电监测网和气象卫星云图实时监测信息确定雷暴云团位置及运动趋势,以雷暴云与输电线路之间的距离为依据,实现分级启动雷电预警、输电线路雷击预警和输电线路雷击闪络预警。

现有的研究方法大多是基于气象条件与雷电参数实现输电线路杆塔雷击预警,没有考虑到雷击的产生是由气象条件、环境参数、杆塔属性等全景信息相互作用的结果。同时由于海量历史监测数据存在着重复交错、多噪声等特点,导致预警模型分类准确率低且训练时间长,难以有效地实现输电线路杆塔雷击预警。

本文提出了一种基于K 近邻和支持向量机相融合的输电线路杆塔雷击预警模型。针对支持向量机处理大样本数据时存在内存占用大、训练速度慢等缺点,采用K 近邻算法删减训练样本集中存在的重复交替、噪声点、孤立点等异常数据点,然后运用支持向量机进行样本训练和分类。通过实例分析验证了所提方法的有效性和实用性。

1 KNN-SVM算法原理

1.1 K近邻法

K 近邻法[7]的主要思想:当输入测试数据时,将测试数据的输入特征与训练集中对应的输入特征进行比较,找到训练集中与之欧式距离最小的K 个数据,则该测试数据的类别就是K 个数据中出现次数最多的那个类别。

给定训练数据集T={(x1,y1),(x2,y2)···,(xN,yN)},其中xi∈Rn为实例的特征向量,yi∈γ={c1,c2,···,ck}为实例的类别,i=1,2,···,N;根据给定的度量距离,在训练集T中寻找与x 最近的K 个数据点,包含着K 个数据点的邻域记作Nk(x),在Nk(x)中根据KNN 分类决策规则决定x 的类别y:

式中,I 为指示函数,即当yi=cj时I为1,否则I为0。在K 近邻法中通过计算两样本间的距离来作为二者之间相似性度量指标,通常用到的距离是欧式距离,如下式所示:

1.2 支持向量机

支持向量机(SVM)是Vapnik 等人在1995年提出的[8]。SVM的主要思想是利用内积函数定义的非线性变换[9],把原有的输入空间映射到一个高维空间,然后在这个高维的空间中寻找输入变量与输出变量之间的一种线性关系。

对于一个二分类问题,给定训练样本集有(x1,y1),i=1,2,...,l,x∈Rn,y∈{0,1},超平面为ω·x+b=0。为确保超平面能够把两类数据分开且使两类支持向量之间的距离最大,要求其满足:

由此可得分类间隔为2/||ω||,于是构造最优超平面的问题转化为如下带约束的最小值问题:

约束条件中引入Lagrange函数得:

式中,为Lagrange系数。约束最优化问题由Lagrange函数的鞍点条件决定,并且最优化问题的解在鞍点处满足对和b的偏导为0。将该二次规划问题转化为如下相对应的对偶问题(a=(a1,a2,···,al)):

经计算,最优权值向量和最优偏置分别为:

其中x ∈Rn。

选用RBF函数作为核函数,其表达式如式(11)所示:

2 基于KNN-SVM算法的输电线路杆塔雷击预警建模

本文提出的基于KNN-SVM 算法的输电线路杆塔雷击预警建模主要分为以下5部分:

1)获取输电线路杆塔雷击历史全景数据;

2)进行数据预处理;

3)KNN 算法进行样本有效约简;

4)建立基于KNN-SVM算法的训练模型;

5)通过新的全景监测数据进行雷击预警。

2.1 获取输电线路杆塔雷击历史全景数据

通过电力物联网获取输电线路走廊包含微气象(天气情况)、微地形(地形地貌、杆塔周边地表情况、土壤情况)及输电线路杆塔本体信息(呼称高、杆塔海拔)等全景数据作为模型的输入,遭受雷击和未受雷击作为输出,从而获得原始训练样本。

2.2 数据预处理

1)数据归一化

为避免不同数据集的值相距较大,导致建模时引起“大数吃小数”的现象,本文采用离差标准化(Min-Max Normalization)的方法对样本集进行归一化处理[10]:

式中:ug为归一化后的数据,u为样本集中的原始数据,umin和umax分别为u的最小值和最大值。

2)文字数值化

微地形数据的统计方式为文字表述,所以需要对微地形数据进行数值化。根据分析易受雷击杆塔的微地形历史数据及参考文献[11]复杂地形与雷击相关性分析,得到变量与杆塔被雷击的相关关系,则在文字-数值转化时的对应关系如表1所示。

2.3 KNN算法进行样本有效约简

由于训练样本数据中正常数据占比最多,雷击数据作为关键训练样本其数据量少,所以雷击样本数据集不需要做删减。KNN算法做数据集删减主要是针对训练样本中的正常数据,因为其数据量占比大且重复交替,所以只需要挑选其中一部分关键样本即可,KNN算法数据删减流程图如图1所示。

算法步骤如下:

Step 1:首先对输电线路走廊涵盖微气象、微地形及杆塔本体信息的历史数据样本进行整理(给每组数据贴上标签,未受雷击数据标签为0,雷击数据标签为1),然后进行归一化,并计算训练集中样本点之间的距离;

Step 2:得到相互之间欧式距离最小的K 个样本点;

Step 3:确定前K 个样本中同类别的样本数量,并判断同类别的样本数量是否小于δ(一般取0<δ≤K/2),若小于δ则删除该样本;

Step 4:检测该K 个近邻样本中是否有相同或极其相近的样本,有则删除该样本;

Step 5:更新训练数据集。

表1微地形数据数值化对应表

图1 KNN算法数据删减流程图

2.4 建立基于KNN-SVM算法的训练模型

将通过KNN 算法进行数据删减后的样本作为训练样本,通过不断调整支持向量机的模型参数,学习得到最优分类超平面。基于KNNSVM算法的输电线路雷电数据学习模型如图2所示。

图2基于KNN-SVM算法的输电线路雷电数据学习模型

2.5 通过新的全景监测数据进行雷击预警

当采集到新的微气象、微地形及杆塔本体信息数据时,将其输入模型中即可得到数据类别预报值,电网工作人员通过分析预报值的类别来决定是否启动预警。基于KNN-SVM 算法的输电线路雷电灾害预警模型如图3所示。

图3基于KNN-SVM算法的输电线路雷电灾害预警模型

3 算例分析

本实验数据来源为某供电局提供的M 线雷电监测数据。数据分为两类,没有遭受雷击的为一类,记为0;遭受过雷击的为一类,记为1。SVM 算法基于LIBSVM-2.22工具箱实现。样本共2012条数据,取前1513条数据做训练集,后499条数据做测试集,SVM 采用RBF径向基函数为核函数,其中参数c=1,g=2。

选取一部分实验数据进行画图,结果如图4、图5所示。

图4实际数据类别与测试结果对比图

图5实际数据类别与测试结果对比图

图5为放大后的结果,虽然图4中可以看出在第24、111、132、193条数据存在分类错误,但其他数据基本能正确分类。

在499条测试数据中有55条为雷击数据,其中正确检测出来了49条,有6条未检测出来,但总体检测率高达90%。实验结果如表2所示。

表2实验结果比较

实验结果表明,SVM算法对于海量数据的处理存在训练时间长、分类精度低等问题。本文在SVM算法的基础上加入K 近邻算法,对训练样本集进行删减,剔除重复交替、噪声点、孤立点等异常数据点,提高了SVM算法的分类准确率,同时缩减了91.4%的训练时间。所提模型对输电线路杆塔进行雷击预警是可行的。

4 结束语

本文提出了一种基于K 近邻法和支持向量机相融合的输电线路杆塔雷击预警模型,并通过实验证明了此方法的有效性。综上所述,得到如下结论:通过K 近邻法优化训练样本后的支持向量机分类模型相比单一支持向量机模型对雷击预警的正确率和训练速度均有大幅提高。进一步提高预测正确率是下一步的研究方向。

猜你喜欢
训练样本杆塔雷电
基于北斗的高压输电杆塔智能实时监测技术与应用
雨天防雷电要选对雨伞
人工智能
基于ZigBee与GPRS的输电杆塔倾斜监测预警系统
雷电
基于小波神经网络的网络流量预测研究
宽带光谱成像系统最优训练样本选择方法研究
计算机机房的雷电防护
降低输电线路雷击跳闸率是采取“疏”还是“堵”
雷电能治病吗?/自杀疑云