基于最小二乘支持向量机的配电网故障量预测模型

2020-05-18 06:45高小芹王梓玮肖诗弋
关键词:汉口配电网向量

高小芹 ,王梓玮,卢 晨,伍 茜,肖诗弋

(1.国网湖北省电力有限公司 武汉供电公司,湖北 武汉 430014;2.武汉理工大学 国际教育学院,湖北 武汉 430070)

随着武汉市汉口城区电网规模的不断扩大,用电客户数量不断增加,配电网故障量也随之增多,特别是在迎峰度夏期间,每日发生的故障量呈井喷式爆发。据统计,电力系统中95%以上的故障发生在10 kV配电网[1]。配电网的安全运行是整个电网安全运行的重要一环,是提高供电系统运行水平的关键环节[2]。因此,如何提高配电网的可靠性,减少配电网的故障量,是目前供电公司亟需解决的问题之一。

较多学者对配电网故障进行了研究,在配电网故障风险方面,张稳等[3]提出一种计及天气因素的配电网故障风险等级预测的方法,基于Adaboost 改进C4.5决策树算法对配电网故障风险等级进行预测,挖掘故障停电风险等级与天气因素间的关联关系。刘科研等[4]采用Rlief-Wrapper 算法分析故障关联因素,采用径向基函数的SVM方法和最优故障特征子集进行风险预警。在配电网故障统计方面,王建雄等[5]在双对数坐标下对故障次数及其累积概率进行拟合,验证配电网故障在多时空尺度下的自相似性和标度不变性,进而从时空上对其形成机理进行对比分析。谭米等[6]对配电网故障进行统计研究,发现配电网故障在双对数坐标下呈直线状,具有幂律分布特性。宋杰等[7]基于调度自动化系统、设备资产管理系统和故障抢修系统中的故障信息、设备运行数据、设备状态数据等多源异构数据进行数据挖掘和智能处理,对上海市配电网在不同季节、不同负荷、不同运行方式等条件下故障信息进行统计分析。在配电网故障量预测方法方面,程淼海等[8]提出了一种基于随机森林算法的配网抢修故障量预测方法,预测不同区域、不同电网故障与非电网故障、不同电压维度下未来一天的故障量,并在真实电力数据上进行了对比验证。王继业等[9]则是构建了基于灰色投影随机森林算法的配电网故障量预测模型,利用灰色投影筛选出相似日的样本集合作为训练数据。李童飞等[10]构建了基于支持向量回归和统计分析的配电网故障分区预测模型,并计算9个区域的故障概率,将预测故障量细化到这9个区域内,实现了配电网故障量的分区预测。喻琢舟等[11]将加权马尔可夫模型应用到配电网故障预测中,根据故障量的历史数据序列,求出每条线路月平均故障量,应用模糊聚类方法建立分级标准,将历史数据序列的相关系数作为权数,通过加权马尔可夫模型对下月的故障量进行预测。

基于上述研究,笔者提出了一种基于最小二乘和支持向量机(support vector machine,SVM)的故障量预测模型,从被动地受理故障变为主动地预测故障,以武汉市汉口地区为例,该区域(包括硚口区、江岸区和江汉区)按街道办事处的行政区域可划分为43个街区,调用SG186、PMS 2.0、95598系统、网格服务电话、市长热线等故障工单数据及来自国家气象局的天气数据,进行43个街区的故障量预测,具体分析方法如图1所示。

图1 分析方法图

1 配电网故障数据预处理

1.1 数据来源

笔者采用的原始数据为武汉市江岸区、江汉区和硚口区的设备运行时限、变压器属性及2015—2016年的故障工单、负荷、天气、空气质量等数据,其中故障工单主要来源于PMS系统、95598系统、市长热线和网格服务电话,投诉工单来源于SG186系统,负荷数据来源于SCADA系统,天气、空气质量等数据来源于国家气象局的天气数据,具体如图2所示。

图2 数据来源

1.2 数据填充

原始数据中会存在着一些异常数据和缺失数据,异常数据一般较少,可直接删除;对于缺失值,将其填充为0。同时,为了对街道区域的故障量进行预测,增加了“所在区域”和 “所属街道办事处”两个字段。

1.3 数据转换

将原有数据转换为易于分析和应用的形式,包含特征构造、数据分级及数据量化等,如量化位置信息、构建变压器投运时间特征属性、天气数据的分级分析等。将空气质量按照雾霾指数的大小分为优、良、轻度污染、中度污染、重度污染、严重污染6个等级,分别用数值1~6代表;将风力划分为微风、1~2级风、3~4级风、4~5级风和5~6级风5个等级,分别用数值1~5代表;将降雨量按照日降雨量的大小分为小雨、中雨、大雨、暴雨、特大暴雨5个等级,分别用数值1~5代表;汉口地区担负着江岸区、江汉区、硚口区3个行政区的供电服务任务,将江岸区、江汉区、硚口区分别用数值1、2、3表示;每个行政区又由若干个街道办事处组成,3个行政区共有43个街道办事处,分别用数值1~43表示。

1.4 内外部数据重组

对配电网故障数据进行内外部重组,得到新的实验参数表,如表1所示。

表1 实验参数表

2 故障统计分析

2.1 故障类型统计

将原始数据整理后,详细的分析和监测是从故障数量的实时分析、故障数量和故障处理的日常趋势监测3个维度进行的。对各区域故障影响范围、用户报修情况、抢修资源实时分布、驻点工作强度进行实时分析,并制成“运维日报”发布给各个班组,同时汇总周、月、季、年统计信息,旨在避免出现配电网运维检修数据分析与发布不及时、运维检修工作重大过失及检修时效低等问题。同时根据统计结果对故障进行初步分析,为决策提供参考。配电网故障按照电压等级可以分为高压故障和低压故障,通过对2015—2016年9 851个故障工单进行分析,得到高压故障和低压故障的统计结果,分别如图3和图4所示。

图3 2015—2016年度高压故障统计

图4 2015—2016年度低压故障统计

根据故障分类统计结果可知,低压故障是高压故障的3倍多,2015年和2016年间低压故障主要集中在进表线、墙头皮线、总空开、墙头空开、搭头线、终端箱等,特别是进表线,两年间的故障量为1 804起,占总故障量的24%,其次是墙头皮线,为781起;而高压故障主要集中在盖板、高压跌落式保险、树障、高压变压器本体、带电线夹等故障类型,其中盖板两年间的故障量为767起,高压跌落式保险为452起。

2.2 配电网故障实时分布分析

配电网故障是24 h受理制,笔者对2015年、2016年和2017年上半年配电网故障按照24 h进行划分,结果如图5所示,可以看出故障报修的早高峰期是早上8点、9点、10点这3个时间段,晚高峰是19点、20点、21点这3个时间段。

图5 配电网故障24 h分布曲线

2.3 配电网故障热力图

汉口配电运检室担负着江岸区、江汉区、硚口区3个行政区的供电服务任务,供电服务面积为144 km2,涉及人口约为300万人。汉口地区已实行一个营配班组管理一个街道办事处服务一片用户的“1+1+1”网格服务模式,但不同地区网格单元的配电网故障量存在差异,利用地图无忧软件绘制2015年—2017年汉口地区配电网故障热力图,如图6所示,可以看出沿江大道、中山大道和解放大道的一元街、车站街、花楼街、汉正街、万松园街等老城区和商业较发达地区为配电网故障高发区,而王家墩CBD新城区的故障发生率极小。

图6 2015—2017年汉口地区配电网故障热力图

3 配电网故障关联因素分析

配电网故障的发生受很多因素影响,分析造成故障的主要因素、判断各因素对故障的影响程度、描述配电网故障发生的规律,是配电网故障预测建模的首要任务。10 kV配电网故障在天气状况恶劣时发生的概率居高不下,在各类影响配电网故障的因素之中,天气为重要因素之一[12]。此外,导致配电网故障的原因还有配电设备老化、市政工程破坏及人为破坏。相比于其他几类因素,天气数据更容易收集,因此笔者重点探究天气因素对配电网故障的影响程度。

3.1 温度对配电网故障的影响

与配电网故障最为紧密的天气因素是温度,根据全年温度的变化可以大致确定全年故障量的变化。汉口地区2015—2016年最高温度与故障量的曲线图和散点图分别如图7和图8所示,可以看出不同温度段故障量对温度的敏感程度不同,在冬季温度趋向0℃和夏季温度趋向40℃时,故障量均比较高。

图7 汉口地区2015—2016年最高温度与故障量曲线图

图8 汉口地区2015—2016年故障量与最高温度散点图

采用Pearson相关分析法分析温度与故障量的相关性,Pearson 相关系数计算方式为:

(1)

式中:X代表温度;Y代表故障量。经计算得到温度与配电网故障量之间的Pearson相关系数为0.930>0.800,说明温度与配电网故障量之间存在高度相关性。

3.2 雾霾对配电网故障的影响

近年来,雾霾天气被准确界定并纳入天气预报与监测范畴。与此同时,大部分地区出现的雾霾天气造成各地空气污染指数攀升,严重影响人们的身体健康和生产生活活动。当雾霾发生时,居民会减少不必要的出行活动;当雾霾天气较严重时,相关部门甚至会采取相应的保证安全的交通管制措施,这样居民的外出活动次数与活动时间会显著减少,室内活动的用电量则会相应增加,进而影响到用电负荷和配电网的故障发生率。汉口地区2015—2016年雾霾与故障量的曲线图和散点图分别如图9和图10所示。

图9 汉口地区2015—2016年雾霾与故障量曲线图

图10 汉口地区2015—2016年雾霾与故障量散点图

由式(1)计算得到雾霾与配电网故障量之间的Pearson相关系数为0.463<0.500,说明雾霾与配电网故障量之间存在低度相关性。

3.3 风力对配电网故障的影响

风力的大小对配电网故障有很大的影响,特别是强风暴,是对配电线路威胁最大的一种自然灾害。通过计算得出风力与配电网故障量之间的Pearson相关系数为0.144<0.300,说明风力与配电网故障量之间存在微弱相关性。

3.4 降雨量对配电网故障的影响

降雨量的大小同样影响着配电网故障的发生,降雨既会直接影响暴露在室外的电力设备的绝缘,又会加剧外力对电力设备的破坏。通过计算得出降雨量与配电网故障量之间的Pearson相关系数为0.098<0.300,说明降雨量与配电网故障量之间存在微弱相关性。

4 配电网故障预测

4.1 最小二乘支持向量机预测模型

支持向量机(SVM)是一种基于统计学习理论的学习方法,最小二乘支持向量机算法[13]是支持向量机算法的扩展,将决策函数的不等式约束改变成为等式约束,选择最小二乘损失函数为优化指标。最小二乘支持向量机算法的分类决策函数为:

(2)

式中:xi、x为输入,i=1,2,…,l;f(x)为输出;λi为拉格朗日乘子;β(x)为输入空间到高维特征空间的非线性映射;d为偏差。

将y(x,xi)=β(xi)Tβ(x)作为最小二乘支持向量机的核函数,引入径向基函数(RBF)和多项式函数(POLY)作为核函数,并比较这两个核函数的平均误差:

y(x,xi)=exp[-‖x-xi‖2/(2φ2)]

(3)

K(x,xi)=[(x,xi)+1]P

(4)

式中:φ2为RBF的参数;P为POLY的参数。

多核函数学习首先需要有针对性地对不同类型的数据创建相应的核函数,再将创建的多个核函数进行组合,并展开机器学习。多核函数学习对多源异构数据处理有较好效果。多核函数的构造一般分为线性多核函数和非线性多核函数两种。采用非线性多核函数学习构造多核函数时,常常存在优化不具备凸性或局部最优解较难获得等问题,经综合考虑,笔者采用线性多核函数,其表达式如下:

(5)

式中:Kh(x,y)为单核函数;λh∈(0,1),为核函数权重;m为单核函数个数。

常用的4种单核函数为线性核函数、多项式核函数、径向基核函数和Sigmoid函数,针对数据异构性,既可以选择参数不同的核函数,又可以选择不同种类的核函数。例如,根据不同的特性选择不同宽度的径向基(RBF)核函数,或根据不同的特性在学习过程中同时选择高斯核函数和多项式(POLY)核函数。其中,径向基核函数做为局部核函数的一种,函数值受距离样本点很近的数据点影响大,学习能力强但泛化性能较弱。而多项式核函数做为全局核函数的一种,具有强大的泛化性能,距离样本点很远的数据点都可以影响其数值,但学习能力较弱。为了充分利用两种函数的优势,高效发挥局部核函数和全局核函数的内推与外推能力,故笔者选择径向基核函数和多项式核函数组合成新的多核函数,扬长避短,以得到性能更加优良的SVM预测模型[14]。

4.2 实证分析

以2015—2017年3年的数据为训练数据,预测2017年7月10日—7月16日的故障量,分别采用径向基函数和多项式函数为内核函数展开预测,预测结果如表2所示。由表2可以看出,最小二乘多项式函数均低于径向基函数, 说明核函数为多项式函数的最小二乘支持向量机模型更适用于配电网故障量的预测。

运用搭建的最小二乘支持向量机模型对故障频发街道如后湖街、二七街、常青街等21个街区2017年上半年的故障量进行预测,将街区故障量预测值作为模型输出值,并与2017年上半年实际故障量进行对比,结果如图11所示,可以看出后湖街、二七街、常青街等21个街区2017年上半年的故障量预测平均误差率为9.01%,在误差允许范围内,说明最小二乘支持向量机模型具有一定的可行性。

表2 预测结果表

图11 2017年上半年21个街区故障量预测结果

5 结论

(1)充分整合武汉市江岸区、江汉区和硚口区2015—2016年的故障工单、负荷、天气、空气质量等内外部数据,深度挖掘配电网故障发生的时间、空间特性。

(2)为了分析汉口地区故障量的发展趋势,融入“所属行政区”和“所属街道办事处”等数据,将故障地址细化到街道办事处,分析颗粒更加精细化、精准化。

(3)开创性地将雾霾作为故障量预测的影响因素,并利用相关性分析,剖析了雾霾与故障量的内在影响关系。

(4)应用所提出基于最小二乘支持向量机的配电网故障量预测模型,可以根据预测结果合理配置应急抢修资源,优化抢修驻点设置,从而缩短抢修到达现场时间,提升抢修服务质效。

猜你喜欢
汉口配电网向量
向量的分解
聚焦“向量与三角”创新题
梅兰芳汉口吃河豚
《汉口北》
配电网FTU配置优化方法研究
10千伏配电网线损原因与管理策略探析
关于城市10kV配电网自动化实施的探讨
《汉口商业简史》 书写江中之城的百年繁华
向量垂直在解析几何中的应用
向量五种“变身” 玩转圆锥曲线