侯雨伸,王秀丽
(西安交通大学电气工程学院,710049,西安)
气象过程信息挖掘与输电线路覆冰预测
侯雨伸,王秀丽
(西安交通大学电气工程学院,710049,西安)
针对现有覆冰预测回归模型以采样点气象参量预报覆冰值的局限性,提出了一种改进的基于气象过程信息挖掘的覆冰预测方法。按线路覆冰增量将气象参量样本分为覆冰增长、维持、消融3个模糊模式类别,定义了以气象参量样本与模式类别中心的马氏距离为变量的隶属度函数,并在计算马氏距离时采用灰色斜率关联度确定各气象参量的权重。基于此,将隶属度与采样点气象参量结合,形成包含覆冰气象过程信息的高维历史数据样本,采用支持向量机进行覆冰回归模型的训练与预测。算例比较了现有的神经网络、支持向量机预测方法与提出的改进预测方法,结果表明,前两者预测的相对误差均值分别为24.50%和22.66%,而改进的预测方法相对误差均值为6.62%。考虑气象过程信息挖掘的覆冰预测模型具有更高的预测精度。
输电线路;覆冰预测;气象过程信息挖掘;马氏距离;灰色斜率关联度;支持向量机
近年来,冰冻灾害天气频繁出现,使电网基础设施受到破坏,电网抗击冰雪灾害已成为电气领域的研究热点之一。1998年加拿大冰冻灾害[1]、2008年中国南部电网的大规模冰冻灾害[2]等都发生了大规模倒塔断线事故,造成了极大的社会经济损失。2013年1月初,中国南方共有497条输电线路出现覆冰情况,由于线路覆冰预警及除冰工作开展及时,只有极少数电力用户供电受到影响。由此可见,线路覆冰预测方面的研究工作具有十分重要的意义,是冰灾预警与提前制定除冰方案的基础。
目前,输电线路覆冰预测模型的研究主要分为两大类:一类是从研究覆冰物理过程的角度出发,根据热力学机理和流体力学机理,建立描述覆冰过程的解析表达式,包括Goodwin模型[3]、Makkonen模型[4]、雨凇覆冰模型[5-6]等,然而线路覆冰物理过程复杂,模型参数难以确定,使该类模型的应用存在一定困难;另一类为统计回归模型,以覆冰气象数据作为时间序列求取回归模型,包括非线性回归[7]、神经网络[8]、支持向量机(SVM)[9]等,此类方法均以采样时刻的气象参数通过回归模型映射到线路覆冰值,然而线路覆冰具有明显的过程积累特性,它们并未考虑覆冰积累过程信息对覆冰预测值的影响。
本文旨在挖掘覆冰气象过程信息,并将该信息与支持向量机的训练与预测相结合,提高覆冰预测的精确性。首先讨论了传统覆冰预测回归模型的局限性,进而提出了基于气象过程信息挖掘的输电线覆冰预测方法。根据线路覆冰增量将气象历史数据划分为3种模糊模式类别,通过气象样本对各模式类别的隶属度来反映覆冰积累的气象过程信息,将气象过程信息与气象参量合并为高维历史样本,采用支持向量机进行输电线路覆冰预测。
1.1 传统覆冰预测回归模型的思路
在现有覆冰回归预测研究中,均采用图1所示的研究思路:利用历史数据{xk,Dk},通过各类统计方法,得到回归函数D=f(x),其中xk是采样时刻气象数据,包括温度、湿度、风速等各类气象观测量,Dk为对应时刻的线路覆冰值。进行预测时,将未来时刻气象参量xt带入回归函数D=f(x)中,即可求得该时刻线路覆冰预报值Dt。
图1 传统覆冰预测回归模型思路
1.2 传统覆冰预测回归模型的局限性
现有覆冰回归预测均认为某时刻的覆冰值是由该时刻气象数据通过一种映射关系得到的,研究侧重于求取该映射关系的统计方法。实际上,以这种映射关系考虑线路覆冰这一物理问题具有局限性。假设连续两个采样时刻的气象参量是相同的,即xk=xk+1,且该天气条件利于线路覆冰的增长。那么,很容易得到Dk 文献[10]给出山西忻州某线路一次覆冰过程的详细数据,其中相邻两个采样时刻的数据见表1。 表1 相邻采样时刻覆冰数据 从表中数据可以看出,连续采样时刻第23、24时的气象参量是相同的,即x23=x24,那么按照回归模型D=f(x)可以推出D23=D24,但实际测量的覆冰厚度却出现接近5 mm的增长,说明仅以采样时刻气象数据求取该时刻覆冰值这一思路不能合理地反映实际情况,缺失了该过程利于覆冰增长这一重要信息。 上述讨论说明,覆冰积累过程对于覆冰回归预测模型的合理性是至关重要的。本文研究重点在于从气象参量历史数据中挖掘覆冰积累过程的信息,在回归预测时考虑它对覆冰发展的影响。 2.1 气象过程分类 文献[11]对南方电网输电线路预警系统数据库中的多组完整覆冰过程数据进行了分析。一个完整的覆冰过程可以依据覆冰增量分为3种典型过程:覆冰增长,覆冰快速稳定增长;覆冰维持,覆冰并未有明显变化,在小范围内波动(±1 mm);覆冰消融,覆冰快速消融。 本文将相邻采样时刻之间的时间间隔定义为覆冰气象过程,依据覆冰增量对气象过程进行分类,如表2所示。其中ΔD为相邻采样点输电线路覆冰增量,δ为覆冰维持类别的波动范围,可以由覆冰数据分析或经验值得到。 表2 气象过程分类 (1) (2) 式中:S+表示覆冰增长集合;S0表示覆冰维持集合;S-表示覆冰消融集合。 2.2 气象过程信息挖掘 (1)使用马氏距离的前提是已知类别的模式集,这在聚类分析中一般是很难得到的。本文将气象过程样本按照覆冰增量进行分类,得到了覆冰模式集。 (2)马氏距离不受量纲的影响,两点之间的马氏距离与原始数据的测量单位无关。气象参量包括温度、风速、湿度等物理量,它们的单位不同,故使用马氏距离比较方便。 (3) 式中:ms为模式集s的聚类中心,s∈S+、S0、S-;Cs为该模式集的协方差矩阵,ci,j为矩阵Cs中的元素,那么有 (4) 各类气象因素对覆冰的影响程度不同,在计算马氏距离时还应考虑各气象因素的权重。灰色关联度分析法[13]是针对小样本、贫信息、不确定系统的一种常用的关联度分析方法。本文采用灰色斜率关联法求取各气象因素对覆冰的权重。 设参考序列为覆冰厚度序列 D=(D(1),…,D(k),…,D(N)) 比较序列为温度、湿度等各气象变量的序列 xj=(xj(1),…,xj(k),…,xj(N)) (5) 其中ξ为灰色关联系数 (6) 式中 (7) (8) 灰色斜率关联系数只与D和xj的几何形状有关,D与xj的斜率越接近,灰色关联系数就越大,它反映了两曲线在某一点变化率的一致程度。其灰色关联度是整个区间上灰色关联系数的平均值,两序列发展趋势越相似,变化率越接近,关联度越大。 定义权重矩阵 W=diag(ε1,ε2,…,εj,…) (9) 则考虑权重的马氏距离为 (10) 以上类别判断属于集合的硬划分。考虑气象因素具有明显的模糊性,将S+、S0、S-看作3个模糊集合,通过隶属度反映气象过程样本与各集合的模糊关系。隶属度函数为 (11) 马氏距离与隶属度呈反比关系。式(11)中分母项对马氏距离加1是为了使隶属度取值范围在0~1。该隶属度便反映了气象过程的覆冰累积信息。 输电线路覆冰的物理机理复杂,非线性强,很难确定该物理过程的解析表达式,因此采用统计回归方法预测覆冰时,宜采用BP神经网络、SVM等方法,将未知的回归函数看作一个黑箱,由输入输出历史数据进行训练。SVM在解决小样本、非线性及高维模式识别等问题表现出许多特有的优势[14],而覆冰历史数据大多为小样本特性,因此本文采用ε-SVM为训练回归模型的方法。为解决传统覆冰预测模型在反映覆冰累积特性的气象过程的信息缺失,本文将气象过程信息扩充到覆冰数据样本,使预测模型在训练以及预测时都包含覆冰积累过程信息,全面地反映输电线覆冰这一物理问题的统计规律。覆冰预测算法流程如下。 (2)由式(5)求取温度、湿度等气象分量与覆冰值的灰色斜率关联度,由式(10)求气象过程样本对S+、S0、S-的马氏距离,再由式(11)求对应的隶属度μk,s+、μk,s0、μk,s-。 (5)在进行覆冰预测时,对气象参量预报值xt,先求上一时刻到该时刻的气象过程信息μt-1,s+、μt-1,so、μt-1,s-,将输入信息扩充为{xt,Dt-1,μt-1,s+,μt-1,so,μt-1,s-},代入训练好的回归模型进行预测。 4.1 算例设计 算例来自山西忻州神元I回线109号塔杆上配置的线路覆冰监测装置所采集的数据。该装置可提供线路的覆冰厚度与对应采样时刻的温度、湿度与风速。算例并未考虑降雨量,原因有二:该覆冰监测装置并未提供降雨量数据;文献[13]指出雨量与覆冰并未存在直接关系,且无降雨时线路也常由于空气湿度大而覆冰。δ按文献[11]的分析选1 mm。覆冰数据共有34组,采样间隔为1 h,见图2。以前28组数据作为训练集,后6组数据作为测试集检验回归模型的预测效果。 (a)温度 (b)湿度 (c)风速 (d)覆冰厚度 为了比较传统预测模型与本文模型的差异,以及在计算马氏距离时是否考虑各气象因素的权重的影响,同时验证SVM方法在处理小样本问题的优势,算例设计了以下4种方案。 (1)BP神经网络预测方法,采用以采样点时刻的气象数据训练、预测线路覆冰的传统思路。 (2)SVM预测方法,采用以采样点时刻的气象数据训练、预测线路覆冰的传统思路。 (3)SVM预测方法,考虑气象过程信息,将覆冰过程对于增长、维持、消融模式的隶属度以及上一时刻的线路覆冰值扩充入训练、预测样本,并且计算马氏距离时不考虑各气象因素的权重。 (4)SVM预测方法,考虑气象过程信息,并且在计算马氏距离时考虑各气象因素的权重。 4.2 气象过程信息挖掘 根据覆冰历史数据求得各气象参量对于覆冰过程的灰色斜率关联度,结果见表3。 从计算结果可知:温度和湿度对覆冰过程影响较大,风速对覆冰过程影响相对较小,最小的关联度也接近0.8,说明这3种气象参量与覆冰过程都是强相关的。在计算马氏距离时分别考虑计及权重与不计权重两种情况,权重取值结果见表4。 当不计权重时,令所有气象参量的权重为1,式(9)中的权重矩阵W为单位矩阵。当计及权重时,令权重矩阵W对角线上的元素分别为对应气象参量与覆冰过程的灰色斜率关联度。 图3、图4分别为不计权重、计及权重情况下各气象过程对于覆冰增长、维持、消融3个模式集的马氏距离。某一样本对于自身所在模式集的马氏距离定义为该样本的主距离。当主距离最小时,由马氏距离来判断气象过程隶属关系的信息是正确的。 当不计权重时,由马氏距离判断气象过程信息的正确率为60.6%;计及权重时,正确率上升为75.8%。由马氏距离计算结果可得如下结论。 (1)考虑不同气象参量的权重时,以马氏距离为判据的气象过程信息正确率更高。 (a)覆冰增长 (b)覆冰维持 (c)覆冰消融 (a)覆冰增长 (b)覆冰维持 (c)覆冰消融 (2)本文算例中,即便是考虑了权重,正确率依旧不超过80%,并不是一个十分理想的结果。这是由于算例中样本数量相对较小造成的,而覆冰气象样本大多为小样本。随着输电线覆冰气象数据的不断积累,样本数量会不断增加,该问题会进一步改善。 4.3 回归模型参数选取 在4.1节中,方案1中BP神经网络参数选择见文献[8]。方案2~方案4中SVM模型的惩罚参数C、核函数参数γ均由粒子群算法求取。模型的历史数据训练采用交叉验证方法中的留一法[15]。由训练集的覆冰真值与模型覆冰计算值的均方差评价参数的选择结果。SVM参数的计算结果见表5。 表5 SVM参数的计算结果 由SVM回归模型的均方差对比来看,传统SVM的均方差最小。仅从训练集的角度看,传统SVM回归模型具有更好的适应度。 4.4 覆冰预测结果 将测试集代入回归模型,对线路覆冰值进行预测,结果见表6。 图5为覆冰预测值绝对误差的柱状图比较结果,可以看出,BP神经网络方法与传统SVM方法所预测的线路覆冰值并不能很好地跟踪覆冰真值,特别是在采样点32、34处误差很大,说明仅用某一时刻的气象参量来映射线路覆冰具有局限性。考虑了气象过程信息以后,在这两个采样点预测误差均得到了明显的改善。4种方案的预测误差平均值如表7所示。 图5 4种方案预测误差对比 表7 4种方案覆冰预测误差的对比 表7从整体上对比了4种方案的预测误差,方案1、2以传统思路预测覆冰厚度,误差相对较大。方案3、4将气象过程信息挖掘与覆冰预测相结合后,预测误差明显减小,且方案4在考虑了各气象参量的权重后,预测误差进一步减小,相对误差均值仅为6.62%。 需要指出的是,本文提出的预测方法在进行气象过程信息挖掘时,要求覆冰历史数据的采样时刻是连续的。另外,在挖掘气象过程信息时,只能处理例如风速、湿度、温度等以数值表达的气象因素,而如风向等信息暂时无法处理。 现有覆冰预测回归模型以采样点气象参数反映对应时刻线路覆冰情况,本文讨论了该思路的局限性并提出了覆冰气象过程信息挖掘的方法。将气象过程信息挖掘的思路引入到覆冰统计回归预测中,将气象过程信息与气象参数合并,一同进行支持向量机回归模型的训练与预测。预测结果表明,本文方法具有更高的预测精度,对输电线路覆冰预测与制定除冰工作方案具有实际的工程意义。挖掘过程信息的思路也可推广到其他回归预测问题中。 [1] 薛禹胜,费圣英,卜凡强.极端外部灾害中的停电防御系统构思: (二) 任务与展望 [J].电力系统自动化,2008,32(10): 1-5. XUE Yusheng,FEI Shengying,BU Fanqiang.Upgrading the blackout defense scheme against extreme disasters: part II tasks and prospects [J].Automation of Electric Power Systems,2008,32(10): 1-5. [2] 陆佳政,蒋正龙,雷红才,等.湖南电网2008年冰灾事故分析 [J].电力系统自动化,2008,32(11): 16-19. LU Jiazheng,JIANG Zhenglong,LEI Hongcai,et al.Analysis of Hunan power grid ice disaster accident in 2008 [J].Automation of Electric Power Systems,2008,32(11): 16-19. [3] GOODWIN E J III,MOZER J D,DIGIOIA A M Jr,et al.Predicting ice and snow loads for transmission lines design [C]∥Proceedings First IWAIS.Hanover,HN,USA: IAC,1983: 267-273. [4] MAKKONEN L.Modeling power line icing in freezing precipitation [J].Atmospheric Research,1998,46(1/2): 131-142. [5] 刘和云,周迪,付俊萍,等.导线雨淞覆冰预测简单模型的研究 [J].中国电机工程学报,2001,21(4): 44-47. LIU Heyun,ZHOU Di,FU Junping,et al.A simple model for predicting glaze loads on wires [J].Proceedings of CSEE,2001,21(4): 44-47. [6] 刘春城,刘佼.输电线路导线覆冰机理及雨凇覆冰模型 [J].高电压技术,2011,37(1): 241-248. LIU Chuncheng,LIU Jiao.Ice accretion mechanism and glaze loads model on wires of power transmission lines [J].High Voltage Engineering,2011,37(1): 241-248. [7] FARZANEH M,SAVADJIEV K.Statistical analysis of field data for precipitation icing accretion on overhead power lines [J].IEEE Transactions on Power Delivery,2005,20(2): 1080-1087. [8] XU Xinhui,ZHENG Zhenghua,TAN Shaoqiong,et al.The study on the prediction method of ice thickness of transmission line based on the combination of GA and BP neural network [C]∥2010International Conference on E-Product E-Service and E-Entertainment.Piscataway,USA: IEEE,2010: 1-4. [9] 宋尖.输电线路覆冰规律与预测技术研究 [D].长沙: 长沙理工大学,2012. [10]黄新波,孙钦东,张冠军,等.线路覆冰与局部气象因素的关系 [J].高压电器,2008,44(4): 289-294. HUANG Xinbo,SUN Qindong,ZHANG Guanjun,et al.Relation of transmission line icing and local meteorology [J].High Voltage Apparatus,2008,44(4): 289-294. [11]王敩青,戴栋,郝艳捧,等.基于在线监测系统的输电线路覆冰数据统计与分析 [J].高电压技术,2012,38(11): 3000-3007. WANG Xiaoqing,DAI Dong,HAO Yanpeng,et al.Statistics and analysis of transmission lines icing data based on online monitoring system [J].High Voltage Engineering,2012,38(11): 3000-3007. [12]ELATTAR E E,GOULERMAS J,WU Q H.Electric load forecasting based on locally weighted support vector regression [J].IEEE Transaction on Systems,Man,and Cybernetics,2010,40(4): 438-447. [13]阳林,郝艳捧,黎卫国,等.输电线路覆冰与导线温度和微气象参数关联分析 [J].高电压技术,2010,36(3): 775-781. YANG Lin,HAO Yanpeng,LI Weiguo,et al.Relationships among transmission line icing,conductor temperature and local meteorology using grey relational analysis [J].High Voltage Engineering,2010,36(3): 775-781. [14]王定成.支持向量机建模预测与控制 [M].北京: 气象出版社,2009: 30-37. [15]邓乃扬,田英杰.支持向量机: 理论、算法与拓展 [M].北京: 科学出版社,2009: 115-155. [本刊相关文献链接] 曲翀,王秀丽,谢绍宇,等.含风电电力系统随机生产模拟的改进算法.2012,46(6):115-121.[doi:10.7652/xjtuxb2012 06020] 程临燕,张保会,李光辉,等.采用有向电气介数的脆弱线路选取.2011,45(6):91-96.[doi:10.7652/xjtuxb201106017] 汪成根,张保会,李鹏,等.基于自适应解列的电力系统解列面快速搜索.2009,43(2):90-95.[doi:10.7652/xjtuxb2009 02020] 别朝红,刘辉,李甘,等.含风电场电力系统电压波动的随机潮流计算与分析.2008,42(12):1500-1505.[doi:10.7652/xjtuxb200812014] 徐林,王秀丽,王锡凡,等.电力系统充裕度分析中的快速组合事件概率算法.2008,42(6):713-717.[doi:10.7652/xjtuxb200806014] 李静耘,杜正春,楚国莉,等.基于聚类的多运行方式下电力系统稳定器设计.2008,42(2):204-208.[doi:10.7652/xjtuxb200802017] (编辑 杜秀杰) MeteorologicalProcessesInformationMiningandTransmissionLinesIcingForecast HOU Yushen,WANG Xiuli (School of Electrical Engineering,Xi’an Jiaotong University,Xi’an 710049,China) In view of the imperfection of existing predictive regression models for icing forecast where only meteorological parameters at one moment are used to foretell the predicted icing value at the same moment,a revised icing forecast method based on meteorological process information mining is proposed.The samples of meteorological parameters are divided into three fuzzy pattern categories,i.e.,icing growing,sustaining and melting.Then the membership function with the variable symbolized by Mahalanobis distance from meteorological parameters sample to the center of categories is defined.And the method of gray slope-correlation is used to determine the weights of meteorological parameters to evaluate the Mahalanobis distance.The degrees of membership and the samples of meteorological parameters are combined to form the high dimensional historical samples containing icing meteorological processes information,then support vector machine method is used to train the icing forecast regression function and predict.Numerical tests are conducted and the results indicate that the mean relative error in neural network method gets 24.50% and 22.66% in the current support vector machine method,but 6.62% in the revised cases.The icing forecasting model based on the meteorological processes information mining is endowed with higher predicting accuracy. transmission line; icing forecast; meteorological processes information mining;Mahalanobis distance; gray slope-correlation; support vector machine 2013-10-16。 侯雨伸(1988—),男,博士生;王秀丽(通信作者),女,教授,博士生导师。 国家自然科学基金资助项目(51277140)。 时间:2014-03-06 10.7652/xjtuxb201406008 TM71 :A :0253-987X(2014)06-0043-07 网络出版地址:http:∥www.cnki.net/kcms/detail/61.1069.T.20140306.1027.003.html2 气象过程信息挖掘
3 基于气象过程信息的覆冰预测
4 算例分析
5 结 论