基于改进聚类分析算法的微地形归类及对冰区量级修正系数研究

2021-03-02 10:01张露松马晓红彭赤杜昊张伟姜苏
电力大数据 2021年11期
关键词:量级投影聚类

张露松,马晓红,彭赤,杜昊,张伟,姜苏

(1. 贵州电网有限责任公司电力科学研究,贵州 贵阳550000; 2. 中国电建集团贵州电力设计研究院有限公司,贵州 贵阳 550000)

根据最新IPCC报告中AR6部分对气候评估指出,于2040年地球温升将超过1.5℃,全球增暖效应将会增大极端气候发生频率,而气候变化程度对输电线路的稳定运行具有一定的威胁。自2008年我国西南区域发生严重冰灾事件以来,发现冰期寒潮活动越来越频繁,输电线路覆冰严重程度也逐年增加[1-5]。电力部门也加强对主配网防冰抗冰工作的重视度,为全面提升电网抗冰能力,响应党的十九大提出的“不断满足人民日益增长的美好生活需要”工作要求,更多的新技术、新手段运用于线路防冰工作中。

目前,电力部门针对线路防冰工作主要包括:编制冰区分布图[6]、安装在线监测设备[7-10]、人工观冰、无人机观冰等手段[11]。其中,冰区分布图主要是利用长时间序列覆冰资料,计算30年、50年、100年一遇覆冰极值,但由于冰区分布图均是采用DEM作为底层数据计算区域范围内覆冰量级,属于事后分析,且无法反映西南地区微地形众多的区域覆冰情况,往往微地形所造成局地小气候对线路覆冰的驱动作用远远高于一般地形;安装在线监测设备方式,极端低温、高相对湿度对传感器的灵敏性要求极高,根据运行情况反映由于终端故障率高、消缺不及时、覆冰厚度计算不准确等原因,不能在冰期更好地指导防冰工作;人工观冰多为巡线人员通过肉眼观测估算覆冰厚度,存在测量误差大、效率低等问题;同时,无人机观冰仅能通过主观判断线路覆冰情况,无法准确判断线路覆冰类型,不同的覆冰类型所对应的覆冰密度差异性较大,对线路的危害程度也不相一致,这些是借助无人机手段是不能解决的。

因此,准确地、有效地做好线路防冰工作,需要实现对微地形区域线路覆冰情况定量的认知,因为微地形区线路覆冰复杂程度、危害程度均远远高于其余地形区域。现有部门学者建立了微地形因子对线路覆冰的影响,其中文献[12-15]主要研究了海拔与线路覆冰关系模型,均指出海拔与覆冰厚度之间存在正相关性关系。文献[16]指出线路覆冰是微地形因子和气象因子共同作用的结果,其中微地形因子除了考虑海拔,还应考虑坡度因子。文献[17]指出风向对线路覆冰的影响较大,因此在进行微地形与覆冰关系研究工作中,需要判断线路是否处于迎风坡。虽然部门学者采用不同微地形因子分别研究了其与线路覆冰厚度关联程度,但目前的研究工作所考虑的地形因子均不全面,且大多是研究某个具体位置,而缺乏对全省大区域防冰工作有效指导意义。

基于上述分析,本文综合考虑覆冰类型、海拔、迎风坡、线路走向高度差、坡度、临近区域水体等地形指标,首先采用主成分分析算法结合各点位微地形数据,实现对微地形归类;其次分类后的微地形区域覆冰观测资料进行质量控制,保障研究资料的准确性;最后分别研究各地形指标对线路覆冰的贡献程度,并给出微地形因子对覆冰量级修正系数。通过本文的研究,能够较为全面地考虑微地形对线路覆冰的影响,研究结论能够为冰区分布图升级改造以及在线监测设备安装点位均具有较大实际意义。

1 总体技术路线及理论

1.1 技术路线

本文首先采用GIS技术,结合贵州DEM数据(空间分辨率12.5m),对安装有覆冰在线监测终端、人工观冰500个微地形点位实现微地形因子准确提取,本文上述分析部分学者研究高程、坡度、风向等对线路覆冰的影响,其中风向是实时变化量,无法准确地用一个衡量来表示,在本文研究工作中主要研究线路朝向与冬季主风向的关系,判断该微地形点位线路是否处于迎风坡。同时,大型水体也是造成线路容易覆冰的重要因素之一,主要是由于水体的存在,造成邻近区域范围内相对湿度较大,而相对湿度大于80%是形成覆冰的一个必要条件[18-19]。因此,本文所考虑的微地形因子主要包括:高程(S1)、坡度(S2)、迎风坡或背风坡(S3)、冬季主风向与线路走向夹角(S4)、线路走向高度差(S5)、与水体距离(S6)。

其次,基于上述提取出的微地形因子,结合各微地形区域覆冰类型观测资料,采用改进聚类算法,实现对各研究样本从微地形角度进行归类,实现较好归类的原则为在同一个归属类别内各样本微地形较为一致且覆冰类型相同。针对归类后的样本,本文对各归属类内覆冰观测资料进行质量控制,保证为后续研究微地形因子与覆冰厚度关联程度使用资料的准确性。最后,建立微地形因子与覆冰厚度的关联模型,并结合现有冰区分布图,提出微地形区域冰区量级修正系数。

图1 总体研究技术路线Fig.1 General research technical route

1.2 相关理论

在本文的研究工作中,由于涉及的微地形指标较多,通过多维指标对500个微地形点分别提出覆冰量级修正系数,不仅工作量较大,且仅仅通过多维指标直接判断覆冰量级修正系数难度较大。现有常规聚类模型主要通过计算各样本指标数据之间相关性、欧式距离等,实现对样本聚合划分,这些聚类模型对于少指标、小样本数据能够较为准确地寻优出最佳聚类中心,从而较好地实现样本聚合分类[20]。但对于本文研究多指标、大样本数据情况,采用直接采用常规的聚类模型将无法准确地计算出最优聚类中心,从而影响到样本聚合的准确效果。

因此,本文提出改进的聚类分析算法,首先通过降维思想,将多维度微地形因子指标转化为一个可以综合评价的指标,即采用投影寻踪算法,根据6个微地形因子以及所对应的覆冰类型(含同期气温、相对湿度)共计9个评价指标计算出500个样本最优投影方向,并将最优投影方向作为聚类分析的输入,实现对500个样本聚合。投影寻踪算法核心理论为[21]:

(1)

上述公式中:a(j)为单位投影向量方向,x(i,j)为第j个样本中第i个指标归一化后数值。

为较好地获得各样本最优投影向量,在整体上要投影点要尽量分开,而对于局部投影点要尽量聚合,对此投影指标函数可以构造为:

(2)

上述公式中:Sb为z(i)的标准差,R为计算局部密度是设置的窗口半径,u(R-rij)为单位阶跃函数,rij为各样本投影空间距离。

根据上述计算出的500个样本最优投影方向值,采用欧式距离法,实现对样本进行聚合分类。

在实现利用7个评价指标对样本聚合分类后,本文需要根据500个样本多个冰期统计出的最大覆冰厚度,计算与6个微地形因子之间的关联程度,而在关联程度分析之前,需要保证数据的有效性,因此需要对覆冰观测资料进行质量控制,本文根据上述对500个样本聚合归类,提出相似区覆冰一致性原则对观测资料质量控制,具体质量控制流程如图2所示。在同一个聚类结果(覆冰相似区),覆冰类型、微地形、气象条件较为一致,所形成的覆冰厚度分布在一个可量化的误差范围内,本文对每个覆冰相似区内,逐年统计各样本最大覆冰厚度,采用1.5倍均值偏差原则,剔除大于1.5倍均值的数据。

图2 观测资料质量控制技术路线Fig.2 The technical route of observation data quality control

2 研究与分析

2.1 微地形因子识别与提取

本文主要采用GIS技术,结合12.5m的DEM 数据、500个样本坐标值,实现对各样本高程、坡度、迎风坡或背风坡、冬季主风向与线路走向夹角、线路走向高度差、与水体距离提取。其中,由于DEM为高程属性数据,因此只需要将500个样本坐标值在DEM上叠加,即可提取各样本高程值;对于坡度的提取主要采用三阶反距离平方权差分方法,文献[22]指出在坡度提取中该算法要优于其他方法;对于迎风坡或背风坡的提取主要计算坡向与冬季主体风向的夹角θ,当0<θ<90°时表明处于迎风坡,其余为背风坡。图3为典型微地形区域现场踏勘情况,根据实际踏勘结果与GIS提取结果比对。

(a) 220kV YY线#039地形(a) Terrain of #039 under 220kV YY line

对于典型微地形区域实地踏勘测量显示,高程、坡度、迎风坡或背风坡、线路走向高度差,均与GIS自动识别提取结果相一致,对于冬季主风向与线路走向夹角实地踏勘与GIS结果存在平均0.4°的偏差,主要是由于现场踏勘人员对于冬季主风向通过人为判断的方式,对于与水体距离提取实地踏勘与GIS结果存在平均2m的偏差,主要是由于水体与塔位水平距离通过人工方式无法准确地测量。通过上述分析,实地踏勘与GIS提取微地形结果相一致,可以说明本文所提取的微地形因子是合理、准确的。

2.2 微地形归类及关联度分析

本文对提取出的6个微地形因子以及所对应的覆冰类型(含同期气温、相对湿度)共计9个评价指标,首先对各分析指标归一化处理,然后采用改进的聚类算法进行聚合划分,根据计算结果显示,500个样本可以划分为5个大类,分类如表1所示。

表1 样本分类结果Tab.1 Classification results of samples

续表1

根据表1归类结果,采用本文所提出的相似区覆冰一致性原则对各分类结果中覆冰观测资料进行质量控制,剔除同一个分类区域内各样本覆冰厚度值大于区域内1.5倍平均值的年份观测值,然后建立各分类区域微地形因子与所对应的塔位覆冰厚度最大值关系模型。对于研究多指标与影响结果之间的关联程度,需要计算各指标的权重值,常规的方法有层次分析法、模糊数学等方法,这些方法在构造判断矩阵过程中存在较大的人为主观因素,所得出的评价结果缺乏一定的科学依据。因此,本文主要采用熵权法[23-25],通过每个指标数据波动程度对覆冰厚度的敏感性,来确定指标权重值,分别计算出5个类别中6个微地形因子指标权重值见表2。

表2 各类别中微地形因子权重Tab.2 Weight of micro terrain factor in each category

续表2

从表2计算结果可以看出,每个分类内6个微地形指标权重值均不相一致,但高程值所占权重均最高,说明了高程对覆冰的影响相对较大。

2.3 覆冰量级修正系数研究

本文利用贵州电网2018版冰区分布图,提取安装有覆冰在线监测终端、人工观冰500个微地形点位所对应冰区量级,其中依据《电力工程气象勘测技术规程》(DL/T 5158-2012),对于110kV、220kV电压等级点位主要提取30年一遇冰区量级、500kV主要提取50年一遇冰区量级。

统计2008年之后这500个微地形点位最大覆冰厚度与提取的冰区图量级比对,比对结果如图3所示。根据比对结果显示,多年观测最大冰厚高于同位置处冰区图量5mm、10mm、15mm、20mm的分别有54个、37个、24个、19个,说明这些点位覆冰情况远远严重于冰区图结果,因此需要对这些位置处冰区图量级进行修正。

表3 观测最后冰厚与冰区图量级比对

本文对表3中比对结果,依据上述分类规则,以及根据表2计算出的各类别中微地形因子权重,构建冰区图量级修正系数εm计算表达式为:

(3)

上述公式中:m为第几类(取值1-5),n为第m类中冰区图量级不合理点位数,j为第几个指标,gcmn为第m类中第n个样本多年最大观冰厚度,bqmn为所对应冰区图量级,ωmj为5个分类中所对应的6个指标权重,Sj为6个指标数据,εm为每个分类需要计算的冰区量级修正系数。

经过计算,5个分类结果的冰区量级修正系数分别为:1.14、1.22、1.19、1.31、1.28。

3 结论

本文首先提出改进聚类算法,利用投影寻踪算子将多指标评价指标投影成一维向量,并采用欧氏距离法对样本一维向量结果分类,并提出相似区覆冰一致性原则对观测资料质量控制,剔除大于1.5倍均值的数据;其次采用熵权法计算每个分类中各微地形指标权重系数;最后给出微地形点冰区量级修正系数。主要得出:可以将500个微地形点划分成5类,根据所提出相似区覆冰一致性原则对观测资料质量控制,剔除大于1.5倍均值的数据,每个分类内6个微地形指标权重值均不相一致,但高程值所占权重均较高,5个分类结果的冰区量级修正系数分别为:1.14、1.22、1.19、1.31、1.28。

猜你喜欢
量级投影聚类
一种傅里叶域海量数据高速谱聚类方法
全息? 全息投影? 傻傻分不清楚
投影向量问题
一种改进K-means聚类的近邻传播最大最小距离算法
AR-Grams:一种应用于网络舆情热点发现的文本聚类方法
找投影
找投影
21连胜
基于Spark平台的K-means聚类算法改进及并行化实现