黄绪勇,沈志,王昕
(1.云南电网有限责任公司电力科学研究院,昆明 650127;2.上海交通大学电工与电子技术中心,上海 200240)
中长期暴露在空气中的绝缘子由于大气中盐雾、尘埃等污秽物在其表面逐渐积累,遇雨水受潮后往往会发生污闪事故,造成严重的后果,因此绝缘子发生污闪事故的概率与气象环境的污秽程度直接相关。污区等级是衡量绝缘子所在地区污秽程度的重要指标,也是绝缘子安全性能的一个关键参数,尤其是随着我国超高压输电线路的逐步发展,污区等级的评估已经成为绝缘子污闪事故预警过程中必不可少的环节。
目前,对污区等级的评估主要分为两类方法,一类是人工测量法,包括等值附盐密测量法[1-3]、泄漏电流测量法[4-6]等。这种方法能够较为准确地测量出绝缘子表面附着的污秽物的定量值,从而推断出绝缘子发生污闪事故的概率,但这种方法需要一定的实验环境,测量成本较高,测量周期长。另一类评估方法为数据预测法,包括BP 神经网络评估法[7,8]、粒子群(PSO)优化评估法[9,10]和支持向量机(SVM)评估法[11-13]等。这种方法可以有效地推测出绝缘子所在环境的污区等级,不需要专门的试验器材和大量的评估时间,仅需要提取训练样本进行机器学习就能进行定性评估,应用广泛。文献[8]利用BP 神经网络建立了以泄漏电流最大值、环境湿度、温度等8 个变量作为输入参数,等值附盐密度(ESDD)作为输出参数的智能预测模型。但是BP 神经网络所需训练样本较大,同时其网络结构及参数的选择需要由经验判断[14],在数据缺乏的情况下得不到合适的参数;文献[9] 利用粒子群优化算法,优化神经网络的网络结构以及设定参数,合理有效地选择得到最终的优化学习结果。但其计算精确度较低、易发散,甚至可能错过最优解导致算法不收敛。文献[15]利用最小二乘支持向量机(LSSVM),以泄漏电流有效值、泄漏电流峰值、脉冲电流次数、环境湿度、温度作为输入参数,以ESDD 作为输出参数,实现了绝缘子表面污秽程度的在线评估。LSSVM 具有较强的泛化能力和较快的收敛速度,但其性能极其依赖于核函数和参数的选择[16],针对LSSVM 的核函数选择和参数选择是目前研究的热点。
传统SVM 算法虽然在结构参数复杂度以及算法收敛速度上有一定的优势,但处理本文所采用的多维气象数据的非线性关系时较为困难,往往得不到理想的预测效果。LSSVM 算法可将传统SVM 算法中不等式约束转换为等式约束,并利用最小二乘线性系统替代SVM 中的二次规划方程,本文首先建立LSSVM 模型。
式中,φ(x) 为x的映射函数,可将训练数据映射到高维空间。ω为权向量,b为偏置常数。LSSVM 的目标函数则为:
式中,γ称为惩罚系数,用以控制样本噪声的影响程度。ξ为误差变量。针对上述目标优化问题,引入拉格朗日函数:
式中,ai为拉格朗日乘子。由KKT 最优条件,有:
保留方程中b和a,消去方程组中其他项可得:
将核函数公式带入到式(5)中联立解得b和α,可写出LSSVM 回归函数:
式中,K为RBF 核函数。这样还待求解的参数为RBF 中的核参数λ以及惩罚系数γ,本文采用CSO 算法对这两个参数进行寻优求解。
CSO 算法是一种模拟鸡群觅食行为的新型智能优化算法[17]。该算法通过适应度值确定鸡群等级,整个鸡群分为公鸡、母鸡和小鸡3 类个体。公鸡的觅食能力最强,小鸡的觅食能力最弱。每个个体按照一定的运动规律觅食。其中,公鸡位置更新公式为:
式中,Pi,j为第i 只公鸡所处位置第j 维度的值;randn(0,σ2) 为正态分布随机数,其期望为0,标准差为s;第i 只公鸡的适应度值用fi来表示;fr为随机选取的第r 只公鸡的适应度值。母鸡位置的更新公式为:
式中,R1和R2为随机数,取值范围为[0,1];r1为母鸡i 的伴侣;r2为母鸡i 所在群体中除自身以外的另一只公鸡或者母鸡;C1和C2代表影响因子。小鸡位置更新公式为:
式中,Pm,j代表小鸡母亲所处位置第j 维度的值;母亲觅食行为对小鸡的影响程度用F来表示,其取值范围通常为(0,2)。
本文提取了云南省2016 年31 个气象监测站的全年日值气象数据对气象站所在地区的污区等级进行评估,根据污区划分国标[18]中所述,绝缘子污秽物的形成主要与当地的相对湿度、气温、降水量和平均风速有关。根据云南地区的气候湿度高、多雨雪的特点,本文主要提取了有关相对湿度、气温、降水量、风速四个主要气象因素的共9 维数据,另外以海拔高度和风向作为辅助参考因素,对气象数据进行主成分分析(PCA)预处理,选取其中4 维向量作为实验数据。
根据云南省输电网的分布,本文选取了31 个采样点的数据作为本文算法和评估结果分析的依据,气象采样点选择如图所示,其中选择23 个气象站点的监测数据以及所在区域的污区等级作为训练样本,其余8 个作为预测样本点,如图1。
图1 气象采样点分布图
对所处样本点2016 年全年日值气象数据进行整理,提取出日相对湿度、日平均气温、日平均降水量、日平均风速等作为数据源,主要指标及数据以腾冲区站为例构建数据阵,如表1 所示。
表1 样本点信息与数据阵
其中样本采样点所处的污区等级根据云南电力科学研究院2016 年污区划分数据,分为A、B、C、D、E 五个等级,在对样本点数据进行训练前,需要进行离差归一化处理。
CSO 作为一种全局搜索优化算法,需要预先设定搜索空间。本文采用大步长网格搜索 法 对LSSVM 参 数γ,σ进 行 最 优 搜 索,构建N×M的搜索空间,从中选取预测效果最好的组合作为最优参数。本文所设搜索空间为(0~102)×(0~102),并采用二进制编码。设定鸡群规模为100,公鸡占20%,母鸡占60%,小鸡占20%,鸡群关系更新代数为10。
综上所述,采用CSO-LSSVM 算法对污区等级进行评估的具体步骤可分为6 步:
1)输入训练样本并进行归一化处理,设置CSO 算法参数;
2)计算每个个体所对应的参数的适应度(预测准确率);
3)根据适应度确定每个个体的最优位置,并做记录;
4)判定最优位置是否在种群范围内;
5)判断是否满足鸡群关系更新条件,若满足,则更新鸡群等级秩序、伙伴关系和母子关系,并更新鸡群位置;若不满足,则直接更新鸡群位置;
6)完成预设的迭代次数,并输出最优参数带入LSSVM 中进行评估。
由于污区等级的划分是一种定性划分,本文将污区的5 个等级数值化,对应“1、2、3、4、5”数值,数值越高,污区等级越高,最终预测结果由四舍五入取整并归类等级。在经过训练之后,将23 个训练点数据和8 个预测点数据同时进行评估,并分析评估结果。
图2 预测样本原始值与评估值对比
图2 可以看出,将污区等级数值进行四舍五入近似后作定性分析后,训练样本的评估具有极高的准确度,正确率高达95.6%(22/23),预测样本的结果正确率也达75%。为进一步分析LVSSM 算法评估污区等级的性能,本文引入BP 神经网络算法作为对照,其收敛误差和学习速率等参数也由CSO 算法进行最优选择,在同样的数据模型下进行10 次试验,评估结果如表2:
表2 不同算法的性能比较
由表2 可得,在同样训练数据和寻优方法的情况下,相较BP 神经网络算法,LSSVM 在评估污区等级时正确率更高,参数寻优速度更快。
1)本文采用了基于CSO 优化的LSSVM 算法对污区等级进行预测评估,取得了较好的效果,证实了气象数据与绝缘子表面污秽物的形成存在着内在联系。
2)对于LSSVM 算法的参数选择问题需要具体问题具体分析,本文将CSO 优化算法引入到对污区等级评估算法中,评估结果正确率较高,同时减少了CSO-LSSVM 的迭代次数,提高了算法效率。
3)本文在基于23 个气象监测站数据训练下,获取了污区等级数值的预测模型,预测结果正确率达75%,相比较BP 神经网络算法有较高的正确率,具有一定的实际应用意义。
4)本文所选取的数据仅考虑了基于气象数据的四维状态变量,在有其他数据如绝缘子材质、爬电距离等的支持下,可以考虑利用CSOLSSVM 算法进行多因数混合评估,评估正确率将得到进一步提升。