赵 妍,霍 红,徐晗桐
(1.东北电力大学输变电技术学院,吉林 吉林 132012;2.东北电力大学电气工程学院,吉林 吉林 132012)
电网的大规模互联可以带来一系列的经济效益,但互联后的系统中易出现低频振荡现象[1].近年来,国家对新能源建设强力推进,风力以及光伏发电飞速发展[2].但是,受风能资源和负荷中心的逆向分布,大规模的新能源发电模式普遍采用的是“集中式发展,远距离输送”,这样系统中低频振荡的概率就会大幅度提高[3].例如河南电网于2006年7月1日发生的线路故障跳闸中,多段500 kV和220 kV的线路因故障导致跳闸,致使华中电网产生较大规模的功率振荡,最终造成华中电网和华北电网、川渝电网和华中主网发生解列[4].所以,低频振荡的在线监测和预警成为了低频振荡研究中的一个关键问题[5].另外,引起低频振荡的机理不同,采取的应对方式同样不尽相同[5-7].因此,如何准确、迅速判别振荡的性质同样非常重要[8].在现有的研究功率振荡机理的文献中,区分负阻尼振荡以及强迫振荡两种类型的方法多是在事故发生后的分析[9-11].所以,研究在线分类方法是低频振荡研究中的另一个重要问题.
与经典的分类方式比较来说,机器学习分类器不需要建立复杂的数学模型,而是通过离线训练方式利用已经标记的信息发现分类规则、构造分类模型,从而能够输出未含标记信息数据的属性特征,其最终的目标是使分类准确度达到最理想.这种通过已有的输入与输出数据之间生成相对应的函数从而能够将其他数据映射到适当输出的过程称作监督学习[12].随机森林(Random Forest,RF)是多棵决策树组合的一种监督分类方法,大量研究表明RF相比于其他算法有着明显优势[13].它能够处理大规模数据,并且在数据缺失的状态下也有着较高的精度,实现过程比较简单,训练速度快,既能处理连续的数据也能处理离散的数据.因此近几年来,随机森林算法在多个领域中都有着较好发展[14-15].
在基于实测数据的PMU数据中,样本类别不均衡以及噪声问题经常同时存在.实测的数据中正常数据容易获得,数量多;发生振荡的数据不易获得,数量少.数据类别不均衡能够导致RF的训练效率低下,训练准确率降低.量测信号中的噪声会导致机器学习方法产生过拟合,较强的噪声会影响随机森林的分类性能,并且会使模型对部分样本的学习受到进一步影响.
为了解决上述困难,本文提出了一类基于RF的低频振荡两阶段分类方案:第一阶段RF分类器来判断是否发生低频振荡,如果判断为发生低频振荡则快速告警.然后,将判断为发生低频振荡的信号送入第二阶段RF分类器用于振荡类型的判断.第一阶段RF分类器既减少了低频振荡预警的时间,又改善了样本类别的不均衡.筛选后的数据,能够大大降低了RF2预测模型的训练时间,而且有利于提高第二阶段RF分类器的准确性.
SWT是建立在连续小波变换(CWT)基础上的时频重排算法,通过在时间频率平面上的局部频率区间内压缩信号,得到频带集中的时频表达[16].使用SWT进行低频振荡信号参数辨识的基本过程如下:
(1)对获得的低频振荡信号x(t)进行连续小波变换(CWT).
(1)
(2)划分采样区间.假设信号x(t)的长度n=2L+1,采样时间间隔为Δt,则可根据Nyquist采样定理[17],将低频信号所处的频率划分为数个互不相同的频率区间:
(3)对离散小波变换量值Tx(a,b)进行计算.
(2)
(4)ωl低频振荡模态分量的提取.利用公式(3)可以重建x(t)的第k个分量xk(t).
(3)
公式中:Lk(tm)为xk(t)(x(t)的第k个IMT分量)曲线附近的ωl的下标集合;tm为t的离散值.
(5)低频振荡的模态参数计算结合希尔伯特(HT)变换求取[18].在一般的控制理论里,阻尼振荡环节存在的振荡特性为
(4)
公式中:λ为衰减因子;ξ为阻尼比;ω0为无阻尼频率.由此可得出
(5)
由公式(4)可以得到阻尼比的计算公式为
(6)
随机森林为半监督集成学习分类器,它采用一种Bootstrap重复抽样方案(反复简单随机并且有放回),并将所有Bootstrap样本依次构建其对应的模型,得到一组由决策树构成的分类器,最后进行投票并且预测[19].每个训练子集的抽取过程都有约37%的样本不会被抽中,类似这种剩余的数据称做袋外数据,可以拿来进行误差测试.
随机森林其核心为一种以决策树为基础的集成运算方法[25],也可以说它是一种树状分类器,依次从内部节点中选取最合适的属性对其分类,每个叶节点均为含有同一种类属性的数据.输入期望区分类别的数据后,经由决策树决定根节点至叶节点的固定路径,此路径叶节点的类别与期望区分的样本相同.
随机森林的算法步骤如下:
(1)将初始训练样本中所含的样本总数记为N,特征属性数量记为M,在初始训练集中使用Boot- strap方案抽样,选出N个样本,由此组成训练子集.
(2)在M个特征里随机选择m个特征为候选特征(m≤M),在决策树的每个节点依据某种规则挑选最优属性分裂,直到该节点的全部训练样例均为相同类别,在此过程中完全分裂不剪枝.
(3)反复进行上述两个步骤k次,可得出k棵决策树,由此构成的即为随机森林,如图1所示.
训练和试验随机森林过程与训练每个决策树相同,而每个决策树之间的训练彼此又不相同,互不影响,由此对随机森林训练过程进行并行处理,能够加快构建模型的速度.
2.2.1 第一个RF分类器(RF1)
RF1分类器的功能是判断是否发生低频振荡,若发生及时告警.分类器的样本来源是:已有系统正常运行和发生低频振荡的PMU实测的历史数据;或者依据系统的结构人工进行构建的数据.由于快速傅里叶变换(FFT变换)计算量小、计算速度较快,所以使用FFT对采集到的PMU数据进行变换,如果变换后得到的频率小于或等于2.5 Hz,判断为发生低频振荡;如果频率大于2.5 Hz,则判断未发生低频振荡.因此,RF1的分类原则是:
类别1:若f≤2.5 Hz,发生低频振荡并发报警信号;需要进一步判断振荡类型.
类别2:若f>2.5 Hz未发生低频振荡.
2.2.2 第二个RF分类器(RF2)
RF2分类器的功能是区分出振荡类型.该分类器的样本来源是:经过RF1后,判断为低频振荡的数据.输入特征是经SWT变换并结合HT变换得到主导模态的衰减系数和阻尼比.
由谐振导致的强迫振荡与由负阻尼导致的振荡其起振部分十分相似,不同之处在于强迫振荡产生时系统阻尼为正,因此一旦扰动源不存在,振荡将会按照系统本身的阻尼比逐渐进行衰减,直到平息,这是两者间存在的主要区别.因此,RF2分类器的分类原则是:
类别1:当λ>0,ξ<0时,系统为动态且不稳定,相对应的时域振荡曲线是增幅.在此状态下系统内任一个瞬时扰动均会导致系统内发生功率振荡,而且不会平息.此时判断为负阻尼功率振荡;
类别2:当λ<0且ξ>0时,对应的时域振荡曲线为衰减,此状态时系统中产生连续的周期小扰动.若某一时刻扰动频率和系统本身振荡频率相似,能够致使系统产生谐振,后果可能产生大幅振荡,此时判断为强迫振荡.
类别3:当λ≥0且ξ≥0时,为弱阻尼振荡模式,对应等幅的时域振荡曲线,属于一种临界状态,此时也应是不稳定的,若在这种情况下产生扰动源,同样能够导致较大的振荡.
2.3.1 RF1的训练和测试
构建一组样本集,对本文所设计的随机森林分类器进行训练,其中部分样本集如表1所示.
表1 RF1的部分样本集
使用随机森林对前80组进行学习,后20组进行测试,通过交叉验证以及测试新的振荡情况来判断分类器的性能是否满足需要.
交叉验证是一种能够检验分类效果的方式.其思想就是将绝大部分数据作为训练集进行建模,然后用剩余数据验证是否符合模型[20].本文使用常见的十折交叉验证,即把数据集等分10组,依次对其中9组进行训练,另一组做验证,通过循环模拟10次,将10次的结果的均值,作为对算法精度的估计依据.经过交叉验证可得到,学习此样本的RF分类器其准确率约为69.5%,继续对样本集进行扩充,并使用仿真数据作为样本集的补充部分,最后准确率上升为100%,可知通过扩充样本容量,分类器的准确程度也随之提高.
2.3.2 RF2的训练和测试
构建一组样本集,对随机森林进行训练,其中部分样本集如表2所示.
表2 RF2的部分样本集
使用随机森林对样本集中的前90组数据进行学习,对后10组进行测试,得出结果并未全部正确.继续对样本集进行扩充,使用仿真数据作为样本集的补充部分,并进行交叉验证,最后得出的分类结果其准确率达到100%,经过验证可得:分类情况正确可以使用.
2.3.3 性能分析
构建一组数据集,分别使用朴素贝叶斯(NB)、随机森林(RF)和本文设计的SWT-RF方法进行训练和测试,最终的比较结果如表3所示.
表3表明:噪声增强,几种方法准确率均发生了降低,但SWT-RF方法降低程度最小.说明采用SWT最大程度的减少了噪声对RF分类器分类性能的影响,降低过拟合的发生,因此SWT-RF分类的准确率最高.此外,由表中可知RF1训练时间非常短,且准确率较高.经过RF1预筛选,缩短了RF2的训练时间,而且经过RF1处理也提高了RF2的准确率,说明二阶段方法的有效性.采用二阶段方法在没有牺牲快速性的前提下,其准确性也能够提高.
表3 几种方法的比较
二阶段RF的低频振荡监测步骤如图2所示,简单说明如下:
(1)分类器RF1和RF2的构建:按照2.2节进行构建,其中对RF1进行训练的数据集是由实测数据或者仿真数据进行FFT变换后获得的频率构成,对RF2进行训练的数据集是由RF1判断为低频振荡的数据进行SWT变换后结合HT辨识的阻尼和衰减因子构成.
(2)基于二阶段RF的低频振荡监测:将PMU实时数据FFT后通过RF1进行初步分类,判断是否为低频振荡,若判断为是,继续进行下一步SWT辨识参数,通过RF2判断出振荡类型并输出结果.
(3)分类器的完善:在辨识过程中,如果出现原样本集没有的新的情况时,将此新样本继续交由随机森林分类器学习,新样本如果满足交叉验证,则将其投入使用更新分类器,否则依然使用原分类器,最终变为循环,使之达到自我不断完善.
2010年7月14日,华中电网因为在长江上游水位上涨,三峡水电站所发出功率增至17.8GW.导致电厂机组以及附近区域的出线均产生异常功率振荡现象, PMU录波情况如图3所示.图3分别为三峡左侧一号、二号,右侧一号、二号发电厂传输至线路上的有功功率振荡波形.
首先,对左一出线进行分析,取前10s的数据.使用FFT对振荡数据进行频率分析,送入已经训练好的RF1中判断发生低频振荡,继续进行下一步分析.使用SWT对该数据分析,获得三个IMT分量如图5所示.分别计算主导模态的衰减因子以及阻尼比,结果如表4所示.将其送入分类器RF2判断为负阻尼振荡.
依次采用上述方法对其余三条电厂送出线振荡的数据做分析处理,获得结果如表4所示.
表4 振荡参数辨识结果
由表4可知,本文的分类结果与实际情况相符合,证明本文方法在实际系统分析中的有效性.
四机两区系统模型如图6所示,用Matlab-Simulink中搭建四机两区系统,并对其进行仿真验证,设置一次新的低频振荡,在t=2 s时,在G3施加正弦扰动,得到母线9的有功功率如图8所示.为模拟实际情况,在信号中加入白噪声(SNR=20dB),每2 s进行一次分析,结果如表5所示.
时间/s0~22~44~6FFT分析频率/Hz00.680.68RF1判断结果2正常运行1低频振荡1低频振荡SWT分析衰减因子α
由表5中数据可知,前两秒运行状态正常,即没有发生低频振荡.RF1分类器判断正确.在2 s~4 s时,RF1判断发生低频振荡,发预警信号;经RF2辨识判断发生低频振荡且为强迫振荡,在4 s~6 s时,同样判断发生强迫振荡.
本文针对在PMU上实现的低频振荡在线监测方法所存在的不足,本文将机器学习方法随机森林进行改进,应用于低频振荡的在线监测中.
(1)利用RF1得到的低频振荡告警模型作为低频振荡初步的判断,以达到快速预警的目的.然后对判断为低频振荡后的数据再用RF2进行分类,解决了样本类别的不均衡性问题,减少了RF2分类模型的离线训练时间和低频振荡在线分类的时间,并且提高了RF2分类的准确性.
(2)因为SWT具有较好的抗噪能力,参数辨识速度快,并且对信号的采样频率要求不高,将SWT分析得到的低频振荡参数作为RF2的输入,提高了RF2分类的准确性,改进后的方法有着较强的泛化性能.
(3)RF可以通过对FFT辨识频率和SWT辨识得到的参数进行学习,生成RF1和RF2分类器,可以自动实现对电力系统低频振荡进行快速、准确的在线监测.