基于谱分解的聚类方法在风电场/群输出功率特性分析中的应用

2014-04-29 03:02:49李艺欣常太华张琦

电子世界 2014年19期

李艺欣常太华张琦

【摘要】随着风能规模化利用的进一步推广，区域电网中风电的渗透率不断增加，电网对风电的合理调度日益重要。大型风电场/群的输出功率是关于多台机组的高维非线性模型。本文考虑风电场/群内风机的类型、位置等因素，根据风电场/群中风机的输出功率特性数据，采用基于马尔科夫转移矩阵的谱分解聚类方法对风电场/群进行充分降维，并提出相应的评价指标用于分析和优化聚类结果。最后，选取华北某大型风电场中任意20台风机的输出功率数据进行仿真实验，实验结果表明：该方法能够有效的根据风电场内风机的输出功率特性将其划分为4个集群。同时，采用波动性指标进行评价并得到了输出功率最平稳的一类机群;采用误差带指标对其中一个集群进行优化，显著降低了该集群的输出功率标准差。

【关键词】风力发电;风电场/群;功率特性分析;马尔科夫链;聚类分析

1.引言

我国规模化风能利用发展十分迅速，至2012年，我国风电的总装机同比增长20.8%[1，2]。由于风能的随机性和间歇性导致风电场输出功率波动，难以保证平稳的电力输出，使得电网对风电场的调度及并网造成了很多困难，也对电力系统的发电和运行计划的制定带来极大挑战[3]。随着大规模风电并网，其渗透率日益增加并对电网的影响越来越大。为了解决这个问题，分析风电场/群的功率输出特性以优化电网调度是十分必要的。

现代风电场/群通常由数十至上百台风机组成，其总输出功率是关于多台机组的高维非线性模型，建模时一般将风电场/群整体特性做简化处理。文献[4]采用了集总建模法对风电场进行等值建模，但对于风电机组之间风速差异较大的风电场，基于集总建模法的等值模型会存在较大的误差[5]。文献[6]中使用K-means聚类算法对风电场进行了动态等值建模。然而K-means算法有两个主要的缺点：一是运算结果对集群的数量的选择是十分敏感的，即K变化时，聚类结果会出现很大的差异;另外就是K-means算法不能很好的解决集群是非线性这类聚类问题[7，8]。为了解决K-means算法的问题，一些新的聚类算法被应用于系统建模中。文献[9]中通过提取每台机组的运行特征值建立特征矩阵，进而对该矩阵使用模糊聚类分析，将具有相同或相似特性的机组划分为同一集群，以达到简化风电场模型的目的。文献[10]中使用了聚类树算法对双馈机组风电场进行动态等值建模。指出与传统建模相比，聚类分析的方法更适用于大容量风电场的等效建模。

为了有效的克服集群离散非线性以及对集群数量敏感等问题，本文使用了一种基于马尔科夫转移矩阵谱分析的聚类方法。首先，根据每台风机输出功率时间序列建立了马尔科夫转移矩阵;然后对该马尔科夫转移矩阵进行谱分解来确定主导特征值和集群的数量，进而由主导特征值计算任意两台风机的扩散距离决定聚类的结果;最后引入波动性和误差带两个指标对聚类结果进行分析评价。

2.基础理论

目前存在的聚类算法一般都对集群大小有强制限制，容易陷入局部收敛及实现复杂等问题[11]。谱分解只需解决矩阵特征值分解问题，可以有效的克服上述问题。马尔科夫链是估计系统离散状态之间转移概率的随机过程[12]，便于与谱分解结合使问题简化。

2.1 马尔科夫转移矩阵

S为随机试验的样本空间，t为时间变量，定义一个具有平稳分布的随机过程x（t），t={1，…，m}。则一个随机过程的样本集合为X={x1，…，xn}。根据文献[13]，定义矩阵：

（1）

其中是代表数据结构接近程度的宽度参数。

将矩阵A行标准化：

（2）

则矩阵P为马尔科夫转移矩阵，代表着任意两个过程按照局部相似划分到一个集群中的概率。

2.2 谱分解

构建矩阵P的目标是为了找到划分的集群的数量。对马尔科夫转移矩阵进行谱分解也就是分析特征值和特征向量进而发现数据的几何结构特点。假定马尔科夫链是非周期和不可约的，根据马尔科夫链的性质可知，存在平稳分布且满足：

（3）

即是矩阵P的特征值为1的左特征向量。同时，对于遍历不可约马尔科夫链，应满足下式：

（4）

其中n为马尔科夫转移矩阵P的阶数。

设表示矩阵P的第i个特征值，表示矩阵P的第i个特征值的左特征向量，表示矩阵P的第i个特征值的右特征向量。将所有特征值降序排列：

那么马尔科夫矩阵P的谱分解形式为：

（5）

则其低阶模型为：

（6）

为了得到很好的低阶近似模型Pa，参数q的选择有两种情况：

1）矩阵P有q个主导特征值（q

2）如果矩阵P没有明显的主导特征值，若q满足i，其中q满足则低阶近似模型Pa是由和它们对应的左、右特征向量组成的。

2.3 扩散距离的计算

令X=（x1，x2，...，xn），利用单位向量（e1，e2，...，en）分别表示集合X中元素的分布情况。那么xi和xj的扩散距离可以写成下式[14]：

其中i表示矩阵P的右特征向量的第i个元素。对于存在q个集群的近似模型，扩散距离表示为：

（13）

如果D2（xi， xj）小于一个临界值，就认为xi和xj属于同一个集群。

引入矩阵J：

（14）

对矩阵J进行分析即可得到聚类结果。

3.聚类结果评价

基于上一节的理论可以完成对一个风电场/群的聚类。根据聚类结果，可以用集群的平均输出功率来代替同一集群内的每台风机的输出功率，对聚类结果的分析等价于对每个集群平均输出功率的分析。本节中，将使用适当的指标对每个集群的平均输出功率进行评价分析。

3.1 波动性指标

由于风电并网困难的原因主要来源于其输出功率的随机性和波动性，对风电输出功率波动性的描述在不同场合应使用不同的方法。本节中，波动性指标由下式给出：

（15）

其中Piave表示第i个集群的平均输出功率;t为采样时间。该式以集群的平均输出功率的前后采样时刻的差值的平方和来体现该集群在一段时间内输出功率的波动性情况，显而易见，值越小，说明该集群风机的平均输出功率波动性越小，反之亦然。

为了对波动性进行全方位分析，确保分析结果准确有效，本节将再引入阶跃变化[15]与式（15）组成对波动性的多指标评价方法。

若风机输出功率时间序列为x（t），，那么阶跃变化为：

（16）

（17）

k为选取采样点的个数。则阶跃变化的标准差为：

（18）

（19）

由（16）至（19）可得出在指定段时间内，描述风机输出功率的波动性的序列，以及该序列的标准差，用上述两项结果，对该时间段内风机功率输出的波动性进行分析。

3.2 误差带指标

为了优化聚类效果，避免出现聚类后集群的平均输出功率与集群内每台风机输出功率的偏差过大，使平均输出功率能较好的反映集群内风机的输出功率，引入集群误差带指标：

（20）

其中Pij（t）为t时刻的第i个集群内的第j台风机的输出功率 Pistd（t）表示t时刻的第i个集群的风机输出功率标准差。

Sij（t）表示t时刻时第i个集群内的第j台风机与该集群内所有风机平均值的偏离程度，若Sij（t）与Sij（t+1）均大于某一阈值，那么就认为第i个集群内的第j台风机已经不能归为该集群，应当从该集群内移除，重新计算在t+1时刻该集群风机功率输出均值，进而确保该集群风机的平均输出功率更能有效的代表该集群内各台风机的输出功率。

移除风机之后，应随时关注优化前后集群风机输出功率标准差Pistd的差值，当差值呈明显减小趋势时，则代表被剔除的风机对该集群平均输出功率的影响逐渐变小，可将原剔除的风机重新归入原集群。

表1 样本数据

时间

序列 1号风机 … 20号风机

Y（t） x（t） Y（t） x（t）

1 23.4 -20.4 10.39 -2.89

2 3 7.51

… …

2027 223.2 -35.4 254.0 -32.7

2028 187.8 221.3

4.实例分析

本节基于华北某风电场数据，采样时间从2012年5月1日到2012年5月15日，采样周期为10分钟。在风电场66台风机中随机抽取20台风机生成基本数据，并假设输出功率数据是一个随机马尔科夫过程[16]。

这里同样使用风机输出功率波动性作为基础数据：

（21）

其中y（t）是风机在t时刻的功率输出值，x（t）为相邻两数据的差值。表1列举了部分数据。

4.1 构建马尔科夫转移矩阵

根据第二节可知，为了衡量任意两台风机的相似程度，必须要先建立马尔科夫转移矩阵P。设随机过程集合，其中xi表示第i台风机的x（t）的序列。所以X是一个202720的矩阵。将X矩阵进行归一化处理，，根据（1）式，列出矩阵：

其中参数。

根据（2）式，得马尔科夫转移矩阵：

4.2 谱分解

基于谱分解理论，矩阵P的特征值和特征向量包含着划分集群的特征。用线性代数的方法求解出矩阵P的特征值和特征向量。由（3）和（4）联立求出固定分布是：

求出矩阵P的特征值并且按照降序排列：

可知矩阵P不存在q个接近于1的主导特征值。但是对特征值序列分析可以发现所以q=4，即集群数量为4个。

4.3 计算扩散距离

通过矩阵P的特征值和它对应的右特征向量可以求解任意两台风机的扩散距离。以风机1和风机2为例，其扩散距离为：

由（14）得：

它的第ij个元素就对应的是第i台风机与第j台风机的扩散距离，该数值越小，则表示这两台风机的相似度越高。因此，选取一个合适的阈值，当J（i，j）的值小于该阈值时，则第i与第j台风机可归为一类。本例中，该阈值取0.005。

4.4 仿真结果

风机聚类结果如表2所示：

表2 聚类结果

风机数量 20

集群数量 4

集群号集群1 集群2 集群3 集群4

风机号 1，5，9，12，

15，19，20 2，4，6，

10，18 7，11，13，

14，16 3，8，17

对应风场内风机号 1，2，5，4，

10，9，7 66，64，62，

60，61 20，27，21

25，24 12，14，13

图1 某时间段内不同集群内风机平均输出功率

4.5 仿真结果分析

4.5.1 波动性分析

由图1可知，在一定时间内，四个集群的风机平均输出功率差异明显，由（15）可得在t=370至t=440之间各个集群的波动值，结果为：

计算结果表明该时间段内，集群1、3的波动性较小，而集群2、4的波动性较大。应用阶跃变化指标结果得出集群3的阶跃变化标准差最小;集群2的阶跃变化标准差最大。结合两个指标得出集群3在该时间段内的波动性最小。当电网需要该风场内风机并网时，可以优先调度集群3中的各台风机，减小风力发电的波动性对电网的冲击，确保电网运行安全和稳定。

图2 某时间段内不同集群内风机输出功率标准差

图3 某时间段内集群2中所有风机的功率输出

图4 某时间段内集群4中所有风机的输出功率

4.5.2 误差带分析

图5 某时间段内集群3中所有风机的输出功率

由图5可知在采样时间t=395附近，各个风机与该集群平均功率输出之间的偏差很大。取t=396，则取1，根据计算，66号和64号风机从集群内移除。

图6 优化后某时间段内集群3中各个风机输出功率

图7 优化后某时间段内集群3的标准差

由图6、图7可知，优化后的集群3的标准差比原集群3的标准差在一个时间段内更小，意味着，优化后的集群3的输出功率平均值与集群内各个风机的输出功率的偏差更小，使用优化后集群3平均输出功率则比原集群3平均输出功率更具有代表性与真实性。由图7可知，在t=415附近，优化前后的标准差近似相同，可将移除的66号与64号风机重新归入该集群，达到对该集群优化的目的。

5.结论

本文将马尔科夫转移矩阵与谱分解理论相结合应用于风电场输出功率特性分析方面。首先，使用风机相邻时刻的输出功率变化量建立了马尔科夫转移矩阵并对该矩阵进行谱分解确定了集群数量，有效的避免了因为集群数量不确定而导致聚类结果差别很大的问题;然后，根据谱分解结果计算任意两台风机的扩散距离进行聚类。为解决由于大型风电场/群内各个风机输出功率特性的不同，导致并网时对电网冲击过大的问题提供了有效的方法。

结合聚类结果，本文提出了波动性指标与误差带指标。前者以输出功率的平稳性对各个集群进行评价，后者则可以根据实时状态微调每个集群内的风机组成，优化每个集群的平均输出功率，提高了每个集群的平均输出功率的实时准确性。结合这两项指标，为实现对集群输出功率平稳性的实时监控提供可能。

参考文献

[1]2012年中国风电装机容量统计[J].风能，2013，03：44-55.

[2]工控中国.国家电网持续发力风电并网总量持续提高[EB/OL].工控中国，2013.http：//www.gkzhan.com/news/detail/37819.html.

[3]娄素华，李志恒，高苏杰等.风电场模型及其对电力系统的影响[J].电网技术，2007，31（2）：330-334.

[4]Slootweg J G，Kling W L.Aggregated modelling of wind parks in power system dynamics simulations[C].Power Tech Conference Proceedings，2003 IEEE Bologna.IEEE，2003，3：6pp.Vol.3.

[5]Perdana A.Dynamic models of wind turbines[M].Chalmers University of Technology，2008.

[6]陈树勇，王聪，申洪等.基于聚类算法的风电场动态等值[J].中国电机工程学报，2012，32（4）：11-19.

[7]Kannan R，Vempala S，Vetta A.On clusterings：Good，bad and spectral[J].Journal of the ACM（JACM），2004，51（3）：497-515.

[8]杨小兵.聚类分析中若干关键技术的研究[D].杭州：浙江大学，2005.

[9]刘吉臻，曾德良，刘继伟，等.单一风电场的短期负荷调度优化策略[J].中国科学：技术科学，2012，42（4）：437-442.

[10]徐玉琴，王娜.基于聚类分析的双馈机组风电场动态等值模型的研究[J].华北电力大学学报，2013，40（3）：1-5.

[11]徐森，卢志茂，顾国昌.基于矩阵谱分析的文本聚类集成算法[J].模式识别与人工智能，2009（5）：780-786.

[12]Sahin A D，Sen Z.First-order Markov chain approach to wind speed modelling[J].Journal of Wind Engineering and Industrial Aerodynamics，2001，89（3）：263-269.

[13]Szummer M，Jaakkola T.Partially labeled classification with Markov random walks[C].2001：945-952.

[14]Runolfsson T，Ma Y.Model reduction of nonreversible Markov chains[C].Decision and Control，2007 46th IEEE Conference on.IEEE，2007：3739-3744.

[15]Boutsika T，Santoso S.Quantifying short-term wind power variability[C].Power and Energy Society General Meeting，2011：1-7.

[16]Papaefthymiou G，Klockl B.MCMC for wind power simulation[J].Energy Conversion，IEEE Transactions on，2008，23（1）：234-240.

作者简介：李艺欣（1989—），男，华北电力大学控制与计算机工程学院硕士研究生在读，研究方向：大型风电场调度策略研究。