王吉东, 许 昌, 王 欣, 韩星星, 郑 源, 刘德有
(河海大学 能源与电气学院,南京 210098)
由于风资源的不可预测性以及机械、电气等多重因素的影响[1],风电机组运行工况复杂多变,系统具有明显的非线性、随机性和强耦合性,因此,很难建立精确的物理模型[2].在传统的风力机建模中,风能计算通常采用文献[3]中提供的风能利用系数Cp的经验公式,由于机组类型、参数等差异,该公式不能适用于不同机组,所以,采用经验公式建立的控制理论缺乏实用价值.而以实际运行数据为基础,通过现代智能算法探究风电机组的实际运行规律,为风力发电系统建模与控制提供了新思路.
现代智能建模领域应用最为广泛的是人工神经网络算法,而神经网络模型中最常用的是BP(back propagation)神经网络,该方法结构简单、处理非线性问题能力强,但是,由于其基于经验风险最小化原则(ERM),预测时常出现局部误差过大的问题,对于小样本模型无法达到理想的预测精度[4].Vapnik在统计学习理论基础上提出的支持向量机(SVM)是一类新型的机器学习算法,它基于结构风险最小化原则(SRM),克服了常规神经网络算法的缺陷,具有预测精度高、泛化能力强、能收敛于全局最优等特点[5].文献[6-7]针对不同类型的训练数据,讨论了SVM 核函数的选择方法.文献[8]讨论了SVM中惩罚参数C 和预设误差ε 对回归函数的影响.文献[9-11]分别介绍了利用双线性搜索法、网格搜索法、双线性网格搜索法、二分法及粒子群算法等对SVM 参数进行优化的方法.SVM 算法用于回归估计时输出为实函数集,多用在非线性函数逼近、时间序列预测、过程建模和控制领域[12-14].
本文从历史运行数据入手,针对风电机组实际运行特点,对原始样本进行分类、剔除坏点、归一化等处理,得到新的训练样本,大大增强各个输入变量和目标值之间的相关性,克服了支持向量机在处理庞大杂乱数据时速度慢、预测精度低的缺点[15].通过对实际样本训练分析,比较样本修整前后和分别运用SVM 算法与BP神经网络算法的训练结果,证明本文提出的方法能够缩短训练时间、具有更高的训练精度和预测精度,是一种切实有效的风电机组系统辨识方法.
图1是风力机标准运行曲线,据此可以看出,在运行点B 并网以后,风电机组运行状态可分成两段:a.额定风速以下的部分负荷区,控制风力机转速变化,跟踪最佳叶尖速比实现最大风能捕获;b.额定风速以上的满负荷区,调节桨距角,限制风力机转速和气动功率捕获,确保发电机组输出功率稳定在额定值.
图1 风力机标准运行特性曲线Fig.1 Standard operation characteristic curve of wind turbine
在图1中,pu为标幺值,风力机转速和输出功率分别以发电机同步转速和风力机额定功率作为基准值.
本文的研究目的是利用风电场实测数据,在低风速时,建立风力机转速给定值输出模型;在高风速时,建立实际的桨距角给定值输出模型.得到转速控制和桨距角控制的给定值,为采用智能转速控制器和桨距角控制器取代传统PID 控制器提供理论支持.
对样本进行预处理:
a.提取样本.根据实际运行特性按工况提取所需样本数据,提取额定风速以下的部分负荷区数据作为样本I,提取额定风速以上的满负荷区数据作为样本II.
b.剔除坏点.训练样本包括输入和输出样本数据,输入样本Xk=(xk1,xk2,…,xki,…,xkm),其中,主要变量设为M(本文中指风速v);输出样本Th=(th1,th2,…,thj,…,thm),根据训练目标不同,选定输出的目标变量T(输出功率P、风力机转速ω 或桨距角β).
在样本中存在一些不合理的数据点,会严重影响训练和预测的精度,这些点大致分为两类:第一类是由于设备检测或数据记录错误等因素产生的与实际运行规律相悖的数据点;第二类是由于机组惯性或湍流风速过大等原因引起的严重偏离最优运行曲线的数据点.对两种“坏点”进行数学定义,对于样本内的第i个数据点:
第一类
第二类
式中,δ为平整度,可自主设定.
以江苏省某风电场额定风速以下的运行数据为例,选择风速v 作为样本主要属性,输出功率P 作为目标变量,平整度δ=15%.按照式(1)和式(2)逐个剔除样本中的“坏点”,图2(a)和2(b)分别显示了样本处理前后的数据点分布情况,比较发现,剔除坏点后样本得到有效简化,数据间具有更强的相关性.
图2 剔除坏点前后样本数据比较Fig.2 Comparison of initial data and reduced data
c.数据归一化处理.为了避免各指标的数值之间相差过大影响学习训练的速度,对历史数据进行规一化处理,即将原始数据经过线性变化至[0,1]区间中,构成训练数据集[16].
在支持向量机回归方法中,分为线性回归与非线性回归.对于线性回归问题,根据给定的训练集样本{(x1,y1),(x2,y2),…,(xl,yl)},xi∈ℝn,yi∈ℝ,i=1,2,…,l.xi为输入量,yi为对应的输出量,寻求一个反映样本数据输出和输入的最优函数关系f(x),并且对于预测集样本的输入量{xl+1,xl+2,…,xm},能够由该函数得出较为准确的预测值{yl+1,yl+2,…,ym}.
函数“最优”是指按照某一确定的误差函数来计算,所得的函数关系对样本数据集拟合的累计误差最小,SVM 算法用于回归估计采用ε-intensive损失函数作为误差函数,形式为
训练学习的过程是构造最优的线性拟合函数f(x)=wx+b,其中,w∈ℝn,b∈ℝ.根据结构风险最小化原理,将训练过程进行转化,通过最小化目标函数来训练w 和b[17].
式(4)中第一项使拟合函数更为平坦,以提高泛化能力;第二项为减小误差;惩罚参数C>0,表示对超出预设误差ε的样本的惩罚程度,这是一个对偶二次凸规划问题,引入Lagrange函数,将式(4)的对偶最优化问题转化为最大化目标函数
约束条件为
参数b的求解,对于满足0<αi<C条件的标准支持向量,有
式中,SV 表示标准支持向量的集合,包含所有在间隔区边缘的训练样本点.
通过式(8)和式(9)对所有标准支持向量分别计算b的值,然后求平均值,即
式中,NSV表示标准支持向量的个数.
最终求得的线性拟合函数为
对于非线性回归问题,首先通过一个非线性映射Φ(x)将样本数据映射到某个高维特征空间中,在高维特征空间中进行线性回归,这样将原空间中的非线性回归问题转化为高维特征空间中的线性回归问题.为了从原始空间中抽取特征,将原始空间中的样本映射为高维特征空间中的一个向量,引入的映射函数K(xi,xj),称为核函数[18],核函数是连接低维与高维之间的桥梁.
常用的核函数有多项式核、S型核、RBF(radial basis function)核 等[19].本 文 选 择Gaussian 型RBF[20-21]作为SVM的核函数,其形式为K(x,x′)=exp(-‖x-x′‖/2σ2),其中,x′ 为核函数中心,σ为函数的宽度参数,控制了函数的径向作用范围,通过径向基函数实现了用一元函数表示多元函数的目的.
于是,式(5)转化为
约束条件与线性问题相同,这样就得到非线性拟合函数的表达式为
以江苏省某风电场2013年1月的10min运行间隔数据作为初始样本,选定机组的额定风速为11m/s,按工况条件提取样本I和II,剔除样本I,II中的坏点,再进行归一化处理.用SVM、BP 神经网络分别对预处理(DPP)后的样本和处理前的样本进行训练,选取均方根误差(RMSE)和平均相对误差(MRE)作为训练和预测效果的主要判别依据.
均方根误差
平均相对误差
式中,Y(i)和F(i)分别为实际值和预测值.
选定风速作为输入变量,即X=v,输出功率作为输出变量Y=P,对样本I进行预处理后样本点从3 608个缩减到了1 831个.由于支持向量的数目随着预设误差ε的增大而减小,根据训练过程,取ε=0.001,此时支持向量数目较少,数据点的逼近精度较高.选用双线性网格搜索法,对SVM 参数σ2和C进行优选,得到最优参数σ2=0.328 2,C=1 028.BP神经网络采用标准的3层网络模式,SVM 和BP神经网络的输入层节点数均为3,输出层节点数为1,训练得到额定风速以下P-v运行曲线,结果如图3和图4所示(见下页).
图3 BP神经网络算法下P-v 曲线预测结果Fig.3 P-v prediction curves by BP neural network algorithm
图3和图4分别为使用BP网络和SVM 算法对处理前和处理后的样本进行训练,并将得到的预测曲线与标准风功率曲线进行对比,进一步计算得到表1中的预测误差.比较图3中的BP和DPP-BP曲线以及图4中的SVM 和DPP-SVM 曲线可以看出,数据预处理后的样本训练得到的曲线比处理前贴合得更好;比较图3、图4和表1可以看出,与BP神经网络算法相比,运用SVM 算法的训练结果更加靠近标准风功率曲线,训练误差更小并且训练时间更短.
图4 SVM 算法下P-v 曲线预测结果Fig.4 P-v prediction curves by SVM algorithm
表1 P-v 曲线在不同算法下的预测误差和训练时间Tab.1 Prediction error and training time of P-v curves by different algorithms
应用上述方法,分别通过样本I和II训练得到转速-风速(ω-v)曲线和桨距角-风速(β-v)曲线,剔除坏点后样本I(ω-v)数据点从3 573缩减到1 424个,样本II(β-v)数据点从2 108缩减到971个,训练结果如图5和图6所示.
由于ω-v,β-v 标准曲线无法获得,选择训练误差作为准确性的判别依据,表2和表3分别是训练ω-v和β-v曲线得到的训练误差和训练时间.
图5 不同算法下ω-v 曲线预测结果Fig.5 ω-v prediction curves by different algorithms
图6 不同算法下β-v 曲线预测结果Fig.6 β-v prediction curves by different algorithms
表2 ω-v 曲线在不同算法下的训练误差和训练时间Tab.2 Training error and training time ofω-v curve by different algorithms
表3 β-v 曲线在不同算法下的训练误差和训练时间Tab.3 Training error and training time ofβ-v curve by different algorithms
比较图3和图4可知,训练得到的P-v 曲线与图1的标准运行曲线BC 段的走势基本一致;在图5中,ω-v曲线的风速v 在5~8m/s变化时,转速和风速基本符合一次函数关系,说明在这一工况区间机组是严格按照恒叶尖速比规律运行的;在图6中,β-v曲线的风速未超过额定风速时已经开始进行变桨操作,风速较低时桨距角变化较慢,随着风速增大,变桨幅度呈现先增大后减小的趋势.进一步比较表1、表2和表3中的误差和训练时间,由于计算训练误差时用到的样本点远远多于计算预测误差用到的样本点,因此,训练误差普遍大于预测误差.比较可得本文提出的基于数据预处理的支持向量机算法的预测精度和训练精度最好,训练速度最快,并且没有出现BP 神经网络中局部误差过大的问题,具有明显的优越性.
充分考虑了并网风电机组的运行特性,对实测大样本进行数据预处理,分别使用SVM 和BP神经网络方法对修整后的样本进行训练.结果表明,在非线性曲线拟合方面,基于结构风险最小化原则的SVM 算法致力于寻找全局最优解,而基于经验风险最小化原则的BP神经网络算法容易出现局部误差过大问题.本文提出的基于样本预处理方法和SVM算法的非线性拟合方法在预测精度和训练速度上都存在明显优势.由于本方法原理简单,易于实现,在风电机组运行特性研究领域具有很强的实用性.
[1]李辰奇,许昌,杨建川,等.基于CFD 的复杂地形风能分布研究[J].上海理工大学学报,2013,35(3):270-274.
[2]Hippert H S,Pedreirea C E,Souza R C.Neural networks for short-term load forecasting:A review and evaluation[J].IEEE Trans,Power Systems,2001,16(1):44-54.
[3]Hand M M.Variable-speed wind turbine controller systematic design methodology:a comparison of nonlinear and linear model-based designs[R].Colorado:National Renewable Energy Laboratory,1999.
[4]Vapnik V N.Statistical learning theory[M].New York:Wiley,1998.
[5]李盼池,许少华.支持向量机在模式识别中的核函数特性分析[J].计算机工程与设计,2005,26(2):302-304.
[6]周洪利,刘培玉.支持向量机中的模型选择研究[J].信息技术与信息化,2006(6):61-63.
[7]王鹏,朱小燕.基于RBF 核的SVM 的模型选择及其应用[J].计算机工程与应用,2003,39(24):72-73.
[8]刘东辉,卞建鹏,付平,等.支持向量机最优参数选择的研究[J].河北科技大学学报,2009,30(1):58-61.
[9]赵璐华,彭涛.一种有效的SVM 参数优化选择方法[J].制造业自动化,2010,32(9):146-149.
[10]徐海龙,王晓丹,廖勇,等.一种基于PSO 的RBFSVM 模型优化新方法[J].控制与决策,2010,25(3):367-370.
[11]贺媛媛.基于支持向量机的电力系统短期负荷预测模型研究[D].大连:大连理工大学,2005.
[12]牛东晓,谷志红,刑棉,等.基于数据挖掘的SVM 短期负荷预测方法研究[J].中国电机工程学报,2006,26(18):6-12.
[13]徐勤兰,樊重俊,张鹏.灰色支持向量机在机场吞吐量预测中的应用[J].上海理工大学学报,2012,34(4):347-350.
[14]靳忠伟,陈康民,闫伟,等.基于支持向量机的中长期电力负荷预测研究与应用[J].上海理工大学学报,2008,30(2):129-132.
[15]崔瑜琦.基于最小二乘支持向量机风电机组的预测研究[D].北京:华北电力大学,2010.
[16]Gunn S R.Support vector machines for classification and regression [R].Southampton:Unicersity of Southampton,1998.
[17]Atthajariyakul S,Leephakpreeda T.Neural computing thermal comfort index for HVAC systems[J].Energy Conversion and Management,2005,46(15/16):2553-2565.
[18]谢宏,魏江平,刘鹤立.短期负荷预测中支持向量机模型的参数选取和优化方法[J].中国电机工程学报,2006,26(22):17-22.
[19]Wendland H.Piecewise polynomial,positive definite and compactly supported radial basis functions of minimal degree[J].Adv Comput Math,1995,4(1):389-396.
[20]Wu Z M.Generalized Bochner’s Theorem for radial function[J].Approximation Theory and its Applications,1997,13(3):47-57.
[21]Lu Y W,Sundararajan N,Saratchandran P.Performance evaluation of a sequential minimal radial basis function(RBF)neural network learning algorithm[J].IEEE Trans,Neural Networks,1998,9(2):308-318.