杨溪源,李彦哲
(兰州交通大学自动化与电气工程学院, 兰州 730070)
近年来,我国铁路事业迅猛发展,随着列车运行速度的不断提高,铁路运营安全成为人们关注的热点。铁路运营安全主要包括:列车车体安全、信号与通信系统安全、调度指挥安全等[1-2]。其中,脱轨作为列车车体安全考虑因素之一,容易受大风等自然灾害的影响[3-4]。在大风环境及风口区域的高路堤、丘陵等特殊路段中,由于列车气动性能恶化,导致列车稳定性受到严重影响,大大增加列车脱轨的可能性[5],因此,对铁路风速预测研究,显得尤为重要。
国外,文献[6-7]提出在铁路沿线建立挡风墙、列车外形优化等的方法,一定程度上解决了大风对高速列车运行的影响,但是有一定的局限性;文献[8]根据列车运行沿线历史风速数据以实现外推估计的风速预测研究,该方法简单、实时性好,但预测精度不高;国内,文献[9-11]针对铁路沿线风速短期预测,学者分别利用时间序列分析理论和神经网络等方法进行预测研究,很好的提高了风速预测精度,但存在神经网络初始权值和选择训练数据样本不易确定等缺陷,基于此,支持向量机法等机器学习型算法应运而生,以结构风险最小化为目标的SVM预测模型较神经网络模型具有较高的精度,这在一定程度上克服了神经网络在铁路短期风速预测中的劣势[12],但是SVM模型仍存在核函数选择条件苛刻需遵循Mercer条件,核函数较多且其值的选取对SVM模型的预测精度有着较大的影响。在此,本文根据新型计算机算法相关向量机核函数选择灵活无需遵循Mercer条件,核参数的设置数目少的特点,利用差分进化算法在参数优化方面的优势,采用交叉算子可自适应调整的自适应差分进化算法,并混合了模拟退火算法对最优参数进行二次优化,提出了基于自适应混合差分进化相关向量机(Self-Adaptive Hybrid Differential Evolution-Relevance Vector Machine, SAHDE-RVM)的铁路短期风速预测模型,通过实例对预测模型进行验证,并与现有模型的预测结果进行对比分析。
相关向量机(Relevance Vector Machine, RVM)是一种基于贝叶斯框架的算法[13]。与传统的SVM相比,RVM具有高稀疏性,仅有核参数的设置,核函数的选择灵活,无需满足Mercer条件等优点,在回归预测方面有着良好的应用价值。
本文使用RVM进行回归预测,建立RVM回归预测模型。给定训练样本的输入集X={x1,x2,x3,…,xn,}与相应的输出集T={t1,t2,t3,…,tn},其中n为样本个数,设ti为目标值且有ti∈R。输出值ti的函数模型可表示为
ti=y(xi,w)+εi
(1)
式中,εi表示高斯白色噪声,且εi服从分布εi~N(0,σ2),则p(ti|xi)=N(ti|y(xi,w),σ2)。RVM模型的输出可表示为非线核函数的组合,核函数无需满足mercer条件。RVM的回归预测模型为
(2)
式中,wi为加权系数;K(x,xi)为核函数;N为样本数量。
对于独立分布的输出集ti的似然估计为
(3)
式中,Φ=(Φ1,Φ2,…,ΦN);Φi=(1,K(xi,x1),…;K(xi,xn))T(i=1,…,N)。
由稀疏贝叶斯原理定义的权值参数为零的高斯先验分布为
(4)
式中,αi为先验高斯分布的超参数;α=(α0,…,αN)T。每个独立的超参数αi控制着权参数wi的先验分布,使相关向量机模型具有稀疏性。
由式(3)、式(4)根据贝叶斯原理计算权值矢量w的后验分布
N(w|μ,∑)
(5)
式中,μ=σ-2∑φTt,∑=(A+σ-2φTφ)-1,A=diag(α0,α1,…,αN)。
由式(5)可知,若要确定权值矢量w需对超参数α、σ2进行确定。用贝叶斯框架计算超参数的似然分布
(6)
式中,C为协方差且C=σ2I+ΦA-1ΦT。
(7)
(8)
式中,uj是第j个后验平均权值;γj=1-αjMjj(γj∈[0,1]);Mjj为权值协方差矩阵Σ的对角线元素。
RVM学习过程中,首先初始化式(7)、式(8)中的两个参数,并通过更新迭代公式不断更新计算两个超参数,当模型中的参数均达到最大训练次数时,更新计算停止,此时得到的α与σ2为最优值。若给定系统一个输入值X*,则输出的概率分布为
N(t)(t*|y*,σ2)
(9)
y*=uTΦ(X*)=uMPΦ(X*)
(10)
(11)
Storn R和Price K于1995年提出了差分进化算法(Differential Evolution,DE),DE是一种使用实数矢量编码的群体智能化的优化算法,其原理类似于遗传算法。DE具有强大的易用性、鲁棒性和全局搜索能力,已有大量的文献证明DE算法的优越性高于遗传算法、蚁群算法等智能算法[14]。DE通过对群体中的个体分别进行变异、交叉、选择等操作获取最优个体,从而得到最优值。但DE算法仍然具有易早熟,较难搜索到全局最优解等缺陷,鉴于此,本文采用一种自适应混合差分进化算法(Self-Adaptive Hybrid Differential Evolution,SAHDE)[15-17],该模型可自适应调整DE的交叉概率算子CR,在算法的初期保持种群的多样性的同时提高其全局搜索能力,并引入了模拟退火算法,该算法具有较强的搜索能力可对获取的最优解进行二次搜索,SAHDE算法可解决DE算法早熟收敛,优化算法的全局所搜能力。差分进化算法的操作步骤如下。
(1)变异操作:DE算法由多种变异操作方法,本文选用如下方法进行变异操作。
xm=xbest+F[(x1-x2)+(x3-x4)]
(12)
随机挑选出4个父代个体,分别记为x1,x2,x3,x4;xbest是父代中的最优个体;xm为变异产生的变异个体;F为变异率(F∈[0,1.2])。
(2)交叉操作:选取两个个体xi和xm进行交叉操作,交叉操作后生成的新个体为xc,具体的操作方法如下式
j=1,2,…,D
(13)
其中,rand()表示[0,1]之间的随机函数,randr(i)∈{1,2,…,D}为随机产生的整数;D为优化变量的维数;CR为交叉率(CR∈(0,1))。
(14)
(15)
CR0为交叉算子CR的初值,CR的值根据上式自适应调整,初始值CR0较小,而后其取值逐步增大,此时算法具备一个优秀搜索算法所具备的能力,与传统DE相比具有更好的性能。
DE种群的多样性会导致其早熟收敛。为了进一步提高算法的搜索效率,本文使用模拟退火算法对SAHDE产生的当前最优个体进行二次搜索。在SAHDE当中,选定当前最优个体为初始个体,既y0=xbest初始温度选定为T0,产生新个体的方式如下所示
yr+1,j=yr,j+ηε(xjmax-xjmin)
j=1,2,…,D
(16)
式中,r为模拟退火算法的迭代次数;yr为r次迭代后产生的新个体;η为控制扰动幅度;ε为服从均值或正态分布的随机变量;xjmax、xjmin分别为第j维优化变量的取值范围。