冀光峰
中海油天津分公司,天津 300461
近年来,基于数据驱动的软仪表建模方法在石化过程中得到了越来越多的应用[1]。然而,DCS系统采集的辅助变量的数据非常多,且往往伴随着噪声;另外,辅助变量与主导变量之间的关系多呈非线性。针对这两个问题,本文提出一种基于PCA和OFR的软仪表建模方法,首先采用PCA提取输入数据的主成分,对其进行降维,消除噪声影响;然后采用OFR建立提取到的主成分与输出之间的非线性关系,最大程度地提高了模型的推广性能及稀疏性。最后,将该方法应用于柴油沸点的预报,并与其它线性和非线性方法相比较。
PCA的原理[2]简介如下 :设 X=(x1,x2,xm)为维输入向量 ,其协方差阵为∑ ,∑的m个特征值为 λ1≥λ2≥… ≥λm≥0,相应的标准化正交化特征向量为 l1,l2,…,lm,则X的第i个主成分ui为:
设非线性模型通过下式辨识[3-4]:
其中 pk(⋅)是已知的非线性基函数,M为节点个数,θ(k)、ξ(t)分别为模型参数和误差项 ,对P进行正交分解 ,即P=WA,得
模型的留一预报误差可以表示为:
其中 βM(t)=1-w( t)T[WTW]-1w( t )。若向模型中添加第k+1个节点,那么ξk+1(t),βk+1(t )可以递推获取,即
本文提出的方法的软仪表建模策略如图1所示。
图1 基于PCA-OFR的软仪表建模结果图
采用本文提出的方法建立轻柴油在50%收率时的沸点软仪表模型。数据由Soutwest研究所提供 [6]。数据集中的数据已经过预处理,含有401个辅助变量,是典型的高维工业过程。
分别采用PCA、偏最小二乘(Partial Least Squres,PLS)、最小二乘支持向量机(Least Squares Support Vector Machine,LSSVM)以及本文提出的方法(PCA-OFR)建立柴油沸点软仪表模型。以均方根误差(RMSE)、均方根相对误差(ReRMSE)、最大误差绝对值(MaxAE)作为衡量不同方法性能的指标。上述四种方法的预报误差如表1所示。
表1 不同方法对柴油沸点的预报误差
从表1中可以看出,PCA和PLS这两种线性方法的预报误差较大,这是因为柴油沸点和辅助变量间呈非线性关系,所以PCA-OFR和LSSVM这两种非线性方法有较好的预报结果。而本文提出的方法由于具有更好地稀疏性(建模样本共113个,而PCA-OFR自动选择的中心个数仅为45个),因此较LSSVM获得了更高的预报精度。
PCA-OFR对柴油沸点的预报结果和误差如图2所示。
图2 本文提出的方法对柴油沸点的预报结果和误差曲线
面向变量维数高的工业过程,提出一种基于主成分分析和正交前向回归的软仪表建模方法,实现以下几个功能:1)消除数据间的共线性,提取主成分;2)降低噪声的影响;3)采用非线性模型辨析过程的输入输出关系,并实现模型的稀疏性、提高模型的推广能力。最后通过仿真验证了本文提出的方法的有效性。
[1]俞金寿,刘爱伦,张克进.软测量技术及其在石油化工中的应用[M].北京:化学工业出版社,2000.
[2]常兆光,王清河,杜彩凤.应用统计方法[M].北京:石油工业出版社,2009.
[3]S.Chen,X.Hong,B.L.Luk et al.Orthogonalleast-squares regression:A unified approach for data modeling.Neurocomputing,2009,72(10-12):2670-2681.
[4]S.Chen,X.Hong,Harris C J,et al.Sparse modeling using orthogonal forward regression with PRESS statistic and regularization[J].IEEE transaction on system,man and cybernetics-part B:Cybernetics,2004,34(2):898-911.
[5]X.Hong,P.M.Sharkey,K.Warwick.Automatic nonlinear predictive model-construction algorithm using forward regression and the PRESS statistic.IEE.Proc.-Control Theory Appl.,2003,150(3):245-253.
[6]http://www.eigenvector.com/data/SWRI/index.html.