魏迎奇,张 申
(中国水利水电科学研究院 岩土工程研究所,北京 100048)
目前,对大坝渗流资料的统计回归分析中,通常采用普通多元回归分析法,利用该方法进行建模的前提条件是自变量因子之间不存在多重相关性,而大坝渗流过程的滞后效应使得自变量间存在共线性的现象,如果强制运用该方法进行回归建模,将会破坏参数的估计,扩大模型误差,无法对研究对象做出合理有效的预测。另外,采用普通多元回归分析法时,需要的样本数较多,有时这在工程实际中是很难实现的。鉴于此,采用偏最小二乘法对渗流变量进行回归建模,解决了变量间共线,样本少等诸多问题,进而可对大坝的运行状态做出合理的预测和评价。
1.1 建模方法偏最小二乘回归分别在自变量X和因变量Y中提取成分t1和u1,二者必须尽可能多地携带它们各自数据表中的变异信息,且相关程度能够达到最大[1]。在第一成分t1和u1被提取后,偏最小二乘回归分别实施X对t1的回归以及Y对u1的回归。如果回归方程已经达到满意的精度,则算法终止;否则,将利用X被t1解释后的残余信息进行第二轮的成分提取。如此往复,直到能达到一个较满意的精度为止。
1.2 模型因子的选择大坝渗流主要受上下游水位差、水位升降速率及降雨量等因素的影响。另外,筑坝材料在库区蓄水过程中,土体结构在渗流过程中发生相应变化,这使得大坝渗流具有时效性的特点。因此,坝体渗流与水头和时效因素等息息相关。由于这些分量相互独立,无交互作用,按各因素对渗流水头的作用形式,其分析模型可表达如下[2-3]:
式中:
式(2)中涉及的待估系数a(ii=1,2,3)可以通过式(5)求得:
式中:r为相关系数;m为提取主成分的个数;
同理,可求出待估系数b(ii=1,2,…,6)、c(ii=1,2,…,6)、d(ii=1,2)。
利用式(1)求得的渗流水头来测算大坝的渗漏量,即:
式中:h为渗流水头,m;a、b为待估参数,可由观测库水位和渗漏量求出。
2.1 精度分析在偏最小二乘回归计算过程中,测量th对X和Y的解释能力做如下定义[4]:
(1)th对某自变量xj的解释能力为
式中:r为相关系数。
(2)th对X的解释能力为
式中:p为自变量个数。
(3)th对Y的解释能力为
式中:q为因变量个数。
2.2 自变量xj在解释因变量集合Y时的作用分析自变量X与因变量Y之间的关系时,引入变量投影重要性指标(VIP)来测度二者的关系。
式中:p为自变量个数;ωhj为轴ωh的第j分量。
通过计算不同的VIP值可以定性地分析自变量X对因变量Y的影响作用。
2.3 T2椭圆图与特异点的发现样本中的奇异点就是在95%的检验水平上,样本点i对成分t1,t2,…,tm的贡献过大,超出了样本总体的平均水平。当提取成分个数为2时,则有:
在t1/t2平面图上做出T2椭圆图后,若所有的样本点都落在椭圆区内,则认为所有样本点的分布是均匀的;否则,认为落在椭圆区外的样本点为奇异点。
根据吉林台面板堆石坝工程渗漏实测资料[5],首先计算出水头H、H2、H3、H5(ii=1,2,…,6)、及θ。θ从测算日起取零,以后每天递增0.01。为方便计算说明,令:x1=H,x2=H2,…,x17=ln(1 +θ)。
从变量因子间的相关系数中可以看出,大坝渗流统计模型中所选的水位因子和时效因子之间存在很强的相关性,采用偏最小二乘回归方法进行建模,它能够较好地解决这一问题。
3.1 模型计算通过对该大坝渗流资料的计算分析,建立偏最小二乘回归统计模型如下:
从能量观点看,渗流边界条件一定的情况下,渗流区内任一点的渗流水头与上、下游水位差有关的变量间的关系只能成正比,而不能成反比,否则就违反了能量观点。从式(12)中可以看出,渗流水头与各水头因子成正比,且均介于0和1之间,这与工程实际相符合。
在水头变量因子间存在很强相关性的情况下,采用常规的最小二乘法对渗流观测资料进行回归建模,结果如下:
从式(13)中可以看出,采用常规的最小二乘法对渗流观测资料进行回归建模后,渗流水头与多个变量因子成反比,即:当库水头增加时,大坝渗流水头反而减小,这显然与实际情况不相符。由此说明了在变量因子间存在强相关性的情况下,运用偏最小二乘法进行回归建模是可行的。
3.2 渗流统计模型的辅助分析
3.2.1 模型的精度分析 在该工程实例计算中,从自变量系统中提取了两个成分t1与t2,并计算出它们对自变量和因变量的累计解释能力,结果如表1所示:
表1 成分t1、t2累计解释能力
从表1中可以看出,提取的两个成分t1与t2对自变量和因变量的累计解释能力分别为97%和96%,可以认为这两个成分t1与t2的综合信息能代替17个变量因子的信息。
3.2.2 自变量在解释因变量时的测度 用变量投影重要性指标VIPj来测度各个自变量xj对解释因变量y的作用,通过计算可得到不同自变量的VIPj值。如图1所示。
从图1中可以看出,大坝的渗漏量主要受当日水头因子、平均水头因子和时效因子的影响,而平均水头升降速率对渗漏的影响相对较弱。
3.2.3 对样本点分布结构的观察与特异点的发现通过计算成分t1与t2所对应的方差s1与s2,进而求出c值,并在t1/t2平面图上做出T2椭圆图,结果见图2。
从图2中可以看出,大部分样本点都落在椭圆区内,但是,还有5个样本点落在椭圆区外,由此可以认为总体上各测值样本点的分布是均匀的;在椭圆区外的样本点取值远离了总体样本点的平均水平,它们对应的渗流测值为奇异值,这一般由观测过程中的偶然误差所致,在建模时,应将这些测值剔除,以免影响模型的精度。
3.2.4 统计模型的结果评价 利用偏最小二乘法与常规预测法分别预测出渗漏量,并计算出它们与观测渗漏量的误差值,将其绘制成渗漏量的误差分布图,结果见图3。
从图3中可以看出,通过偏最小二乘模型预测的渗漏量误差明显更接近于X轴,这表明利用该方法对渗流观测资料分析时弱化了随机模糊不确定性因素的影响,从而提高了模型的预测精度,也更加充分地反映了大坝渗流的实际状态。
本文根据大坝渗流变量的特点,研究了采用偏最小二乘法对其建模的可行性和优越性。从计算结果可以看出该方法能够在样本点个数较少、自变量因子存在强相关性的情况下进行回归建模,利用该方法能够较好地对渗流水头做出合理预测;另外,通过辅助性分析计算,检验了模型的拟合精度、辨析了因变量与各自变量之间的关系、剔除了影响模型精度的奇异点,从而达到对该大坝渗漏量进行科学预测的目的。
[1]王惠文.偏最小二乘回归方法及其应用[M].北京:国防工业出版社,1999.
[2]郦能惠.土石坝安全监测分析评价预报系统[M].北京:中国水利水电出版社,2001.
[3]柳利利.偏最小二乘回归在大坝安全监测资料分析中的应用研究[D].西安:西安理工大学,2008.
[4]王惠文,吴载斌.偏最小二乘回归的线性与非线性方法[M].北京:国防工业出版社,2006.
[5]魏迎奇.新疆吉林台一级水电站混凝土面板堆石坝渗流分析[R].中国水利水电科学研究院,2005.
[6]高祥宝,董寒青.数据分析与SPSS应用[M].北京:清华大学出版社,2007.