李志国 白瑞涵 刘旭进 王庶懋※
1) 中国电力工程顾问集团华东电力设计院有限公司,上海 200063
2) 河海大学岩土力学与堤坝工程教育部重点实验室,江苏南京 210024
3) 河海大学江苏省岩土工程技术工程研究中心,江苏南京 210024
地基沉降是沿海地区的一种严重缓变的地质灾害,具有累积和不可逆转的特性,其影响将持续的发生作用。上海作为我国地基沉降最严重的城市之一,控制地基的沉降对上海地区的发展十分重要。土的压缩模量和压缩系数是评价土体压缩性和地基沉降计算的主要指标,而土体的物理指标参数会影响土体压缩性,所以需要开展土体压缩性指标与物理参数的相关性分析,为实际工程提供指导。
Koppula[1]与Rendon-Herrero[2]认为天然含水率对土颗粒表面水膜厚度有影响,对土体结构与压缩性展开了相关性分析;Schofield和Wroth[3]与Nakase等[4]认为土体的可塑状态与其压缩性密不可分,基于工程实测数据进行压缩指数与塑性指数的相关性分析;Azzouz等[5]对700多组固结试验得到的压缩指数和压缩系数进行了回归分析,建立了塑性指数、天然含水率、初始孔隙比多变量特征的压缩指数预测公式;刘吉福和高玉峰[6]对广东省13条高速公路软粘土的物理力学指标进行了相关性分析,并得出压缩系数与含水率、孔隙比、密度之间呈现良好的幂函数关系;赵孝旗等[7]对杭州地区大量的海相软土试样进行统计分析,研究结果表明压缩系数与物理指标孔隙比、质量密度、天然含水率具有较强线性关系;刘伽等[8]对上海、广州、江苏、连云港、温州等地黏性土物理力学指标统计分析,结果表明压缩指数与初始孔隙比、干重度、液限多参数的相关性最高;涂春霖等[9]基于相关关系和一元线性回归分析等方法分析了遮放盆地粉质黏土,其中液性指数与压缩系数、压缩模量相关性较好,并提出可根据液性指数估算力学指标;白冰等[10]研究了塑性指数对饱和软黏土压缩变形参数的影响,得到了压缩指数、回弹指数、次固结系数等与塑性指数的线性拟合关系;李晨晨等[11]取土样于昆明市南市区,给出了物理指标与力学指标参数的经验公式;孙毅力和于洪民[12]以北京地区积累的物理指标参数为研究对象,分析了该地区土体参数对压缩模量的影响规律;李旭昶等[13]对扬州地区土体的物理力学指标展开分析,并就塑性指数与压缩系数提出了经验公式;丁祖德等[14]就昆明地区泥炭质土提出了压缩系数与液性指数的经验公式。以上土体压缩系数与物理参数的相关性研究大多采用拟合或回归分析的方法,拟合方法往往对非线性问题表现不佳,而回归分析是基于先验知识的推测,限制了变量的多样性和不可测性,这使得以上方法在实际工程应用时具有一定局限性。近年来随着机器学习、深度学习等新理论、新技术的高速发展,众多学者就人工智能在土木工程领域做出了众多的尝试,张鹤[15]基于MLP和RBF神经网络建立不同的软土物理参数——压缩模量神经网络预测模型;蒋建平等[16]基于RBF神经网络建立了以压缩系数为输出,多参数组合孔隙比、塑性指数、水与土粒的质量比、密度为输入的模型,并验证了该模型的误差在岩土工程中是可以接受的;Zhang等[17]基于GBRT算法建立了压缩模量的预测模型,并使用GA遗传算法对GBRT超参数优化,与传统的经验公式对比证明了该方法的优越性。
机器学习中支持向量机算法(SVR)的核心理念为寻求结构化风险最小来提高模型的泛化能力,即通过合理的函数变换将输入变量映射到高维空间后进行回归分析,能够很好的处理非线性特征的相互作用。本文将结合支持向量机算法,对上海地区土体的物理力学指标展开相关性分析,为进一步拓展到更为广泛区域提供重要指导。
土体物理力学指标统计分析所需的数据来源于上海地区的6处工程场地的室内试验。
对上海地区工程场地所取得的大量淤泥质粘土、粘土、粉质粘土、砂质粉土的物理力学指标进行统计,结果见表1。由表统计分析结果知,上海地区土体的天然密度ρ和土粒比重Gs的变化范围都不大,且变异系数都接近于0,说明这些指标在上海地区相对均一,所以在实际应用分析时可不考虑土的天然密度和土粒比重的影响。上海地区所取得的4种土体有以下特征:
表1 土的物理力学指标统计Table 1 Statistics of physical and mechanical indexes of soil
(1)淤泥质粘土的天然含水量w变化范围为24.40%——63.40%,均值达到42.93%,土体含水量较大;液性指数IL变化范围在0.52——2.57之间,均值为1.41,这说明上海地区淤泥质粘土多处于软塑至流塑状态;塑性指数IP的变化范围为9.40——22.80,均值为14.62,说明土中有一定的粘粒含量;其塑限、液限、液性指数与塑性指数的变异系数分别为0.13、0.16、0.23、0.23,这几个指标的变异系数均大于0.1,在具体取值时应考虑其变异性;压缩系数的均值为 0.84 MPa−1,大于 0.5 MPa−1,属于高压缩性土。
(2)粘土的天然含水量w变化范围为24.00%——52.60%,均值达到36.22%;液性指数IL变化范围在0.35——1.93之间,均值为0.92;塑性指数IP的变化范围在10.80——20.60之间,均值为15.47,这些说明上海地区粘土土粒较细,黏粒含量较高;其塑限、液限、液性指数与塑性指数的变异系数分别为0.12、0.12、0.47、0.16,这几个指标的变异系数均大于0.1,液性指数接近于0.5,变异性相对较大,在具体取值时应考虑其变异性;压缩系数均值为0.57 MPa−1,大于 0.5 MPa−1,属于高压缩性土。
(3)粉质粘土的天然含水量w变化范围为18.20%——52.00%,均值达到30.97%;液性指数IL变化范围处于−0.31——1.84之间,变化范围较大,均值为0.72;塑性指数IP的变化范围在9.00——22.80之间,均值为13.68,上海地区粉质粘土的塑性指数较淤泥质粘土和粘土相对较小,所以其细颗粒含量相对较少,颗粒相对较粗;其塑限、液限、液性指数与塑性指数的变异系数分别为0.11、0.13、0.57、0.19,这几个指标的变异系数均大于0.1,液性指数大于0.5,在指标取值时变异性较大;压缩系数均值为0.41 MPa−1,小于0.5 MPa−1,属于中压缩性土,其变异系数为 0.51,变异性较大。
(4)砂质粉土的天然含水量w变化范围为19.90%——46.40%,均值达到31.51%;液性指数IL变化范围大,处于0.35——1.90之间,均值为1.10;塑性指数IP的变化范围为7.10——17.70,均值为10.15,上海地区砂质粉土塑性指数较小,细颗粒含量较少,则其比表面结合水含量较低;其塑限、液限、液性指数与塑性指数的变异系数分别为0.12、0.11、0.30、0.19,这几个指标的变异系数均大于0.1,指标取值时变异性较大;压缩系数的变化范围为 0.10——0.83 MPa−1,均值为0.39 MPa−1,小于 0.5 MPa−1,属于中压缩性土,其变异系数为0.46,变异性较大。
上海地区所取的4种类型土体的天然密度变化范围不大,土颗粒结构紧密状态相近,在土体压缩系数相关性分析中可忽略土体密度的影响;而塑性指数、液性指数影响着土体结构与表面水膜厚度,对土体压缩系数影响较大。因此,本文研究重点针对压缩系数与塑性指数、液性指数的相关性展开研究,建立变量之间的相关性散点图(图1),可见压缩系数与塑性指数、液性指数呈正相关。
图1 相关性散点图Fig.1 Correlation scatter plot
支持向量机是一种基于统计学理论的原理性方法,可用于线性和非线性回归问题。通过寻求结构化风险最小来提高学习机泛化能力,实现经验风险和置信范围的最小化,从而达到在统计样本量较少的情况下,亦能获得良好统计规律的目的。其基本思想是通过一个非线性变换将输入空间对应于一个特征空间,使得在输入空间中的决策超曲面模型对应于特征空间中的决策超平面模型。
给定训练样本,希望基于机器学习学得一个回归模型,使得f(x)与y尽可能接近,w和b是待确定的模型参数。通过设定最大容忍误差ε,当误差绝对值大于ε时才计算损失,SVR问题可转化为:
式中,C为正则化常数,lε为ε的不敏感损失函数。
支持向量损失函数表达为:
引入拉格朗日乘子μi:
上述过程中需要满足KKT条件,即要求:
SVR的解形如:
式中,若0<αi<C,则必有 ξi=0
若考虑特征映射形式,则:
则SVR可表示为:
通过对方程求解确定模型的最终参数w和b,式中k(xi,xj)表示SVR模型的核函数,该函数的主要作用是将样本映射到高维状态并进行运输。
采用MAE(平均绝对误差)、RMSE(均方根误差)、MSE(均方误差)、R2(决定系数)作为预测准确性的评判标准,具体表达式如下:
MAE、RMSE、MSE指标越小,R2越接近于1,表示预测值与真实值间误差越小。
为使机器学习模型在真实数据上能达到良好的预测效果,在训练过程中需要对模型的超参数进行设定,其中包括模型的输入变量与支持向量机参数(核函数系数γ,误差惩罚系数C,最大容忍误差ε)。本文将搜集到的数据集划分两份,一份用来训练模型,一份用来评估模型,分别称为训练集和测试集,并分别基于压缩系数预测值和实测值的分布散点图与误差累计曲线对影响模型预测精度的超参数展开分析,以确定出每个超参数的最优取值。在预测值与实测值的分布散点(图2a)中,横坐标与纵坐标分别为测试样本的真实值与预测值,黑色虚线y=x代表预测值等于真实值,测试样本点越集中于平分线,表明在该情况下模型的预测值越接近于真实值。而误差累积曲线(图2b)中,图中横坐标为待测试样本的序号,纵坐标为误差累计总值,该值初始情况为零,按顺序每对一个待测样本进行误差计算后,该样本的误差值累加在误差累积总值之上,随着测试样本数量的不断增加,误差累计总值不断变大。当总误差累积曲线的斜率越缓,代表在相同的测试样本中该情况下的模型误差累积总值累积速度越快,即总预测的偏离程度越大。
2.3.1 输入变量
为确定压缩系数支持向量机预测模型的输入变量,对比两种单变量输入和一种多变量输入。两种单变量输入分别为塑性指数和液性指数,多变量输入为塑性指数与液性指数。除输入变量不一致外,其余的支持向量机参数设置相同,这里支持向量机算法模型采用线性核函数。
图2给出了支持向量机算法模型在3种输入变量下预测结果的对比分析(图2b),结合误差评价指标(表2),单变量输入液性指数的误差整体较大,塑性指数输入小于液性指数输入,多变量输入误差最小。可以发现多变量输入比另外两种单变量输入在误差大小和模型稳定性上均有较大优势。因此,本文采用由塑性指数与液性指数的多变量输入展开与压缩系数的相关性分析。
表2 不同输入变量预测结果误差对比Table 2 Error comparison of forecast results for different input variables
图2 不同输入变量预测结果的对比分析Fig.2 Comparisive analysis of forecast results for different input variables
图2a中支持向量机在线性核函数下基于塑性指数、液性指数多变量建立预测模型后,对真实值较小的压缩系数预测出现负值,与实际情况不符合。考虑到不同类别土体中细颗粒含量不同,相应的表面结合水含量不同,所以不同类别土体塑性与压缩性的相关性不同,而线性核函数较为简单,对多类别土体关系的映射较为片面,加之没有对模型误差项惩罚性系数C进行优化来降低个别奇异点对整体的影响,故所建立的模型适用性较差。接下来对模型的核函数与误差项惩罚系数C进行分析,以此期望能够增强模型对多类别土体压缩系数预测的鲁棒性。
2.3.2 核函数
当输入为多变量时,为确定最优核函数,这里对支持向量机不同核函数(线性、多项式、RBF)进行对比(图3)。从误差累计曲线沿着y轴正向的增长速度(图3b)及误差指标(表3),核函数RBF模型在预测有一定的优势。就塑性指数、液性指数与压缩系数的相关性分析而言,核函数RBF优于线性核函数和多项式核函数。
图3 不同核函数预测结果的对比分析Fig.3 Comparisive analysis of forecast results for different kernel functions
表3 不同核函数预测结果误差对比Table 3 Error comparison of forecast results for different kernel functions
2.3.3 误差项惩罚系数 C
为了确定最优误差项惩罚系数,这里对支持向量机不同误差项惩罚系数进行比较(图4)。通过误差累计曲线于y轴方向的增长速度(图4b),结合误差指标(表4),误差项惩罚系数C=5相较于其他取值在预测时更加准确。
表4 不同误差项惩罚系数预测结果误差对比Table 4 Error comparison of forecast results of penalty coefficients of different error item
图4 不同误差项惩罚系数预测结果的对比分析Fig.4 Comparisive analysis of forecast results of penalty coefficients of different error item
在以上分析中,根据测试样本的预测误差,确定出模型的最优输入模式为塑性指数与液性指数二维输入变量,支持向量机算法的最优核函数为RBF,误差项惩罚系数的最优取值为5。通过对上海地区工程场地中大量的淤泥质粘土、粘土、粉质粘土、砂质粉土数据集训练建立最终模型,进而为上海广泛区域土体的压缩性研究提供指导。
基于支持向量机算法在塑性指数、液性指数多变量输入情况下建立的模型与线性拟合、多项式拟合方法对比分析。以上海某一场地为例,该场地压缩系数在不同方法下的预测结果如图5所示,各方法预测结果与真实情况的误差指标见表5。
图5 不同方法的压缩系数预测结果对比分析Fig.5 Comparisive analysis of prediction results of compression coefficients by different methods
表5 不同方法的压缩系数预测结果误差对比Table 5 Error comparison of prediction results of compression coefficients by different methods
图5a给出了在不同方法下样本点预测值与实测值的分布结果,基于支持向量机算法在多变量因素下建立的预测模型,数据更加趋于分布在平分线两侧;而线性拟合与多项式拟合的预测方法,部分样本点位于平分线右下方,预测值小于真实值,可见采用本文支持向量机算法所建立的多参数预测模型预测值与真实值较为贴近。图5b为各个方法预测结果的误差累计值,基于支持向量机算法的多因素预测方法样本误差的累计速度较慢,即整体的偏离程度越小,相比于拟合方法有明显的优势。图5c给出了预测值与真实值比值的频数分布曲线,基于支持向量机算法多因素频数分布曲线相较陡峭,数据点最为集中,多项式拟合方法频数分布曲线表现为右边的尾部相对于与左边的尾部要长,即有轻微的右态偏,说明部分样本的预测值大于真实值。因此,从整体上基于支持向量机算法建立的多参数预测模型更有优势。
为了进一步验证支持向量机算法相比于其他拟合方法的优势,本文构建了不同数量的数据集0,1,2,3,4,数据集的数量逐渐增加,然后分别以支持向量机算法、线性拟合以及多项式拟合方法展开训练或拟合,最后就同一测试样本进行精度验证。结果如图6所示,随着样本数据的不断增加,支持向量机所训练的模型精度不断增加,考虑到算法复杂的理念设计,基于大量数据可进行更加深度的挖掘;而拟合方法较为简单,样本达到一定数量后对拟合参数的影响趋于稳定。
图6 不同数量数据集下支持向量机与拟合方法的对比分析Fig.6 Comparative analysis of support vector machine and fitting methods in different datasets
土粒的微观结构反映出不同的土粒孔隙、水膜厚度以及粘粒含量,在沉淀中形成的土体结构会影响土体的压缩性。这里将预测值与实测值之间的偏差定义为预测偏差,利用偏差拟合曲线的变化来分析其他物理指标对模型预测性能的影响,从而对模型的预测性能进行评估。
图7给出了基于物理指标(塑限、液限、塑性指数、液性指数)模型预测性能的偏差变化,散点表示基于模型预测偏差与其所对应的物理指标,黑线和红线分别表示模型预测的偏差拟合曲线与0偏差线。对于不同的物理指标,模型的预测准确性有显著差异,对应各范围预测结果误差(表6)。随着含水量、塑限、液限、塑性指数等物理指标的逐渐增加,相应样本模型预测值上下偏离于真实值越大;而液性指数的变化对模型预测精度的影响较小,所以在模型使用时可忽略该指标对预测准度的影响。
表6 不同物理指标预测结果误差对比Table 6 Error comparison of prediction results for different physical indexes
图7 不同物理指标的预测偏差Fig.7 Forecast bias of different physical indexes
图8给出了基于压缩系数的预测偏差变化,其误差结果如表7所示,高压缩性土的预测偏差曲线随着参数指标的变化波动起伏较大,中压缩性土体趋于稳定,即模型对淤泥质粘土、粘土等中低压缩性土体的预测能力更强。因此,在预测时模型对不同指标区间土体的泛化能力有差异,可结合偏差变化曲线约束样本指标范围来提高模型预测的准确性。
表7 中高压缩性土预测结果误差对比Table 7 Error comparison of prediction results of medium and high compressible soil
图8 基于压缩系数的预测偏差变化Fig.8 Variation of forecast bias based on compression coefficients
本文运用支持向量机算法开展了上海地区土体的物理力学指标相关性分析,得到如下结论:
(1)建立了基于塑性指数与液性指数的土体压缩系数预测模型,所建立的双因素模型相较于单因素塑性指数模型能够有效地对土体压缩系数进行预测,预测结果与实测结果相关性显著提高、误差明显降低,该预测压缩系数的模型算法可作为上海地区参数估计的参考验证。
(2)通过对模型算法的超参数进行优化,并将该模型与传统的线性、多项式拟合方法对比,支持向量机模型预测结果与实际更为接近,具有一定的工程应用价值。
(3)基于含水量、塑限、液限、塑性指数以及液性指数建立预测与实测压缩系数之间的偏差变化曲线,发现含水量少、可塑性小的中压缩性土体相较于高压缩性土体的预测偏差幅度变化更小,模型更加稳定与准确。