基于NRS-ISSA-SVM的砂土液化判别模型

2022-06-08 08:35姜礼涛周爱红刘育林宁志杰牛建广
地震工程学报 2022年3期
关键词:约简砂土液化

姜礼涛,周爱红,2,袁 颖,2,刘育林,宁志杰,牛建广

(1.河北地质大学 城市地质与工程学院,河北 石家庄 050031;2.河北省地下人工环境智慧开发与管控技术创新中心,河北 石家庄 050031)

0 引言

砂土液化是指在震动作用下,砂土颗粒丧失接触压力与摩擦力,进而丧失强度和刚度的区域性地质灾害[1-2]。砂土液化不仅会引发地面沉降、坡体侧滑、管涌流沙等灾害,还会导致建筑物下沉、歪斜和毁坏,甚至使地下结构浮升到地面。因此建立合理的砂土液化预测模型,对砂土液化的防治工作具有重大的现实意义[3-4]。

由于砂土液化灾害的成因机理复杂、影响因素众多,并且影响因素与砂土液化间具有极强的不确定性及模糊性,使影响因素预处理手段与人工智能方法相结合的方法在砂土液化判别工作中得到了广泛的应用。王帅伟等[5]建立了基于粗糙集(Rough Set,RS)-主成分分析(Principle Component Analysis,PCA)-遗传算法(Genetic Algorithm,GA)-SVM的砂土液化预测模型,判别结果与实际结果基本吻合;孙伟超等[6]建立的PCA-Levenberg-Marquardt(LM)算法-BP(Back Propagation,BP)神经网络砂土液化模型预测结果准确性高,满足实际工程的需要;毛志勇等[7]建立的粒子群算法(Particle Swarm Optimization,PSO)优化SVM的砂土液化模型分类效果较好、建模效率高;宫凤强等[8]建立的主成分分析与距离判别分析(Distance Discriminant Analysis,DDA)相结合的砂土液化模型分类结果准确率高,判别结果与实际情况一致;杜星等[9]建立的多层感知器 (Multiplayer Perceptron,MPL) 神经网络砂土液化判别模型,准确地对地震作用下砂土的液化状态进行了评估与预测。虽然上述方法均取得了不错的应用效果,但BP神经网络模型受网络结构与参数设置影响较大,PCA提取的主成分并不具有实际的物理意义,RS只能处理离散型数据,离散化处理连续型数据后会改变数据原始的属性性质导致信息缺失,PSO和GA等优化算法所得最优参数值并不唯一,这极大的限制了砂土液化模型的建模效率与普适性。因此为科学判别砂土的液化状态,还要探索更加合理精准的预测方法。

经阅读文献,发现SVM适用于解决小样本、非线性和高维度等问题[10-11],ISSA有更好的寻优精度、收敛性能和稳定性[12],邻域粗糙集可以有效处理数值型属性的数据集合[13-14]。鉴于此,本文以文献[15]中吉林松原地区的42组实例为样本,砂土液化的影响因素为依据,引入NRS理论和ISSA算法进行因素约简与参数优化,基于训练集(35组实例)建立NRS-ISSA-SVM的砂土液化预测模型。用该模型对测试集(5组实例)的状态进行判别,并将判别结果与NRS-SSA-SVM和NRS-SVM模型对比,以期为砂土液化判别提供一种高效准确的新方法。

1 理论基础

1.1 ISSA-SVM算法基本原理

麻雀搜索算法(Sparrow Search Algorithm,SSA)是根据麻雀觅食和反捕食行为而提出的群智能优化算法。该算法主要模拟麻雀群觅食过程,将麻雀种群划分为发现者(种群找到食物较好的个体)和跟随者(种群的其他个体)的同时,增加了侦查预警机制(意识到存在捕食者的个体),如果发现危险以安全为主,重新搜索食物源。种群中发现者位置更新,跟随者位置更新以及侦查预警行为分别按下式进行:

(1)

式中:t为迭代次数;itermax为最大迭代次数;Xi,j代表第i个麻雀在第j维的位置信息;α∈(0,1]是一个随机数;Q为服从正态分布的随机数;L为元素值为1的d维列向量;R2(R2∈[0,1])和ST(ST∈[0.5,1])分别为预警值和安全值。

(2)

式中:XP为发现者所处最佳位置;Xworst表示发现者所处最差位置;A为元素值为1或-1的d维列向量,并且A+=AT(AAT)-1。

(3)

式中:Xbest表示觅食区最优位置;β服从正态分布随机数;K∈[-1,1]二者为步长控制参数;fi为麻雀个体的适应度值;fg、fw分别为全局最佳和最差适应度值。

多策略融合的改进麻雀搜索算法(ISSA)是针对基本麻雀算法收敛性能差、易陷入局部极小最优等问题而提出的改进算法。其改进主要体现在:采用立方混沌映射[16]对麻雀种群进行初始化,增强其随机性和规律性,采用透镜成像反向学习方法[17]提升麻雀个体质量,精英化初始种群。采用鸡群优化算法[18]中的随机策略改进跟随者位置更新方式,以及采用柯西-高斯变异策略[19]对最佳麻雀个体进行变异,提升算法全局搜索能力。

支持向量机的基本思想是通过某种事先确定的非线性映射将输入X映射到一个高维特征空间,在这个空间中构造最优分类超平面,从而使不同样本之间的分离界限达到最大。在以径向基核函数(Radial Basis Function,RBF)为核函数的非线性SVM模型中,惩罚参数C和RBF中的超参数g值改变影响决策边界的间隔的大小,进而影响SVM模型的性能。因此,为提升SVM模型的性能,引入ISSA算法获取最佳参数C和g值。具体流程如图1,图中输入为m个实例组成的训练样本集X=[X1,X2,…,Xj,…,Xm]

图1 ISSA-SVM算法流程Fig.1 ISSA-SVM algorithm flow

样本Xj=[xj1,xj2,…,xjn,yj],(j=1,2,…,m),由n个影响因素xjn和1个液化状态yi组成,yi∈Y为表示砂土液化状态的列向量。

1.2 邻域粗糙集基本原理

胡清华等[20]针对经典粗糙集理论离散化连续数值型数据时,不同离散化策略结果存在差异的问题,基于邻域系统的概念对经典粗糙集理论进行延拓提出了邻域粗糙集理论。作为一种处理不确定性和模糊性的数学工具,其不仅可以在处理混合型数据时保留原始数据中的大量关键信息,还可以高效准确的实现属性约简。相关定义如下:

定义1对n个属性的分类问题,给定论域U={x1,x2,…,xn},A为砂土液化影响因素 (实数型集合),D为砂土液化状态(决策属性集合),则称NDT=〈U,A,D〉为一邻域决策系统。

定义2给定xi∈U,则有

δB(xi)={xj|xj∈U,ΔB(xi,xj)≤δ}

(4)

式中:Δ为符合某种规则的距离函数;δ为邻域;B为条件属性。

定义3构建邻域决策系统NDT=〈U,A,D〉,决策属性D将论域U划分为N个等价类(X1,X2,…,XN),对任意属性B⊆A,则决策属性D关于子集B的上、下近似分别为

(5)

(6)

其中,

(7)

(8)

同样可得决策系统边界为

(9)

邻域决策系统的正、负域分别为

(10)

(11)

由此可得决策属性D对条件属性B的依赖度为

(12)

定义4给定邻域决策系统NDT,B⊆A,对任意的a⊆B-A,{a}为属性a,定义a对B的重要度为

Sig(a,B,D)=γB∪{a}(D)-γB(D)

(13)

定义5给定邻域决策系统NDT,a∈B⊆A,称B是A的一个约简,则B要满足

(1) 任意的α∈B,皆有γB-{a}(D)<γB(D)

(2)γB(D)<γA(D)

2 预测模型的建立与分析

2.1 指标选取与因素约简

砂土液化受到土质条件、埋藏条件、动力条件等众多因素的影响,结合松原地区的砂土液化的实际情况,选取反映土体土质条件的标准贯入击数、平均粒径、不均匀系数、黏粒含量和反映水土埋藏条件的地下水埋深、液化层厚度、上覆非液化土层厚度以及反映土体动力特性的地震烈度和地震加速度作为砂土液化的判别指标。从42组实例中随机挑选了35组作为训练样本(表1),剩余7组作为预测样本(表2),其中不液化、轻微液化、中等液化和严重液化,分别用1,2,3,4表示。

表1 训练样本Table 1 Training samples

表2 预测样本Table 2 Predicting samples

以选取的判别指标(标准贯入击数x1、地震加速度x2、水位埋深x3、非液化土层厚度x4、液化土层厚度x5、黏粒含量x6、平均粒径x7及不均匀系数x8和地震烈度x9)作为邻域粗糙集的属性值,砂土液化状态作为决策属性。根据NRS因素约简策略,分别计算决策属性对属性集合的依赖度及各属性在属性集合中对决策属性的重要度。通过判断属性重要度是否大于零而得出约简集合,剔除冗余属性,保留对砂土液化影响较大的因素。图2为各因素对砂土液化状态的重要度,可知:标准贯入击数x1、水位埋深x3、非液化土层厚度x4和地震烈度x9的重要度大于0,因此,选其作为砂土液化判别模型的评价指标。重要度按由大到小排序为水位埋深、地震烈度、标准贯入击数和非液化土层厚度,并且水位埋深重要度远远高于其余三个因素。

图2 各因素对砂土液化状态的重要度Fig.2 Importance of various factors on liquefaction state of sand

在《建筑抗震设计规范(GB 50011—2010)》[21]中,采用非液化土层厚度和水位埋深、地震烈度或黏粒含量、平均粒径以及地震烈度,对砂土是否液化进行初判。以水位埋深、黏粒含量与地震加速度作为基本参数,采用标准贯入试验判别法对初判结果进一步的液化判别,最后把标准贯入击数和土层厚度作为基本参数对液化等级进行划分。因此,标准贯入击数、地震加速度、水位埋深、非液化土层厚度、液化土层厚度、黏粒含量、平均粒径及地震烈度都可作为判别砂土液化的重要因素,但都是选取其中几个因素来对砂土进行液化判别,当同时选取上述因素作为判别指标时,难免会出现信息重叠现象,比如标准贯入击数可以用来推断砂土密实度、均匀性等特征,可替代黏粒含量、平均粒径及不均匀系数等因素对液化土的影响;地震烈度可以反映地震加速度,地震烈度越高,地面加速度越大,就越容易发生液化等。由此可知,NRS因素约简结果较为合理。

从数据分布方面,分析不同液化状态下各影响因素的平均值与方差来判断约简结果是否合理(表3)。其中地震加速度与地震烈度为离散型数据,不同液化状态所对应的影响因素取值唯一时,对液化状态的判别更加有利,由方差可知,液化状态不同时,各液化状态下的地震加速度值取值不唯一,地震烈度取值唯一,因此以地震烈度作为评价指标较为合理;其余因素都为连续型数据,各影响因素平均值随液化状态的变化呈现出递增或递减的趋势时,对液化状态的判别更加有利,标准贯入击数、地下水埋深和非液化土层厚度等因素的平均值变化呈现出一定的趋势,且方差较小的数据更集中的分布在平均值附近,数据波动较小,而液化土层厚度、黏粒含量、平均粒径和不均匀系数等因素规律性变化趋势不明显,且部分指标方差较大,数据分布相对分散,因此选取标准贯入击数、地下水埋深和非液化土层厚度作为评价指标相对合理。

表3 不同液化状态下影响因素的平均值与方差Table 3 Average value and variance of influencing factors under different liquefaction states

综上所述,选取反映土体土质条件的标准贯入击数、水土埋藏条件的水位埋深、非液化土层厚度以及土体动力特性的地震烈度作为砂土液化判别模型的评价指标。

2.2 模型建立

本文以NRS因素约简得到的标准贯入击数x1、水位埋深x3、非液化土层厚度x4和地震烈度x9作为输入,砂土液化状态作为输出,分别利用ISSA算法和SSA算法对惩罚参数C与核函数参数g进行搜索,其参数寻优过程如图3和图4所示,将训练样本代入该模型进行回归仿真训练,并将预测分类结果与真实结果进行对比,如图5所示。

由图3和图4不难看出,相比于SSA算法,ISSA曲线能够从初始迭代就开始收敛,并可以快速跳出极值最后使曲线保持平稳状态,说明引入鸡群优化算法以及采用柯西-高斯变异策略使ISSA算法具有收敛速度快以及良好的局部极值逃逸性能。ISSA算法从初始迭代就取得了较好的适应度值,最佳适应度值相比于SSA算法变化小,说明引入立方混沌映射和透镜成像反向学习方法可明显提升初始种群个体质量,使初始种群更快达到最优解;所以使用ISSA算法能更好地优化SVM模型。最终确定适用于吉林松原地区砂土液化判别的SVM模型的参数C=23.687 9、g=1.222 3,满足优化SVM模型参数C和g值的需要。由图5可知,发生误判的样本编号为16、20和22。16、20号样本发生误判原因可能为其标准贯入击数值接近第1类别的平均值,而其他影响因素的第1、2类别的值较为相近,所以造成其判别为第1类别。22号样本因该等级样本数量较少,而且其各指标值都与第4类别的平均值接近,所以造成判别其为第4类别;判别结果准确率可达94.3%,满足实际工程要求,至此成功建立基于因素约简与参数优化的吉林松原地区砂土液化判别模型。此模型判断该区域其他地点的砂土状态时,只需要提供相应的影响因素,该模型便可以通过建立好的映射关系,通过“自学习”方式,分析影响因素内部的隐含联系,进而判别砂土液化状态。

图3 ISSA算法参数寻优Fig.3 ISSA algorithm parameter optimization

图4 SSA算法参数寻优Fig.4 Parameter optimization using SSA algorithm

图5 训练样本原始值和预测值对比图Fig.5 Comparison between original and predicted values of training samples

2.3 预测结果分析

根据上述模型,对测试集进行判别,同时为了增加说服力与可信性,本文还建立了SVM砂土液化判别模型进行对比。测试集的实际状态和模型的判别结果见混淆矩阵图6和图7。

图6 SVM测试集混淆矩阵Fig.6 SVM test set confusion matrix

图7 ISSA-SVM测试集混淆矩阵Fig.7 Confusion matrix for ISSA-SVM test set

在混淆矩阵中,每一行中的数值之和代表该类别的真实样本数量,每一列中的数值表示真实数据被预测为该类别的数量。其对角线位置代表模型预测正确的样本数量,其他位置代表预测错误。由图6可知,分布在对角线上有4个样本,代表在预测的7个样本中有4个样本预测正确,其余三个预测错误,其中第1类别的样本误判为第2类,第3类别的样本误判为第2类,第4类别的样本误判为第3类,SVM模型判别正确率为57%。由图7可以看出:7个样本均分布在对角线上,说明7个样本的预测值完全正确,ISSA-SVM模型判别正确率为100%,判别值与砂土实际状态一致,能够准确反映砂土的实际状态,这表明优化算法能够显著提高模型的判别效果,ISSA-SVM模型的判别结果准确率明显优于SVM模型,建立的NRS-ISSA-SVM模型能够适用于吉林松原地区的砂土液化判别工作。

2.4 判别因子敏感性分析

为探讨砂土液化对选取的判别因子的敏感性,为砂土液化判别提供更为可靠的理论依据。选取典型的回归分析方法(regression analysis)[22]对砂土液化判别模型中选取的判别因子进行敏感性分析。

利用SPSS软件,以判别因子作为自变量,砂土液化等级作为因变量进行多元线性回归分析,采用逐步回归法建立最优的回归方程。其具体含义为:未选入回归方程的因子即为不敏感因子,选入回归方程的因子即为敏感因子;标准回归系数的绝对值代表了因子敏感性大小[23]。非液化土层厚度未选入回归方程,为不敏感因子。其他因子的标准回归系数计算结果列于表4。

表4 回归系数表Table 4 Table of regression coefficients

由表4可知,回归模型的决定系数R2为0.906,说明选入回归的因子与液化等级之间有着较强的线性关系。各因子敏感性按标准回归系数的绝对值大小排序为:地震烈度>地下水埋深>标准贯入击数。非液化土层厚度为不敏感因子。

结合《建筑抗震设计规范(GB 50011—2010)》和吉林松原地区的邻域粗糙集属性约简以及模型训练测试结果及因子敏感性分析结果,要判别场地的液化状态,建议准确查明水位埋深、地震烈度、标准贯入击数,非液化土层厚度这四个因素。尤其是前三个因素。

3 结论

(1) 经NRS约简得到的水位埋深、地震烈度、非液化土层厚度和标准贯入击数是影响吉林松原地区的砂土液化的重要因素。敏感性按大小排序为:地震烈度、地下水埋深、标准贯入击数。非液化土层厚度为不敏感因子。

(2) NRS计算分析的是各因素和结果的量化数值,而不是影响因素本身,因素约简所得指标在地质力学领域存在局限,但是该方法能够剔除因素间的交叉和冗余,降低了输入的维数与计算量,提高了建模的效率,其因素约简的结果仍是可靠的;ISSA算法全局搜索能力强、收敛速度快,能够高效合理的确定SVM模型所需参数,降低了参数选取的盲目性。

(3) 砂土影响因素众多,且这些因素具有多维性和非线性的复杂关系,建立的NRS-ISSA-SVM砂土液化模型,合理地对吉林松原地区的砂土液化状态做出了判别,相比于其他模型,表现出了优秀的泛化能力与预测性能,为砂土液化的判别提供了新的手段。

猜你喜欢
约简砂土液化
水泥土换填法在粉质砂土路基施工中的应用研究
基于HYSYS软件的天然气液化和调压工艺模拟
液化天然气槽车装卸一体化系统
饱和砂土地层输水管道施工降水方案设计
复杂液化地基处理的工程应用分析
龙之中华 龙之砂土——《蟠龙壶》创作谈
近似边界精度信息熵的属性约简
面部液化随意改变表情
广义分布保持属性约简研究
城市浅埋隧道穿越饱和砂土复合地层时适宜的施工工法