基于WOA-LSSVM的海底沉积物物性参数建模

2021-11-02 11:55刘兰军陈家林
海洋技术学报 2021年4期
关键词:物性沉积物电阻率

张 帆,刘兰军,陈家林,刘 健

(1.中国海洋大学工程学院,山东 青岛 266100;2. 山东省海洋环境与地质工程重点实验室,山东 青岛266100;3. 山东省海洋智能装备技术工程研究中心,山东 青岛 266100)

随着海底资源开发和海底科学观测等活动的日益增加,海底沉积物工程地质勘察越来越受到人们的关注。因为具有非侵入性、非破坏性、快速和经济的特点,地电法、探地雷达法、地震折射法等地球物理方法在工程地质勘察中获得日益广泛的应用[1]。其中,电阻率测量是海底沉积物原位长期观测的一种常用方法。电阻率是表征沉积物导电能力的基本物性指标,沉积物电阻率能够反映其基本物理力学性质及结构特征,建立海底沉积物电阻率与物性参数的回归关系模型,可以有效支持海底工程地质勘察的应用。

近年来,国内外学者已经对海底沉积物电阻率与物性参数的回归建模开展了一系列研究工作。通过直接或间接测量方式获得海底沉积物物性参数和电阻率数值的大量实验数据,对实验数据进行基于最小二乘(Least Squares,LS)回归分析,得到电阻率与各物性参数之间的经验公式。郭秀军等[2]通过室内实验,研究了海底沉积物的含水率、饱和度、孔隙比等物性参数以及压缩系数、粘聚力、压缩模量等力学性质参数与电阻率的关系, 基于LS回归方法得出了一系列关系曲线和拟合公式。刘国华等[3]依据大量实验数据,分析了电阻率与含水率、孔隙水的导电性等土壤基本物理参数之间的相关性,建立了一个基于推广阿尔奇公式的黏土电阻率模型。COSENZA P等[4]以法国加西市为例,研究了岩土数据和其电气数据之间的相关性,得到了电阻率与含水率的经验公式,证明电阻率是含水率的良好间接预测因子。SIDDIQUI F I等[1]同时分析土壤调查的现场结果和实验室实验结果,采用简单回归分析和多元回归分析对结果进行评估,证明电阻率与含水率、摩擦角和塑性指数之间存在显著的定量和定性相关性。LIN J等[5]通过对江苏海相黏土岩土工程勘察和实验室实验,使用斯皮尔曼秩相关系数检验了电阻率和含水率、孔隙比、含盐量、塑性指数等岩土参数的相关性,建立了定量关系,证明了电阻率预测岩土工程性质的可行性。经验公式法简单实用,但受限于函数类型,不能获得最优的函数关系。随着机器学习方法的发展,国内外学者开始在海底沉积物含水率、孔隙度等物性参数建模方面开展基于机器学习方法的研究。SIDDIQUI F I等[6]分别应用人工神经网络、模糊逻辑和回归方法研究了土壤性质与电阻率的相关关系,给出了土壤电阻率随其含水率、液塑限指数、摩擦角的变化而发生变化的规律,并与回归模型做了比较,证明了人工神经网络建模方法具有更好的预测精度。冯旭宇等[7]探讨土壤温度和含水量对土壤电阻率的影响,并将偏最小二乘(Partial least squares,PLS)回归模型与反向传播(Back Propagation,BP)神经网络模型应用于土壤电阻率的预测, 证明了PLS模型及BP神经网络模型对土壤电阻率预测皆有较好效果。LIU L J等[8]采用BP神经网络、遗传算法(Genetic Algorithm,GA)优化的BP神经网络和径向基(Radial Basis Function,RBF)神经网络建立了海底沉积物物性参数和电阻率之间的关系模型,利用电阻率来预测海底沉积物的物性参数,与传统回归方法相比,机器学习方法具有更好的定量预测效果。

最小二乘支持向量机(Least Squares Support Vector Machine,LSSVM)是一种性能良好的机器学习算法,在小样本和非线性等数据空间具有较好的预测性能和泛化能力,得到了广泛应用,如啤酒企业能耗预测[9]、木材干燥状态预测[10]、传感器故障检测与数据恢复[11]等。LSSVM建模主要受正则化参数和核函数参数取值的影响,许多优化算法被用于选取上述两个参数,如GA算法[12]、蚁群算法[13]、粒子群(Particle Swarm Optimization,PSO)算法[14]等。鲸鱼算法(Whale Optimization Algorithm,WOA)由MIRJALILI S等[15]在2016年提出,是一种受自然启发的新型启发式优化算法,具有寻优精度高、稳定性强的优点。目前,WOA算法主要用于特定函数的优化求解问题。张华磊等[16]通过WOA算法对电动机的PID控制参数寻优。王熙乾等[17]应用WOA算法优化概率神经网络,对电力电子电路进行故障诊断。此外,基于WOA算法的LSSVM正则化参数和核函数参数寻优取值,已应用于建模预测领域。赵浩然等[18]、刘怀远等[19]、陈友鹏等[20]分别将基于鲸鱼算法优化的最小二乘支持向量机(Whale Optimization Algorithm-Least Squares Support Vector Machine,WOA-LSSVM)的模型应用于CO2排放、锅炉NOx排放量、短期电力系统负荷预测,均取得了不错的效果。海底沉积物物性参数和电阻率参数的样本数据具有小样本、非线性的特点。为此,针对其高性能建模的需求,本文提出了基于WOALSSVM的海底沉积物物性参数与电阻率回归建模方法,该方法建立了沉积物电阻率与沉积物四种基本物性参数(含水率、密度、孔隙比、塑性指数)的单输入、单输出LSSVM回归模型,利用WOA算法对LSSVM参数进行寻优取值。同时,对比研究了GA算法、PSO算法优化的LSSVM建模结果。结果表明,基于WOA-LSSVM的海底沉积物物性参数与电阻率建模误差较小,具有更好的预测效果。

1 WOA-LSSVM建模方法

1.1 LSSVM原理介绍

支持向量机(Support Vector Machine,SVM)是基于统计学习理论,针对小样本的机器学习方法,同神经网络类似,具有拟合非线性函数的能力。但SVM不存在局部极小以及过学习等问题,且具有更好的泛化性[10]。LSSVM是SVM的一种扩展。标准SVM是求解一个带不等式约束条件的二次规划问题,而LSSVM用等式约束来代替标准SVM中的不等式约束条件,将标准SVM求解的二次规划问题转化为求解线性问题,降低了问题的复杂度,求解过程大大加快[21]。对于给定的一组训练样本集{(xi,yi)},i=1,…,n,其中,n为训练样本总量,xi∈Rn为输入量,yi∈R为输出量,LSSVM的基本思想是通过一个非线性映射φ(x),将训练样本映射到高维特征空间,然后在高维特征空间中进行线性回归,回归函数可表示为式(1)。

式中:ω是权向量;b是偏置量。此时,LSSVM的优化问题为式(2)。

式中:ei是误差变量;γ(γ>0)是正则化参数,即惩罚因子,用来调整误差。为求解该问题,引入拉格朗日乘子λ,λ∈RN×1,得到式(2)对应的拉格朗日函数式(3)。

根据卡罗需·库恩·塔克(Karush-Kuhn-Tucker,KKT)条件,可得式(4)。

消去ω和ei,则得到线性方程组式(5)。

式中:el=[1,1,···,1]T是N×1维列向量,拉格朗日乘子为λ=[λ1,···,λN]T,y=[y1,···,yN]T,I为单位矩阵,Q为核函数矩阵,Qij=φ(xi)Tφ(xj)=K(xi,yj)。最终得到LSSVM的预测模型为式(6)。

式中:λi、b可由式(5)求出,K(x,xi)表示从样本空间,通过非线性映射到高维特征空间的核函数。本文选择RBF作为核函数建立海底沉积物基本物性参数预测的LSSVM模型,其表达式为式(7)。在选定核函数后,LSSVM模型还需要确定正则化参数γ和核参数σ2。

1. 2 WOA算法原理介绍

WOA算法是一种新的启发式群体智能优化算法,该算法模拟座头鲸捕食行为,引入泡泡网捕食策略,能够对特定问题进行优化。座头鲸捕食行为如图1所示,在发现猎物后,座头鲸会向下深潜后向上旋转,在猎物周围形成到达水面的螺旋气泡进行攻击[19]。WOA算法将该捕食过程分为以下3个阶段。

图1 座头鲸捕食行为[15]

(1)包围捕食

座头鲸能够识别猎物的位置并包围它们。由于鲸鱼的最优位置不是先验已知的,因此,WOA算法假定当前的最佳位置为目标猎物。距离目标猎物最近的搜索个体是当前最佳搜索个体,确定好最佳搜索个体后,其他搜索个体会朝着最优位置移动,逐步包围猎物。这种包围行为可以用式(8)表示。

式中:t为当前迭代次数,X*(t)为猎物的当前位置向量,X(t)为鲸鱼的当前位置向量,D为鲸鱼与猎物间的位置衡量参数,A和C为系数向量,可通过式(9)得到。

式中:r为[0,1]之间的随机向量;a在迭代过程中从2到0线性递减。

(2)狩猎行为

座头鲸在捕食过程中,会以螺旋运动方式靠近猎物,同时逐渐收缩包围圈。为了模拟这两种同时发生的行为,WOA算法假设收缩包围圈和螺旋运动更新位置的概率各为50%,此时,捕食行为可以描述为式(10)。

式中:D′ =|X*(t)-X(t)|为鲸鱼和猎物之间的距离;b为定义对数螺旋形状的常数;l为[-1,1]区间上的随机数,p为[0,1]区间上的随机数。

(3)搜索猎物

除了上述泡泡网捕食方法外,座头鲸还会通过随机的方式去搜寻猎物。在搜索阶段,一个搜索个体的位置采用随机的方式确定,其他搜索个体根据随机选择的鲸鱼位置不断更新自己的位置,通过鲸鱼群体间的信息交流进行全局的搜索,从而找到更合适的猎物,实现全局最优的求解。搜索过程可以描述为式(11)。

式中:Xrand是随机选择的鲸鱼的位置向量。该算法通过控制|X|来进行搜索捕食,当|X| ≥1时,会迫使搜索个体远离猎物,借此去寻找更合适的猎物,从而保证WOA算法能够进行全局搜索。

1. 3 WOA-LSSVM建模过程

在采用LSSVM进行建模过程中,正则化参数γ和核参数σ2的取值会对模型预测的精度产生重要影响,如果参数设置的不合理,将导致模型的预测能力变差。鲸鱼优化算法具有很好的全局优化能力,因此,为了提高预测性能,通过WOA对LSSVM中的正则化参数γ和核参数σ2进行全局寻优。WOA-LSSVM具体建模过程如下。

(1)对样本集进行归一化预处理,形成训练集和测试集。

(2)参数设定。WOA有5个需要设定的参数,包括鲸鱼种群规模大小、变量数、最大迭代次数、变量上限和变量下限。

(3)初始化种群。WOA中鲸鱼的位置可以表示为矩阵(12)。

式中:W表示鲸鱼种群的位置,wij表示第i个鲸鱼位置在j维度上的位置大小。wij的值可以通过式(13)来更新。

式中:Wij为矩阵第i行、第j列的值;ub(i)和lb(i)表示第i个鲸鱼的上限和下限;rand(i,j)为[0,1]区间上的随机数。初始种群的位置可以通过式(13)计算得到,迭代值在初始阶段置1。

(4)适应度函数的确定。本文将均方误差(Mean Square Error,MSE)作为适应度值,MSE的计算公式为式(14)。

(5)利用WOA算法进行迭代寻优,得到优化后的正则化参数γ和核参数σ2。

(6)将得到的优化后的参数输入到LSSVM预测模型中进行预测。

(7)比较预测值和真实值,评价预测模型。

2 模型验证

2.1 数据准备

本文的数据来源于2015年南海北坡“实验3号”科考船采集到的海底沉积物样本的实验室测量数据。采样区选在南海北部陆架陆坡区,水深在50~1500 m之间,沉积物总体上呈带状规律分布。本次采集实验共设置15个采集站位进行重力柱状取样和箱式取样,取样信息如表1所示。

表1 海底沉积物取样信息

其中,箱式取样1至10站点主要位于陆架区,重力柱状取样A至E站点位于陆坡区。重力柱状取样采用直径110 mm的PVC衬管和薄壁取土器取样,所取样品最长可达3.1 m。对于采集到的每个箱式样在其水平中心位置用内径为110 mm的PVC 管垂直下插获取柱状样。对利用两种取样器取得的所有柱状沉积物样品,需要将柱状样品两端受到扰动土样截去,做好标记后封存运回实验室做下一步测试。实验室土力学物性参数测试试验均按照国家土工试验方法标准GB/T50123—1999的要求进行。电阻率测试利用E60DN型电法仪采用温纳四极法实现,将柱状样品以1 m为单位截断,沿轴向剖开,其中一半样品进行电阻率测试,如图2所示。

图2 电阻率测试示意图

测量时,沿剖开样品断面的中轴线进行走线测试,A、B、M、N 4个电极的间距均为10 cm,测线方向沿柱状样自上而下,每组实验测试3次值并记录,取3次实验值平均值作为最终电阻率值。电阻率计算参照式(15)。

式中:ρ为土层电阻率;ΔU为M、N极测得的电位差;K为装置系数,可由式(16)求得。

式中:AM=BN=10 cm,AN=BM=20 cm。

本文将所测得的实验数据作为样本集,建立电阻率和各物性参数的独立数据集。最终,本文获得61组电阻率—含水率数据、36组电阻率—密度数据、32组电阻率—孔隙比数据和34组电阻率—塑性指数数据,如图3所示。数据随机排布后,将其中约70%的数据作为训练集,剩余约30%的数据作为测试集。

图3 数据集

在进行建模训练前,需要对数据进行归一化预处理。归一化的目的主要是将输入和输出数据归一化到[0,1]或者[-1,1]区间上,以免因两者量级相差过大而相互影响出现预测错误。可以采用公式(17)将数据归一化到[-1,1]区间。

2. 2 结果与分析

在数据归一化处理后,将数据导入WOALSSVM模型进行训练和预测。本文中WOA算法的参数设置如表2所示。

表2 WOA参数设置

为了进一步验证WOA-LSSVM相较于其他优化算法模型的预测效果。本文选取GA算法、PSO算法两种比较经典的智能优化算法来优化LSSVM参数,将WOA-LSSVM与GA优化的LSSVM(Genetic Algorithm-Least Squares Support Vector Machine,GA-LSSVM)、PSO优 化 的LSSVM(Particle Swarm Optimization-Least Squares Support Vector Machine,PSO-LSSVM)进行比较,各模型均使用相同的样本集进行训练和预测。最终,各算法经过寻优之后确定的正则化参数γ和核参数σ2如表3所示,标准LSSVM模型参数由交叉验证和网格搜索法得到。

表3 各模型确定的LSSVM参数值

将各优化算法确定的两个参数值分别代入LSSVM预测模型中,得到各预测模型的测试集样本的预测输出结果如图4所示。从预测结果来看,在当前测试环境和样本数据下,采用LSSVM模型的预测效果均优于传统最小二乘法,3种优化算法均取得了不错的优化效果。其中,WOA-LSSVM预测模型相较于其他优化模型,预测结果更加接近目标真实值。

图4 各算法模型的预测输出结果

图5给出了测试集样本每个样本点预测输出与真实值的相对误差。从图中可以看出LS预测的误差波动范围较大,未经优化的LSSVM模型误差的波动性也相对较大,经过优化后的LSSVM预测模型有所改善,其中WOA-LSSVM模型总体上误差波动范围较小,稳定性更好。

图5 各算法模型的预测相对误差

为了定量地比较各模型的预测能力,本文引入均方根误差(Root Mean Square Error,RMSE)和平均绝对百分比误差(Mean Absolute Percentage Error,MAPE)作为评价模型的性能指标。各物性参数预测模型的RMSE、MAPE如表4所示。从表4可以看出,采用LSSVM模型的预测能力相较于LS方法均有不同程度的改善,利用3种优化算法的进行参数选优后,LSSVM模型的预测精度有较为明显的提升,WOA-LSSVM相较于其他的选定模型,预测精度更高,预测误差更小。

表4 各预测模型的RMSE和MAPE对比

海底沉积物含水率和电阻率有着较好的相关关系,电阻率随含水率的增加呈指数型降低,LS方法的回归分析结果较好。与LS方法相比,各LSSVM方法的性能提升有限,RMSE降低了13.9%~17.0%,MAPE降低了15.4%~20.2%。各参数优化LSSVM方法的预测结果差距较小,WOA-LSSVM均优于其他参数优化LSSVM方法,RMSE降低了1.1%~1.8%,MAPE降低了0.4%~1.0%。

海底沉积物密度与电阻率的数据关系较离散,相关关系较差,LS方法受限于函数类型不能很好地描述其相关关系。与LS方法相比,各LSSVM方法的性能提升较明显,RMSE降低了10.1%~36.2%,除LSSVM方法外,MAPE降低了9.0%~24.2%。WOA-LSSVM方法明显优于其他参数优化LSSVM方法,RMSE降低了6.8%~11.1%,MAPE降低了9.5%~16.7%。

海底沉积物孔隙比与电阻率的数据关系较离散,相关关系较差。与LS方法相比,各LSSVM方法的性能提升较明显,RMSE降低了14.1%~28.5%,MAPE降低了4.6%~25.1%。WOA-LSSVM方法明显优于其他参数优化LSSVM方法,RMSE降低了14.7%~14.9%,MAPE降低了19.3%~19.9%。

海底沉积物塑性指数与电阻率的相关关系较好,大致呈指数函数关系。与LS方法相比,各LSSVM方法的性能提升有限,RMSE降低了10.2%~18.1%,MAPE降低了8.2%~26.3%。WOA-LSSVM均优于其他参数优化LSSVM方法,RMSE降低了1.8%~4.6%,MAPE降低了13.6%~14.9%。

综上可知,对于数据关系分布较为离散、规律性不强的小样本数据,WOA通过包围捕食、狩猎行为、搜索猎物3个阶段的寻优,避免了局部最优和早熟收敛现象,建立的WOA-LSSVM模型预测效果提升明显,泛化能力好,具有较高的预测精度。

3 结 论

WOA算法作为一种新型的启发式智能优化算法,具有良好的优化能力。基于WOA算法对LSSVM模型的正则化参数和核参数进行优化,较好地解决了以往LSSVM建模过程中的参数选择问题。本文利用南海北部陆架陆坡区采集到的海底沉积物样本的实验室测量数据,建立了基于WOA-LSSVM的单输入、单输出预测模型,利用电阻率数据预测海底沉积物的含水率、密度、孔隙比和塑性指数4种基本物性参数。结果表明,WOA-LSSVM预测模型有效地改善了预测效果,4种海底沉积物物性参数预测精度要优于其他优化算法模型,预测结果误差更小,验证了本文所采用方法的有效性,为海底沉积物物性参数预测提供了一种新的思路。

本文对海底沉积物电阻率和物性参数建立的模型采用单输入—单输出方式,是仅考虑单因素影响的建模。下一步工作将继续丰富数据集,加入相关的多个影响因素,进一步挖掘WOALSSVM的预测能力,并考虑将该方法应用于海底沉积物的力学参数预测。

猜你喜欢
物性沉积物电阻率
物性参数对氢冶金流程能耗及碳排放的影响
晚更新世以来南黄海陆架沉积物源分析
雨水管道沉积物累积对过流能力影响的模拟试验
基于反函数原理的可控源大地电磁法全场域视电阻率定义
R1234ze PVTx热物性模拟计算
渤海油田某FPSO污水舱沉积物的分散处理
LKP状态方程在天然气热物性参数计算的应用
阻尼条电阻率对同步电动机稳定性的影响
基于防腐层电阻率的埋地管道防腐层退化规律
土壤电阻率影响因素研究