基于人工神经网络的海底细粒土工程分类研究

2021-02-01 04:12星孙永福宋玉鹏张牧子
海洋科学进展 2021年1期
关键词:黏粒沉积物准确率

杜 星孙永福宋玉鹏张牧子

(1.自然资源部 第一海洋研究所,山东 青岛266061;2.青岛海洋科学与技术试点国家实验室 海洋地质过程与环境功能实验室,山东 青岛266235;3.国家深海基地管理中心,山东 青岛266237)

海洋沉积物工程分类定名是海洋工程地质研究的基础,无论对海洋工程设施的建设还是科研领域的研究都有着重要作用。海洋工程地质领域需要通过对沉积物定名来初步判断其物理力学性质,继而结合地球物理调查和钻探等手段对岩土体进行全面评价,为工程设施的选址、设计和施工提供基础支撑和保障。虽然碎石土和砂土可以方便地通过颗粒形状和颗粒级配进行定名,但是粉土和黏性土的工程定名需要利用塑性指数[1],其测定手段相对颗粒分析较为复杂且容易产生人为误差。海洋沉积物的常用沉积定名方法主要有Shepard分类法[2]和Folk分类法[3],分别通过沉积物各颗粒组分间的含量和比例关系进行定名。沉积分类方法对沉积物类型划分较为细致,能够一定程度上反映沉积过程中沉积动力学的变化,是沉积环境的指示标志,区域分布也可以反映沉积物的来源方向[4-6]。现有沉积物工程分类数据主要集中于近岸工程区域,远岸海域资料较少,这不利于全海域海洋工程建设的发展。若能提出一种依靠现有粒度数据即可快速为沉积物进行海洋工程定名的方法,将大幅度地提高远海海洋工程建设的效率。因此,寻求简便的海洋沉积物工程分类方法,既可以提高工程定名的效率,也能够减少实验操作的人为误差。新定名方法的重点便是简化塑性指数对细粒土定名的影响,寻找其他相关因素对塑性指数的替代作用。

塑性指数的大小受到与黏粒质量分数、蒙脱石矿物和土体结合水质量分数等因素共同作用的影响[7],当同一地区其他因素影响较小时黏粒质量分数占主要作用。学者们通过试验探讨了黏粒质量分数对土体抗液化性能的影响[8-11]。张梅静和陈亮[12]、何停印和闫芙蓉[13]、闫芙蓉等[14]对塑性指数和黏粒质量分数进行了回归分析,研究认为两者间存在密切相关性。杜星等[15]通过对大量粉土、黏性土样品进行分析,提出了海洋沉积物工程分类黏粒界限法,能较为准确地只通过黏粒质量分数对粉土、黏性土进行工程定名。综上所述,黏粒质量分数与塑性指数具有密切相关性,能起到较好的替代作用,但是通过整理数据人为划定黏粒质量分数来定名的方法主观因素影响较大。为了更科学、客观地建立黏粒质量分数和沉积物工程定名的关系,本文将通过人工神经网络的方法,使用大量基于沉积物工程定名的颗粒级配数据进行训练得出海洋细粒土工程分类定名神经网络。

1 海洋沉积物工程分类方法

1.1 海洋沉积物工程分类规范方法

《岩土工程勘察规范》[1]中碎石土部分根据颗粒形状和颗粒级配进行定名;砂土部分根据颗粒级配进行定名;粉土和黏性土根据颗粒级配和塑性指数进行定名。其中根据颗粒形状和颗粒级配进行碎石土和砂土定名的方法在此不做叙述。塑性指数(IP)由相应于76 g圆锥体沉入土样中深度为10 mm时测定的液限计算而得。

粉土和黏性土定名标准见表1。粒径>0.075 mm的颗粒质量不超过总质量的50%且IP≤10的土,应定名为粉土。IP>10的土应定名为黏性土:10<I P≤17的土定名为粉质黏土;IP>17的土应定名为黏土。

工程分类将颗粒级配分成了砂粒、粉粒和黏粒三大类,不同类别对应着不同的沉积物工程性质,同时在细粒含黏粒沉积物的定名中引入了塑性指数,有助于确立具体的工程性质。

1.2 海洋沉积物工程分类黏粒界限法

黏粒界限法[15]海洋沉积物工程分类标准见表2,该方法提出当粒径大于0.075 mm的颗粒质量不超过总质量的50%时,若黏粒质量分数小于20%,沉积物可定名为粉土;黏粒质量分数大于20%且小于35%时,定名为粉质黏土;当黏粒质量分数大于35%时应定名为黏土。该方法为简化塑性指数对定名的影响而发明,依靠大量数据进行统计划分了沉积物之间黏粒含量界限。

表2 粉土和黏性土分类Table 2 Classification of silt and clay

2 含黏粒沉积物工程分类网络构建

2.1 数据来源

本文研究数据来源于自然资源部第一海洋研究所在黄河口埕岛海域钻探获取的柱状样品测试结果,共有284组数据:粉土198组、粉质黏土42组、黏土44组。黄河口埕岛海域沉积物类型以粉土为主,从近岸至远岸端沉积物粒径逐渐变细,超过15 m水深的海域逐渐过渡为粉质黏土和黏土。每组数据均包含沉积物各粒径的质量分数,使用海洋工程分类方法的沉积物定名名称。其中,沉积物包括砂粒(0.075 mm≤粒径<2.000 mm)、粉粒(0.075~0.005 mm)和黏粒(<0.005 mm)。

2.2 人工神经网络

人工神经网络(Artificial Neural Networks,ANN)是有监督机器学习算法的一种类型,通过模仿自然界生物神经元之间电信号的传递并由大量节点相互连接组成[16]。典型的人工神经网络通常包含输入层、隐藏层和输出层。输入层与输入变量有相同数量的节点数;隐藏层包含了神经元之间连接的权重值以及相应的阈值函数,用来传递和处理信号,可为一层或多层;输出层为要得到的数据。

图1 神经网络训练流程Fig.1 Flow chart of Neural Network Training

本文使用了MATLAB的神经网络模块进行计算,该模块能够通过成熟的神经网络算法对数据进行训练和验证,其可靠性在地质学领域的多个方面都得到了证实[16],模型计算流程见图1。首先对数据进行归一化处理,即将不同区间的数据归一至[0,1]区间上,方便后续运算。神经网络研究数据可分割成训练数据、验证数据以及完全独立的检验数据。训练集和验证集共同参与网络训练过程,训练集数据用于训练模型的权重,验证集数据主要用于确定网络中的超参数。选定算法后首先向后训练得到结果,并与实际结果比较。利用二者的误差将向前进行反馈并更新权重值,使网络更能接近实际的表达值,直至所有训练数据训练完毕。对于一组训练数据通常会进行多次训练,每训练一次称为一个世代(Epoch),一般训练达到设定的参数条件后停止。

使用传统定名方法对沉积物定名时,依靠各种粒径的质量分数确定沉积物名称,相似粒径质量分数的沉积物具有一致的沉积学和工程方面的性质。神经网络的工作原理也是通过对若干输入参数进行矩阵运算最终得出输出参数,这与传统定名方法的输入输出方式较为相似。二者区别为:传统定名方法是粒径参数与定名结果的线性关系,而神经网络方法是先通过已有定名数据训练得出网络节点间一系列权重值,再通过训练好的网络对新沉积物进行定名。使用沉积学定名或者工程定名中较粗颗粒的沉积物时,只需要使用粒径组分,因此本文并未关注粗颗粒沉积物的定名。而进行海洋细粒沉积物工程定名时,除了颗粒级配还需要塑性指数,由于黏粒含量与塑性指数间存在非线性相关关系,因此具备非线性问题的良好解决性的神经网络具备细粒沉积物工程定名的能力。

图2 神经网络结构示意Fig.2 Neural network structure

神经网络构建的重点为确定不同神经层的节点数目以及传递函数的类型,由于当前还没有理论能够明确地指出不同研究问题的节点数目和传递函数类型,因此需要根据训练数据在合理的范围内进行多组尝试。本研究中,输入参数为5个,因此输入层节点数为5;输出参数包括粉土、粉质黏土和黏土共3种,因此输出层节点数为3。隐藏层经验公式为其中m为隐藏层节点数目,n为输入层节点数目,l为输出层节点数目,a为1~10间的常数。因此在本问题中可知隐藏层节点数m的取值范围为4~13,试验时将范围扩展至4~20。本文使用神经网络整体结构(图2)。

本文按照训练数据70%、验证数据15%和检验数据15%来进行数据划分,网络结构为5-x-3类型;训练函数将分别对Levenberg-Marquardt,Bayesian regularization,Scaled conjugate gradient进行试验,根据最终检验对准确率选择最佳函数。输入的训练数据为沉积物在0.5 mm≤粒径<2 mm,0.25 mm≤粒径<0.5 mm,0.075 mm≤粒径<0.25 mm,0.005 mm≤粒径<0.075 mm以及粒径<0.005 mm时的质量分数。神经网络参数设置见表3,第1组试验用来确定最优的网络隐藏层节点数目,训练函数采用了Scaled conjugate gradient;第2~4组试验暂定网络结构为5-10-3,通过改变训练函数类型来确定最优的传递函数。每组试验中,首先将数据随机划分为3类,对于每隐藏层节点数目进行5次运算,选择运算中最高准确率表示该节点条件下的网络模型准确率;一次训练及验证结束后再次对数据进行随机划分,共进行10次数据的随机划分,统计准确率结果后可以得到最优节点数。获得隐藏层最佳节点数和最佳训练函数后,可获得满足海洋沉积物工程定名精度的神经网络模型。分别使用最终获得的神经网络模型以及基于黏粒质量分数的分类方法对测试数据进行计算,对比2种分类方法的准确性。

表3 神经网络试验参数设置Table 3 Parameters for neural network experiments

3 结果与讨论

通过对隐藏层节点数4~20的不同网络训练并验证后,得到了准确率统计结果(图3),使用箱型图表示了不同节点对应准确率的最大值、最小值、中位数以及平均数。由图3可知,当隐藏层节点数目为9时,网络预测准确率的最大值、最小值、平均数和中位数均超过其他节点数目对应的网络。因此,在海洋含黏粒沉积物工程分类问题上,隐藏层节点数目为9时具有最佳准确率。

关于隐藏层节点数准确率的验证,本文将全部数据进行10次随机的70%-15%-15%数据分割,并对每次分割后的数据进行5次训练和验证取准确率最大的值。该验证方法能够充分挖掘数据信息,避免了只分割一次数据造成的数据学习不充分现象。

图3 不同隐藏层节点网络准确率统计Fig.3 Statistics of accuracies for neural networks with different hidden layer nodes

当网络节点数一定时,分别使用3个不同训练函数进行了20次训练并使用测试集进行了验证,准确率结果见表3。当使用Levenberg-Marquardt与Scaled conjugate gradient函数时,网络训练速度快;使用Bayesian regularization函数时网络训练速度很慢,所用时间通常为另2种函数的数十倍。同时,统计结果显示最高准确率、最低准确率、平均和中位准确率,Scaled conjugate gradient函数得到的都是最大值。因此,选定Scaled conjugate gradient函数作为本研究中神经网络的训练函数。

表3 不同训练函数准确率统计(%)Table 3 Statistics of accuracies of different training functions(%)

综上,当隐藏层节点数为9、训练函数为Scaled conjugate gradient时,海洋含黏粒沉积物工程分类神经网络具有最佳准确率。使用最优网络对数据进行训练和预测所得结果见图4。随着训练世代的增加交叉熵逐渐减小,在22世代时验证集具有最小交叉熵,此时网络准确率最高。由网络对测试集43组数据预测结果可知:33个粉土数据均预测准确;3个粉质黏土数据也全部预测准确;7个黏土数据中有1个预测错误、6个预测准确。因此,使用本文试验得到的神经网络对测试集预测的总准确率为97.7%。神经网络精度随着世代增加通常表现为先提高后降低的趋势,存在中间位置的最优世代。

图4 训练过程Fig.4 Training processes

图5 沉积物工程分类预测结果Fig.5 Prediction results for sediment engineering classification

分别使用神经网络方法和海洋沉积物工程分类黏粒界限法对测试集进行预测,并与实际分类情况比较,结果见图5和表4。采用本文提出的神经网络预测时,43组数据中预测正确42个,准确率为97.7%;采用海洋沉积物工程分类黏粒界限法进行预测时,43组数据预测正确40个,准确率为93%。结果表明,与原有海洋沉积物工程分类黏粒界限法相比,采取神经网络预测的方法具有更高的准确率。原有方法通过大量数据总结归纳了黏粒质量分数与定名之间的关系,虽然能够达到超过90%的准确率,但只使用2个简单的黏粒质量分数分界点划分3种沉积物类型仍然存在局限。本文提供的方法能够建立粒径质量分数和沉积物定名之间的非线性耦合关系,比黏粒质量分数界限法更加接近原有分类方法的本质,更为科学地对含黏粒细粒沉积物进行分类。

表4 基于神经网络进行海洋沉积物工程分类的预测结果与实际结果比较Table 4 Comparison of prediction results and actual results of marine sediment engineering classification based on Neural Network

神经网络训练在训练过程中不断利用每一组数据来调整节点间的权重,使得即使数据、算法和参数相同,每次训练得到的网络也略有不同,因此并不存在对于一个问题的最好网络算法,只有相对满足需求和精确度的网络算法。训练不足可能导致预测与实际值偏差过大;训练过量将导致“过拟合”现象,引起训练数据预测准确率过高、测试数据准确率较低的现象。本文通过大量试验得到了对于测试数据集预测准确率较高的网络,能够简化工程定名的操作步骤,在不需塑性指数的情况下保证较高的沉积物工程定名准确率。

沉积物工程分类区域主要集中于近岸工程区域,与沉积定名相比不够广泛。使用本文提出的方法,可将沉积规范定名的沉积物粒径质量分数数据转化成工程分类的粒径质量分数,砾石和砂土可直接使用规范进行定名,粉土和黏性土使用本文提供的方法进行定名。通过沉积物分类方式之间的转化,可以扩展沉积物工程分类的范围,将沉积物工程性质从近岸扩展至海洋。

文中使用了284组数据进行训练、验证和测试,取得了97.7%的准确率,这足以表明神经网络方法对沉积物分类这一问题有着良好的适用性,能够较为准确地满足全新世河口沉积物的工程定名需求。该网络能够较为准确地对黄河口埕岛海域海底沉积物进行工程定名,获得其他海域的转化关系网络仍需使用补充数据进行训练和验证。由于黄河口埕岛海域底质类型以粉土为主,因此试验数据中粉质黏土和黏土数据与粉土相比较少,这很可能是造成测试数据中存在误差的重要原因。当今处于人工智能和大数据的时代,各个领域的训练数据往往以TB为单位计算,而海洋工程领域受获得数据成本高、难度大等因素的影响,数据量相对较少。随着后续黄河口地区沉积物训练数据量的增加,应用于工程定名的网络会更加准确;随着其他海域沉积物颗粒级配数据的训练,该网络将逐渐能够应用于更加广泛的区域。

4 结 论

本文使用了人工神经网络的技术手段,通过对黄河口埕岛海域284组海底粉土、黏性土沉积物颗粒级配数据进行训练和学习,建立了只需使用沉积物粒径质量分数就可以进行沉积物工程分类的神经网络,主要得到以下结论:

1)使用人工神经网络技术能够对海洋细粒含黏粒沉积物进行准确的分类,当网络中含有5个输入节点、9个隐藏层节点、3个输出节点、训练函数为Scaled conjugate gradient时定名准确率最高,经检验可达97.7%。

2)依靠沉积物粒径质量分数可以较为准确地对黄河口埕岛海域海底沉积物进行工程定名,定名结果与使用塑性指数的规范定名方法高度一致。

3)海洋工程地质领域数据获得困难、训练数据量少是造成结果存在误差的主要因素,同时也是限制神经网络技术在本领域广泛应用的重要原因,随着未来海洋工程地质领域数据量的增加以及测量精度的提高,神经网络技术将得到进一步应用。

猜你喜欢
黏粒沉积物准确率
晚更新世以来南黄海陆架沉积物源分析
渤海油田某FPSO污水舱沉积物的分散处理
降雨条件下不同黏粒含量土体的非饱和入渗特性
粉砂土抗剪强度黏粒含量效应
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
2015—2017 年宁夏各天气预报参考产品质量检验分析
水体表层沉积物对磷的吸收及释放研究进展
颈椎病患者使用X线平片和CT影像诊断的临床准确率比照观察
月球高纬度地区发现赤铁矿沉积物