利用随机森林算法建立沥青路面车辙预测模型

2022-05-23 01:30许有成杜亚冰
河南城建学院学报 2022年2期
关键词:塑性变形车辙线性

许有成,杜亚冰

(1.安徽理工大学 土木建筑学院,安徽 淮南 232001;2.河南城建学院 数理学院,河南 平顶山 467036)

车辙指道路路面在受到行车荷载、路面材料、气候环境条件等因素长期影响下,引起面层、基层以及底基层的塑性变形(见图 1)[1-2]。车辙是沥青路面的主要病害形式,也是MEPDG(《力学-经验路面设计指南》)中衡量沥青路面关键性能的一项标准。MEPDG是由美国NCRHP(国家合作高速公路研究计划项目)于1996年资助并在2004年正式出版发行的一项路面设计指南,代表着美国最先进的道路路面设计方法,对于路面病害防治有着重要的意义[3-5]。MEPDG中建立的车辙预测模型能够为研究人员以及从业者提供参考,并在其模型基础上进行改进来提高预测准确性。近年来,研究人员投入了大量的时间与金钱用于改进工作[6]。但是,根据Pierce Linda M和McGovern Ginger的观点,仅有三个机构将原始的MEPDG方法作为设计工具,原因是MEPDG使用的线性回归模型用于预测路面破坏与寿命在准确性方面还有待提高[7]。所以,在MEPDG设计方法的基础上搭建更全面、效果更突出的预测模型就显得十分重要。

近年来,机器学习领域备受各个行业关注,通过不断学习输入变量的数据特征探寻当中的规律从而选择合适的权重参数,成为解决众多回归以及分类问题的一种优异方法,逐步应用于道路工程。其中,最具有代表性的就是集成学习里面的RFR(随机森林回归)算法。RFR指的是利用多棵决策树对样本进行训练并预测的一种分类器,如图2所示,该分类器能够用于建立高预测性能的模型[8]并具有可以同时处理十分庞大的数据量、准确预估未知值、鲁棒性较好的优点。例如Gong Hongren成功地用RFR算法准确地预测了道路IRI(国际平整度指数)[9]。Luo Xiaohua通过RFR算法对路面密封层数据进行处理并得出密封层厚度对车辙和IRI性能至关重要的结论[10]。

本文通过使用Python编程语言下的Scikit-learn扩展包建立一个RFR模型以提高车辙预测的准确性,并分析输入变量之间的影响因素。构建模型的数据来源于从美国28个州收集的包含88个站点在内的共计440个样本[11-12]。将RFR模型结果与传统线性回归模型进行比较,并对模型的性能进行评价。

(a)结构性车辙

(b)失稳性车辙

图2 决策树结构图

1 MEPDG中车辙模型

1.1 车辙计算

由于沥青层直接与车辆轮胎接触,因此也是发生车辙破坏的主要层面。MEPDG中关于沥青层车辙的计算公式为:

Δp(AC)=εp(AC)hAC=β1rkzεr(AC)10k1rnk2rβ2rTk3rβ3r

(1)

其中:Δp(AC)——AC(沥青)层累积永久变形(英寸,1英寸=2.54 cm);εp(AC)——AC层累积塑性轴向应变;h(AC)——AC层厚度(英寸);β1r,β2r,β3r——地方标定系数;kz——深度围压系数;k1r,k2r,k3r——全体标定系数;εr(AC)——沥青层中部回弹应变。

其他未结合层塑性变形的计算公式为:

(2)

其中:Δp(unbound)——未结合层永久变形(英寸);ks1——修正系数;εv——平均竖向回弹应变;hunbound——未结合层厚度(英寸);ε0——材料参数;εr——室内实验时回弹应变;n——交通荷载数。

1.2 线性回归

根据式(1)和式(2),将道路各个层位的塑性变形计算后进行加权求和得出车辙值,因此需要选择合适的权重参数确保达到最佳组合。根据式(1)选择适当的k2r和k3r值后,再利用式(3)的参数最小化函数确定式(2)中的ks1值。ΔTotal的最终结果通过式(4)计算线性组合后得到。

arg min∑k1rk2rk3rks1(ΔTotal-ΔActual)2

(3)

(4)

其中:ΔTotal——计算得出的车辙深度(英寸);ΔActual——实际测得的车辙深度(英寸);kij——标定系数矩阵;Δlayers——每层的塑性变形矩阵。

1.3 模型评价指标

在完成上述线性回归模型的构建后,需要对评估模型的质量进行评价。常用的评价指标是计算相关系数R2和标准差Se。R2表示未来样本中有多少可以被该模型解释,其值介于0~1。R2越高,能够被解释的样本越多,模型的效果越好。Se是总体各单位标准值与其平均数离差平方的算术平均数的平方根,反映组内个体间的离散程度,Se越小,数据点越向中心线集中,模型拟合得越好。R2和Se的计算公式为:

(5)

(6)

(7)

2 RFR模型搭建

2.1 RFR原理

决策树是机器学习领域中常用的一种监督学习方法,监督学习就是在结果已知的情况下对给定样本进行训练[13]。如图 2所示,决策树主要有决策根节点、决策节点和叶子节点构成,样本数据由根节点开始往下将数据进行分类,每一层都有自己的分类规则,直到数据达到不可再分为止,整体看上去像个倒立的树,由此得名[14]。数据在学习的时候需要根据结果对权重值进行优化,提升模型的性能。单棵树计算产生的结果可能具有偶然性,随机森林通过构造一组随机创建的决策树并预测每棵树所属类模式(分类)或均值(回归)来进行工作[15-16]。简单来说,随机森林就是将众多决策树并行地集成到一起,再根据每一棵树的计算结果将它们按一定权重值组合到一起。

2.2 数据准备

大量且可靠的数据集对于成功构建监督学习方法模型至关重要,在本次RFR训练中,使用了从LTPP(长期路面性能)数据库中收集的来自美国28个州包含在内的88个站点共计440个样本数据集,目前可以在NCHRP 项目01-37A发布的两个报告当中的附录EE-1和附录GG-1中查看这些数据,交通相关数据来源于LTPP InfoPave网站。数据有10列输入变量特征值和1列实际测得的车辙作为目标值,表1列出了这些变量的具体内容。

表1 输入变量以及来源

2.3 模型建立

2.3.1 数据集划分

训练模型开始前需要对样本进行数据集划分,根据实际需求一般分成三个相互独立的部分:训练集、验证集和测试集。训练集用于估计模型,验证集用于确定模型结构,而测试集用于检验模型性能[17]。对于本次RFR模型搭建,随机选择了352个样本(数据的80%)用于训练,其余的88个样本(数据的20%)用于测试。考虑到样本数据量有限,单独设置验证集非常浪费,为了充分利用现有数据,在机器学习中引入了交叉验证方法[14]。经过多次尝试,最终使用了四重交叉验证。在验证特定结果时,整个过程需要分为四次迭代计算。在第一次中,将前三个用作训练集,最后一个用作验证集以得到结果,每次使用不同于之前的数据作为验证集,其余作为训练集。以这种方式经过四次迭代计算后,获得四个结果,然后将最后的四个结果取平均值,从而获得最终的模型评估结果。

2.3.2 模型调参

在配置模型时需要确定适当的超参数,例如树的个数、最大深度、节点最小分裂所需样本个数以及叶子节点最小样本数等。超参数的选择主要影响RFR的预测精度以及计算速度。为了选择最佳模型配置,在一定限制范围内利用随机搜索方法来确定最佳模型,最终结果见表2。

表2 超参数选择

图3 误差衰减过程

图4 变量重要性分析

3 结果与分析

如图3所示,经过800次循环迭代计算后,模型的误差达到最小。图4展示了不同变量对车辙产生的影响程度,AC层的塑性变形和AADTT是主要因素,因为表面层直接承受车辆施加荷载,在轮胎的反复滚动摩擦作用下容易累积产生塑性变形。为了更好地评价模型,使用相同数据按照MEPDG方法构建了一个线性回归模型,并将所得结果与RFR模型进行比较,图5绘制出了两种模型的最终效果,具体参数见表 3。

表3 模型结果比较

图5 模型训练效果

对于线性回归模型,R2与Se在训练集中分别为0.27和3.256 mm,在测试集中分别为0.392和3.23 mm。对于随机森林回归模型,R2与Se在训练集中分别为0.84和1.93 mm,在测试集中分别为0.875和1.41 mm。与线性回归模型相比,在训练集中,R2提升了211%,Se下降了40.7%;在测试集中,R2提升了123%,Se下降了56.3%。因此RFR模型的预测能力比线性回归模型表现更为出色。由于传统的线性模型处理数据过于单一,很难对整体样本进行全面解释,RFR模型通过不断监督学习样本数据特征进行反复迭代运算,能够充分利用数据,因此得到的模型也能更好地解释数据,从而表现出较高的预测能力。

4 结论

通过构建RFR模型并预测沥青路面性能车辙的深度。利用来自NCHRP项目01-37A的两个最终报告以及LTPP网站数据,通过考虑相关的影响因素来控制RFR的输入变量,调整了RFR的超参数以优化模型,最大程度地提升了最终结果的准确性和可靠性。通过结果分析,得出以下结论:

(1)与线性回归模型相比,使用RFR模型预测车辙深度时,在训练集中,R2提升了211%,Se下降了40.7%;在测试集中,R2提升了123%,Se下降了56.3%;预测结果准确性有了大幅提升。

(2)通过变量的重要性分析可以看出,不同的变量对模型的影响程度不同。最主要的影响因素是AC层的塑性变形和AADTT,因为表面层直接承受车辆施加荷载,并且在轮胎的反复挤压摩擦作用下,容易使塑性变形发生累积。

(3)该模型是通过在机器学习领域随机森林算法对数据进行监督学习而建立的,可以很好地计算并预估沥青路面的车辙深度,不仅为获悉路面破坏状况提供了参考,而且能够指导道路的周期检测和维护。

猜你喜欢
塑性变形车辙线性
温拌型抗车辙剂改性沥青流变性能
二阶整线性递归数列的性质及应用
线性回归方程的求解与应用
抗车辙剂对沥青混合料路用性能影响试验研究
沥青路面现场车辙的精准化评价方法
非齐次线性微分方程的常数变易法
ℝN上带Hardy项的拟线性椭圆方程两个解的存在性
磨削烧伤裂纹的产生及控制
现场热再生技术在高速公路车辙处治中的应用探讨
金属材料强化的途径