赵 飞,施发垦,陈 利
(中交西安筑路机械有限公司,陕西 西安 710020)
路面平整度是路面使用性能中非常重要的指标,不仅是路面病害的综合体现,还反映了道路的使用性能状况。通常,路面平整度状况以国际平整度指数(international roughness index,IRI)来进行评价。路面平整度会影响行驶质量、行车安全以及道路服务质量,因此关于平整度对路面使用性能影响的研究具有非常重要的意义[1]。对路面性能评价数据收集最全的是国外路面长期性能(Long-Term Pavement Performance,LTPP)数据库,它收录了包括美国、加拿大等国在内的覆盖各种影响因素的大约900条道路作为研究对象和广泛的路面相关信息数据,包括一般信息、气候数据、材料试验数据、交通数据和路面检测数据等[2]。
国内外平整度预测必须依靠室内或者室外试验的数据,并拟合影响平整度的因素与平整度之间的数学关系。一方面这种形式收集的数据具有局限性和离散性,另一方面也缺乏大量的实际工程对其进行验证。相比之下,LTPP数据库则提供了完整的数据类型,避免了数据类型单一、数据量少等问题。
影响路面平整度的因素诸多,路面病害、行驶交通量、路面结构、气候因素都能引起平整度的变化,大量的变量也会导致获取数据和预测平整度的过程变得相对复杂,所以在建模之前对每个影响因素进行分析是必要的。
力学-经验设计指南基于LTPP数据库的研究表明,IRI与路面其他病害有很大的关系,具体包括疲劳裂缝、车辙、横向裂缝、纵向裂缝、块裂、坑洞、交通荷载、道路使用寿命、环境参数(冰冻指数、降雨量等)[3-7]。同时,平整度对未来道路发展有很大的关系,不同程度的病害也影响平整度的变化。因此,将平整度影响因素分为5大类:路面病害、交通荷载、路面结构、环境道路和道路使用年龄[8-10]。
本研究从LTPP数据库提取气温、降水量、弯沉值、交通荷载、冰冻指数、龟裂、块裂、边缘裂缝、横纵裂缝、修补和坑槽12个影响因素,依据12个影响因素与平整度之间的关系建立预测模型。
BP(Back-Propagation)神经网络是一个前向多层网络,每一层的神经元只接受来自前一层神经元的输入,后面的层对前面的层没有信号反馈。BP网络的神经元分层排列,依次是输入层、隐含层和输出层。其中输入层负责把网络的输入数据传给第一隐含层,相当于一个缓冲器,随后输入模式在各级隐藏层之间顺序传播,最终在输出层上得到输出。图1是BP神经网络的结构模型。
Logistic回归分析技术是一种多变量分析方法,它主要研究分类结果与多个影响因素之间的关系,以特征因素的权重和非线性概率转化为主要技术基点。Logistic回归分析相较于多元线性回归而言,具有假设条件要求低、模型结果解释性更强等诸多优点。Logistic回归的数学模型表达式为:当有k个自变量时,模型公式扩展为
那么,相应的Logistic回归模型为
式中:pi=p(yi=1|x1i,x2i,…,xki)为在给定系列自变量x1i,x2i,…,xki的值时的时间发生概率。
采用复判定系数(R2)评价模型性能指标。若拟合的点基本上分布在对角线上,说明拟合程度较高,误差相对较小,R2是评价BP神经网络模型性能的指标之一,同时均方根误差RMSE和平均绝对值误差MAE也用来评价模型的性能。
式中:xoi为变量xi的实测值;x′oi为xi的平均值;xpi为xi的预测值;n为测量值的总个数。
该研究采用LTPP数据库的观测值作为模型的样本构建BP神经网络模型,初始变量输入和输出见表1。
由于坑槽值比较少且与平整度的相关性太低,所以模型输入中不包括坑槽。模型初始输入变量为降水量、弯沉值、交通荷载、气温、冰冻指数、龟裂、块裂、边缘裂缝、横向裂缝、纵向裂缝和修补,输出量为IRI。该研究采用归一化使输入输出变量数据归于[0,1],归一化处理使收敛的速度加快,计算时间短而且结果精准。
表1 初始变量输入和输出说明
(1)网络层数设计。在不限制隐含神经元个数的情况下,3层中只有一个隐藏层的BP网络可实现非线性映射关系。在样本相对较少的情况下,可以选用一个隐含网络,当模型样本很大时,可增加网络层数。在本文中,选用隐含层为一层。
(2)隐含层神经元个数设计。关于隐含层神经元个数的选择问题,目前没有固定的方法,网络隐含层的节点数根据经验和试验确定。隐含层神经元个数太多,会导致学习的时间过长;反之,则会降低模型的精度,使得模型识别未学习的样本能力低。因此,应该综合考虑以上因素来进行隐含层神经元个数的设计。
(3)激活函数。BP神经网络中的激活函数采用Sigmoid型函数,即
(4)网络的训练、验证与测试。样本分为3个部分:训练集、验证集、测试集。训练集是整个输入数据的70%;验证集是整个输入数据的20%;测试集是整个输入数据的10%。
(5)迭代次数选择100次,误差达到预先设定的0.001目标时网络收敛。
(6)神经模型终止时输出各变量的相对权重,调整输入参数,提高模型精准度,构建BP神经网络模型的流程如图2所示。
图2 构建神经网络模型流程
当输入变量为9个即降水量、弯沉值、交通荷载、气温、冰冻指数、龟裂、块裂、横向裂缝和纵向裂缝,图3给出模型预测变量对平整度影响的权值。修补和边缘裂缝都是0.01,接下来通过调整输入变量个数去除修补和边缘裂缝,提高模型的准确率。通过调整隐含神经元个数(3、4、5、6)进行对比分析,图4给出输入9个变量得出的性能指标值,图5给出当输入变量个数为9,隐含层神经元个数分别是3、4、5、6时的拟合效果。
图3 BP神经网络预测变量对平整度影响的权值
图4 输入9个变量得出的性能指标值
从以上预测结果可看出,虽然存在误差但都在定义的误差范围内,构建BP算法有较好的拟合效果。通过进一步验证证明,当输入变量个数为9,即降雨量、弯沉值、交通荷载、气温、冰冻系数、龟裂、块裂、纵向裂缝和横向裂缝,隐含神经元个数为4时,R2最大,所以隐含神经元个数为4时,神经网络的模拟结果最好,均方根误差为0.881,平均绝对误差为0.682,误差较小,表明该网络模型的结构设计是正确的。通过BP神经网络模型预测平整度具有较高的精度,对于所有样本(训练、测试和验证),R2值始终大于0.80,说明该模型能够有效地预测IRI值,表2是Logistic模型得出的分析结果。
由表2可知,PATCH、PRECIP、EDGE_CRACK、TEMP、BLK_CRACK、LONG_CRACK的 Wald统计量 分 别 为 1.423、0.075、0.845、0.821、0.756、0.659,显著值分别为0.345、0.721、0.152、0.157、0.583、0.459。当显著值小于0.05时模型收敛,所以Logistic模型中剔除上述变量。图6、7分别给出Logistic模型输入11个变量和5个变量的预测值与真实值的回归效果。
表2 Logistic模型得出的结果
由图6、7对比分析可知:图7明显消除了远离回归线的异常点,拟合效果比图6效果好,并且R2统计量由0.692增大到0.731,拟合效果已经明显提升,说明调参设置是正确的;但图7中有较多拟合数据离回归线距离较远,表明该模型不适用于本文数据。
图5 BP神经网络模型预测值与真实值的回归效果
图6 Logistic模型输入11个变量的预测值与真实值回归效果
图7 Logistic模型输入5个变量的预测值与真实值对比回归效果
本文以BP神经网络模型与Logistic模型的相关系数R2来进行对比分析,Logistic模型的R2为0.731,BP神经网络模型R2为0.876,模型输入变量的影响因素变量个数越多,模型预测精度相对越高。可以得出,经过训练的神经网络模型在预测平整度时产生的误差更小,各变量之间的相互关联可通过模型直观地表现,该平整度数据应用神经网络模型能够实现有效的预测,并且精度较高,达到了预期效果。神经网络模型预测方法简单,把数据质量提升后的数据样本分别用Logistic模型和BP神经网络模型预测时,Logistic模型训练的时间是30 min,而BP神经网络模型训练的时间是2min,BP神经网络花费的时间更短,预测速度快,结构简单。
本文设计了三层网络训练BP神经网络模型,以Sigmoid为激活函数,将平整度影响因素作为输入输出样本,通过不断地调整与分析神经网络的输入变量和隐含神经元个数,提高了模型预测平整度的精度。神经网络与Logistic模型对比分析表明,采用BP神经网络模型,当隐含神经元个数为4和输入变量个数为9时 ,模型的准确度达到最佳,R2为0.876,RMSE为0.881、MAE为0.682,此时IRI真实值与IRI预测值之间的误差较小。本文采用神经网络模型预测平整度的方法正确,预测精度较高,是一种有效的评价路面性能的方法,该方法也适用于对路面性能其他指标的评价分析。