基于ANN贡献分析及GEP算法的地铁车站土建造价预测模型

2020-09-14 01:44王杰卢毅
铁道科学与工程学报 2020年8期
关键词:土建车站神经网络

王杰,卢毅

基于ANN贡献分析及GEP算法的地铁车站土建造价预测模型

王杰,卢毅

(长沙理工大学 交通运输工程学院,湖南 长沙 410114)

科学地选取工程特征因素及预测方法对于构建一个好的造价预测模型十分关键。在选取的14个影响地铁车站土建造价特征因素中,利用神经网络贡献分析的变量选取方法,筛选出12个主要特征因素。并针对这选定的14个全部特征因素和12个主要特征因素分别组合BP神经网络和GEP 2种预测方法构建4个不同的造价预测模型,应用18组地铁车站土建造价和特征因素的历史数据进行实例探究,通过2,MSE,RMSE和MaxRE 4个指标的评价,结果表明:用主要特征因素为模型输入变量能显著提高模型的预测精度,且和GEP算法组合建立的造价预测模型为最优。将主要特征因素选取和预测方法选取相结合构建求解的最优模型很好地解决了已有相关研究中选取特征因素主观性多科学性不足及未考虑特征因素选取对预测方法选取的影响问题。

交通运输经济;特征因素;造价预测;GEP模型;ANN模型;地铁车站

造价预测是地铁车站土建造价控制和管理的重要内容之一,其精确程度直接影响到项目的投资决策、建设规模确定以及工程设计方案制定的科学性,因此其研究具有重要意义。地铁车站土建造价的影响因素众多,且不确定性大,其造价与其自身特征又具有高度的非线性关系。由此可见地铁车站土建造价预测研究的关键问题主要是造价影响因素的选取、预测方法的选用及其优化。近年来,地铁工程造价预测模型引起了一些学者的研究:何佳[1]研究认为地铁车站长度在很大程度上反映车站的规模,从而直接影响地铁的投资造价;马靖华等[2]研究结果表明不同施工工法对地铁车站的工程造价有明显影响;黄义勇[3]通过全面系统的分析得出围护结构、车站主体结构、出入口通道及土方支撑降水是地铁车站造价的主要组成部分,并且与物价紧密相关;黄栋[4]研究表明地铁车站的不同埋深是工程造价的主要影响因素。对工程造价预测方法的研究上:Agnieszka等[5]通过问卷调查的方式确定工程类型,工程地理位置,工期等特征因素,运用BP神经网络预测工程间接费用;Murat等[6]通过选取17个因素为变量建立基于人工神经网络的地铁轨道造价预测模型;赵欣[7]引入模糊数学理论构建地铁土建工程造价的神经网络模型;王杰等[8]通过专家打分的方式选取8个地铁隧道特征因素建立基于基因表达式编程(GEP)的地铁隧道土建造价估算模型。这些文献在特征因素选取方面,多根据经验法及比例法,选取的方法主观性强科学性不足;未考虑特征因素选取对预测方法选取的影响。而预测方法选用上,神经网络容易出现局部最优及过度拟合现象。本文拟在实证研究中,选用基于神经网络(ANN)贡献分析的变量选取方法[9],并结合GEP算法建立一个预测精度更为准确的造价预测模型。该变量选取方法是将样本数据中隐含的知识转化到神经网络的结构和连接权值中,根据计算每个输入变量对网络输出的贡献大小,剔除冗余变量,科学筛选出影响地铁车站土建工程造价的主要特征因素。而GEP算法作为一种处理高斯和不确定性因素的新型人工智能数学建模方法,拥有强大的函数挖掘能力和处理高度非线性系统的能力,可以克服ANN预测建模方法的不足。

1 相关理论及研究流程

1.1 神经网络贡献分析的变量选取方法

在计量经济建模与预测研究领域,主要考虑的神经网络模型是单隐层BP网络(如图1),其一般形式为:

(1)

若()为sigmoid函数,()为线性函数,

=0,…,;=0,…,。

则(,)可写为:

其中:=1,…,;为样本数。

对决定系数2进行分解,则有:

定义:

显然,0可以理解为未被解释的残差部分。从方差分析看,Z可理解为第个隐含层节点对输出变量的贡献,个隐含层节点贡献之和体现了模型对输出变异解释程度,即2。

式中:表示第个输入变量对总体输出的贡献,表示未引入因素对总体输出的贡献。

如果有个变量的贡献之和(<)接近于1时(例≥*,*可以取0.85或0.95),就选取这个变量为重要变量,而删掉那些贡献比较小的变量。这里*的取值可以视具体情况而定。

图1 单隐层BP神经网络拓扑图及其层次贡献分析图

Fig. 1 Topology diagram of BP neural network with single hidden layer and its hierarchical contribution analysis diagram

1.2 基因表达式编程及算法流程

基因表达式编程融合遗传算法(GA)和遗传编程(GP)的优势,它以操作符号和基本变量作为遗传信息,一个染色体(个体)代表一个问题解,通过遗传、变异、重组等遗传算子,进行迭代,直到达到较好的适应度,算法终止得到一个更接近事实本质的模型和公式[6]。

通过以上介绍,可将GEP 算法描述如下:

输入:模型输入变量;算法参数;输出:最优染色体(拟合函数f) Step 1:随机初始化染色体群; Step 2:计算每个染色体的适应度值; Step 3:判断是否达到设定的结束条件,达到结束,未达到则继续进行下一步;

Step 4:遗传操作产生下一代:首先保存最好个体,然后进行包括选择、复制、变异、IS插串、RIS插串、基因插串、基因重组等在内的遗传操作; Step 5:转到Step 3。

1.3 研究流程图

研究流程图见图2。

2 特征因素选取及造价预测模型构建

2.1 特征因素分析

选取工程特征因素要求一方面能代表工程所具有的特点,另一方面能有效地将对工程主要成本构成有影响的核心参数反映出来。根据黄义勇[3]的研究,围护结构、主体结构、出入口通道及土方支撑降水是地铁车站造价的主要成本构成,约占土建费用的84%。结合查阅已有文献及工程历史资料,根据专家的经验,剔除对工程造价影响相对较小的因素,初步选取14个变量作为地铁车站土建工程造价的特征因素。根据这14个特征因素,搜集整理到18组广州市不同线路的地铁车站土建工程特征值及它们延米造价数据(见表1),考虑到统一量纲,将它们线性压缩至[0.1,0.9](见表2)。

图2 地铁车站土建工程造价预测模型研究流程

表1 地铁车站土建工程特征因素原始数据

132246.5027.341110.1014.222.883114101.86533.87 142151.6018.30119.0015.763.20271298.49349.83 153182.9023.101112.0017.203.60531198.49444.42 162168.2017.70328.0017.112.50531198.49353.14 172260.4026.401112.1013.572.094211101.86635.40 182147.6024.101115.0015.601.50562498.49668.53

注:施工方法1-3分别指明挖、盖挖、明盖。站台形式1-3分别指岛式、侧式、一岛两侧。主体结构1-7分别指单层多跨、双层单跨、双层双跨、双层三跨、双层多跨、多层三跨,多层多跨。围护结构中1-7分别指地下连续墙、圆形挖孔桩、矩形挖孔桩、钻孔灌注桩、钻孔灌注桩和挖孔桩、挖孔桩和土钉墙、土钉墙。支撑方式1-3分别指钢支撑、锚杆支撑、水泥土 地锚。

表2 标准化后的地铁车站土建工程特征因素数据

2.2 神经网络参数设置

本文拟利用神经网络进一步选择影响地铁车站土建造价的主要特征因素。神经网络设计第1步是选定其结构。以14个特征因素作为神经网络的输入层神经元节点,地铁车站土建工程其延米造价作为输出神经元节点,选定隐含层数为1。隐层神经元个数采用“试凑法”进行确定,试验后隐层节点数取7。选用logsig作为输入层到隐含层的激活函数,隐含层与输出层采用purelin型激活函数[7]。

BP神经网络模型的训练函数选取也很重要,因为它直接影响收敛速度与误差率。根据张德丰[10]的研究,Levenberg-Marquardt反向传播算法具有最快的收敛速度,因此选用trainlm为训练函数。由于是对具体数值的预测,损失函数选用MSE。相应的参数设定为:显示间隔次数=1,最大循环次数300,目标误差=1×10−7,其他参数设为默认值。

2.3 造价预测模型GEP算法的构成要素设置

2.3.1 选择适应度函数

由于本文样本数据取值在[0.1,0.9]之间,考虑选用基于相对误差的适应度函数,其函数表达式为:

2.3.2 设置算法参数

通过参考相关文献的历史经验及分析研究GEP算法特性[8, 11],选定如表3所示参数。

表3 GEP算法参数设定

3 模型的求解与比选

3.1 主要工程特征因素的选取

将搜集到的案例数据的前15组设为训练样本,后3组作为验证样本,并依据上述BP神经网络的相关参数设置,利用 MATLAB仿真,所得结果如图3所示。

由图3可知,第7次循环结束时训练样本的均方误差达到设定的精度要求(<1×10−7),从图4可以看到:虽训练样本具有极好的预测精度,但验证样本的预测精度低,无法满足工程可研阶段投资估算<±10%的精度要求。

图3 训练效果与训练状态

(a) 训练样本预测结果对比;(b) 验证样本预测结果对比

将训练好的BP神经网络代入式(10)~(11)分别计算出各输入变量对隐层节点的贡献及各隐层节点对输出的贡献值,再根据式(12)~(13)计算各输入变量对输出的贡献值。具体的贡献比例结果如图3所示,其中114代表地铁车站土建工程特征因素,15代表为未引入因素。

图5 各输入变量对输出变量的贡献以及试验出现的频数

Fig. 5 Contribution of each input variable to output variable and frequency of test occurrence

同时将18组样本数据平分为6个部分:轮流选出一部分作为验证样本来检验网络的泛化能力,其他的则作为训练样本提供网络训练学习。共进行20次试验,从每次试验结果中统计累计贡献值≥0.95的输入变量出现的频数(结果见图5),将出现频数大于10的因素筛选出来作为地铁车站土建工程造价的主要特征因素,其分别为层数(1)、车站长(2)、标宽准(3)、施工方法(4)、站台型式(5)、埋深(6)、主体结构(7)、围护结构(8)、支撑方式(9)、支撑数(10)、物价指数(11)和出入口通道数(12)。

3.2 求解造价预测模型及预测模型比选分析

为了比较在不同建模方法以及不同输入变量对地铁车站土建工程造价预测效果的的影响,本文将上述选定的12个主要特征因素和14个全部特征因素分别作为模型自变量,再分别结合BP神经网络、GEP算法建模,同时构建4个不同的造价预测模型。预测结果如表4。

表4 不同模型预测结果及误差对比

3.3 模型评价及比选

表5 不同模型的预测评价结果

因此模型2为最优模型,其拥有适应度1 758.40。通过GEP算法挖掘得到此模型的最优染色体结构由6个子表达式树构成,其中每个子表达式树对应一个基因,每个子表达式树通过‘+’号连接(见图6)。该染色体结构对应的拟合函数的表达式为:

图6 最优染色体结构

4 结论

1) 应用神经网络贡献分析的变量选取方法,克服以往造价预测模型特征因素选取主观性多科学性不足的问题,实证研究结果表明地铁车站土建工程造价主要特征因素有12个:层数、车站长、标宽准、施工方法、站台型式、埋深、主体结构、围护结构、支撑方式、支撑数、物价指数和出入口通道数。并将主要因素选取与预测方法选用相结合进行实例探究,解决未考虑特征因素选取对预测方法选取的影响问题。

2) 通过2,MSE,RMSE和MaxRE 4个模型评价指标的结果不难看出:不论是采用ANN算法还是GEP算法构建地铁车站土建造价预测模型,与用全部特征因素作为输入变量相比,运用主要特征因素作为模型自变量能显著提升所构建模型的预测精度,其中以主要特征因素作为自变量结合GEP算法构建的预测模型最优,能够很好地满足工程可研究阶段造价估算的精度要求。

3) 研究选取的主要特征因素及GEP 算法模型在地铁车站土建造价预测领域具有广泛应用价值,同时此研究设计方案可以在更大范围的工程造价估算领域应用。此次实例探究也再一次验证了GEP算法强大的函数挖掘能力和极高的全局搜索效率,能够有效地克服BP神经网络泛化能力不足(训练期预测精度高,验证期预测精度低)的问题。由于仅收集到广州市部分已完工地铁车站的工程数据,存在一定局限性,下一步可结合工程地质及水文情况做进一步研究。

[1] 何佳. 优化车站建筑设计降低地铁工程造价[J]. 工程建设与设计, 2004(6): 58−59.HE Jia. Optimizing station architectural design and reducing subway project cost[J]. Engineering Construction and Design, 2004(6): 58−59.

[2] 马靖华, 程亚平. 地铁车站不同施工工法对工程造价的影响研究[J]. 建筑经济, 2019, 40(5): 64−68. MA Jinghua, CHENG Yaping. A study on the influence of different construction methods on the construction cost of subway stations[J]. Construction Economy, 2019, 40(5): 64−68.

[3] 黄义勇. 地铁车站造价分析与控制[J]. 铁路工程造价管理, 2012, 27(3): 55−59. HUANG Yiyong. Analysis and control of subway station cost[J]. Railway Engineering Cost Management, 2012, 27(3): 55−59.

[4] 黄栋. 地铁车站的造价分析与控制[J]. 工程技术研究, 2017(6): 150−151. HUANG Dong. Cost analysis and control of subway station[J]. Engineering Technology Research, 2017(6): 150−151.

[5] Agnieszka Leśniak, Michał Juszczyk. Prediction of site overhead costs with the use of artificial neural network based model[J]. Archives of Civil and Mechanical Engineering, 2018, 18(3): 973−982.

[6] Murat Gunduz, Latif Onurugur, Erhan Ozturk. Parametric cost estimation system for light rail transit and metro trackworks[J]. Expert Systems with Applications, 2011, 38(3): 2873−2877.

[7] 赵欣. 基于BP神经网络的地铁土建工程造价估算方法研究[D]. 北京: 北京交通大学, 2008. ZHAO Xin. Research on cost estimation method of subway civil engineering based on BP neural network[D]. Beijing: Beijing Jiaotong University, 2008.

[8] 王杰, 卢毅. 基于基因表达式编程的地铁隧道土建工程造价估算[J]. 长沙理工大学学报(自然科学版), 2019, 16(3): 17−24. WANG Jie, LU Yi. Cost estimation of subway tunnel civil engineering based on gene expression programming [J]. Journal of Changsha University of Science and Technology (Natural Science Edition), 2019, 16(3): 17− 24.

[9] 高仁祥, 张世英. 基于神经网络的变量选择方法[J]. 系统工程学报, 1998, 13(2): 32−37.GAO Renxiang, ZHANG Shiying. Variable selection method based on neural network[J]. Journal of Systems Engineering, 1998, 13(2): 34−39.

[10] 张德丰. Matlab神经网络仿真与应用[M]. 北京: 电子工业出版社, 2009. ZHANG Defeng. Matlab neural network simulation and application[M]. Beijing : Electronic Industry Press, 2009.

[11] Danial Behnia, Mazda Behnia, Kourosh Shahriar. A new predictive model forrock strength parameters utilizing GEP Method[J]. Procedia Engineering, 2017(191): 591− 599.

Prediction model of subway station civil engineering cost based on ANN contribution analysis and GEP algorithm

WANG Jie, LU Yi

(School of Traffic and Transportation Engineering, Changsha University of Science and Technology, Changsha 410114, China)

Selecting engineering characteristic factors and forecasting methods scientifically is very important for constructing a good cost forecasting model. Among the 14 characteristic factors influencing the construction cost of subway stations, 12 main characteristic factors were selected by using the variable selection method of neural network contribution analysis. According to allthe14 characteristics of the selected factors and 12 key features combined BP neural network and GEP respectively, two types of forecast method were used, and four different cost prediction models were built. The18 sets of subway station construction cost factors and characteristics of the historical data were used to perform example exploration, and to conduct evaluation through2, MSE, RMSE, MaxRE four indices. The results show that the use of the main characteristic factors as model input variables can significantly improve the prediction precision, and the cost prediction model with the combination of GEP algorithm is the most optimal. By combining the selection of main characteristic factors with the selection of prediction methods, an optimal model was constructed to solve the problem of lack of subjectivity and multi-scientificity in the selection of characteristic factors and the influence of the selection of feature factors on the selection of prediction methods.

transport economy; characteristic factors; cost forecast; GEP model; ANN model; the subway station

U231+.4

A

1672 − 7029(2020)08 − 2152 − 10

10.19713/j.cnki.43−1423/u.T20190998

2019−11−13

2018年度湖南省交通运输厅科技进步与创新计划项目资助(201836)

卢毅(1964−),男,湖南宁乡人,教授,博士,从事公路工程管理、交通工程研究;E−mail:Lyhjr@163.com

(编辑 阳丽霞)

猜你喜欢
土建车站神经网络
高层建筑中土建施工技术实施以及应用
基于递归模糊神经网络的风电平滑控制策略
桩基的土建施工技术
土建施工现场管理土建施工技术质量控制解析
车站一角
神经网络抑制无线通信干扰探究
高层建筑土建施工关键技术探讨
基于神经网络的中小学生情感分析
在北京,一个车站的治理有多难
基于支持向量机回归和RBF神经网络的PID整定