基于栈式降噪自动编码器的建筑工程施工成本预测

2020-07-20 08:14刘必君叶雨辰
关键词:编码器神经网络工程施工

刘必君,叶雨辰

(1.南昌大学建筑工程学院,江西南昌330031;2.江西省华赣环境集团有限公司,江西南昌330105)

建筑工程是我国基础建设的重要组成部分,它与国内生产总值(GDP)的发展水平息息相关。建筑业在我国的国内生产总值占比较大,尤其在近些年,建筑业在国内生产总值的份额持续增加。根据国家统计局资料显示,随着供给侧结构性改革推进,2017年全年房地产开发投资109 799亿元,比上年增长7.0%。其中住宅投资75 148亿元,增长9.4%。因此建筑工程的施工成本预测研究具有重要意义。

关于建设工程施工成本的预测理论与数学模型包括:线性回归、时间序列法、灰色理论、BP神经网络等。近几年,国内外基于人工神经网络方法展开的工程成本预测的研究较多,也是目前理工科领域主流的预测方法。段鹏[1]分别针对传统的如线性回归、参数估计、指数平滑等统计分析方法进行对比分析,指出指数平滑法更适合短期内的一些预测,计算较为简单,对样本数据需求小。谢玉梅[2]通过收集类似工程已标价工程量清单的综合单价建立数据库,利用灰色预测模型预测分部分项工程成本。陈文胜[3]通过估算模型概念、结构和原理,构建了基于层次分析法改进的BP神经网络的工程造价预测模型,并通过Matlab对案例进行分析。国外学者Sajadfar[4]结合了线性回归和数据挖掘技术,提出了一个基于信息学框架的工程特征,应用于数据挖掘以及算法所支持的成本估算。Putra[5]提出了一种基于BP神经网络的人工智能计算方法用于对已完工典型项目的直接成本和间接成本进行建模,以减少不确定性。该方法特别适用于评估安装工程的成本,使工程成本估算的总不确定度大大降低。

虽然,国内外基于人工智能方法展开的工程成本预测的研究较多,主要通过两个方式进行预测。一是通过神经网络参数调整或者改进神经网络来进行建筑工程成本、造价预测;另一种是通过其他数学分析方法改进神经网络的方法来实现预测。这些研究方法在一定程度上都存在着理论方法选取不合适或者影响因素指标体系构建不完善的瑕疵,导致预测精度低,预测结果不稳定。目前国内暂无学者将深度学习应用于施工成本预测领域,主要针对深度学习网络的建模与改进方向进行探究。

在了解目前国内外各种常用的建筑工程施工成本(造价)预测方法后,重点分析对比了基本原理和预测结果。

(1)线性回归法

线性回归法原理是利用数理统计的方法研究变量之间的函数关系。预测精度受数据影响较大。

(2)时间序列法

时间序列法是通过历史资料分析量与时间的变化规律,从而预测变量的具体数值。适合短期的发展预测,预测精度不高。

(3)灰色理论

灰色利润根据序列曲线几何形状的相似程度来判断其联系是否紧密。适合短期预测,预测精度不高。

(4)神经网络

神经网络是多层前馈神经网络,通过模拟动物的神经网络行为特征,调整内部大量节点之间连接权值。预测结果易陷入局部极小值,预测精度较高。

(5)深度学习

深度学习神经网络是指先进行无监督学习提取数据特征,再进行有监督学习,预测精度高。深度学习是由传统的多层神经网络发展而来,它具有优秀的非线性映射能力和泛化能力,能够表征复杂的高维函数。深度学习在计算机图像识别、语音识别、自然语言处理、预测等其他领域表现优异。

由于建筑工程施工成本的影响因素复杂,施工成本数据收集不易,因此,建筑工程施工成本的预测是一个典型的大样本、高维非线性问题。而且建筑工程施工成本的快速预测往往是为企业成本管理服务,对预测的精度和时间要求也较高。在建筑工程施工成本预测方法的选取上,传统的预测方法往往达不到较为理想的预测效果,而深度学习网络模型,可有效避免传统的施工成本预测方法如回归分析、灰色理论等所表现出的预测精度较差,预测花费时间较长的问题,同时还具有一定的泛化能力。

在系统地分析传统的建筑工程成本预测方法基础上,选取了基于深度学习网络下的栈式降噪自动编码器和BP神经网络强大的学习预测原理,通过建立预测模型对样本数据进行训练学习,可以准确快速地实现非线性工程项目施工成本的预测。同时,构建了高层建筑工程施工成本影响因素集合,全面概括了高层建筑工程土建结构施工成本影响因素体系,并提出相应的量化以及归一化过程,有效避免了专家打分法下的指标量化方法产生的人为误差,为建筑工程施工成本预测理论提供新的思路。

1 建筑工程项目施工成本影响因素分析

1.1 建筑工程施工成本影响因素的识别

建筑工程项目的建设周期长、影响因素多、设计方案的多样性等共同决定了建筑工程的成本。影响建筑工程成本的因素很多,总体来说可分为四类:工程属性、环境属性、市场属性以及管理属性。

工程属性,也就是建筑工程自身结构设计的特征,包括建筑面积、占地面积、标准层建筑面积、基础类别、结构类别、楼梯结构形式、抗震强度、外立面装饰、层数、层高等。环境属性,主要是现场条件,包括场地施工条件、排污、土方开挖处理难度等。市场属性,与市场经济环境相关的特征,包括人工成本、混凝土、钢筋等原材料价格及其趋势。管理属性,指的是涉及到建筑工程项目建设阶段管理的主要三方以及施工工期。

建筑工程施工成本指的是建筑工程的建造成本。一般情况下,对于施工单位来说,建筑工程成本即建筑安装工程总价格,它是指在为建成某一项工程,预计或实际在市场交易活动中所形成的交易总价格[6]。而建筑安装工程费由直接费、间接费、利润和税金组成。建筑工程项目成本是指承包商在进行某建筑工程项目的施工过程中发生的全部费用支出的总和。工程项目成本不同于施工企业成本,更有别于建筑安装工程造价。它们的关系如下:

式(1)、式(2)中,建筑安装工程造价是指建设单位支付给该建筑工程项目的工程价款收入,即工程项目的价格;施工企业成本是企业为工程项目施工所发生的各项费用支出,一般包括项目生产性费用支出和企业非生产性费用支出两大部分。非生产性费用是施工企业为组织和管理生产经营活动而产生的费用,往往具有很大的伸展和压缩空间,是企业形成利润和效益增长的支撑点。主要包括电话费、运输费、业务招待费、办公用品费、能源费等。最终要预测的研究对象(被影响因素)——“施工成本”即上述施工企业成本。

1.2 建筑工程施工成本的主要影响因素量化

由于结构类型与建筑层数是影响建筑施工成本的决定性因素,所以在考虑多样本情况下统计数据的可靠度,将结构类型与建筑层数作为控制因素。所采集的建筑工程样本数据限制结构类型为框架剪力墙结构,限制建筑层数为高层建筑(层数≥12,层高<100m),通过两个控制因素的限制,使得预测网络的原始数据更可靠,样本数据学习过程中更稳定,预测结果更贴近样本。

非控制因素分为定量影响因素与定性影响因素。定量影响因素通过其数值上的大小对建筑工程施工成本产生影响,而定性影响因素由设计方案、施工工艺等方式决定。

建筑工程施工成本预测模型的样本需要将收集的数据中的定量影响因素与定性影响因素进行量化,其量化过程如下:

(1)基础工程

①基础结构形式:按照基础构造受力特点,可以分为:梁式基础、条形基础、片筏基础、箱型基础、桩基础等。定性指标,量纲为一后,分别为1、2、3、4、5。②桩基类型及桩基工程量:建筑工程桩基础主要有预制管桩、旋挖钻孔灌注桩、人工挖孔桩、冲孔桩、多种桩型组合以及无工程桩,定性指标,量纲为一后,分别为1、2、3、4、5、6。这里之所以引入“无工程桩”,是因为高层建筑工程如果采用上述的梁式基础或者片筏基础等基础类型的情况下,那么“桩基类型”项数据无法填写,同样地,下述“桩基工程量”数值也为“0”,为了避免无监督学习阶段出现“0”,在实际采集的数据中将“无桩基工程”项的“桩基工程量”换成“0.01”。

由于各种桩型的不同,桩基承载力不同,桩径也大相径庭,桩基的工程量主要以设计的混凝土灌注的工程量为准。桩基工程量为定量指标,取其单位为:“方”。

(2)地下室工程(见表1)

(3)建筑面积:定量指标,取其单位为“m2”。

(4)标准层面积:定量指标,取其单位为“m2”。

表1 地下室工程影响因素Tab.1 Influencing factors of basement engineering

(5)结构类型:为了预测的精确度,将样本数据中的结构类型(控制因素)限定为框剪结构。

(6)楼梯类型

①疏散楼梯:定量指标,取其截面尺寸面积,m2。②电梯:主要考虑两个方面,一是截面面积,定量指标,m2;二是电梯数量,定量指标,取其单位为“部”。

(7)建筑层数:定量指标,取其单位为“层”。将建筑层数作为一个控制因素,统一采集的数据为高层建筑(层数≥12,层高<100m)。

(8)建筑层高:定量指标,m。

(9)抗震设防类别:抗震设防类别划分为甲、乙、丙、丁四级,定性指标,量纲为一后,甲级为1、乙级为2、丙级为3、丁级为4。

(10)墙体砌筑材料:常见的砌筑材料有:非黏土烧结多孔砖、非黏土烧结空心砖、混凝土空心砌块、烧结空心砌块、加气混凝土砌块、石膏砌块、加气混凝土板、轻质条板、石膏空心条板。定性指标,量纲为一后,分别为:1、2、3、4、5、6、7、8、9。

(11)外立面装饰:主要包括干挂、玻璃幕墙、面砖、涂料等。定性指标,量纲为一后,干挂为1、玻璃幕墙为2、面砖为3、涂料为4。

(12)屋面工程

①屋面结构:一般分为平屋顶、坡屋顶、拱屋顶、折板屋顶、薄壳屋顶、悬索屋顶、网架屋顶等。定性指标,量纲为一后,分别为1、2、3、4、5、6、7。②屋面防水:主要有卷材防水屋面、刚性防水屋面、涂膜防水屋面以及复合防水屋面。定性指标,量纲为一后,分别为1、2、3、4。

(13)场内施工条件:综合考虑现场围护设备、临时设施、临水和临电等,是否符合施工工序有序进行的要求。定性指标,完全符合、基本符合以及暂不符合,量纲为一后,分别对应1、2、3。

(14)气象特征:定性指标,根据历史气象特点,对施工产生较大、较小和无影响的分别量纲为一后为1、2、3。

(15)场外交通状况:定性指标,对施工进度产生较大、较小和无影响的分别量纲为一化为1、2、3。

(16)人工造价指数

在研究影响建筑工程施工成本的影响因素时,除了要考虑不随时间变化而改变的静态因素外,还需考虑到人工与主材等价格跟随市场价格波动而改变的动态影响因素。为了使所建立的预测模型能够适应时间的变化,需要引进一个与时间变化相关的指标——工程造价指数。工程造价指数是反映一定时期的工程造价相对于某一固定时期(基准期)的工程造价变化程度的比值或比率[7]。通过与基准期的价格相比较,反映出当前的市场价格相对于基准期市场价格变动的趋势,可以用做调整工程造价的价格差异的依据。

工程造价指数的计算公式为

因此,人工造价指数,定量指标,取其单位为“1”,基准期统一为2011年5月。

(17)其他影响因素,见表2。

表2 其他影响因素Tab.2 Other influencing factors

2 栈式降噪自动编码器基本原理

深度学习网络在计算机识别(图像、语音等)领域取得了显著的成功,在不同的应用领域通常会用到不同的网络结构,三种常见的深度学习网络分别是:深度卷积网络(CNN)、受限玻尔兹曼机以及自动编码网络(Autoencoder)[8]。

2.1 深度学习网络模型

在了解栈式降噪自动编码器之前要先了解深度学习。深度学习起源于多层神经网络,传统的人工神经网络只有监督学习过程,而深度学习是先进行无监督学习过程,这个过程最重要的目的就是提取数据特征,在提取的数据特征基础上再进行有监督学习过程,因此深度学习比传统的多层神经网络更加优越。

深度自动编码器(Auto-encoder,缩写为DAE)是通过无监督逐层贪心预训练和参数优化的多层非线性网络从无标签数据中提取高维复杂输入数据的特征,并得到原始数据分布式特征表示的深度学习神经网络结构。深度自动编码器由编码器、解码器和隐含层构成。编码器(encode)是输入x到隐含表示h的映射,表示为

式中,S就是Sigmoid激活函数。

解码器函数g(h)将隐含层数据映射回重构输出y,表示为

式中,Sg是解码器的激活函数,同样为Sigmoid函数。训练DAE过程就是在训练数据样本集X上寻找参数θ={W,by,bh}的最小化重构误差。重构误差的表达式(代价函数)为

式中,L为重构误差函数,用平方误差函数表示为

本文选择的深度学习模型的误差反向传播算法是基于online梯度下降法。自编码网络的输入层是原始数据,如图像、声音、数据包等,隐藏层就是特征提取层,经过自动编码器提取相应的高维特征(编码),再将得到的高维特征作为另一个自动编码器的输入(解码)就可以得到更高层次的特征(输出层)。

2.2 栈式降噪自动编码器

栈式降噪自动编码器是将降噪自动编码器通过栈的形式连接起来构成深度学习模型的隐藏层。栈式降噪自动编码器是深度编码器的一种,任何一种深度编码器都是基于自动编码器的[9]。

通过修改自动编码器的编码公式,得到降噪自动编码器编码的计算公式如下:

式(8)与普通自动编码器的区别在于输入数据己经完成降噪了。损失函数的计算公式仍旧是采用最小二乘法的L(x,z)函数。

栈式降噪自动编码器的核心在于每一层的降噪自动编码器先进行无监督预训练,再在无监督预训练完成的基础上进行整个栈式降噪编码器有监督调整。通过多次的无监督训练学习、迭代,隐藏层的降噪编码器同时调整自身的参数。栈式降噪编码器在有监督阶段使用反向传播算法回传误差,有监督学习阶段的过程就是BP神经网络算法。

3 实例分析

为了保证模型预测的准确性,需要收集工程案例相似的工程数据作为训练样本。在收集输入数据的过程中,考虑到不同地区的人工、主材等价格不同,建造工艺和技术方案也有区别,因此样本选取时均选用南昌及其周边城市的住宅工程。通过江西省工程造价信息网和相关造价信息期刊等多种渠道收集并筛选2010年—2017年的高层住宅数据25组,所收集的样本工程均为22—33层的住宅工程,且工程所在地均为南昌及其周边城市,保证了样本的地区统一性和类别一致性。经过初步统计训练样本的31个工程特征(影响因素X)和1个工程成本数据(被影响因素Y),可以得到训练样本的所有特征向量。

3.1 样本特征变量归一化

为了避免输入数据绝对值相差过大而导致自编码网络的输出达到饱和,甚至导致过早陷入局部最小值,需要提前对训练数据样本集X的输入向量和输出向量分别都进行数据的归一化处理,使输入输出数据范围控制在[0,1]区间内。

采用线性归一化处理方式对输入数据进行变换,变换公式为

式中:-xi为归一化后的数据;xi为当前收集的数据;

xmin为该类数据的最小值;xmax为该类数据最大值。

3.2 样本数据量化及预测运算

为了方便模型对样本数据的处理和计算,对得到的初步统计数据进行量化。量化后的输入向量见表3。

根据式(9)对初步统计数据表3进行变换,再将变换后的数据导入Matlab中进行预测分析。

表3 工程特征向量量化表Tab.3 Engineering feature vector quantization table

根据图1,训练预测过程在80—100次迭代时,预测数据收敛。返回到Matlab运行结果代码进行数据反查,预训练(无监督学习)全局误差在第88次迭代达到0.05,第100次训练迭代时,全局误差为0.042。有监督学习阶段,发现在第424次迭代时,全局误差达到0.001,已经基本满足预测精度,第500次迭代时,全局训练误差达到0.000 8。

3.3 误差分析

通过重绘的测试样本施工成本预测值与实际值比较,可以得到测试样本的预测值与实际值的相对误差如表4所示。

图1 误差损失函数Fig.1 Error loss function

通过分析表4的数据可以发现:预测的3组数据中,预测结果与实际值的相对误差均小于2%。

表4 测试样本实际施工成本与预测值的相对误差Tab.4 Relative error between actual construction cost and predicted value of test sample(万元)

可以看到,3个预测样本的相对误差最大为1.61%,相对误差最小的甚至在1.00%以内,一般情况下,在项目施工阶段,工程施工成本测算的相对误差一般控制在2%以内,就可以作为施工组织的依据,因此采用栈式降噪自动编码器构建的建筑工程施工成本预测模型预测效果很好,相对误差表现理想。

3.4 预测模型测试结果稳定性分析

为了更好地研究新模型的预测效果的稳定性将表4中的相对误差值图形化,见图2。

由图表可以总结出,预测的相对误差最大为1.39%,最小达到了0.82%,预测模型在控制相对误差上表现良好,稳定性强,且仿真分析结果很好地检验了预测模型的预测效果。另外,整个栈式降噪自动编码器模型的建立以及进行建筑工程施工成本预测的实现均在Matlab编程平台上,通过一系列编程运算即可实现,相较于传统的概预算软件、BP神经网络等方法进行建筑工程施工成本的估算或者预测来说,所构建的建筑工程施工成本预测模型预测速度较快,预测结果稳定。

图2 预测相对误差稳定性Fig.2 Predictive relative error stability

4 结论

通过查阅工程管理与工程造价相关文献资料,以及结合多年的实际工作经验,对建筑工程施工成本预测进行了较为深入地研究,主要结论如下:

(1)通过分析影响建筑工程施工成本影响因素,构建了建筑工程施工成本的影响因素集合体系,以及影响因素指标的详细量化、归一化过程,对预测模型起到重要辅助作用。

(2)在预测算法理论上深入研究了栈式降噪自动编码器的基本原理、算法结构、Matlab建模等研究工作,在理论与实践操作的层面探讨了解决建筑工程施工成本预测此类非线性问题的流程,同时结合建筑工程施工成本管理、预测的理论,应用栈式降噪自动编码器进行建模仿真分析。

(3)根据理论上的对比以及实例预测结果分析,以Matlab编程语言构建的预测模型可以实现高层建筑工程施工成本预测,预测速度较传统预测方法更快更精确,预测精度在2%以内。随着招投标制度以及工程计价制度的完善,建筑施工行业已然是一个充分市场化竞争的行业,各个企业之间的成本差异也逐渐缩小。未来建筑工程的施工企业成本预测理论将会在大数据以及规范的市场背景下愈加完善。

猜你喜欢
编码器神经网络工程施工
融合CNN和Transformer编码器的变声语音鉴别与还原
基于递归模糊神经网络的风电平滑控制策略
设定多圈绝对值编码器当前圈数的方法
采暖工程施工常见问题探究
探讨自来水管道工程施工的通病与防治
转炉系统常用编码器选型及调试
舞台机械技术与设备系列谈(二)
——编码器
神经网络抑制无线通信干扰探究
BIM在工程施工中的应用
论高层建筑电气防雷接地工程施工