王馨雪 吴炯璨
1.武昌理工学院 湖北 武汉 430223
2.中建五局投资管理公司 湖南 长沙 410000
随着经济社会的快速发展,全国各地大力投资建设高层住宅项目。高层住宅工程造价是评判其投资合理性与投资效益的重要依据,其预测结果的准确性与效率性直接影响着项目的投资决策。近些年来,随着定额法、线性回归法、工程量清单法在应用过程中效率较低、误差较大等问题逐渐暴露,基于机器学习的工程造价方法研究日益得到专家学者的重视。
本文拟基于工程历史数据建立GA-SVM高层住宅造价预测模型,利用GA算法对SVM模型核参数与惩罚系数寻优,充分发挥SVM模型的学习、预测能力,为高层住宅工程造价提供新方法,进而降低造价误差、提升项目投资决策效率。
支持向量机(SVM)是在20世纪90年代由Vapnik等人提出的一种机器学习方法,能实现对小样本、高维度、非线性问题的精准拟合与预测。该方法可在线性不可分情况下,将低维空间样本经非线性映射至高维空间,进而在高维空间对其进行线性分析,并寻找最优分类超平面。
设有训练集{(x1,y1),(x2,y2),…(xn,yn)},其在高维空间线性回归函数:
式中:f(x) 代表回归函数预测值,t代表真实值。
为求解回归函数参数ω、b,引入惩罚系数C和松弛变量ξ i,,得到优化方程:
通过拉格朗日函数求解该方程:
由此,可得到线性回归函数:
在该函数中,惩罚系数C与核函数参数g的合理选取对拟合、预测效果影响较大。
遗传算法(GA)基于生物进化理论发展而来的,将搜索最优解的过程转化为染色体的交叉、变异等。该算法具备较好全局寻优能力、可自适应地调整寻优方向。其一般步骤为:(1)种群初始化;(2)个体适应度评价;(3)选择:选取适应度较高个体为父母;(4)交叉:父母染色体交叉,产生子代;(5)变异:子代染色体变异。
为实现对高层住宅项目造价的准确预测,本文通过文献研究法对影响高层住宅造价的影响因素进行识别与分析,主要包括:
(1)地上建筑面积
地上建筑面积是指高层住宅首层及以上的楼地面面积,包括附属于建筑物的室外阳台、走廊、楼梯等。随着面积增大,住宅总造价增加,呈正相关性;但单方造价由于规模效应,通常呈负相关性。
(2)地下建筑面积[1]
地下建筑面积是指负一层及以下的建筑面积。由于地下工程需要挖土方及配筋要求较高,其造价远高于地上工程。其面积越大,造价越高,单方造价也越高。
(3)地上层数
地上层数是指地坪以上建筑总层数。高层住宅随着层数增加,总造价升高;当超过一定层数时,随施工难度、辅助设备等要求提升,造价提升更为显著。
(4)地下层数
地下层数是指地坪以下的建筑总层数。随层数增加,开挖深度、施工难度增大,造价相应提升。
(5)地上层高
地上层高是指地上建筑标准层层高。减少层高有利于节约造价、加强抗震性能,通常高层住宅标准层层高为3m左右。
(6)地下层高
地下层高是指地下层平均层高。随层高增加,挖深增加,造价相应增加。
(7)抗震等级
抗震等级一般分为一至四级,通常根据设防类别、结构类型、烈度及房屋高度进行设计。随等级升高,造价对应提升。
(8)装修类别
高层住宅装修类别通常包含毛坯、简装及精装修。随着装修类别的提升,造价提升较为显著。
(9)基础类型
基础类型根据构造方式通常分为独立基础、条形基础、满堂基础、桩基础等。其中满堂基础又可分为筏板基础、箱型基础。在高层住宅中,满堂基础与桩基础由于其承压能力较强,应用较多,但同时造价偏高。
(10)桩基类别
桩基类型通常包含人工挖孔、钻孔灌注、预制管桩三种方式。是否采用桩基础以及采用何种桩基础都对高层住宅造价影响显著。
(11)结构类型[2]
结构类型根据承重方式可分为砖混、框架、剪力墙、框架-剪力墙等。根据高层住宅的层高、层数,可选取相适应的结构类型,与此同时造价也会发生变化。
(12)内墙装饰[3]
内墙装饰材料通常包括涂料、水泥砂浆、混合砂浆,其中涂料最常用的材料为乳胶漆。
(13)外墙装饰
外墙装饰材料用于建筑物外部围护结构,通常包括涂料、墙面砖、石材。
(14)楼地面装饰
楼地面装饰材料通常包括毛面、水泥砂浆、面砖、块料。
(15)门窗类别
门窗工程中门的主要类型包含木质门、塑钢门、不锈钢门、铝合金门;窗的主要类型包括塑钢窗、金属窗、断热铝合金窗。随着门窗组合的改变,工程造价也会产生变化。
(1)根据高层住宅造价影响因素的可量化性进行分类及归纳,在输入维度形成7个定量指标、8个定性指标,在输出维度设置单方造价指标。在此基础上,对定性指标进行编码,以便运机器学习方法。指标体系及编码见表1,表2。
表1 高层住宅造价预测指标体系
表2 高层住宅造价预测定性指标编码
(2)通过广联达指标网及相关企业收集工程造价历史数据,并通过式(7)对其进行标准化处理。
(3)将收集到的样本数据划分为训练集、测试集,利用训练集数据构建SVM预测模型,并通过遗传算法优化SVM模型中的惩罚系数C与核函数参数,提高SVM模型预测的准确性。
(4)将高层住宅造价预测模型应用于测试集数据,分析验证其准确性、效率性。
本文通过广联达指标网及相关企业提供资料共收集到33组高层住宅造价数据作为分析数据。在所收集的数据中,高层住宅地上建筑面积在5000至50000、地下建筑面积在0-9000、地上层数在11-34层、地下层数在0-3层、单方造价为950元/至2400元/,其余各项指标基本涵盖普通高层住宅项目。
将搜集到的前30个高层住宅造价数据作为训练集,输入至GA-SVM模型中,并将第31-33作为测试集对模型预测效果进行检验。在模型训练时,遗传算法终止代数设定为100,种群数量设定为20,计算得到SVM模型最优惩罚因子与核函数参数分别为11.71,0.0925,此时计算均方误差为0.0817。
在此基础上,将训练集、测试集指标分别输入GA-SVM模型,将输出结果与对应高层住宅实际造价进行比较,分析该模型在训练集与测试集上的拟合与预测能力。
在训练集上拟合结果较好,拟合曲线与实际曲线基本重合;在测试集上预测值与实际稍有偏差,3个样本数据偏差率依次为4.79%、5.59%、4.54%,均在误差允许范围内,说明该模型泛化能力较好,可运用于高层住宅造价预测中。
为进一步验证GA-SVM高层住宅造价预测模型的准确性、高效性,将该模型与BP神经网络及选取其他惩罚因子、核参数情形下的SVM模型预测结果比对。
(1)BP神经网络对比
BP神经网络是前馈性神经网络中应用最为广泛的学习算法,通过梯度下降法、误差反向传递不断调整网络的权值和阈值,降低模型误差。本文将高层住宅造价数据输入BP神经网络模型中,设定输入层为17个因子、输出层为1个因子,隐含层节点数根据kolmogorov定理设定为5;设定传递函数为tansig,训练函数为trainlm、网络权值学习函数为learngdm、性能函数为mse;设定学习速率为0.01,最大迭代次数为1000,最大误差设定为0.0001。由此得到模型训练与预测结果。
在训练集上BP神经网络学习效果一般,虽然高层住宅单方造价曲线趋势基本一致,但多栋住宅单方造价存在较大偏差;在测试集上BP神经网络的预测效果良好,误差分别为8.55%、6.29%、1.60%,平均误差为5.48%,高于GASVM模型4.98%的平均误差。此外,通过对BP神经网络进行多次拟合预测,发现该模型存在精度相对较低、预测结果随机性较大等问题。因此,相较于BP神经网络模型,GASVM模型更适用于高层住宅造价预测。
(2)惩罚系数调整
在设定核函数参数值0.0925不变条件下,将最佳惩罚系数C=11.71在取值范围[1,61]调整,以10为步距。
将惩罚系数在[1,61]范围内调整,其值在取1时平均误差为5.53%,取11时平均误差达到最小,在设定为41以上时平均误差为6.75%,且不再上升,达到误差上限。反映出本SVM模型中惩罚系数在[41,61]内不敏感,在[1,41]范围内敏感性较大,通过人工进行参数寻优具备难度,虽然其平均误差均处于可接受范围,但是通过遗传算法优化SVM模型惩罚系数能有效提高模型精度及使用效率。
(3)核函数参数调整
在设定惩罚系数C值11.71不变条件下,将最佳核函数参数=0.0925在取值范围为[0.3,2.1]调整,以0.3为步距。
随着核函数参数由0.3调整至2.1,平均误差不断提升;其中,在由0.3调整至1.5过程中,平均误差由5.83%上升至10.48%,敏感性较大;由1.5调整至2.1过程中,平均误差由10.48%上升至10.83%,敏感性较小。此外,核参数在[0.3,2.1]范围内调整时,平均误差均大于选取最佳核参数时。由此,进一步验证了GA-SVM模型应用于高层住宅造价预测的准确性、高效性。
本文将GA-SVM模型应用于高层住宅造价预测,并通过模型对比分析,得到相较于传统造价方法,机器学习方法能基于已有高层住宅项目数据更加高效地预测类似项目造价;相较于BP神经网络,SVM模型在小样本预测问题上具备更高的精度,预测结果更加稳定;GA算法改进SVM模型能显著增加参数寻优速度,进而提升算法使用效率及准确性。因此,基于GA-SVM模型高层住宅造价预测模型能有效提高工程造价预测效率,提升投资决策的科学性,在工程领域具备较好应用前景。