基于数据挖掘技术的BIM工程项目成本控制应用研究

2022-10-22 03:40秦国兰
天津职业院校联合学报 2022年5期
关键词:聚类关联数据挖掘

秦国兰

(天津国土资源和房屋职业学院,天津 300270)

一、前言

BIM理念引入中国以来已有了若干年的历史,通过不懈的努力和探索,BIM在国内也有了一定的发展和应用,中国建筑业进入“大数据”时代。BIM的应用为工程项目的成本控制提供了系统的、专门的信息服务机制,为工程项目控制的全过程提供了平台,为成本控制工作提供了突破性的进展,开启了工程项目成本控制宏观分析与动态实时把握的新纪元,对工程项目的成功完成具有积极的价值。首先,广泛的信息来源与动态外部链接为工程项目的全过程成本控制提供了最有效的数据,使得工程项目概算值、预算值等数值更加准确,为工程项目的全过程成本控制提供了有效保障。其次,集成化的信息管理解决了工程项目各参与方之间的沟通问题,为工程量数据的准确计算、工程项目变更的及时调整、各参与方的及时协调等全过程成本控制措施提供了条件。再次,模拟性的工程项目数字模型使得工程项目成本控制全过程中的设计、控制等方案的不断优化成为可能。最后,BIM的优化性、可出图性等功能特性也为工程项目的全过程成本控制提供了不小的辅助作用。BIM的发展及应用为工程项目成本的全过程控制提供了条件,使得工程项目成本控制真正地实现了系统化、全面化。BIM技术的系统统一信息服务,能实现信息实时共享,使得工程项目成本控制过程中的信息孤立现象消除,具体表现为成本控制总体情况的及时呈现、工程项目成本的实时计算等,非常有助于解决成本控制工作效率低、错误率高等问题,从根本上改变我国传统成本控制技术手段中工作人员单打独斗的局面。

然而,任何事情都有两面性,BIM在成本控制中的应用也不例外。从工程项目建设角度看,BIM是对工程项目建设全生命周期的一种数字表达,参与方众多,根据参与程度不同,有直接参与方和间接参与方之分,其中,直接参与方包括业主、设计单位、监理单位、施工单位、运营单位以及材料供应商,间接参与方则包括政府部门、社会公众、银行、保险机构及其他,而各项目建设参与方所产生和需要应用的信息累加起来便是一个庞大的数据库。从工程项目成本角度看,BIM应用全过程中产生的基础数据库主要有三大类,即BIM数据库、价格动态数据库和企业定额数据库。其中,BIM数据库是具体项目海量数据创建、承载、管理、共享支撑的管理平台;价格动态数据库是动态数据收集、分析和共享的结果,这些动态数据主要是基于互联网的材料、机械设备、人工等;企业定额数据库即企业消耗量指标数据库。在BIM数据库中,有的信息由于不同项目参与方在项目建设过程中管理方法和目标不同的,因而类型不相同;有的信息由于是两个或两个以上参与方共同参与某一相同过程而产生的,因而类型相同但用途不同;还有的信息由于是出于备份管理及报告等原因而产生,因而类型相同且用途也相同。综合以上描述,在BIM数据库中,工程基础信息数据众多,信息类型复杂,且信息重复、信息叠加及信息模糊等现象普遍存在,使得工程项目在实际建设过程中很容易发生信息模糊和信息误用,影响着工程项目的成败。不仅如此,在与BIM数据库并称三大基础数据库的价格动态数据库和企业定额数据库中,也包含了庞大、复杂的信息,且一直处于不断变动的状态。综合以上描述,BIM平台中集成了与成本控制相关的庞大、复杂、连动的数据,如何更有效的利用这些数据的问题成为工程项目成本控制需要解决的主要问题。

作为大数据处理常用方法之一的数据挖掘技术,能够实现有效信息的准确提取,并且能将这些信息运用到预测、分类及关联等领域。数据挖掘所具备的处理海量数据的特有能力正好可以用来解决BIM成本控制应用中数据利用效率低下的问题。数据挖掘技术与工程项目成本控制的结合研究也早有前人涉足,因此,为了取得数据挖掘技术与成本管理理论结合的最佳效果,实现现代工程项目成本控制中以最低成本完成工程项目的建设目标,聚集数据挖掘、BIM、成本控制三者之间的契合点,运用数据挖掘对BIM工程项目进行成本控制研究是成本管控研究领域的一个新方向。

二、数据挖掘技术概述

数据挖掘概念始于国外,广义上的数据挖掘指的是数据知识的发现,是对大量数据的高度概括和抽象表达,即应用一定原理的科学算法,寻找大量数据中科学规律的技术,具体步骤如图1所示。

图1 数据挖掘步骤流程图

在实际应用过程中,数据挖掘的过程一般都是通过一定原理的科学算法来实现的,数据挖掘的主要算法总结如下:

(一)聚类分析算法

聚类分析就是将对象集合分组为多个类似对象簇的过程,聚类分析算法有很多,具体见表1。

表1 聚类分析算法分类

序号算法分类代表算法1基于分割的聚类分析K-均值法、Clara法2基于层次的聚类分析BIRCH法、Chameleon法3基于密度的主要分析方法DBSCAN法、DENCLUE法等4基于网格的主要分析方法STING法、Wave Cluster法及CLIQUE法5基于模型的主要聚类分析方法COBWEB法、竞争学习和自组织特性映射等。

(二)数据总结与预测方法

数据挖掘中的数据总结方法主要是根据概率论与统计学的原理发展而来,包括回归分析、线性回归预测、敏感性分析等等,在实际应用中,根据数据挖掘主题的不同,相应选择应用。

(三)分类分析算法

分类分析算法即是通过技术特点将数据分类,具体包括决策树类、Bayes类、基于关联规则类以及利用数据库技术类等算法,具体见表2。

表2 分类分析算法分类

序号算法分类代表算法1决策树分类C4.5法、SLIQ法和SPRINT法2Bayes类分类NB法和TAN法3关联规则类分类CBA法4数据库技术类分类MIND法和GAC-RDB法

(四)关联规则分析算法

关联规则分析算法的作用是找相关性,其原理主要是频集理论,关联规则挖掘分析法的主要算法有APRIORI、APRIORITID及FP-growth等。其中,APRIORITID算法是APRIORI算法的改进方法,FP-growth算法比APRIORI算法高了一个数量级但不适宜于大型数据库。

(五)异常分析方法及其他

异常分析算法主要以从检测孤立点为任务,即从大数据集合中找出非常规数据,异常分析算法的分类也有很多,具体见表3。

表3 异常分析算法分类

序号算法分类代表算法1基于距离原理的嵌套循环算法、索引算法、单元算法2基于统计原理的确定替代分布算法、固有替代分布算法、混合替代分布算法3基于密度原理的以聚类算法为基础4基于偏离模型原理的OLAP技术、序列技术

此外,其他方法还包括基于模糊数学及其模糊逻辑理论、遗传算法等的具体计算方法。

三、国内外BIM工程项目成本控制

BIM,即Building Information Modeling,建筑信息模型的缩写,简单的可以理解为借助了计算机辅助技术而进行的建筑信息管理,BIM工程项目成本控制是建筑信息管理的一部分。BIM的发展可以理解为一个从1D发展到nD的过程,发展到4D的时候加入了进度控制目标,发展到5D的时候加入了费用控制目标。鉴于国外工程项目从设计到施工基本一体化的现状,BIM在国外的发展相对于国内较快,基于5D的应用相对成熟,表现出的是已投入应用的软件,例如Visual软件系列(美国Innovaya公司)、Vico软件系列(美国Vico公司)ITWO软件(德国RIB集团)等等;2003年,BIM理念引入国内,经过了若干年的应用和探索,虽然起步较晚,但也有了一定的发展。在理论方面,研究课题已深入到动态监控、设计概预算、全过程管理、API接口、IFC标准等方方面面。在应用上,基于BIM的工程建设项目策划、设计、招投标、施工、竣工及运营等各阶段的已有实际案例,更加值得一提的是,专业的BIM 咨询公司也已出现。在BIM工程项目成本控制领域,则表现为与此相关的软件的出现和推广,其中以广联达BIM-5D软件、斯维尔BIM-5D软件为代表。综合国内外BIM工程项目成本控制研究现状可了解到,基于BIM的工程项目成本控制在国外已得到了实现应用,引入国内后,针对工程项目实际情况而进行的关于开发、连接、实现、功能等方面的研究也层出不穷,但在BIM工程项目成本控制功能与应用面不断扩大,大数据不断集成的同时,与数据挖掘理论相结合的研究却一直停留在初始阶段。

四、基于数据挖掘技术的BIM工程项目成本控制应用

基于数据挖掘技术的BIM工程项目成本控制应用,一方面以实现项目成本的计划值为目标,具体表现为通过科学算法实时监控成本数值,如果发现超出计划值,则在最短的时间内采取行动,从而保证实际成本始终保持在计划内。另一方面,是将工程项目的成本控制效果做到最好,将预算人员、相关工作人员从烦琐算量、核算、分析等工作中解救出来,从而达到节约资源、建设低碳社会的目的。主要的体现是通过数据挖掘算法来实现聚类定位、价格预测、风险细分及关联规则四大功能。值得注意的是,工程项目成本控制全过程的各阶段并不是相互独立的,因而数据挖掘功能分析具有相对性,其作用并不只是仅仅停留在工程项目建设的某一阶段,而是贯穿于工程建设的全过程,同一功能既能是企业工程项目历史数据的分析,又能是企业待建项目建设阶段的管理分析。

(一)工程项目成本定位

聚类分析算法运用的主要作用是工程项目类型聚类,运用企业历史数据中工程项目的工期长度、建筑面积、设计变更率、成本超支额等特征数据作为聚类分析的特征值,将工程项目聚类为若干个簇类,根据各簇类的成本控制难度情况分别制定不同的有针对性的成本控制方案,并对照聚类的结果对待建项目进行归类,从而形成待建项目的初步定位,借此把握工程项目成本控制的基本方向,为工程项目的具体成本控制计划做参考的模型。

项目投资决策阶段,相关人员下达聚类开始指令,设定好聚类分析特征指标后,BIM平台首先从企业历史项目数据库中提取开工时间、竣工时间、工期长度、建筑面积、设计变更率、初期图纸完整度、成本超值额等特征的数据值,并对与成本超值额小于等于0,或者数据搜集不完整的项目进行删除、赋值等数据预处理操作;然后,根据相关人员输入的聚类簇数目要求进行算法的计算过程;最后,根据聚类计算结果进行对各簇类项目特征分析,并根据待建项目特征与各簇类项目特征的对比分析,提供相应的参考建议。值得注意的是,相关工作人员在开始进行聚类定位分析的时候可能对聚类簇数的把握不是很准确,所以得出的聚类结果特征性不分明或意见参考性不大,相关人员根据自身经验对聚类分析结果和参考意见可用性进行大致判断,可以选择重设聚类个数,重复聚类过程,得出更准确的结论,也可以选择接受待建项目成本控制规划。

(二)价格预测

价格预测是指基于设计阶段工程项目相关价格数据统计的基础上,对工程项目施工阶段相关价格进行数据挖掘预测,从而为成本计划提供准确参考指数。工程项目的建设过程中少不了人才机的使用,人才机的价格及其变化对工程项目的成本有着直接的影响,于是,对工程项目涉及的相关价格进行分析、预测是设计阶段必不可少的成本控制流程。

设计阶段,相关人员根据自身经验及理论判断设定好与建筑材料价格相关的极可能具有相关关系的两个或若干变量指标后,BIM平台迅速从价格数据库中提取出相应指标数据,自动将指标统计值的趋势进行对比,并对它们的关系进行初步假设,然后,运用一元回归分析、多元回归分析等模型对它们之间的假设相关关系进行验证,若猜测成立,则通过变量中发展趋势固定或比较好确定的变量值代入相应的相关关系函数,计算出不确定变量的参考值,从而为相应建筑材料的价格发展趋势提供参考建议。若猜测不成立,则返回给相关工作人员进行变量指标的重新选择。

(三)成本控制风险细分

风险细分是指在分析成本超支风险因素的基础上,进一步深度挖掘风险因素之间的内在联系,以达到将相关风险进行分类的目的,从而杜绝风险之间相互影响的现象,最终确保风险控制的精准性和有效性。进行阶段性成本细项数据记录的宏观分析能挖掘出成本超支的内在原因,帮助相关工作人员了解项目实施过程中真正的风险所在,并自动提供成本控制的相关改进意见参考,在便于及时纠偏的基础上,尽量避免下阶段成本超支情况的再发生。

施工阶段,当系统中实际记录的成本细项超出已设定的计划值时,系统自动将该记录标记为异常数据,并锁定该异常数据的发生原因及风险类型等属性,例如当实际施工工程量比计划工程量大时,系统会将该数据进行标记为异常数据,并附加发生原因为工程量偏差及风险类型属于技术风险等。当工作人员开始风险细分操作时,系统自动提取出所有的成本数据记录,经过数据预处理后,依照分类分析算法步骤进行细分分析,并将分析结果与纠偏建议反馈给相关工作人员。

(四)成本超支事件项集关联分析

关联规则分析具体是指通过工程项目成本数据的关联规则分析,找出容易出现成本超支事件项集之间的频度关系,从而为后一阶段的工程项目成本控制或企业的其他工程项目成本控制提供信息参考。建筑信息模型中,工程项目信息中的各字段之间(建筑面积、工期、造价、安全级别、质量级别等之间)可能存在着很大的相关关系,通过数据挖掘关联规则分析算法,能够实现成本超支事件项集关联分析,为后一阶段的工程项目成本控制或企业的其他工程项目建设提供参考。

竣工结算阶段,相关人员下达关联开始指令,设定好关联分析特征指标后,BIM平台首先从企业历史项目数据库中提取建筑面积、工期、造价、安全级别、质量级别、工程项目种类等属性数据,并对与成本超值额小于等于0,或者数据搜集不完整的项目进行删除、赋值等数据预处理操作,然后,BIM平台开始运行关联规则算法的计算过程,得出关联规则结果,并根据相应的结果提供相应的参考建议。

五、结论

BIM技术的应用本质是运用所有相关数据的集成进行工程项目全面、系统管理,大数据的集成在为工程项目管理工作提供统一、全面信息服务机制的同时,也不可避免地产生了大数据利用效率问题。基于数据挖掘技术的BIM工程项目成本控制应用能够深度挖掘建筑信息模型中的大量信息,实现工程项目成本定位、价格预测、风险细分和成本超支事件项集关联分析等功能,在事前定位、预测,在事中发现偏差、纠正偏差,在事后分析成本超支源事件的全过程、全方位地对工程项目成本进行管控,在确保成本控制效果最佳、资源节约、低碳环保方面具有现实意义。

猜你喜欢
聚类关联数据挖掘
基于数据挖掘探讨慢性肾衰竭处方规律
基于数据挖掘和海流要素的船舶导航改进研究
基于数据降维与聚类的车联网数据分析应用
基于模糊聚类和支持向量回归的成绩预测
奇趣搭配
拼一拼
基于密度的自适应搜索增量聚类法
软件工程领域中的异常数据挖掘算法
智趣
基于R的医学大数据挖掘系统研究