基于案例推理模型的公路工程造价估算研究

2013-03-11 09:03肖丽红
关键词:案例库关联度修正

李 珏,肖丽红,黄 祺

(1.长沙理工大学交通运输工程学院,湖南 长沙 410004; 2.湖南交通职业技术学院,湖南 长沙 410132)

公路工程造价控制是工程建设管理工作重要组成部分,而其投资决策阶段的工程造价控制是公路工程造价控制的源头,它对建设全过程的工程造价往往其决定性作用。[1]公路工程项目特点涉及许多的不确定性因素,构成复杂,其工程造价计算繁琐,且具有动态性和较大的模糊性。有关数据表明,决策与设计阶段对工程造价的影响程度达到88%,项目前期投资估算的偏差和设计的不合理,是造成投资效益低下、“三超”现象屡禁不止的根源。[2]除此之外,公路工程前期准确估算可保证项目计划、时间安排和资源分配有效进行,因此,加强对公路工程投资决算阶段的研究具有重大意义。

一、基于案例推理模型的公路工程估算的建立

基于案例推理(case based Reasoning,CBR)是20世纪70年代末发展起来的一项人工智能技术,起源于认知科学中记忆在人类推理活动中所扮演的角色,是人工智能领域一种迅速而且有效的推理方法。[ 3]案例推理模型是利用以往类似问题的求解经验解决当前的问题。它首先通过检索已经解决好的问题集合(案例库)中与当前问题类似的案例,然后对此进行一系列的修改后,给当前问题提供合适解的一种推理模式。案例推理一般过程由检索、复用、修正、学习4个主要过程组成。[4]基于案例推理模型的工程估算是利用已完工程项目的资料建立案例库;同时对数据标准化处理,在检索阶段,首先对目标案例(待测项目)进行项目特征描述;然后从案例库中检索与之相似的旧案例,并对相似案例的待定结果进行修正,并把修正阶段分为修正I、修正II阶段,修正I阶段运用定量方法,通过对检索得到一系列相似案例重用,在目标案例特征属性值的基础上对其调整,弥补了该模型应用于工程估算的不足之处;修正II阶段为专家评价,确定当前案例的结果;学习阶段是对当前案例学习后并保存在案例库,以便丰富案例库。其实现流程如图1所示。

二、确定工程项目特征属性

公路工程主要特征在于它是建设在大地表面上的一种线性带状结构物,因此,其造价也体现了特殊性和差异性。其结构组成包括:路基、路面、排水结构物、公路特殊结构物(如隧道、桥梁、挡土墙等)以及防护工程。从实践中我们得知,公路工程的任何一个特征都会影响到总的工程造价,如果考虑所有的特征属性,尽管对案例的描述起一定的作用,但增加了案例检索的复杂性,甚至对案例库的聚类起反作用。[5]因此,为了避免选择工程特征属性的盲目性,本文结合公路工程实际的客观规律来挑选,尽量选取独立的因素。同时,为了方便后面的研究,我们把公路工程项目特征划分为二种:数值型、字符型 。综上所述,选取13个公路工程特性,可以比较全面的反映公路工程造价的情况。[6]公路工程项目特征如下表1所示。

图1 案例推理模型流程图

为了使估算的结果更加准确,所有使用的数据尽量采用工程预决算数据。对于数值类型数据的属性值直接采用原始数据表示;对于字符型的项目特征,把定性的数据定量化,在路面形式中,可以分为:沥青混凝土路面和水泥混凝土路面,分别取0.8和0.6;在地形特征中,可分为平原、微丘区、重丘区,这三种情况分别取0.2、0.5和0.8,所在地区工程特性的选取中,中国各个省份分为三种情况,分别取为0.3、0.6和0.9。当一条路的不同路段有不同的工程特性时,利用加权求和的方法。[6]

表1 公路工程项目特性

三、项目特征权重值

权重系数的大小反映案例相似性评估中各个特征属性的相对重要程度,取值将直接影响到评估结果的好坏。[7]由于公路工程各个特征在案例中所处地位不同,对案例性质的影响程度和所起的作用也不相同,因此公路工程项目特征权重值的分配和确定是进行案例匹配的重要基础性工作之一。传统的案例特征定权方法过分依赖于主观判断和经验,而运用粗糙集理论对特征属性权重系数的计算方法,可以克服传统方法的局限性,使案例相似性匹配更具有客观性,提高匹配精确度。[8]同时,在进行某一分类检索时,并且可以根据这种重要程度对各个相似特征属性的权重值赋值,删除某些没有起到预期作用的特征属性,提高案例检索的效率,因此,本文运用粗糙集方法确定公路工程特征属性的权重值。

把一个信息决策表系统表示为S=(U,A,V,F),其中U为非空的有限论域,表示在案例中所有案例的集合;A=C∪D(C∩D=∅)是非空的属性有限集,其中条件属性C为案例特征属性的集合,V为属性取值的集合。[7]在公路工程造价预测分析中,由于无决策属性,在信息系统处理中令D=C进行离散化。

基于粗糙集的案例特征属性权重计算步骤为:

(1)首先需对案例库中的数据预处理。采用Rough Set理论中连续属性的离散方法[8]对公路工程项目特征连续属性值进行离散化,转变为定性属性。其基本任务是通过选择适当的划分点将整个连续属性的值域范围化为一些离散区间,并且用不同的整数值代表每个子区间得属性值。

(2)计算各案例库特征属性的知识熵H(ai),并进行归一化后得出权值。在离散化的基础上,确定当前特征对案例的划分,特征ai划分为ρ

(1)

其知识熵计算公式:

(2)

根据特征属性的知识熵大小确定权重分配,归一化处理的权值计算公式为

wi=H(ai)/∑H(ai)

(3)

因此,权重的取值范围为[0,1-1/n],(n=1/|U|),符合权值的要求,当分类均匀的时候不确定性最大,权重也最大。当不分类就不存在不确定性,其权重为0,而权重为0的属性对造价几乎没有影响,可把该属性删除,达到了简约属性的目的,也减少了案例匹配工作。

四、检索相似案例

在案例推理系统中,目标案例以不完整或者模糊的信息出现,需要利用目标案例特征属性联想过去的源案例,即对案例库进行检索。在最初的检索结束后,需比较它们之间的相似性由此得出一些与目标案例相似的案例。现有的传统检索方法主要包括:最近相邻法、归纳法、知识引导法,以上三种方法都比较适合定性属性的检索,但对定量属性的检索不易完成,而且对于一些具有模糊型的定量属性的检索就更为困难。[9]考虑到影响公路工程造价因素众多,需要从总体上分析两个工程项目的相似性,结合灰色关联分析法对定量属性进行检索,开展了对公路工程项目的总体相似性分析。

由于案例库中的案例不尽相同,为了简化工作,首先对案例库中的案例进行粗选,其计算公式:w=n/m,其中m代表目标案例与案例库中案例属性并集属性的个数,n代表交集中属性的个数。在CBR系统中可令w=1时的案例可作为粗选结果。[10]

灰色关联分析法是分析系统中各个元素之间关联程度或相似程度的方法,其基本思想是依关联程度对系统排序。[11]进行关联分时,把目标案例的特征属性作为参考的数据列,参考的数据列常记为X0,X0={X0(1),X0(2),…,X0(n)},被比较数据列表示为Xi,Xi={Xi(1),Xi(2),…,Xi(n)}。对于一个参考数据列X0,比较数据列为Xi,可用下述关系表示各比较数据列与参考数据列的各元素差:

ξi(k)=

(4)

其中:ρ为分辨系数,ρ∈(0,1)。引入它可以减少极值对计算的影响,在实际运用中,应根据序列间的关联程度选择分辨系数,取ρ≤0.5最为恰当。

关联度是表示两个事物的关联程度,具体地说,关联度是因素之间关联性大小的量度,它可以定量地描述了各因素之间相对变化的情况,关联度计算式表示为

(5)

其中,ri表示数据列Xi与X0的关联度,wk表示第k个元素的特征权重值。关联度ri越大,表示目标案例与该案例的相似程度越高。对相似案例的关联度按大小进行排序,取阀值ζ=0.6,当相似案例关联度大于阀值时,保留这些相似案例,当相似案例的关联度小于阀值时,将其舍掉。

五、修正待定结果

经过相似案例的检索阶段,得到一些与目标案例相似的案例。由于检索后的结果并不能作为目标案例的解,因此,需把目标案例与相似案例的特征属性之间的值进行比较,根据特征权重值对相似案例的建议解修正,最后确定目标案例的解。

检索后得出几个相似案例的建议解,每个属性相似度可用目标案例的属性值与相似案例的属性值之间的比值表示,其计算式表示为

(6)

其中,ASi表示特征属性i的相似度,X0(i)表示目标案例属性值i,Xj(i)表示相似案例属性值i(j=1,2,…,n)。由于所选取的属性与公路工程造价都是正相关,属性i的误差率AERi表示为:

(7)

当目标案例与源案例的属性值完全一致时,ASi取值为1,每一个特征属性对公路造价的影响不同,因此,特征属性i的修正值ARVi为

ARVi=(wi×PS)×AERi=ICCi×AERi

(8)

其中,ICCi表示特征属性i对公路造价的影响大小,PS表示为相似案例的建议解。

对相似案例的特征属性的修正值进行求和,最后可以得出相似案例的修正解,其计算公式为

(9)

六、得出估算值

对相似案例的修正值进行分析,舍掉修正值偏离大的相似案例,根据相似案例的关联度,对修正后的结果进行加权平均计算,得出目标案例的估算值。

七、实例分析

本文利用文献[6]的23条已竣工高速公路工程的预决算资料,假设案例库由编号为E1~E22的实例组成,把实例E0作为目标案例,用它们对所建模型进行检验。首先运用索引机制进行粗选,检索出与目标案例有相同特征属性的实例,同时,为了方便比较,需把粗选后实例的造价建安费都换算为同一时期(2000年)的价格,结果如表2所示。

表2 已建高速公路工程特性和造价数据

由表2,可用U={E0,E1…,Es}表示案例集合,12个案例特征属性可以描叙为:C={X1,X2,,..,X12},对8个实例的定量属性进行离散处理,采用文献[8]的离散方法,利用MATLAB对属性特征值离散化,使其变为定性属性,离散后的结果见表3。

表3 离散化的工程实例特征属性表

如X1对案例库划分为U/IND(X1)={(E1,E2),(E3,E5),(E4),(E7),(E8)},由公式(1)、(2)得主线路程属性权重值,利用公式(3)进行归一化后得到特征属性权向量:

W=(w1,w2,…,w12)=

(0.1053,0.1053,0.0981,0.0810,0.1093,

0.0931,0.0972,0.0931,0.0891,0.0850,

0.0526)

由表2中的数据,运用公式(4),可分别得出目标案例E0与实例E1~E8元素差ξi,把ξi分别代入公式(5)可得出目标案例的关联度,r1=0.7665,r2=0.8010,,r3=0.7338,r4=0.6217,r5=0.7296,r6=0.5453,r7=0.6655,r8=0.6330,其关联度大小排序为:r2>r1>r3>r5>r7>r8>r4>r6。因此,其与目标案例匹配的相似程度排序为,E2>E1>E3>E5>E7>E8>E4>E6。取ζ=0.6,由于E6关联度小于0.65,将E6舍掉,保留E1、E2、E3、E4、E5、E7、E8作为相似案例。

由公式(6)、(7)、(8),对相似案例E1、E2、E3、E4、E5、E7、E8的工程造价建安费进行修正,可得出修正后分别为:RS1=1759.373,RS2=1694.60,RS3=1768.15,RS4=1850.34,RS5=1762.42,RS7=1780.48,RS8=1788.13。按相似程度从高到低排列,其修正前和修正后误差率如图2所示。

图2 相似案例的建议解修正前和修正后的误差率

由于相似案例E4的修正后的值偏离比较大,将其舍掉,由相似案例的关联度,对E1、E2、E3、E5、E7、E8的修正后的结果采用加权平均的方法,1759.373*0.7665/4.3294+1694.60*0.8010/4.3294+1768.15*0.7338/4.3294+1762.42*0.7296/4.3294+1780.48*0.6655/4.3294+1788.13*0.6330/4.3294=1756.84,从估算当前目标案例的工程造价建安费结果可以看出,证明了该方法的有效性。

八、结语

本文基于案例推理模型形成了一种对公路工程精确估算的方法,整个过程充分发挥了采用定量分析对数据处理的优势,克服了多指标因素相互关联的情况,从而准确地检索到相似案例,并对相似案例定量地调整和评价,提高了对公路工程造价预测的准确度,实例分析验证了本文模型的有效性。

[参考文献]

[1]林佑性.公路工程投资决策阶段造价控制的主要问题和对策[J].科技经济市场,2008(9):34-35.

[2]汪晓慧.基于案例推理的道路工程投资估算方法的分析[J].工程与建设,2009(5):745-747.

[3]王晓亮,刘西拉.基于事例推理系统中的模糊检索[J].上海交通大学学报,2007(11):1783-1787.

[4]武智鹏,陈立潮,黄波.基于案例推理的研究[J].科技情报开发与经济,2007(1):158-159.

[5]Marir ,F., and Watson, I. (1995). CBR efurb: Case-based cost estimation, Institute of Electrical Engineers (IEE), London, 513-515.

[6]张驰宇.高速公路造价快速估算模型与方法研究[D].西南交通大学,2006.

[7]李闻宇.基于事例推理的稿件刊发计划的建模方法研究[D].大连理工大学,2002.

[8]孙翎,张金隆,迟嘉昱.基于粗糙集的CBR系统案例特征权值确定[J].计算机工程与应用,2003(30):44-46.

[9]陈虹,毛红保.一种新的基于粗糙集的案例特征权值确定方法[J].西安工业大学学报,2010(30):402-405.

[10]苗夺谦,Rough set理论中连续属性的离散化方法[J].自动化学报,2011(5):296-302.

[11]张文领,姜韶华,刘国栋 .基于灰色关联分析的工程项目案例推理模型研究 [J].价值工程,2009(11):84-87.

猜你喜欢
案例库关联度修正
心血管外科教学案例库的建设及应用研究
Some new thoughts of definitions of terms of sedimentary facies: Based on Miall's paper(1985)
修正这一天
国内首个海事司法案例库正式上线
基于实践应用的基坑工程设计案例库建设研究
合同解释、合同补充与合同修正
中国制造业产业关联度分析
中国制造业产业关联度分析
沉香挥发性成分与其抗肿瘤活性的灰色关联度分析
MTI朝鲜语同声传译教学案例库建设研究