孙淑生,刘 丹(武汉科技大学 管理学院,湖北 武汉 430081)
基于大数据的工程项目投标决策风险管理研究
孙淑生,刘 丹
(武汉科技大学 管理学院,湖北 武汉 430081)
建筑行业的数据信息呈爆炸式增长的同时,承包商在工程项目投标决策中要考虑的风险因素也不断增加,但施工企业的信息管理水平没有跟上时代的脚步,对汹涌而来的海量数据无从下手,导致资源浪费、风险控制不当、投标失败等严重问题。大数据时代的到来,为施工企业在工程项目投标决策过程中的风险控制提供了可靠支持。在现有的工程项目投标风险管理模型基础上,从承包商角度出发,利用大数据技术对数据进行预处理,结合数据挖掘决策树算法筛选出了有效的风险信息,创建了工程项目投标风险评价指标体系,以实际工程项目为案例,论证结果表明,能够有效帮助承包商量化风险,提高风险识别的准确度。
大数据;投标决策;评价指标体系;风险管理
建筑业作为目前企业规模最大、过程最为复杂、数据量最多的行业,但由于其特殊性,相比于其他同等规模的行业,也是“最没有”数据的行业。建筑行业管理创新能力较弱,行业转型升级困难重重,在信息化、互联网、大数据的运用方面都有待革新,这与行业的性质也有一定关系。建筑行业的产品生产过程复杂性大、周期长、涉及的物质资源广泛,导致互联网、大数据技术等转化为生产力的难度巨大。这也大大降低了技术对行业变革的冲击,使保守势力得以长期掌控行业。因此,从承包商的角度出发,探讨如何将海量数据转换为有效的决策依据是非常有意义的。
IBM公司出版的《理解大数据》一书中,按照大数据的三个特征即数量、类别和速度来解释大数据。麦肯锡全球研究所指出,大数据应该是“通过传统的软件工具无法实现对实时筛选、管理和分析的数据集合”。本文将大数据定义为:以信息技术为基础,在人类学习、工作、生产生活等行为中产生且被记录的海量、多样、快速、真实的数据,构成的一个完整的数据系统。大数据的核心是从数量巨多、类别多样、增长迅速、真实准确的数据中挖掘有用的信息,实现数据驱动科学决策。
投标决策的主体是施工单位,指承包商在对工程承包市场、招标项目信息、招标公司等方面通过调查分析后有了充分了解的前提下,进行系统分析后作出选择,最终找出最适合本公司的投标项目或者最佳投标方案。投标决策是施工企业运营的重要组成部分,投标工作对施工单位有着十分重要的意义,它是公司实现经营目标的保证,是公司获取经营利润的前提,也是公司在竞争中获胜的关键。管理者作出决策的主要依据就是对积累的历史经验数据进行整理、分析,而大数据处理技术正是服务于此类海量数据的分析过程。收集数据只是大数据处理的前提,但是如果只是数据堆积,则不能体现数据的价值。大数据的核心是将对生产管理活动有用的知识信息从规模庞大、种类多样、高速增长的数据中提取出来,辅助管理者们进行分析决策,满足不同的工作需求[1]。大数据强大的数据集成管理、分析处理和可视化处理技术为管理者提取有用信息提供了有力的技术支持。长久以来,诸多学者针对大数据处理技术的运用和投标决策过程中的影响因素作出了许多研究。Fatos Xhafa[2]分析了大数据时代的到来对人们生活的影响,指出知识隐藏在数据中,通过专家评审并给出意见书,认为从大数据的生成到维护,大数据的知识可以建立在一个系统中,使管理数据的寿命周期等相关问题得以解决。Ming Lu[3]针对工程问题数据计算量大的问题,利用PERT网络技术,重新测算建设工程工期风险,在计算量和评价准确性等方面都均有显著改进。学者S.H Han[4]、Bakker[5]在综合运用信息网络技术和风险管理方法这一领域也进行了相关研究。郭鹏等[6]将灰色评价与模糊数学相结合,形成风险综合评价方法,这种方法的特点是针对专家评判信息的模糊性与灰性,运用聚类理论得出指标灰色统计量,通过创建项目风险模糊隶属矩阵运算得出相关项目的风险评价等级。胡艳妮[7]以独特的角度考虑问题,采用AHP方法和改进的两两比较判断方法,从内、外部风险对投标活动进行考察,并对之前的方法进行了改进,建立一种定量的投标风险评价方法。
工程项目日趋复杂化,其全过程中出现的风险因素越来越多,在预测其多变性、不确定性等方面的难度也越来越大,且工程项目各个阶段所出现的风险又是相互影响的,工程项目投标决策阶段作为项目的启动阶段,必须做好风险管理工作[8]。大数据风险评价指标体系的建立与风险管理的第一阶段风险识别有着密切的联系。指标体系是在大数据处理后的结果,风险识别是对大数据处理的结果进行初步判断。
信息技术在建筑行业的应用不断深入,结合自身运营的业务范畴和发展需求,企业会建立不同的办公自动化平台和业务处理系统来存储业务数据资料。在激烈的市场竞争中,管理者需要从这些不同的系统平台中筛选出有效的数据信息进行分析,大数据分析和数据挖掘技术可以把这些历史数据进行归纳、总结和补充,结合计算机技术,建立操作方便的风险决策系统,如图1所示。
(一)数据仓库的建立
数据仓库是面向主题的、集成的、具有时间特征的、稳定的数据集合,用于支持经营管理中的决策支持过程[9]。数据仓库是许多不同数据源的信息集成,这些数据源本身有可能就是一个完整的数据库,因此数据仓库对数据挖掘技术的要求更高。以企业的立场出发,数据仓库涵盖了多个部门的数据信息。数据挖掘的任务是在现有的数据基础上发掘新知识,建立数据仓库能够将减少数据挖掘过程中的阻碍[10]。
投标项目数据库的建立以大数据的收集为基础。投标工作涉及到多个方面,积累和现有的数据大多杂乱无章,且承包商对日常工作中的数据积累不够重视,导致这些大量数据的浪费。要建立稳定、有效的数据库系统,必须先将这些数据信息进行整理。横向划分为组(包括企业自身、竞争对手等),纵向列出项目属性(包括项目名称、项目合同信息、招标业主、类型、规模、工期等),将数据以表的形式存储起来,如表1所示。企业内部数据源主要是企业自身多年工作的数据累积,一般来自各部门的业务处理系统、信息处理系统、资源规划系统和客户管理系统。企业外部数据包括竞争对手信息、行业市场信息等。行业市场信息可以从相关部门或网络平台获取,竞争对手信息较难获取,可以向第三方咨询公司购买或组织调研小组进行专项调查。各项目的风险影响因素又构成子数据库,对于企业积累的历史数据,可根据项目投标决策阶段的风险研究,结合项目在施工过程中的风险变化,进行风险重要性分析,总结针对各项风险因素的有效应对措施。
(二)数据的划分及筛选
大数据的分析分为两个阶段:一是对数据仓
库中的信息进行初步提取筛选,缩小分析范围;二是运用数据挖掘算法进行准确处理。投标项目的基本信息数据属于结构化数据,对于结构化数据的挖掘,必须以一个专业领域的、满足关联规则的数据仓库为前提,结构化数据应符合的关联规则如图2所示。而投标项目的风险影响因素属于非结构化数据,对于非结构化数据的挖掘,可采用类似文献关键词检索技术进行分类管理。
数据预处理阶段,通常包括三个重要的数据操作:抽取、转换和装载。数据的抽取要明确数据仓库需要什么样的数据;数据转换是为了消除数据在类型、格式、质量等方面的差距,将数据进行归一化;数据装载的过程中应注意数据仓库系统同业务不能在同一个数据库系统中,以免影响系统的额性能。数据预处理的最终目的是结合企业拟投标项目的基本信息,排除关联性不大的项,初步筛选出类似工程项目,基本筛选条件为:工程类型相同;本次竞标活动中的参与者。按照企业内部、企业与竞争对手之间的关联进行划分,以缩小数据挖掘范围,能够更准确地找出有效的信息。
数据挖掘分析阶段,主要是对非结构化数据进行分析,常用的数据挖掘方法包括关联性分析、聚类分析、异常发现和分类发现等,工程项目投标风险因素的筛选首要工作就是对风险进行归类,运用分类发现法进行数据挖掘。分类模型常用的算法有统计分析、决策树法、BP神经网络等[11]。决策树算法是数据分类器中应用最为广泛的一种算法,在处理数据的过程中,结合树状结构,将数据按照类别划分为不同的树干和枝叶,生成决策树。数据元组的类别归属属性通过决策树的每个分枝来体现,继而从每个分枝中提取属性,建立数据关联规则。树根作为整个决策树的根节点,树枝表示下一阶段的决策节点,每个决策节点对应一个问题或者决策,每个叶子节点表示一种可能的分类。
设{决策属性1=a,决策属性2=b,决策属性i=x}(i=1,2,…,n)为决策树从根节点到当前节点的决策属性集合,若当前节点对应的元组集合X中,按照类别的属性取值进行分组,得到的若干个互不相交的子集中存在子集Yk(Yk满足类别标 识属性=ck,k=1,2,…,m)中的元组占集合X元组总量的p%,则称p%为子集Yk对集合X的支持度。
决策树的创建过程:
(1)选取分类标识明显的属性作为当前决策节点,确定决策对类别标识属性的最小支持度的阈值α(0≤α≤1)。
(2)计算当前决策节点下每个决策属性的信息增益,取最大项作为决策节点,将训练样本数据集分成若干个子集。
(3)计算每个子集中各类别的标识属性值在该子集中支持度,过滤掉低于最小支持度α的元组。
(4)针对每一个子集,重复循环步骤(2)(3),直至最终的子集满足子集中所有元组类别相同、该子集是遍历了所有的决策属性得到的或者子集中剩余的决策属性已经无法进行划分等条件之一。
(5)确定叶子节点,生成决策树,将决策树中规则可信度低于最小可信度β所对应的分枝删除。
在项目投标风险因素分析的过程中,将数据预处理的结果进行整理,以“项目所属公司”作为决策树根节点,以风险损失度值作为标识属性。构建的决策树如图3。
对于项目风险影响因素,由于建筑项目的相对独立性,不同的项目即使在相同的情况下,面临的风险因素也不尽相同,因此,在风险评价指标体系的建立过程中,要充分考虑对目标项目的适用性。例如,对某工程项目的经济风险类别进行挖掘,样本训练集中共有500个元组,分为经济风险“很高”、“较高”、“一般”、“极低”,对应的子集Y1、Y2、Y3、Y4中元组个数分别为130、260、70、40,设最小支持度阈值α为10%,则经济风险为“极低”的支持度为40/500=8%<10%,因此经济风险发生率“极低”的类别标识属性将被舍去。继续分析经济风险类别下的影响因素,对各影响因素按照风险后果划分等级并赋值,运用公式风险值=影响因素发生概率×事件后果,设置阈值,根据计算结果舍去低于阈值的影响因素,剩下的就是需要重点分析的风险因素。
(三)数据挖掘结果的解释
数据挖掘中的决策树算法,是根据历史数据,先由根部开始发散,构建决策树,再从底层向上筛选计算,对风险因素进行排序,这是一个定量分析的客观过程。对项目投标风险数据进行挖掘筛选的最终目的,是要找出有用的风险决策信息,为了让企业能够了解最终的结果,要组织专业人员对结果进行进一步的处理,即结合定性分析,通常表格的形式来说明。通过对工程项目投标海量数据平台处理分析后,得出项目投标风险一级指标有4个:经济风险、行业风险、公司风险和项目风险。将这4个一级指标作为重点挖掘的数据,继续筛选得到各一级指标下的子集,如表2所示。
桂林奥林匹克花园世纪华庭工程概况:该项目地处桂林西城新区,毗邻新市政府。周边自然风光较好,东临鲁湖,西接骑马山。开发商为世纪家园房地产开发有限公司,项目投资金额约50亿,规划占地面积约为7.28万平方米,建筑总面积达180万平方米,计划入住人口4万左右。项目内配套建设多种公共设施,如酒店、商圈、幼儿园等。
(一)项目投标决策风险确立
根据桂林奥林匹克花园世纪华庭工程的项目概况和市场调研结果,利用大数据构建项目投标风险评价指标体系,结合风险识别的科学方法,并参考专家们给出的意见,识别出该项目存在的主要风险。
1.建立数据库。湖北中进建设工程有限公司拟参与投标,投标工作小组整理公司内部、行业内以及竞争对手的数据信息,通过第三方数据软件,建立投标项目数据仓库。
2.对数据进行筛选分析。
数据预处理:目的是要找出类似工程的数据以供参考。该项目为住宅小区建设,输入项目类型为“住宅”,初步筛选出符合条件的元组,建立新的数据存储集合。
数据挖掘分析:根据表2列出的风险指标评价体系,建立优化后的决策树,从右向左进行推算,15分为阈值,即低于15分以下的分枝进行修剪。风险值=风险发生概率×事件后果严重程度,这里的事件后果严重程度是根据历史数据中,风险发生后对工程项目的影响,以费用的形式体现,按照费用高低来进行严重度划分,如表3。
通货膨胀的风险值:0.5×50=25
项目融资途径的风险值:0.3×90=27
供应商价格波动的风险值:0.2×70=14
利率浮动的风险值:0.2×50=10
地方保护主义的风险值:0.6×30=18
将各项风险影响因素的风险值与阈值15进行比较,可得供应商价格波动和利率浮动两项较低,在该项目的风险分析工作中可以少关注,不作为主要的经济风险因素。以此类推,行业风险、公司风险和项目本身风险的二级影响因素都可以生成相似的决策树。最终得到该项目需要重点分析的风险影响因素有:通货膨胀风险、资金来源风险、地域保护风险、投标竞争风险、政策变化风险、气候地址条件风险、公司信誉风险、管理水平风险、信息取舍失误风险、施工技术风险、工期风险、质量风险、安全风险等。
(二)项目投标风险分析
1.投标风险初步分析。根据识别出的风险因素,设计工程项目投标风险调查表。在企业内部选出5位专家,请各专家对桂林奥林匹克花园世纪华庭工程项目投标风险因素的可能发生率P、影响严重程度S、监测能力D进行排序打分,同时确定各风险因素的概率等级P0,如表4为某位专家的投标风险评价表。风险管理者收回并整理调查表,计算各专家的评分。
根据每位专家对相关项目工作经验、招标项目的了解程度以及自身知识的掌握程度等,赋予每位专家权威性权重值T,计算该项目投标风险初步评价汇总情况,见表5。
将每位专家评定的风险度加权平均得到本项目的投标风险度为0.5303,在区间(0.4,0.6]内,属于风险中等范围,可以正常参与投标,但接近上限值,因此要密切关注各投标风险因素的发展。
2.投标风险详细分析。资格审查环节结束后,承包商仔细研究招标文件,结合现场考察情况,作进一步的调查研究,在更加详尽的信息基础上进行项目风险分析,分析结果通过层次结构图来展现。
在行业内选择8位专家组成风险评价小组,其中5位是参加过风险初步评价的专家,另外3位是非本单位的行业内专家。专家小组分别对一级、二级评价指标进行比较打分,根据专家讨论分析的结果得到两两判断矩阵。
B1、B2、B3、B4对A:
C11、C12、C13对B1:
C21、C22、C23对B2:
C31、C32、C33对B3:
C41、C42、C43、C44对B4:
(1)B1、B2、B3、B4对A的排序权重向量为
w(2)=(0.29 0.2 0.07 0.44)T
且λmax=4,因此B1、B2、B3、B4对A的判断矩阵具有满意一致性。
(2)C11、C12、C13对B1的排序权重向量为
vB1=(0.648 0.122 0.23)T
λmax=3.005则
C.I.
C.R.
(3)C21、C22、C23对B2的排序权重向量为
vB2=(0.163 0.297 0.54)T
λmax=3.01则
C.I.(3)2=0.005,R.I.(3)2=0.58
C.R.
(4)C31、C32、C33对B3的排序权重向量为
vB3=(0. 222 0.333 0.111)T
λmax=3.0038则
C.I.(3)3=0.0019,R.I.(3)3=0.58
C.R.
(5)C41、C42、C43、C44对B4的排序权重向量为
vB4=(0.188 0.375 0.375 0.062)T
λmax=4,则C41、C42、C43、C44对B4的判断矩阵具有满意一致性。
整理评价结果,计算评价指标对评价集的隶属度,得到各隶属度矩阵为:
计算可得各指标对评语集Y的隶属向量分别为:
D1=W1·R1=(0.648 0.122 0.23)×
(0.353 0.222 0.206 0.152 0.067)
D2=W2·R2=(0.163 0.297 0.54)×
(0.383 0.233 0.249 0.118 0.017)
D3=W3·R3=(0.222 0.333 0.111)×
(0.160 0.261 0.122 0.123 0)D4=W4·R4=(0.188 0.375 0.375 0.062)×
(0.274 0.426 0.171 0.122 0.007)
进一步可得该项目投标风险评估的一级指标对评语集Y的隶属矩阵为:
由上可得到B1、B2、B3、B4对Y的隶属向量为
B=(0.29 0.2 0.07 0.44)×
(0.311 0.317 0.193 0.026)
二级指标的风险度求解:
×
(0.1 0.3 0.5 0.7 0.9)T=
(0.445 0.265 0.181)T
(0.1 0.3 0.5 0.7 0.9)T=
(0.559 0.187 0.338)T
(0.1 0.3 0.5 0.7 0.9)T=
(0.240 0.488 0.216)T
(0.1 0.3 0.5 0.7 0.9)T=
(0.303 0.361 0.306 0.407)T
一级指标风险度求解:
×
(0.1 0.3 0.5 0.7 0.9)T=
(0.363 0.329 0.239 0.332)T
此项目投标整体风险度求解:
P=(0.311 0.317 0.193 0.130 0.026)×
(0.1 0.3 0.5 0.7 0.9)T=0.337
3.桂林奥林匹克花园世纪华庭工程项目投标风险应对。通过风险评价模型分析得到的风险度值,对比各层次风险评估等级标准,我们可以得出该投标项目的风险水平,运用工程项目投标风险应对的方法,从而针对不同的风险水平采取风险应对措施。对于风险度很大的项目,承包商应持谨慎态度,以回避风险为主;对于风险度较大或一般的项目,承包商应重点关注,寻求帮助或分散风险来减小损失;对于风险度很小的项目,承包商可以选择风险自留或转移,例如以分包的方式将风险转移给下级分包商,通过购买工程保险的方式获得可能的损失补偿等。本项目编制的项目投标风险应对详细方案,见表7。
当前,大数据技术的不断发展,在不同领域的成功运用为建筑行业提供了有效的经验支持。正是由于学者们对大数据技术的探索和研究,推动着建筑行业走向信息化管理时代。本研究基于大数据的工程项目投标风险管理对于帮助项目决策者作出最合适的风险管理决策有着积极可靠的现实作用,同时建立大数据风险评价指标体系也有助于企业进一步实现信息化管理,可降低风险带来的损失。虽然大数据工程项目投标风险评价指标体系能够为承包商风险管理提供基础,但实际操作中工程项目可能面临的风险因素数以万计,且类别多变,通过数据挖掘算法得到的评价指标仅能代表小部分,尤其是对于工程技术复杂、规模大、投资巨额的项目,其风险控制工作更加困难,就需要更完善、更全面的风险评价指标体系,有待进一步研究。
[1]梁吉业,冯晨娇,宋 鹏.大数据相关分析综述[J].计算机学报,2016(1):1-18.
[2]Fatos Xhafa. Big Data knowledge discovery[J]. Knowledge-Based Systems, 2015(1):79.
[3]Ming LU. About Risk Simplified CPM/PERT Simulation Model[J]. Journal of Construction Engineering and Management, 2013(3):219-226.
[4]S.H Han, J E Diekmann. Making A Risk-based Decision for Overseas Construction Projects [J]. Construction Management and Economics, 200l,21(9):765-776.
[5]Bakker K.D, Boonstra, A., Wortmann, H. Does Risk Management Contribute to IT Project Success? A Meta-analysis of Empirical Evidence [J]. International Journal of Project Management, 2010,28(5):493-503.
[6]郭 鹏,施品贵.项目风险模糊灰色综合评价方法研究[J].西安理工大学报,2005(1):106-109.
[7]胡艳妮.工程项目风险识别与分析方法探讨[J].现代商贸工业,2010(21):46-47.
[8]崔 阳,陈勇强,徐冰冰.工程项目风险管理研究现状与前景展望[J].工程管理学报,2015(02):76-80.
[9]李海强.依托大数据解决供应链企业信用贷款问题的研究[D].上海:华东师范大学,2014:33.
[10]崔小委,吴新年.大数据应用促进大数据产业落地[J].科技管理研究,2016(2):203-207.
[11]金澈清,钱卫宁,周敏奇,等.数据管理系统评测基准:从传统数据库到新兴大数据[J].计算机学报,2015(1):18-34.
(责任编辑 王婷婷)
Risk Management of Project Bidding Decision-making Based on Big Data
SUN Shu-sheng, LIU Dan
(SchoolofManagement,WuhanUniversityofScienceandTechnology,Wuhan430081,Hubei,China)
While the data of the construction industry shows an explosive growth, contractors should consider more factors when they make decisions about project bidding. However, the outdated information management of construction enterprises leads to amounts of data can’t be disposed, and even more serious problems, such as a waste of resources, improper risk control, bidding failure, etc. The big data provides support for construction enterprises to control risks in the process of project bidding. Based on the existing project bidding risk management model, the thesis utilizes the big data technology to preprocess information. Decision tree algorithm of data mining is used to select effective risk information. And then, the project bidding risk evaluation index system is created. With the example of practical engineering project, this paper proves the evaluation index system can help the contractors quantify risks effectively, and improve the accuracy of risk identification.
big data; project bidding decision-making; evaluation index system; risk management
2016-11-20
孙淑生(1968-),女,黑龙江省齐齐哈尔市人,武汉科技大学管理学院管理科学与工程系教授,博士,主要从事工程项目管理研究; 刘 丹(1991-),女,湖北省荆门市人,武汉科技大学管理学院硕士生,主要从事工程项目管理研究。
C931
A
10.3963/j.issn.1671-6477.2017.02.0002