杨志勇,申映华,霍腾飞,吴斌堂
建筑业是国民经济的支柱产业,是一个重要的物质生产部门。我国建筑业增加值约占国内生产总值的7%,建筑业总产值是固定资产投资总额的2/3,建筑业总就业人数达4000多万人[1]。因此,在今后很长一段时间内中国建筑产业的发展情况很大程度上影响着中国经济发展的速度,以及中国的就业等社会民生问题。但是目前,我国的建筑产业整体竞争力不足,与发达国家相比有着不小的差距。在《美国工程新闻记录》(Engineering News-Record,简称ENR)发布的2010年度国际承包商225强榜单上,美国上榜企业为20家,其海外营业总额为497.3亿美元,仅仅略低于中国54家企业的海外营业总额[2]。因此,分析影响建筑产业竞争力的因素,预测省域建筑产业竞争力,提高建筑产业竞争力,对于提高我国整个建筑行业竞争力具有重要的理论和现实意义。
本文将借鉴波特的竞争优势理论[3],依托金碚教授提出的“因果分析范式”[4],将竞争优势和竞争结果加以区分,建立中国省域建筑产业竞争力评价指标和竞争力度量模型,并运用PCA与SVM相结合的方法实证分析预测中国省域建筑产业竞争力。
根据数据的可获得性,结合中国省域的建筑产业竞争力状况,选择了生产经营效益;产业生产效率;生产要素;需求状况;辅助产业;产业集中度和创新因素7个一级个指标22个二级指标作为评价地区建筑产业竞争力评价指标体系。其中产业经营效益及产业生产效率两个指标视为竞争结果,其余5个一级指标视为竞争优势形成的原因。具体如图1。
由于我国各地区建筑产业主管部门统一受中央主管部门的管理,各地区根据具体情况,将中央主管部门的法律、法规、规章等细化,用于指导具体工作,加之各地区具有较强的地方保护主义,因此,政府在影响区域之间建筑产业竞争力的作用不明显,在建立竞争优势评价指标体系时不考虑政府行为的影响。
图1 中国省域建筑产业竞争力评价指标
图1构建的指标体系,全部数据可从2006~2010年中国统计年鉴获得,其中总承包企业特、一级产值比例、一级专业分包企业人均利润,是三个复合指标,其他19个指标为单一指标。根据29个省份(因数据缺乏,不含西藏、海南、香港、澳门、台湾5个地区)22个指标5年中的平均值,利用SPSS12.0软件的因子分析计算出的“七因素”主成分提取个数情况以及累计达到的贡献率见表1。
表1 主成分选取分析
产业经营效益、需求状况和辅助产业三个指标的第一主成分累计贡献率已经超过了85%;生产要素、产业集中度、生产效率和创新因素第一主成分的累积贡献率虽然未达到85%,但生产要素第一主成分的特征值为5.668,第二主成分的特征值为0.788,产业集中度第一主成分的特征值为1.463,第二主成分的特征值为0.537;生产效率第一主成分的特征值为1.359,第二主成分的特征值为0.641;创新因素第一主成分的特征值为1.682,第二主成分的特征值为0.318,因此,各提取一个主成分。
依据主成分载荷矩阵,分别写出生产经营效益、产业生产效率、生产要素、需求状况、辅助产业、产业集中度及创新因素的主成分表达式。
根据上述主成分表达式确定各省份生产经营效益、产业生产效率、生产要素、需求状况、辅助产业、产业集中度、创新因素综合得分状况,具体数据见表4。
产业竞争力是一个非常复杂的概念,涉及到许多的因素,对于竞争力的度量,目前在学术界还未形成统一的认识。通过对前文相关文献的阅读可以看到,国内和国外的学者和相关的研究机构对产业竞争力的概念定义以及评价标准不尽相同。但是通过归纳总结不难发现,其包含的内容主要有四个方面,一是市场占有率;二是财富收益率;三是资源利用率;四是可持续发展能力。这四个方面之间并非相互独立地存在着的,其中,财富收益率可以用市场占有率和资源利用率构成的某一函数来表示。由于“可持续发展能力”是一个动态变化过程的指标,本研究只针对同一时期的静态竞争力展开研究,因此,只采用市场占有率和资源利用率两个指标刻画产业竞争力。本文将借鉴刘炳胜提出的静态竞争力度量模型[5]:
该模型新签订的合同额代替市场占有率,用资本利润率代替资源利用率,这就有一定的局限性。本文考虑用生产经营效益代替市场占有率,用产业生产效率代替资源利用率。即使用:
作为建筑产业竞争力的度量模型。
支持向量机(Support Vector Machine,简称SVM)是在统计学习理论的基础上发展起来的新一代学习算法,它集成了对偶理论、凸二次规划、泛化性理论、核函数理论、最优化算法,稀松解和松弛变量等多项技术。SVM能较好的解决分类和回归问题,本文主要运用SVM解决回归问题。和其它神经网络相比,SVM在估计回归函数时具有以下三个独特的特征:第一,SVM用高维特征空间中的一组函数来进行回归。第二,SVM用风险最小化的原理来进行回归估计,风险运用Vapnik的非敏感损失函数来衡量。第三,SVM贯彻了SRM(结构风险最小化原理),即最小化由经验风险和置信范围组成的风险函数。
考虑给定的n个学习样本(xi,yi),xi∈Rd,yi∈R,i=1,2,…,n,线性回归的目标就是求回归函数:
式中,权重ω∈Rd,阀值b∈R,<ω·x>为ω与x的内积。在以往的学习算法中,优化目标是使经验风险即样本损失函数,然而统计学习理论指出,经验风险最小并不能保证期望风险最小,在结构风险最小化的目标下,线性回归方程(5)中的参数应该满足。
上式中的‖ω‖2/2反映了回归函数f(x)的泛化能力,C为惩罚因子。上式表明,结构风险最小化能够折中考虑回归函数的经验风险和泛化能力,因此回归函数具有更好的性能。本文利用SVM中的v-SVR进行建立模型。v-SVR是用参数v来控制支持向量的数量,n为训练样本个数。为求解(3)中的w和b,引入正的松弛变量ξ≥0和ξ*≥0,ε称为管道大小,它反映函数逼近的精确程度。将(4)式转化为最小化的原规划问题:
表2 标准化并提取主成分后的数据
引入参数αi,αi*,ηi,ηi*,β≥0构造Lagrange函数对上述优化问题进行求解:
为了最小化式(5),需要最小化变量ω,ε,b,ξ*i及最大化变量α*i,β,η*i,因此,可以得到以下4个方程,即:
求解上述问题,可得到回归函数式(10)。根据支持向量机回归函数的性质,只有少数(α*i-αi)≠0,这些参数对应的向量称为支持向量,回归函数f(X)完全由其决定。对于式中阀值b,任选一支持向量便可求出。
对于非线性问题,引入核函数K(Xi,Xj)代替样本向量的内积运算,实现数据空间到特征空间的非线性映射,并使低维数据空间的非线性问题转化为高维特征空间的线性问题。引入核函数后,式(10)变成如下形式:
在具体问题中,选择一个合适的核函数很重要,它可以提高支持向量机的学习效率。目前最常用的四种核函数:
(1)多项式核函数:K(x ,xi)=(< xi∙x > +1)q
(2)径向基函数核函数:
Ki(x ,x)=exp(-γ‖x-xi‖2),γ>0;
(3)二层神经网络Sigmoid核函数:
支持向量机形式上类似于一个神经网络,其输出是中间节点的线性组合,每个中间节点对应于一个支持向量,其结构如图2所示。
图2 支持向量机示意图
根据表4分别将各个省的生产经营效益与产业生产效率相乘得出对应省域的竞争力。将27个样本作为训练集,2个样本作为测试集,如表3所示。通过SVM的学习训练获得生产要素、需求状况、辅助产业、产业集中度、创新因素与建筑产业竞争力之间的映射关系。
表3 训练集与测试集
运用SVM进行预测研究时,所选用的核函数及参数很重要。通过实际操作发现,本研究选用径向基函数核函数:K(x ,xi)=exp(- γ‖x-xi‖2)效果较其他核函数更佳。
核函数中γ采用1/k=0.2(k为因素个数),其余参数均采用默认值。通过调整惩罚系数C和ν,将训练样本输入,进行SVM的学习,根据不同的参数C和v,形成不同向量机模型。本研究中用不同的四组参数学习形成了四种SVM模型,并在这四种模型上进行了测试,测试效果如表4。
表4 测试效果对照表
从测试对照表中可以看出,对于四组SVM模型,参数估计的MSE均属于较小的数。可决系数R2均为1,说明竞争优势对竞争力值的解释程度较高。广西和云南两个省的测试均取得了较好的效果。特别是在第三组c=16,ν=0.5参数下的测试效果较其他组更为精确,广西的偏差率5.7%,云南的偏差率为2.9%,两个省区的平均偏差为4.26%,均方误差为0.001041。可见SVM在竞争力的测试上取得了不错的测试效果,对竞争力有一定的预测能力。
本文在借鉴金碚教授的“因果分析范式”的理论基础上,将区域建筑处产业竞争优势及竞争结果加以区分,建立了中国省域建筑产业竞争力评价指标,采用了静态竞争力竞争力度量模型刻画产业竞争力。在此基础上,运用主成分分析与支持向量机相结合的方法定量地分析预测中国省域建筑产业竞争力。研究表明,PCA与SVM相结合的方法具有较好的预测效果,对省域建筑产业竞争力有一定的预测能力。在今后的研究中,可以方便地更新数据,根据各地区建筑产业发展优势对区域建筑产业竞争力展开预测研究。更具现实指导意义的是,各地区可以与其他地区进行竞争优势及竞争结果对比,找出本地区建筑产业在发展过程中存在的不足,有针对性地提高本地区建筑产业竞争力。
[1] 姚兵.建筑经济学研究[M].北京:北京交通大学出版社,2009.
[2] 赵志国.海外营业额居首中国那个企业跨步“走出去”[N].中华建筑报,2010-9-9
[3] 迈克尔·波特.国家竞争优势[M].北京:华夏出版社,2002.
[4] 金碚.中国工业国际竞争力—理论、方法与实证研究[M].北京:经济管理出版社,1997.
[5] 刘炳胜.中国区域建筑产业竞争力形成机理研究[D].天津:天津大学,2009.