基于主成分分析法的新疆运输通道建设多指标因素影响分析

2020-12-14 01:52王伯礼WANGJinWANGBoli
物流科技 2020年12期
关键词:贡献率聚类新疆

王 晋,王伯礼 WANG Jin, WANG Boli

(1. 新疆农业大学 交通与物流工程学院,新疆 乌鲁木齐830000;2. 新疆维吾尔自治区交通运输厅规划设计管理中心,新疆乌鲁木齐830000)

(1. School of Transportation and Logistics Engineering, Xinjiang Agricultural University, Urumqi 830000, China; 2. Xinjiang Uygur Autonomous Region Transportation Department Planning Design Management Center, Urumqi 830000, China)

0 引 言

在中共中央、国务院已经印发《交通强国建设纲要》和国家“十四五”综合交通运输发展规划编制工作正在紧锣密鼓进行的背景之下,抓紧建立现代化综合交通运输体系已刻不容缓。作为保障不同区域或城市群之间相互往来的运输通道,在现代化综合交通运输体系中占据着重要的地位。建设便捷、高效、集成的运输通道,不仅能够促进区域经济稳步增长,而且能够在极大程度上保障和利于政治、文化、军事交流。针对综合立体交通运输通道的建设与发展,国内外诸多学者从多领域、多角度进行了不同程度的研究。

Xiaowei 等人从综合运输通道内乘客长途和低频旅行角度出发,采用分解模型研究综合运输走廊中旅行者的选择行为[1]。Zhi-Chun Li 等人解决了位于线性城市运输走廊中的铁路运输线的设计问题,以铁路线长度、车站数量和位置、车距和票价的组合为服务变量,提出了两个利润最大化模型,这些模型考虑了不同的公交定价结构(固定票价和基于距离的票价制度) 的影响[2]。Füsun Ülengin 通过关联分析确定土耳其主要运输方式的影响因素[3]。Godil Danish Iqbal 分析了客货运输量与碳排放之间的相互影响关系[4]。Litman T 研究了运输问题中的可达性影响因素。Michelle R,Oswald Beiler 分析了BosWash 都市圈的综合运输走廊建设问题[6]。以上研究虽然对运输通道的乘客出行选择和运输走廊道路运输线设计进行了研究,但多局限于单一运输方式。

当前国内研究者对运输通道的研究多结合路网规划建设布局、重要度联合交通区位分析和建立评价模型等层面展开。康文庆将重要度和交通区位融合,进行干线公路网规划布局研究[7]。杨海花从重要度联合区位法理论出发,对运输通道布局、交通节点选择和区位线进行了分析[8]。谭健妹、李涵等人对城市群客运结构和运输通道的评价指标做出了评价研究[9-10]。张铱莹对客运专线运输通道的分担率进行了研究[11]。夏倩引入效用理论对出行决策的三个阶段进行了分析,对特性变量参数建立MNL 模型,估计结果采用t统计量和似然率对模型进行了验证[12]。王伯礼分别从城市公路建设对区域经济影响和运输通道内交通基础设施建设对经济增长的贡献进行了分析[13]。

综合上述,国内外学者对运输通道的规划布局和运输方式等进行了研究,通过建模,系统分析了运输通道客运分担率和交通基础设施建设等对区域经济的影响,但较少从出行者决策和社会总体考虑运输通道影响因素。

1 基于多指标的通道建设评价体系建立

一般而言,便利的交通运输条件,会在一定程度上降低要素流动成本、扩大区域市场范围、促进区域产业合理布局,同时便利的交通条件本身就是区域经济发展的引力之一,它能够起到吸引经济资源的作用。影响运输通道建设的因素指标较多,宏观层面可能涉及国家政策方针、对区域交通基础设施建设的规划布局等,微观层面可能涉及建设运输成本、客货运输总量等。

为保证数据的可靠性,本文选取《新疆维吾尔自治区国民经济与社会发展统计报告》、《新疆统计年鉴》所列指标和数据,并将其归纳为三个方面指标:社会经济指标、交通运输指标、城市设施建设指标。具体指标如表1 所示。

表1 多指标体系建立

2 主成分分析法原理及模型建立

2.1 主成分分析法及模型建立

主成分分析法(Principal Component Analysis,PCA) 是将多个变量通过线性变换以选出较少个数重要变量的一种多元统计分析方法,是处理数据降维的一种方法。其原理是设法将原来众多具有一定相关性的指标,重新组合成一组新的互相无关的综合指标来代替原来的指标[14]。具体算法如下:

设有n个样本、p个评价指标,构建出客运服务质量评价指标体系的原始数据矩阵X为:

式(1) 中:xij为第i个样本对第j个指标的打分值:

2.2 主成分分析法计算步骤

(1) 建立评价指标,收集所需指标数据。

(2) 标准化。由于各指标的特征参数不一样,数量级有大有小,所以会存在指标的量纲不同,通常在计算之前须先消除量纲的影响,将数据标准化,也叫无量纲处理。设有n个样本观察值,用xij表示,i代表样本,i= (1,2,…,n),j= (1,2,…,p)代表指标,采用Z-score 法。

(3) 求相关系数矩阵R及相关系数矩阵R特征值、特征向量

各指标的贡献率亦即综合主成分线性表达式的权重系数。

(5) 确定综合主成分表达式

式中:ηi为各主成分对应的方差贡献率,按照各主成分对应的方差贡献率为权重计算,Fi为各个主成分表达式。

3 实例分析

中国新疆深处亚欧大陆腹地,并与多国接壤。跨境、跨区、区内运输通道成为新疆交通运输体系的典型特点和主体组成部分,也是交通强国新疆试点建设所确定的四大试点建设领域之一。其中,最为典型的是丝绸之路经济带核心区北通道、中通道、南通道,该三条通道横贯新疆全境,东联内地,西出北亚、中亚、南亚,在丝绸之路经济带核心区、交通强国新疆试点建设中居于主干线地位,也是当前和未来一个时期新疆运输通道建设的主要方向和重点。

为了更好地评定新疆区域运输通道建设的影响因素,结合新疆全域发展实际,本文收集2012~2018 年新疆区域运输主通道多项指标数据,应用主成分分析法,探寻新疆区域运输通道建设主要影响因素,并就新疆区域运输通道后续建设提出相关建议。

3.1 数据预处理与分析

(1) 原始数据标准化。利用SPSS25.0 统计软件,计算得出变量的相关系数矩阵R,计算R的特征值和贡献率及累计贡献率。如表2 所示,依据特征值大于1 且累计贡献率大于85%的原则提取2 个主成分,第一主成分的贡献率为83.4%,第二主成分的贡献率为9.1%,2 个主成分的累计贡献率92.5%,说明两个主成分即可表征所有指标的92.5%的信息,满足要求,故提取两个主成分。

表2 总方差解释

提取方法:主成分分析法。

(2) 主成分载荷分析

由表3 可以发现GDPX1()、城镇居民人均可支配收入X2()、农村居民人居可支配收入X3()、社会消费品零售总额X4()、公路里程(X13)、铁路客运量X6()以上6 个变量在第一主成分上具有较高载荷,载荷值均在0.95 以上,能较好地反映指标信息。民用航空里程(X14)、道路长度(X16)在第二主成分上有较高的载荷,说明第二主成分能够反映这2 个指标的信息。因此,所提取的2 个主成分基本可以反映绝大部分指标的信息,能够代替17 个变量进行分析。

(3) 计算主成分得分

表3 成分矩阵a

提取方法:主成分分析法;a. 提取了2 个成分。

根据主成分系数可以看出:

第一主成分主要反映了城镇居民人均可支配收入/元、铁路客运量/万人、公路里程/里程、社会消费品零售总额/亿元、GDP/亿元、铁路周转量/亿人公里、民用航空客运量/万人、管道输油(气)、民用航空周转量/亿人公里的指标信息。

第二主成分主要反映了道路面积/万平方米、道路长度/公里、铁路里程/公里、民用航空里程/公里、货物进出口总额/亿美元、公路周转量/亿人公里、公路客运量/万人的指标信息。

(4) 计算综合得分

以贡献率为权重,构建主成分综合评价模型:

主成分得分和指标权重及排名如表4、表5 所示:

表4 主成分得分

表5 指标权重及排名

3.2 指标变量的聚类分析

针对指标的聚类分析,通常是对研究对象指标特性相似或相近程度进行分类,关于聚类个数的确定是划分指标属性对通道建设影响的关键,分类簇数太少不能充分地将通道建设影响进行归类,分类簇数太多则会削弱聚类结果的概括性[15]。由于对聚类个数不能确定,本文采用系统聚类分析的方法对指标变量进行聚类分析,并根据平均欧氏距离采用组间联接,生成聚类谱系图。

此外,由于所分析的指标个数较多,可能会引起数据的自相关性过高,导致聚类结果的偏差。为降低指标间的自相关性问题,最简单直接的方法是削减指标的数量,故在此基础上提出精简的指标确定方法,结合主成分F1的主成分系数和权重大小,选取10 个精简指标进行聚类,为防止数量级大小的不同,采取Z-score 对指标数据标准化。聚类后精简指标结果如图1 所示。

3.3 结果分析

从表3 可以看出,第一主成分F1的得分排名与综合得分排名一致,主要由于第一主成分方差贡献率达83.4%,基本反映出新疆区域运输通道发展状况。从综合得分来看,自2014 年以来,新疆区域交通运输通道发展水平逐年提升。主要原因是“一带一路”倡议的提出,对新疆区域经济发展和运输通道建设发挥了重要引导和促进作用。

从表4 的指标权重排名可以看出,铁路周转量/亿人公里、民用航空周转量/亿人公里、道路面积/万平方米、GDP/亿元指标信息占据了较高的权重,涵盖了社会经济、交通运输和城市设施建设三种主要的指标体系,这也在一定程度上表征了所建立的运输通道指标体系具备一定的合理性,从侧面说明以上占据较高权重的指标对运输通道建设具有较大影响。

图1 平均联接组间谱系图展示了指标的聚类过程,每次分类的组间距离不同,可以将民用航空周转量/亿人公里、道路面积/万平方米归为一类,民用航空里程/公里独自为一类,其余的指标变量归为一类,共分为3 类,分类结果与指标体系建立具有一定相关性,说明该方法分类效果较好。

研究结果表明,社会经济发展和交通运输发展因素是主要影响因素,政策因素对运输通道建设的影响作用也不可忽视。

图1 平均联接组间谱系图

4 结束语

(1) 本文从社会经济、交通运输和城市道路设施建设三个主要方向,列举了17 个指标因素,构建了多指标的运输通道建设影响分析体系,提出了利用主成分分析理论进行运输通道建设综合评价的新方法,该方法避免了人为经验值的主观性干扰,由定量分析计算出的综合主成分得分和权重值。

(2) 设计了主成分分析和系统聚类方法,依据主成分系数和权重大小,精简指标体系,优化聚类结果。由此得到主成分得分和指标类别划分簇数,通过以上的方法研究,可以较好地反映出新疆运输通道当前建设状况。

(3) 本文对个别问题的研究还存在不足,在判别多种指标属性对区域运输通道的影响程度方面还需做进一步分析研究,如交通基础设施对经济效益影响的具体评价、对通道演变过程及规律的分析、对未来年份的客货运输量进行预测研究等。

关于运输通道建设影响因素的研究是多方面的,除了考虑到以上影响因素外,还应考虑规划建设总体布局、建设项目时序等。相关交通管理部门应立足实际,主动契合国民经济发展要求,依据交通运输与社会经济发展耦合关系,着重考虑运输通道建设关键影响因素,做到有的放矢,突出重点,努力实现经济发展与交通建设互利共赢协调发展。

猜你喜欢
贡献率聚类新疆
一种通用的装备体系贡献率评估框架
关于装备体系贡献率研究的几点思考
基于DBSACN聚类算法的XML文档聚类
基于高斯混合聚类的阵列干涉SAR三维成像
В первой половине 2016 года вклад потребления в рост китайской экономики достиг 73,4 процента
一种层次初始的聚类个数自适应的聚类方法研究
新疆多怪
自适应确定K-means算法的聚类数:以遥感图像聚类为例
新疆对外开放山峰
新疆对外开放一类口岸