王春豪
(石河子大学 商学院,新疆 五家渠 831300)
主成分分析 (Principal Components Analysis,PCA)是采取数学降维的方法,找出几个不相关的综合变量代替原来众多变量,使这些综合变量能尽可能地代表原来变量的信息[1]。基于国内学者提出的指标体系[2-4],考虑数据的客观性、与区域物流发展的相关性,建立新疆区域物流发展水平综合评价指标体系,如表1所示。其中,Y2主要从生产、消费等方面反映区域物流需求状况和规模,Y3主要反映区域物流发展的物质基础、供给能力和人力资源情况等。
表1 新疆区域物流发展水平评价指标体系
设X为n×p维矩阵,n为样本数,p为评价指标数。
(1)对原始数据进行标准化处理。
(2)计算样本相关矩阵R。
假定原始数据标准化后仍用X表示,则经标准化处理后,数据的相关系数为:
(3)采用雅克比方法求相关系数矩阵R的特征值 (λ1,λ2,…,λp) 和相应的特征向量am=(am1,am2,…,amp),m=1,2,…,p。
(5)计算主成分得分。将标准化的原始数据分别代入主成分表达式,得到主成分得分。
(6)计算综合主成分得分,并且根据得分高低得出各样本的排名。计算公式为:
为使时间序列数据[5]具有纵向可比性,以 1978年为基准年,对X1、X2、X4、X5、X6的原始数据进行相应处理:将其分别对应的 1978 年的 GDP 指数、人均 GDP 指数、工业总产值指数、批发和零售业指数、商品零售价格指数等定基为 100,利用 1978 年现价的数据折算为各年份可比价的时间序列。如1978年新疆 GDP 现价为39.07 亿元,GDP 指数为 100,2000 年的 GDP 指数为 878.4,则 2000 年新疆 GDP 的可比价为 343.19 亿元,由此可计算出 2000—2009 年的各指标的数据,如表2所示。
(1)原始数据标准化。利用 SPSS16.0 统计软件,计算得出变量的相关系数矩阵R,计算R的特征值和贡献率及累计贡献率。按特征值大于1的原则提取2个主成分,第一主成分的贡献率为 80.03%,第二主成分的贡献率为 13.25%,2 个主成分的累计贡献率为 93.28%,远大于 85%,如表3所示。
表2 2000—2009 年新疆区域物流发展水平各指标处理后的数据
表3 相关系数矩阵R的特征值、贡献率及累计贡献率
(2)主成分载荷分析。由各原始变量的主成分载荷矩阵 (见表 4) 可以发现,地区生产总值 (X1)、人均地区生产总值 (X2)、工业总产值 (X4)、批发零售贸易业总额 (X5)、社会消费品零售总额 (X6)、运输周转量 (X7) 6 个变量在第一主成分上有较高载荷,说明第一主成分能够反映这6个指标的信息。地区生产总值增长率 (X3) 和物流从业人员比例(X10) 在第二主成分上有较高的载荷,说明第二主成分能够反映这2个指标的信息。因此,所提取的2个主成分基本可以反映绝大部分指标的信息,能够代替 10 个 变量进行分析。
(3)计算主成分得分。
(4)计算综合得分。对2个主成分的得分进行加权求和,取其贡献率作为权重。
表4 主成分载荷矩阵
通过计算得出 2000—2009 年新疆区域物流发展水平综合得分,如表5所示。
表5 新疆区域物流发展水平综合得分
从表5可以看出,第一主成分F1的得分排名与综合得分排名是一致的,主要因为第一主成分的方差贡献率达 80.03%,基本反映出新疆区域物流发展状况。从综合得分来看,自 2000 年以来,新疆区域物流发展水平是逐年提升的。2000—2005 年处于低水平阶段,从 2006 年开始有了突破。主要原因是新疆于 2006 年开始加大铁路、公路、机场等基础设施建设,如乌鲁木齐—精河铁路复线、国道 312 线 (星星峡—哈密公路)、国道 312 线 (赛里木湖—霍尔果斯口岸公路)、国道 218 线 (清水河—伊宁高速公路)、国道 217 线 (那拉提—库车公路)、喀纳斯机场等。另外,政府加大对物流产业的投入,使得连锁经营、物流配送、电子商务等新型流通业蓬勃发展。2006 年,“万村千乡”市场工程新增了 30个试点县 (市),总数达 52 个;新改建标准农家店3 500 家,总数达到 4 522 家,这对新疆区域物流水平的提升有着重要影响。
选取 2007—2009 年陕西、甘肃、青海、宁夏、新疆5省区统计年鉴中的连续3年的数据[6-9],运用主成分分析法,以生产总值、人均地区生产总值、工业总产值、社会消费品零售额、批发与零售贸易业总额的算术平均值及各省区 2009 年运输周转量、运输网密度、运输线路长度、物流从业人员比例为原始数据,将新疆与其他4省区进行横向比较分析,如表6所示。
(1)原始数据标准化。利用 SPSS16.0 统计软件,得出变量的相关系数矩阵R,并计算出R的特征值、贡献率及累计贡献率,如表7所示。按特征值大于1的原则提取的3个主成分,第一主成分贡献率为 63.86%,第二主成分的贡献率为 17.01%,第三主成分的贡献率为 14.99%,3 个主成分的累计贡献率为 95.85%,远大于 85%,能比较全面地反映问题。
表6 2007—2009 年西北 5 省区区域物流发展水平评价指标原始数据
表7 相关系数矩阵 R 的特征值、贡献率及累计贡献率
(2)主成分载荷分析。主成分载荷矩阵如表8所示。表8中,地区生产总值 (X1)、工业总产值(X4)、批发零售贸易业总额 (X5)、社会消费品零售总额 (X6)、运输周转量 (X7) 5个变量在第一主成分上有较高载荷,说明第一主成分能够反映这5个指标的信息。人均地区生产总值 (X2) 和地区生产总值增长率 (X3) 在第二主成分上有较高的载荷,说明第二主成分能够反映这2个指标的信息。物流从业人员比例 (X10) 在第三主成分上有较高的载荷,基本能反映该指标的信息。由此可见,所提取的3个主成分基本可以反映绝大部分指标的信息,能够代替 10 个变量进行分析。
(3)计算主成分得分。
表8 主成分载荷矩阵
(4)计算综合得分。
通过计算得出西北5省区区域物流发展水平综合得分,如表9所示。
表9 西北 5 省区区域物流发展水平综合得分
从表9中可以看出,第一主成分得分排名与综合得分排名是一致的,这是因为第一主成分的贡献率达 63.86%,基本反映了新疆区域物流发展的总体状况。第二、第三主成分的贡献率分别为 17.01%和 14.99%,说明人均地区生产总值和物流从业人员比例是影响区域物流发展水平的重要因素。从综合得分来看,陕西省区域物流发展水平排在第一位,新疆区域物流发展水平排在第二位。从分值来看,新疆区域物流发展水平比较低,与陕西省有一定差距,仍处于起步阶段。
构建区域物流发展水平综合评价指标体系,将区域经济基础因素、区域物流需求因素、区域物流支持因素为一级指标,将地区生产总值、工业总产值、运输周转量等 10 个变量为二级指标。运用主成分分析方法对新疆区域物流发展水平分别从纵向和横向两个方面进行实证分析,新疆区域物流发展水平正逐年提升,在西北5省区中处于中上水平,随着国家西部大开发战略的深入实施,以及全国对口支援新疆政策的逐步落实,新疆区域物流水平将得到快速提升。由于区域物流发展水平的影响因素较多,对新疆区域物流发展水平做出纵向评价,与其他4省区进行横向定量分析。因此,仍然需要进一步研究和加强区域物流发展水平的综合评价。
[1] 李卫东. 应用多元统计分析[M]. 北京:北京大学出版社,2008.
[2] 于亦文,周荣虎. 区域物流产业综合实力评价研究——以中原城市群为例[J]. 现代管理科学,2007(11):70-72.
[3] 朱帮助,李 军. 基于主成分分析的区域物流发展水平综合评价——以广东省江门市为例[J]. 工业技术经济,2008,27(5):105-107.
[4] 许小苍. 基于主分量分析的重庆地区物流发展水平综合评价[J]. 铁道运输与经济,2009,31(5):64-67.
[5] 新疆统计局. 新疆统计年鉴(2010)[M]. 北京:中国统计出版社,2010.
[6] 陕西省统计局. 陕西统计年鉴(2010)[M]. 北京:中国统计出版社,2010.
[7] 甘肃发展年鉴编委会. 甘肃发展年鉴(2010)[M]. 北京:中国统计出版社,2010.
[8] 宁夏自治区统计局. 宁夏统计年鉴(2010)[M]. 北京:中国统计出版社,2010.
[9] 青海省统计局. 青海统计年鉴(2010)[M]. 北京:中国统计出版社,2010.