黎诗梅 李雄英
摘要通过主成分分析方法,选取2006、2011和2016年广东省各市邮电业务数据,对广东省21个地级市的邮政和通信事业发展状况进行分析和发展水平层次划分,从时间和地域空间两个维度对广东省各地区邮电业发展情况进行排名分组.结果表明,当前广东省各地区邮电业发展状况存在显著的地区差异.
关键词产业经济学;地区差异;主成分分析;邮电业;广东省
中图分类号F603 文献标识码A
Study on Post and Telecommunications Industry
Development in Guangdong Province Based
on Principal Component Analysis
Shimei Lia , Xiongying Lib
(a School of finance, b School of Statistics and Mathematics , Guangdong University
of Finance and Economics, Guangzhou, Guangdong510320,China )
AbstractBased on the post and telecommunications industry business data of 21 prefecture-level cities in Guangdong province in 2006, 2011 and 2016, principal component analysis method has been applied to analyze and give a ranking order of 21 prefecturelevel cities in terms of their post and telecommunications industry development levels from two dimensions of time and geographical space. The results showed that the regional differences among prefecturelevel cities of Guangdong province were obvious.
Key wordsindustrial economics; regional differences; principal component analysis; post and telecommunications industry; Guangdong province
1引言
郵政和通信是重要的国民经济部门,同时也是社会服务部门,与人们日常生活密切相关,关系到人民群众的切身利益.21世纪以来,广东省邮电业开始快速发展,邮电业务总量从2000年的757.22亿元增加到2016年的6892.41亿元,年均增长率达到14%.与此同时,随着科学技术的进步和互联网、快递等产业的兴起,广东省邮电业务的结构和规模发生了显著的变化,这体现在移动电话、互联网、快递等相关指标数据的大幅度上升,成为评判一个地区邮电业发展水平的重要指标,如互联网宽带接入用户从2000年的216.41万户增长到2016年的2851万户,年均增长率达到17%,函件、报刊以及本地电话等传统业务规模逐渐缩减.广东省作为我国现代化进程最快的地区之一,其邮政和通信事业的发展也领先国内大部分地区,但其发展存在一定的地区差异.依据《广东统计年鉴》,计算2006、2011和2016年各地级市邮电业务总量占全省总量比重.结果显示,近十年间,广州、深圳以及东莞的邮电业务总量约占全省的50%,各地区间邮电业务总量差距较大,且逐年扩大.
“十三五”时期是邮政深化改革、转型升级的重要时期,《邮政业发展“十三五”规划》提出“三个全面”、“三个突出”和“六个注重”,更加明确行业发展方向,推动我国由邮政大国向邮政强国迈进.及时调整广东省邮电业发展结构,使各地区的邮电业务趋向平衡,并朝着更优更强的方向前进是时代发展的必然趋势.因此,研究该省各地区邮电业的发展状况显得尤为必要.
近年来,已有不少学者针对邮电业的地区差异问题展开研究.吴建民等(2008)[3]运用相关分析法,分析我国邮政发展的省际差异,并指出经济收入是影响各地区邮政发展的空间差异的最终决定因素.康国栋等(2008)[4]采用时间序列和空间差异相结合的方法,分析了近 20 年来我国邮电业的发展,通过对我国 31 个省区人均邮电业务量的分析,将其划分为5个等级,结果发现人均邮电业务量与人均 GDP 呈正相关关系.在此基础上,以人口和人均 GDF 为变量,建立了我国邮电业的地域需求模型,发现科技进步和经济发展是我国各省区邮电需求的关键增长因素.曹小曙和李琳娜(2009)[5]利用基尼系数,分析广东省邮电通信业务量 1980~2006 年的变化趋势,在此基础上,选取1985年、1995年和2005年3个时间断面,利用因子分析剖析邮电业务水平的空间分布格局,进而构建邮电通信发展指数P,反映各市的邮电通信发展速度.封烨等(2017)[6]通过对全国与省域层面的邮政函件业务量及人均函件量的时空演变及影响因素的分析,揭示了邮政函件业务在大陆31个省市的空间分布极不均衡等现象.
在此,以先前学者的研究成果为基础,把广东省21个地级市作为研究对象,分别选取2006、2011和2016年广东省各市邮电业务指标,利用R语言统计分析软件,采用主成分分析法,研究广东省邮政与通信事业发展的空间差异,并展现各地区邮电业发展水平的排名趋势.通过相关分析和层次划分,有助于找出当前广东省邮电业在地区差异问题上具体表现,最终找到平衡区域差异的途径.
2研究方法
多元统计分析是数理统计学中的一个重要的分支学科,是一种综合分析方法.重要的多元统计分析方法有:回归分析、判别分析、聚类分析、主成分分析、因子分析、多元方差分析等.苏为华(2012)[7]认为,从评价方法看,应用与关注最多的方法依然是多元统计综合评价方法与运筹优化方法.文献数量最多的前十位分别是: 聚类分析、因子分析、主成分分析、AHP 法、模糊评价、判别分析、综合指数、功效系数、DEA、灰色系统评价等.
在研究广东省21个地级市邮电业发展状况中,采用的研究方法为主成分分析法.
2.1主成分分析法
主成分分析是将多指标化为少数几个综合指标的一种统计分析方法,由 K.Pearson(1901)提出,再由 Hotelling(1933) 加以发展起来.主成分分析是通过降维技术把多个变量化为少数几个主成分的方法,这些主成分保留原始变量的绝大部分信息,它们通常表示为原始变量的线性组合.通过主成分分析,可以从事物错综复杂的关系中找出一些主要成分,从而能有效利用大量統计数据进行定量分析,揭示变量之间的内在关系,得到一些对实物特征及其发展规律的深层次启发,把研究工作引向深入.
主成分分析的计算步骤如下:
(1)求标准化数据的相关矩阵.
(2)求相关矩阵的特征值和特征向量.
(3)计算方差贡献率与累积方差贡献率:每个主成分的贡献率代表了原数据总信息量的百分比.
(4)确定主成分:设 C1,C2,…,CP 为p个主成分,其中前m个主成分包含的数据信息总量(即其累积方差贡献率)不低于80%时,可取前m个主成分来反映原评价对象.
(5)用原指标的线性组合来计算各主成分得分.以各主成分对原指标的相关系数(即载荷系数)为权,将各主成分表示为原指标的线性组合,而主成分的含义则由各线性组合中权数较大的指标的综合意义来确定,即
Cj=μj1χ1+μj2χ2+…+μjpχp,j=1,2,…,m.
该式称为主成分得分函数, 由它来计算每个样品的主成分得分.若取m =2,则将每个样品的p个变量代入上式即可算出每个样品的主成分得分C1和C2,并将其在平面上做主成分得分的散点图,进而对样品进行分类或对原始数据进行更深入的研究.
(6)综合得分与排名.以各主成分的方差贡献率为权,将其加权求和得到综合得分.
C=λ1C1+λ2C2+…+…λmCmλ1+λ2+…+λm=∑mj=1WjCj.
这里Wj 是主成分的权重,利用总得分就可以得到得分名次[8].
在广东省21个地级市邮电业发展状况的研究中,如何科学、合理地对各地区邮电业发展状况进行综合评价和分析,是当前调整广东省邮电业发展结构中的一个重要问题.反映广东省各地区邮政和通信事业发展状况的指标众多,各指标间差别各异,针对多指标统计问题,蒋亮,罗汉(2003)[9]指出通过采用主成分分析法选取评价的综合指标,能在数据信息损失最少的原则下构建主成分综合评价模型,抓住客观事物的主要矛盾,对客观事物作出综合评价,从而增强评价结果的客观性.因此,将主成分分析法应用于广东各地区邮电业发展差异的研究是科学的和可行的.
2.2指标选取
反映广东省各地区邮政和通信事业发展状况的指标众多,同时,各地区之间的情况各异,统计的指标难以统一.为此,综合考虑指标的性质和影响程度以及指标数据获取的难度后,从中国统计出版社出版的 《广东统计年鉴》获得2006、2011和2016年广东省21个地级市邮电业发展的基本数据,选取了7项指标:
x1:邮政业务总量(亿元);
x2:函信件(万件);
x3:报刊累计数(万份);
x4:快递(万件);
x5:移动电话用户(万户);
x6:本地电话用户(万户);
x7:通信业务总量(亿元).
其中,以x1表示邮政规模,以x2、x3和x4反映邮政业务量情况,以x5和x6反映电信业务量情况,以x7表示电信规模.
所用数据来自2007、2012和2017年《广东统计年鉴》,也可在广东统计信息网直接下载。
2.3分析工具
R是一种编程语言,也是一种用于数据处理、统计分析以及制图的软件系统.相较于SPSS、SAS等统计学或数学专用的软件,R更便捷、简单,有利于广大初学者掌握,而更为重要的是,R软件是一个完全免费的自由软件.近年来,由于其优秀的多种统计学及数字分析功能,R得到越来越多的关注.
在此,将基于R语言的主成分分析函数展开相关分析.
3数据分析
通过R语言的主成分分析,将指标的原始数据标准化后建立相关系数矩阵,分别求出2006、2011以及2016年的相关系数矩阵的特征值、方差贡献率及累计方差贡献率见表1,和主成分载荷见表2.
主成分的选取一般要满足两个原则,一是主成分对应的特征值>1,特征值越大代表重要程度越大;二是前m个主成分的累计方差贡献率不低于80%.由表1可以得知,2006,2011和2016年第一个主成分的特征值分别为2.587,2.569和 2.571,远远大于要求的1.此外,累积方差贡献率分别为95.625%,94.307%和94.437%,大于85%的标准,故选取第一个主成分即可反映原来7个指标所反映的绝大部分信息,此时原有变量信息丢失较少,大大简化了计算,分析效果比较好.因此在此使用第一个主成分构成了原指标数据的主成分,并进行下一步分析.
表2是第一个主成分因子载荷矩阵,从中可以分别看到2006、2011和2016年所选定的第一主成分与原始变量的相关系数,主成分的载荷值越大,说明此变量对主成分的解释越多,影响越大.可以看出,在2006、2011以及2016这3年间,各个变量的系数都为负,而且各数值相差不大,第一主成分在每个变量上具有相近的载荷,说明每个变量对主成分的贡献都差不多,第一主成分基本反映了这些原始变量的信息.其中,2006年,第一个主成分中所包含的原始变量邮政业务总量以及通信业务总量变量的系数最大,同时达到0.382,说明这两个变量对第一主成分影响最大, 邮政业务总量以及通信业务总量能够综合代表第一主成分的发展状况.2011和2016年, 相关系数最大的都是通信业务总量,由此看出,随着移动互联网、大数据、物联网等新型信息服务的发展,通信业务总量保持加速增长势头,通信业在社会经济中占据越来越重要的位置.
由表2主成分载荷矩阵得到各年份第一个主成分得分,分别建立主成分综合评价模型如下:
F2006=-0.382x1-0.376x2-0.375x3-0.378x4-0.377x5-0.376x6-0.382x7,
F2011=-0.381x1-0.377x2-0.355x3-0.382x4-0.375x5-0.386x6-0.388x7,
F2016=-0.381x1-0.378x2-0.351x3-0.380x4-0.384x5-0.384x6-0.387x7.
4综合得分以及排名
遵循主成分分析步骤,用原指标的线性组合来计算各主成分得分,可以得到2006、2011和2016年广东省21个地级市邮电事业发展状况的主成分得分,结果见表3.
根据表3中的综合排名,大体上可以将广东省21个地级市邮电业的发展层次划分为高发展区、中等发展区和低发展区.同时,依据《广东统计年鉴》(2017)对广东各地区经济发展水平的划分,将各地级市归类为珠江三角洲、东翼、西翼和山区等区域.
从2006年的排名情况看,广东省邮电业高发展区包括广州、深圳、东莞、佛山、江门、中山和汕头,它们的排名都在整体排名的前7名.其中,除了汕头外,排名较高的地区都属于经济发展水平高的珠江三角洲区域;中等发展区包括惠州、湛江、珠海、茂名、揭阳、梅州和肇庆,它们的排名都在平均排名附近;低发展区包括韶关、阳江、清远、潮州、河源、汕尾和云浮,它们的排名在整体排名的后10位,其中有4个地区属于经济发展水平较落后的山区.
根据2011年的排名情况,不同地区所处的层次发生了变化.与2006年相比,高发展层次的地区发生的变化较小,原先处于中等发展区的惠州市新增到高发展区,而原先处于高发展区的汕头市降到中等发展区,高发展区包含的其它地区排名不变.中等发展区的包含的地区发生的变化也不大,除了已提及的惠州市和汕頭市以外,增加了原先处于低发展区的清远市,同时,肇庆市由先前的中等发展区降到低发展区,除此之外,低发展区所包含的地区与2006年相比没有不同,可见,原属于珠江三角洲区域的肇庆市在邮电业遇到发展的瓶颈,最终拖了珠江三角洲的后腿.
与2011年相比,2016年不同地区的邮电业所处的发展层次发生了细微的变化.高发展区所包含的地区及其排名保持不变,而原先处于低发展层次的肇庆市的排名升到中等发展层次,原先处于中等发展层次的清远市降到低发展层次.此时,广东省各地级市的邮电业发展差异及相关排名已趋向稳定.
5结论
通过运用主成分分析法对广东省21个地级市的邮电业发展的研究,可以得知,当前广东省各地区邮电业发展状况存在显著的地区差异.这首先体现在经济发达、基础设施完善的珠江三角洲地区拥有发展邮电业得天独厚的条件和需求,而经济较落后、地处偏远的部分区域排名总体靠后.以2016年各地区排名和层次划分的情况为例,除了肇庆市和珠海市属于中等发展区,其余珠江三角洲地区都位居高发展区.其次,东翼和西翼各地区大都位于邮电业发展的中等层次,而山区各地区大都位于低发展层次.因此,尽管历年来整体上广东省各地区邮电业的业务量以及相关指标数据不断增长,但无法回避的现实是,广东省邮电业的地区发展水平越来越不平衡.与此同时,在时间上各地区邮电业不平衡的发展状况越发明显.这主要体现在,随着时间的推移,各地级市邮电业发展的差异及相关排名渐趋稳定.从2006、2011和2016年各地区的排名情况看,高发展层次发生排名变动的情况越来越少,尽管近年来,珠海市和汕头市邮电业发展越来越成熟以及相关排名渐趋稳定,但仍无法跻身高发展层次.与此同时,处于低发展区的汕尾和阳江的排名不进反退.这表明,可能在很长一段时间内,广东省各地区的邮电业发展水平以及排名情况不会发生变动,地区间邮电业发展的差异会越来越明显.
参考文献
[1]广东统计信息网.广东统计年鉴[M].北京:中国统计出版社,2001-2017.
[2]刘钦普.数理统计方法在河南地市经济发展水平和分区研究中的应用[J].数理统计与管理,2002(2):10-15.
[3]吴建民,王为民,赵宝柱,丁疆辉.中国邮政发展的省际差异及其影响因素分析[J].邮政研究,2008(2):9-11.
[4]康国栋,孙根年,王美红.我国邮电业发展的地域需求模型研究[J].统计与决策,2008(16):95-97.
[5]曹小曙,李琳娜.广东省邮电通信业发展空间差异变动[J].地理研究,2009,28(1):182-190.
[6]封烨,孙中伟,王岩岩.我国邮政函件业务的时空演变及其影响因素[J].物流科技,2017,40(1):7-14.
[7]苏为华.我国多指标综合评价技术与应用研究的回顾与认识[J].统计研究,2012,29(8):98-107.
[8]王斌会.多元统计分析及R语言建模[M].广州:暨南大学出版社,2011:184-194.
[9]蒋亮,罗汉.我国东西部城市经济实力比较的主成分分析[J].经济数学,2003(3):48-53.
[10]林海明,杜子芳.主成分分析综合评价应该注意的问题[J].统计研究,2013,30(8):25-31.
[11]王中,邓琼,王跃恒.基于多元统计分析的城市竞争力研究[J].经济数学,2017,34(3):30-34.
[12]成亚利,王波.基于聚类分析的中国邮电产业业务分布研究[J].物流科技,2014,37(10):23-26.
[13]罗时超,李曦染.基于主成分分析的农村居民消费性支出研究——以中国31个省市为例[J].重庆工商大学学报(自然科学版),2012,29(11):22-26.
[14]孙梦瑶.基于主成分分析法的我国省级地区邮政业务发展研究[J].现代城市,2017,12(4):27-30.