何叶荣 孟祥瑞 罗文科
摘要:采用多元统计综合评价方法,依据淮南市2014年统计年鉴的数据,借助STATA12.0软件工具,选取皖江城市群10个城市为研究样本,提取9项指标作为研究对象,采用相关分析,回归分析,因子分析和聚类分析,对10个城市的经济发展能力进行比较与评价,找到各个城市的发展优势与,最后提出皖江城市群联动发展的对策与措施。
关键词:皖江城市群;经济发展能力;优势比较;STATA;面板数据
中图分类号:F127
文献标识码:A文章编号:
16721101(2015)06003408
Economic development capacity and advantage comparison of cities
along Yangtze river in Anhui province- panel data analysis based on STATA
HE Ye-rong1,2, MENG Xiang-rui1 , LUO Wen-ke
3
(1.School of Mining and Safety Engineering, Anhui University of Science &Technology, Huainan, Anhui 232001, China;2.School of Economics and Management, Huainan Normal University, Huainan, Anhui 232038 China;3.School of Economics and Management, Anhui University of Science & Technology, Huainan, Anhui 232001, China)
Abstract:In this paper, according to the data in the statistical yearbook of Huainan in 2014, by using the software Stata12.0, ten cities of Yangtze river in Anhui province are chosen as research samples; nine indexes are extracted as research objects; the multiple statistics comprehensive evaluation method is utilized to compare and evaluate the economic development capacity of the ten cities. In the course of the evaluation, correlation analysis, regression analysis, factor analysis and clustering analysis are adopted. By analysis and evaluation, the development advantages of each city are found. Then the countermeasures and strategies are put forward for the cooperative development of the cities along Yangtze river in Anhui province.
Key words:the cities along Yangtze river in Anhui province;economic development capacity; advantage comparison; STATA; panel data
随着中部崛起战略的实施和长三角城市群的加速扩张,皖江城市群的经济区位优势日益凸显[1]。自2010年10月12日《皖江城市带承接产业转移示范区规划》被国务院正式批复以来,安徽皖江城市群(共包括10个城市),即合肥、芜湖、马鞍山、铜陵、安庆、池州、巢湖、滁州、宣城、金安区和舒城县,有59个县(市区)的承接产业转移示范区建设被正式纳入到国家发展战略规划[2]。皖江城市群是安徽省经济较发达的城市群,汇聚了安徽省的主要资源,经济发展能力较强,在经济投入、产出等方面都处于相对领先地位[3,4]。
目前,正值我国重点调整产业结构、优化产业格局之际,对城市群的综合经济实力研究成为目前学者研究的热点。对皖江城市群综合经济实力的研究也不乏其人,主要集中在对皖江城市群的创新能力[1,4],城市化水平[5]和产业承接转移[6-9]等方面。也有的从皖江城市群的现状入手,对皖江城市群的发展进行SWOT分析[10],以便找到更有利于皖江城市群发展的路径。本文借助STATA12.0工具,对皖江城市群综合经济发展能力进行比较研究,找出皖江城市群的综合经济发展能力和各个城市的经济发展优势,对安徽省区域发展综合能力的提升有重要的理论和实践意义。
一、研究设计
(一)研究变量选择
对于城市群经济发展能力比较指标体系的选择,一方面要考虑地方经济总量,另一方面还要考虑到经济质量和经济效能,同时还要考虑所选指标的全面性、代表性和可操作性等原则。本文借鉴了国内外相关研究,选择了9个研究变量,分别定义为:城市名称、地区生产总值(亿元)、规模以上工业增加值(亿元)、社会消费品零售总额(亿元)、全部财政收入(亿元)、固定资产投资(亿元)、进出口总额(亿元)、城镇居民人均可支配收入(元)、农民人均纯收入(元)。9个变量分别定义为V1-V9;10个观测样本分别为:合肥、芜湖、马鞍山、铜陵、安庆、池州、滁州、宣城、金安区、舒城县。
(二)数据来源与研究方法选择
本文采用数据是《淮南市统计年鉴—2014》[11],采用的数据分析方法有相关分析、回归分析、因子分析和聚类分析。借助Stata12.0软件,首先使用回归分析,相关分析等方法研究构成皖江城市群经济发展能力的各个变量之间的关系;然后运用因子分析对构成皖江城市群的各个变量提取公因子,该公因子是最具代表性的主因子;最后构建皖江城市群经济发展能力的评价模型,运用Stata12.0数据处理技巧,采用K个平均值法进行聚类分析,依照提取的公因子对皖江示范区各个城市的经济发展能力进行分类排序。
Stata是由美国计算机资源中心研制的,有着非常强大的数据管理、统计分析、绘制图表、矩阵运算和编程等功能[12、13]。Stata还包含了许多现代经济与管理统计方法、基本统计分析、回归分析、时间序列分析、面板数据分析、广义估计方程(GEE)、混合效应模型、非线性最小二乘估计、极大似然估计、方差分析、交叉分组时间序列分析(panel data)、正态性检验和质量控制等[15、16]。Stata软件是命令式的,比SAS、SPSS软件更具有适用性,因其程序容量较小,操作简单,速度快、效率高、对计算机要求较低、数据管理功能强大、可以非常方便地在各种软件之间交换数据、计算结果输出形式简洁等优点,深受广大科研工作者的青睐。目前已广泛适用于社会科学、管理学与经济学等领域[17-20]。
二、研究过程
(一)数据描述性分析
本文的数据变量除了城市名这一字符串变量外,其余是定距变量,通过进行定距变量的描述性统计,可以得到变量数据的概要统计指标,包括均值、最大值、最小值、百分位数、中位数、偏度系数和峰度系数等。通过获取这些指标可以对拟分析的数据有个整体把握,为后续进行更深入的数据分析做好必要的准备。运用Stata12.0,在Command命令框中输入命令summarize v2-v9,detail,即可得到V2-V9的描述性分析结果。由于篇幅有限,在此仅以地区生产总值为例进行说明,如表1所示。
表1数据描述性分析结果(地区生产总值)
由表1可以看出,地区生产总值这一变量百分位数(Percentil
es)的第一个四分位数(25%)是462.2,第二个百分位数(50%)是964.5;四个最小值分别为:132.9、140.5、462.2、680.6;四个最大值分别为:1 293、1 418.2、2 099.5、4 672.9;均值为(Mean)为1 282.88,标准差(Std. Dev)为 1 336.397;偏度(Skewness)为1.748 433,为正偏态;峰度(Kurtosis)为5.286 893,有一个比正态分布较短的尾巴。通过描述性分析,可以看出,其它各个变量的所有数据都没有极端值和异常值,数据间的量纲差距也在可接受范围之内。
(二)相关分析
运用Stata12.0,在Command命令框中输入命令pwcorr v2-v9,sidak sig star(0.01),即可得到V2-V9的各个变量间的Pearson相关系数,见表2。
由表2可以看出,地区生产总值与工业增加值相关系数为0.974 1,具有很强的相关性,且在0.01的显著性水平上显著;地区生产总值与社会消费品零售总额之间相关系数为0.990 1,具有很强的相关性,且在0.01的显著性水平上显著;工业增加值与社会消费品零售总额之间相关系数为
0.943 5,具有很强的相关性,且在0.01的显著性水平上显著;全部财政收入与固定资产投资、全部财政收入与进出口总额、固定资产投资与进出口总额之间均具有较大的相关性,且在0.01的显著性水平上显著;城镇居民人均可支配收入与农民人均纯收入之间相关性系数为0.881 4,相关性P值为0.020 7,小于0.05,具有较强的相关性。同时分析了其它变量之间的相关性,发现其它变量之间的相关性不很显著。
(三)回归分析
1.模型构建
考虑到各种因素之间的影响较为复杂,本文以地区生产总值为因变量,以规模以上工业增加值、社会消费品零售总额、全部财政收入、固定资产投资、进出口总额、城镇居民人均可支配收入与农民人均纯收入为自变量,进行多重共线性回归。
建立线性模型:
地区生产总值=a*规模以上工业增加值+b*社会消费品零售总额+c*全部财政收入+d*固定资产投资+e*进出口总额+f*城镇居民人均可支配收入+g*农民人均纯收入+u
即:V2= a*V3+ b*V4+ c*V5+ d*V6+ e*V7+ f*V8+ g*V9+u
其中:a、b、c、d、e、f、g为未知参数
,即回归系数。u为随机误差项,即由于其它原因引起的而未被考虑到的因素。运用普通最小二乘回归分析方法进行逐步回归,其步骤及结果如表3所示。
2.模型修正
从上述分析结果可以看出,共有10个样本参与了分析,模型的F(3,6)=8 961.19,P值(Prob > F)= 0.000 0,说明模型整体上是非常显著的,模型的可决系数(R-squared )为0.999 8,模型修正的可决系数(Adj R-squared)为0.999 7,说明模型的解释能力是非常好的。
模型通过逐步回归,经过4次踢出变量后得到最终结果。第一个模型是包含全部自变量的全模型,该
模型中v7变量的显著性P值高达0.938 6,被剔除;第二个模型是包含全部自变量的全模型,该模型中v5变量的显著性P值为0.937 8,被剔除;第三个模型是包含全部自变量的全模型,该模型中v9变量的显著性P值为0.290 3,被剔除;第四个模型是包含全部自变量的全模型,该模型中v8变量的显著性P值为0.248 1,被剔除。剔除上述自变量后得到最终回归模型。
在最终模型中,变量v3的系数标准误为0.058 925 9,T值为6.000,P值为0.001,系数非常显著,99%的置信区间为[0.209 587 5 ,0.497 960 5];变量v4的系数标准误为0.104 917 3,T值为9.97,P值为0.000,系数非常显著,99%的置信区间为[0.789 763 3 1.303 21];变量v6的系数标准误为0.044 62,T值为11.61,P值为0.000,系数非常显著,99%的置信区间为[0.408 848 3,0.627 210 9]。
最终最小二乘回归模型的方程为:
V2=0.353 774v3+ 1.046 487 v4+0.518 029 6 v6+15.826 98即:地区生产总值=0.353 774*规模以上工业增加值+1.046 487*社会消费品零售总额+0.518 029 6*固定资产投资+15.826 98。
3.因变量预测
根据自变量的值和得到的回归方程对因变量进行拟合,可以用以对未来进行预测。在Stata12.0的C
ommand命令框中输入命令predict yhat获得因变量的拟合值yhat。拟合结果可以看出yhat值与V2值是非常接近的,所以拟合的回归模型是非常好的。残差与得到的拟合值的散点图如图1所示。
图1残差与得到的拟合值的散点图
4.异方差检验
由图1可以看出,残差并没有随着拟合值大小的不同而发生大的波动,而是围绕0值随机波动,所以数据很可能不存在异方差。使用得到的拟合值,分别通过怀特检验、BP检验(包括使用所得拟合值对数据进行异方差检验和使用方程右边的解释变量对数据进行异方差检验),检验结果如表4所示。此三种检验方法的原假设均为数据为同方差,通过怀特检验时,P值(Prob > chi2)为0.350 5,运用所得拟合值进行BP检验时,P值(Prob>chi2)为0.542 1,使用方程右边的解释数据进行BP检验,P值(Prob>chi2)为0.281 4。三种方法检验P值均大于0.05,非常显著地接受了同方差的原假设,数据不存在异方差,因此不需要再使用稳健的标准差进行回归。
经过以上最小二乘法逐步回归分析,可以发现,皖江示范区城市群的地区生产总值与规模以上工业增加值、社会消费品零售总额、固定资产投资有显著关系,且这三个变量对地区生产总值起正向促进作用,每增加一个单位,地区生产总值将分别增加0.353 774、1.046 48、0.518 029 6
个单位。地区生产总值与其他变量之间有一定关系,但不很显著。
(四)因子分析
1.用主成分分析法对构成皖江城市群经济发展能力的变量进行因子分析,在Stata12.0的Command命令框中输入命令factor v2 v3-v9,pcf,得出因子分析结果,如表5所示,8个因子中只有2个因子特征根大于1,选取这2个因子分作为新的综合评价指标,LR检验的卡方值(LR test: independent vs. saturated: chi2(28))为184.02,P值(Prob>chi2)为0.000 0,模型非常显著。第一个因子的特征值(Eigenvalue)为6.326 86,方差贡献率(Proportion)为79.09%;第二个因子特征值(Eigenvalue)为1.411 22,方差贡献率(Proportion)为17.64%。前2个因子的累计方差贡献率(Cumulative)为96.73%,解释了原始数据的96.73%的信息。
2.采用最大方差正交旋转法对因子结构进行旋转,由旋转后的因子载荷图显示出Factor1主要解释的是V2、V3、V4、V5、V6、V7这几个变量的信息,Factor2解释的是V8、V9这2个变量的信息。将因子得分情况(这里的因子得分是将每个变量标准化为平均数为0,方差为1)进行加权合计,求出每个因子的线性组合,以因子的方差贡献率为权重对因子进行加权求和,即可得到每个样本的因子综合得分。根据因子得分系数矩阵,写出各因子的表达式。在此,各表达式中的各个变量已经不再是原始变量,而是进行标准化以后的变量。
这里2个主因子的表达式如下:
F1=0.977 0V2+0.939 2V3+0.989 2V4+0.962 3V5+0.966 3V6+0.915 7V7+0.273 0V8+0.175 4V9
F2=0.205 1V2+0.280 2V3+ 0.091 5V4+0.263 8V5+0.246 7V6+0.282 3V7+ 0.927 9V8+ 0.958 8V9
由提取的2个主因子的相关矩阵知,两个主因子之间没有相关性。这说明对因子进行方差最大正交旋转方式是有效的,每个样本在2个主因子维度上的因子得分如图2所示,可以看出,所有样本被分到四个象限,每个样本的因子得分分布情况很直观、很清晰。
通过KMO检验,查看数据是否适合做因子分析, KMO取值在0~1之间,一般来说KMO值在0.9~1表示非常好,0.8~0.9表示很好,0.7~0.8表示还可以,0.6~0.7表示中等。本文中只有单个变量V9的KMO值只有0.4921,效果略差,其它几个单变量的KMO值均0.6以上,总体(Overall)KMO值为0.6792,表明因子分析的效果居中等水平。
3. 皖江示范区城市群经济发展能力的综合得分。
依据提取的主因子对皖江城市群各城市经济发展能力进行分类排序,在Stata12.0的命令框中输入命令generate f=0.702 3*f1+ 0.264 9*f2,即可得出皖江城市群各城市经济发展能力的综合得分,f代表各个城市的综合经济能力,f1、f2为提取的主因子,前面的系数为各个因子的方差贡献率,输出结果如表6所示。
三、研究结论及政策建议
观察综合得分可以发现,合肥市综合经济发展实力得分为1.841 892,是皖江城市群中综合经济实力最强的城市;芜湖、马鞍山综合得分在0~1之间,分别居于第二、第三,综合经济实力也是很强的;安庆、铜陵、滁州、宣城、池州、晋安区和舒城县相对较弱,舒城县最弱,综合得分为-0.744 480 8。各城市综合排名依次为:合肥、芜湖、马鞍山、安庆、铜陵、滁州、宣城、池州、晋
安区和舒城县。
通过相关分析,皖江示范区各地区生产总值与规模以上工业增加值、社会消费品零售总额均有相关性,且在0.01显著性水平上显著;全部财政收入与固定资产投资、进出口总额有相关性,且在0.01显著性水平上显著。城镇居民人均可支配收入与农民人均纯收入有相关性,且在0.01显著性水平上显著。
通过因子分析,提取2个主要因子,第一因子主要反映地区生产总值、规模以上工业增加值、社会消费品零售总额、全部财政收入、固定资产投资、进出口总额;第二主因子主要反映城镇居民人均可支配收入与农民人均纯收入。对综合经济实力得分运用K个平均数聚类分析,皖江城市群10个城市可分为三个等级。但是每个地区有各自的特点和发展空间,根据地区差异要采取不同的发展路径,图3明确显示出10个地区在201
3年各经济指标的绝对值和相对与2012年各个经济指标的相对增加值,左轴表示2013年度各地区各个经济指标的绝对值情况,右轴表示各地区各个经济指标比2012年的相对增长率,有些地区的绝对值很高但增长速度较慢,可能处于经济发展的成熟期;有些地区的绝对较小,但是增长速度很快,发展空间很大。
对于第一等级地区,合肥、芜湖、马鞍山,是皖江城市群中经济较发达地区,人均生产总值较高,非农业人口比重较大,对外经济联系较为密切,城市基础设施好,发展潜力大。合肥在综合排名中经济实力最强,在第一因子得分也最高为2.615 271,但是在第二因子得分只有0.019 584,次于马鞍山、铜陵、芜湖、宣城之后,位居第五,合肥是省会城市又是长江经济带的核心城市,在区位及资源方面都具有很多优势,但是其城镇居民人均可支配收入与农民人均纯收入能相对还不够理想,还要加强规划发展,制定相应的策略,加快创新发展投入程度,增强居民创收能力;芜湖经济综合排名居于第二,在第一因子和第二因子排名分别居于第二和第三,现代化水平基础设施、教育文化等方面在皖江城市群中都具有明显的比较优势;马鞍山综合排名居于第三,在第二因子上得分2.093 192,分值最高,反映了城镇居民人均可支配收入与农民人均纯收入情况良好,但是在第一因子上得分为负值,排名第六,可能是因为其其行政区划偏小,三区一县,人口规模小,有必要扩大其行政区划范围,增加城市腹地范围[21]。
对于第二等级地区,安庆、铜陵、滁州、宣城,安庆总体经济实力综合排名居于第四,但是其在第二因子上得分为-0.942 282 6,居于第九名,反映了城镇居民人均可支配收入与农民人均纯收入情况很差。安庆是皖西南区域中心城市,历史上曾是安徽省的省会,城市基础设施较好,腹地广阔,但其产业结构单一,产业链短,主导产业的乘数效应低,就业扩张缓慢,集聚辐射能力较差,应不断优化城市产业结构和人口结构,增强其经济辐射能力;滁州由于靠近南京都市圈,经济发展速度比较快,但是在第二因子上的得分较低,以后要加强与长江三角洲地区的经济横向联系,依托长三角地区的产业转移和技术创新,形成深加工制造业中心,实现城镇、农村人口的充分就业,人均收入的稳定增长。
对于第三等级地区,池州市、舒城县和金安区,它们相对综合经济实力较差,综合经济实力排名位于后三名,在第一、第二因子上得分均为负值,金安区在第一因子上得分倒数第一,舒城县在第二因子上得分最差。池州地处皖南,受交通区位等因素限制,城市建设滞后,基础设施薄弱,接受长三角的辐射能量较弱。今后要加强城市基础设施建设,加强网络信息的流通,加大政策支持,加大拉动效应,大力改善投资环境,重点发展科技教育,充分积累人力资本,其经济实力的提升空间还是很大的。
总之,要提升皖江城市群的整体综合经济发展能力,首先必须找到各自的发展优势与劣势,找准机会,充分发挥各自优势,合理规避风险,不断完善皖江示范区内外的合作机制,加强区域利益协调机制建设,进行多元化投入;其次要引领示范区城市群走科技促经济发展之路,加强与示范区内各城市的协同创新发展,以科技促经济从而实现整体综合经济实力的大幅提升;第三要明确不同能级城市的功能定位,加强皖江城市群内各地区政府、企业、高等院校与科研机构合作,积极整合区内、省内、国内及国外的各种资源,实现多方资源共享,快速融于长三角地区发展体系中,充分发挥皖江的比较优势,实现皖江城市群整体发展实力的提升[22
];最后要加强基础设施建设,信息网络建设,为皖江城市群综合经济能力的发展提供保障。参考文献:
[1]马溪骏,高袁袁.皖江城市带九城市自主创新能力评价及对策分析[J].安徽大学学报:哲学社会科学版,2010(6):139-144.
[2]夏永久.基于分形理论的皖江城市带城镇体系结构研究[J].资源开发与市场,2009(1):30-39.
[3]韩会然,焦华富.皖江城市带空间经济联系变化特征的网络分析及机理研究[J].经济地理,2010,31(3):384-388.
[4]傅为忠,刘登峰.皖江城市带区域自主创新能力评价及对策研究[J].科技进步与对策.2012,29(5):121-126.
[5]刘定惠,朱超洪.基于主成分分析的皖江城市群城市化水平综合评价[J].国土与自然资源研究,2009(3):6-9.
[6]刘定惠,陈晓华.皖江城市群产业结构动态变化及比较优势分析[J].资源开发与市场,2009,25(2):134-137.
[7]吴雪萍.皖江城市带产业转移影响因素的实证分析[J].经济论坛,2010(6):110-113.
[8]吴艳娟.皖江城市带承接产业转移能力评价研究[D].蚌埠:安徽财经大学硕士学位论文,2014.
[9]王立人.皖江城市带承接产业转移综合评价数学模型与实证分析[D].合肥:安徽大学硕士学位论文,2011.
[10]汪大正.皖江城市群经济发展的SWOT分析[J].合肥工业大学学报:社会科学版,2007,21(2):57-61.
[11]淮南市统计局.淮南市统计年鉴—2014[Z].北京:中国统计出版社,2014.
[12]Cameron,A.C.,P.K.Trivedi.Icroeconometrics using Stata[M].Texas:Stata Press,2009.
[13]陈峰.现代医学统计方法与Stata应用[M].北京:中国统计出版社,1999:1-501.
[14]周文光,李尧远. stata在社会科学研究中的高级
应用[M].西安:西北工业大学出版社,2011.
[15]陈强.高级计量经济学及stata应用[M].北京:高等教育出版社,2010.
[16]黄璨,邓宏兵.基于动态因子分析法的四川省旅游业竞争力实证分析[J].长江流域资源域环境,2013,22(8):1011-1015.
[17]张巍,任浩.Simmelian联系与个体创新:知识分享意愿和共同知识基础的中介作用[J].管理科学,2012,25(6):55-64.
[18]李晓翔,刘春林.投资强度变化:基于绩效偏差和冗余资源的视角[J].管理科学,2013,26(3):26-36.
[19]樊自甫,梅丹.电信产业固定资产投资额与市场绩效关系研究—基于31省市面板数据的研究[J].科技管理研究,2013(8):195-198.
[20]刘博雷.中国36个主要城市经济社会发展水平的实证研究——基于STATA的面板数据分析[J].经济与社会发展,2014,12(3):105-108.
[21]杨昌辉,周开乐,冯南平.城市群创新发展中的产业转移研究—以皖江城市群为例[J].江淮论坛,2014(5):54-59.
[22]程必定.产业转移“区域粘性”与皖江城市带承接产业转移的战略思路[J].华东经济管理,2010,24(4):24-27.
[责任编辑:范君李丽]