杨 翌 刘晓宁
(作者单位:1.西安铁路局;2.西安财经大学)
城镇化是伴随着工业化、后工业化发展在城镇聚集、农村人口向城镇转移和集中的历史发展过程,是人类进化、社会发展的客观发展趋势,也是一个国家实现现代化和科技强国的重要标志。城镇化是一个综合的过程,包括经济城镇化、人口城镇化、社会城镇化、空间城镇化、数字城市等。人口城镇化是城镇化的重要标志,其表现形式为大量的农村劳动力和农村人口向城市转移,城市人口不断密集的过程。新中国成立后,我国的人口城镇化发展经历了两个阶段:第一阶段,1950——1978 年为缓慢增长期,1950 年人口城镇化率为11%,1978 年为17.92%;第二阶段,1979 至今为高速增长期,截至2012年,我国人口城镇化率为52%,取得了显著成效,基本达到世界平均水平。与此同时,我国的人口城镇化发展带有明显的中国特色:人口城镇化滞后于工业化、人口城镇化滞后于土地城镇化、户籍人口城镇化滞后于常住人口城镇化。2014 年3 月我国正式公布《国家新型城镇化规划(2014——2020 年)》,其最大亮点是将以人为本作为新型城镇化的出发点和落脚点,推进城镇化的核心是人的城镇化。
陕西省作为西部大省以及新丝绸经济带的重要省份,近年来人口城镇化水平有了飞速提升。然而,规模大、速度快的人口城镇化发展同时伴随着结构失衡和质量不高的不完全人口城镇化模式,以及地区之间的人口城镇化发展状况不尽相同,城镇化的地域差异较大等问题。在新型城镇化建设的要求下,为顺利实现陕西省人口城镇化由规模扩张到质量提升,区域失衡到区域均衡的整体转型的平稳过渡,对全省人口城镇化质量进行研究具有重要现实意义。
学者们对人口城镇化的研究取得了一定成果,但研究多集中在人口城镇化与经济增长、产业结构变化、土地城镇化、空间城镇化的相互关系上,对人口城镇化质量研究也散见于对城镇化质量的研究中。而专门针对人口城镇化质量研究为数不多,其研究对象也是宏观性的针对整个国家,研究方法也是静态,只针对某个时点的研究。因此,本研究从构建人口城镇化质量评价指标体系出发,采用2013——2021 陕西各地市数据构成的多指标面板数据,运用多指标面板数据因子分析法对陕西省人口城镇化质量进行评价分析。
面板数据是截面数据和时间序列数据的组合,具有空间和时间维度的特征,它分为单指标面板数据和多指标面板数据。单指标面板数据可用二维表或矩阵表示,采用转换方法,将单指标面板数据的时间维度转换为截面数据的指标维度表示,两种数据的统计描述特征相似。多指标面板数据的结构要复杂一些,应该用三维表来表示,设一个样本X包括q个样品,用p个指标来描述每个样品的特征,时间长度为T,实际上多指标数据含有空间(样品)、指标和时间三个维度。
经典的因子分析只针对由样本和指标构成的平面数据表,并未加入时间序列。如果对每张平面数据表进行经典的因子分析,由于不同数据表具有不同的主平面,无法对同一样本不同时间点的评价结果进行对比。多指标面板数据因子分析法是在建立时序立体数据表的基础上施以经典因子分析,其中时序立体数据表是一组按时间过程排放的平面数据表序列,所有数据表有完全同名的样本点和完全同名的变量指标,从而克服了系统分析的统一性、整体性和可比性的难题。在陕西省人口城镇化质量发展的研究中,如果能够从动态角度获得所有年份的连续数据,从而更为完整地审视陕西省人口城镇化质量演变的整个历程,且有效规避了因时间节点选取不科学所导致的各种问题,具有较好的研究效果。具体研究方法如下:
1.建立统一的全局空间
设一个样本X包括q个样品,用p个指标来表示每个样品的特征,时间长度为T。样本X在指标维度上可表示为一组指标,也就是将三维表按指标顺序展开为二维表,即X=[X1…X j…X p]。样本X的一个指标X j的矩阵可表示为:
其中1≤i≤q,1≤j≤p,1≤t≤T,表示第i个样品的第j个指标在t时间的数值,通过变换,把样品数扩展为qT,形成全局空间,在统一坐标系下,针对二维表只进行一次因子分析,得到统一的公共因子,进而得到各样品的得分。
2.多指标面板数据的标准化处理
为了消除指标之间量纲的影响,需要对原始数据进行标准化处理,即第j个指标的均值:j个 指 标 的 方 差:经过变换之后,变量的均值为0,标准差为1,且消除了量纲的影响。
3.数据检验
为了考察收集到的原始数据是否适合进行因子分析,利用KMO 检验和Bartlett 球体的检验结果进行判断。
4.因子提取
因子提取是根据我们所采集的原始变量确定出少数几个因子,使他们能够较为准确地反映原始变量所表述的绝大部分信息,以达到降低线性回归方程维度的目的。常用的主要方法是主成分提取法。首先假设相关矩阵的特征值为λi,若λ1≥λ2≥…≥λm,则根据方差累积贡献率(一般在80%以上)来确定因子的个数P。
5.因子命名和解释
因子命名可以通过因子载荷矩阵并结合所要研究的实际命题来完成,当因子含义难以精确表述或模糊不清时,就需要进行因子旋转,通常采用的方法是Varimax(方差最大正交法)。
6.计算因子得分和综合因子得分
为了计算各主因子得分,对各指标变量进行线性回归,主因子得分的计算公式:
式中:F1,F2,…,Fn为主因子,an1,an2,an3,…,anm表示各指标在第n个主因子上的得分。样本的综合得分值可由各因子特征值的方差贡献率和该因子得分乘积的加权和与累计方差贡献率之比确定,表示如下:
人口城镇化主要表现在城镇人口比重的变化上,其核心内容是农村人口向城镇的集聚,即地域转移。而人口城镇化质量不仅体现城镇人口比例的变化,更体现在城镇人口生活水平的改善、生活方式的变更、教育文化水平的提高,其表现了新迁入城市的居民和原居民在三观的价值取向和生活方式不断转换、生活质量不断提高的过程。对人口城镇化发展质量进行评价,需要构建人口城镇化质量综合评价指标体系。按照指标的代表性、多样性、可获得性等原则,围绕人口城镇化质量内涵,同时兼顾可比性和数据的可获取性,本文选取12 个指标,在进行区域经济的综合评价时,由于各地区人口数量是不同的,若用绝对数进行评价不能反映出综合实力,因此采用了相对数,比如:人均地区生产总值、每万人在校大学生数,指标分别为:X1:人口城镇化率(%);X2:人均地区生产总值(元);X3:建成区绿化覆盖率(%);X4:每百人公共图书馆藏书(册、件);X5:人均居民用水量(吨);X6:城乡居民人均生活用电量(千瓦时);X7:每万人拥有公共汽车(辆);X8:每百万人拥有医生数(位);X9:每万人在校大学生人数(个);X10:城镇居民可支配收入(元);X11:教育支出占财政支出比重(亿元);X12:职工平均工资(元),它们构成了陕西省人口城镇化质量评价指标体系。数据来源为2013——2021 年的《陕西统计年鉴》《中国城市统计年鉴》,所有涉及价格的数据均换算为1980 年不变价。城市位置、行政边界等取自国家基础地理信息中心1 ∶400 万数据库。
按照研究方法第1 步将三维数据转化成二维形式,构建2013——2021 年陕西省10 个地级市12 个指标的全局数据表,进而按照步骤2 将数据进行标准化处理。再利用SPSS 软件进行数据有效性检验,本文采用KMO 取样适当性度量和Bartlett 球形检验,结果KMO 检验值为0.751,指标之间偏相关系数较大,Bartlett 球度检验统计量为845.313,检验的P值接近0,表明拒绝单位相关原假设。由此可知,本文数据适合因子分析。
通过SPSS 对数据进行因子分析,显示结果共有3 个因子的特征根大于1(表1),分别为5.617、1.908、1.244,其中3 个公因子总共解释了原始变量方差的82.537%,表明这3 个因子包含了12 个变量的绝大部分信息,因子分析的效果比较理想。3 个因子所解释的原始变量的方差发生了变化,旋转后因子的含义更加清楚。
表1 解释的总方差
由表2 中数据可知:F1的权重最大,约占52.86%,是最主要的影响因子,其在X1、X2、X10、X12各指标上的载荷大,表明F1与这些指标有较高的相关性,这些指标从各方面分,反映居民在城镇生存的难易程度,可称之为生存质量;F2的权重为17.96%,是次要影响因子,其在X4、X8、X9、X11各指标上的载荷大,这些指标主要反应居民未来发展的情况,可以称之为发展质量;F3的权重为11.71%,其在X3、X5、X6、X7各指标上的载荷大,这些指标主要涵盖了居民的衣食住行等情况,可以称之为生活质量。
表2 旋转成分矩阵
根据因子得分系数矩阵(表3)和原始数据标准化后的数据得到各指标的得分F1、F2、F3,根据F1、F2、F3得分可以计算出陕西各地市人口城镇化质量的各年综合得分(表4)。
表3 因子得分系数矩阵
表4 陕西省10 个地级市人口城镇化质量综合得分
本文在基于前述多指标面板数据因子分析所得到的综合得分数据,分别从序空间、相空间、实空间3 个角度研究陕西省人口城镇化质量空间结构的演变历程。
分别计算上文求得每年10 个城市的综合得分以及生存质量、发展质量和生活质量三个主要成分的标准差。分析综合得分可以看出:2013 年10 个城市综合得分的标准差为1.737,2021 年上升至2.241,9 年间差距扩大了2.08 倍;选取2013 年、2018 年、2021 年3 个主要时间节点采用ARCVIEW 分层设色图示法,3 个年份采用3 种数据分级分别进行分层设色,即3 个年份的图形在空间格局上可比、在颜色上不可比,将10 个城市的综合得分标准值按颜色深浅标绘在地图上(图1)。从图1 可以发现,2013——2021 年陕西省人口城镇化质量空间格局由低水平的均衡向不均衡演变,发展差异逐年增大;仔细分析各城市发现,西安的人口城镇化质量水平综合得分遥遥领先,近9 年来一直保持排名第一的位置,榆林、铜川、延安三座城市发展速度较快,排名第二、三、四位,宝鸡市排名第五位,咸阳排名第六位,汉中、渭南第六、七位,安康、商洛处于后列,排名没有太大的变化。
图1 不同数据分级方法下的陕西人口城镇化质量演变
从人口城镇化质量发展水平的动态变化来看,从2013 年到2021 年,综合得分增幅大于1.0 的共有8 个地区,西安的综合得分上升了一倍,增长至两位数。榆林、铜川、延安三个地市增幅最快,综合得分上升了将近两倍。宝鸡、咸阳紧随其后。汉中在陕南增幅最大,但相对关中差距仍较为明显。渭南综合得分增幅大于1.0,但相对其他关中平原地市,差距不小。增幅最小的是地处陕南山区的安康和商洛,综合得分增幅小于1.0。总的来说,2013——2021 年,陕西所有城市的人口城镇化质量有了飞速增长,但参差不齐。10 个城市的SPSS 聚类谱系如图2所示。
图2 10 个城市的SPSS 聚类谱系图
人口城镇化质量不断提高选取2013 年、2018 年、2021 年3 个主要时间节点,采用ARCVIEW 分层设色图示法3 个年份采用同一种数据分级进行分层设色,即3个年份的图形在空间结构和颜色上均为可比,可以发现,2013——2021 年陕西人口城镇化质量不断提高(见图3)。具体分析可见,2013 年,除西安这一城市外,其他城市的人口城镇化质量发展水平较低;2018 年以后,西安人口城镇化质量持续走高,发展速度之快。咸阳、铜川、延安、榆林紧随其后,陕北和关中相继攀升。2021 年西安己达到新的发展高度,延安、榆林也进入较高水平,同时全省大部分城市也整体起步。因此,可以看出,从2013 年到2021 年,陕西省人口城镇化质量由低水平逐步走高,其发展过程呈现出由西安到陕北到关中其他城市,再到全省范围的梯度扩散。进一步将三个主成分不同年份各城市平均得分进行比较发现,第一主成分(生存质量)呈现出逐年上升的局面,由2013 年得分的1.720 上升到2.504,上升速度最快;其次为第二主成分(生活质量)由2013 的0.192 年得分上升到2021 年的0.831;而第三主成分(发展质量)则由2013 年得分0.285,上升到2021 年的0.460,位列第三,可见陕西省人口城镇化质量的提高很大一部分来自于生存质量提高所做的贡献。
图3 相同数据分级方法下的陕西省人口城镇化质量的演变
本文运用多指标面板数据因子分析法,测算陕西省人口城镇化质量并对其进行了分析,得出如下结论:(1)人口城镇化质量发展是一个复杂的人类社会变迁过程,涉及经济、教育、文化等各方面,对人口城镇化质量的发展进行测度和评价,应采用多指标综合评价方法。本文应用多指标面板数据因子分析法,不仅能克服主观赋权法无法避免的随机性、臆断性问题,避免多指标变量间信息的重叠,而且能有效规避因时间节点选取不科学导致的研究不一致,具有较强的实用性。(2)陕西省10 地市人口城镇化发展质量整体有了很大的提高,从2013 年起,陕西人口城镇化质量有了较快的发展,但同时可以看出,陕西人口城镇化质量发展很不平衡,空间差异十分显著。(3)从以上研究可以发现,关于人口城镇化质量的研究,目前尚不成熟,有关人口城镇化质量的内涵及其评价指标各学者各抒己见,表述不一。本文以陕西省10 个城市为例,设立了3 个因子、12 个指标的人口城镇化质量评价指标体系。由于目前研究者所站的角度不同,对人口城镇化质量的内涵理解不同。加之研究方法的差异,统计资料的采集困难,相关指标数据的缺失,导致我们的指标体系存在一定缺陷,有待在以后的研究中进一步充实和完善。