基于数学模型的城镇化贡献因子分析及预测

2016-01-21 05:56李逸菲

重庆第二师范学院学报 2015年1期

关键词：城镇化

李逸菲

(山东师范大学数学科学学院，山东济南250014)

基于数学模型的城镇化贡献因子分析及预测

李逸菲

(山东师范大学数学科学学院，山东济南250014)

摘要：选用灰色关联度模型，利用matlab编程，定量分析城镇化对经济和社会发展指标的依赖程度。计算灰色关联度得到第二、三产业尤其是工业的发展程度是影响城镇化进程的最主要的因素；农村教育水平和人口素质等教育指标对城镇化率有着重要的贡献；农村居民人均纯收入也对城镇化有着重要的影响，且这种影响要比城镇居民人均可支配收入对城镇化的影响大；农村总人口对城镇化的影响程度最小。用logistic模型评价并预测了中国的城镇化率。中国的城镇化进程分为三个阶段：城镇化发展水平较低、发展速度较慢的初级阶段；人口迅速向城镇聚集，城镇化发展速度加快的中级阶段；城镇化已经达到一定水平，城镇化增长趋势变慢甚至停滞的高级阶段。计算得到未来几年的城镇化率的预测数据，由此预测到2050年，中国的城镇化率将达到73%，基本实现城镇化。

关键词：城镇化；灰色关联理论；logistic预测

随着经济社会的发展和现代化建设进程的加快，农村城镇化成为必然趋势。城镇化的程度也是一个国家或地区经济和社会发展水平的标志，是推动社会进一步发展的动力。城镇化的发展给社会生活以及经济的方方面面带来巨大变化。影响城镇化进程的因素很多，中国人多地少，从事农业生产的人口大大超过需求，是一种劳动力剩余经济。随着农业生产技术的进步，农业生产将不再需要这么多劳动力，剩余的劳动力必将进入城镇从事第二第三产业，劳动力的转移和产业结构的变化将对城镇化产生影响。城镇化不仅仅是把农业用地转为非农业用地，也不是简单地把农村劳动力转为非农村劳动力，而是包含着人口聚集、基础设施建设、生活方式改变、产业结构调整、耕作技术革新、耕作方式变化、金融融入农业等一系列因素的科学合理的让农村由单一的耕作地转为城市的过程。农村人口能否适应城市生活、能否转变生产角色是城镇化的关键。

改革开放30多年来，中国工业化、城镇化步伐明显加快，城镇居民从1.7亿人增加到7亿人，促进了经济发展和社会进步。2011年末，中国城镇人口首次超过农村人口，达到6.9亿人，2011年城镇化率比2010年提高1.59%，达到51.27%，2000-2010年间城镇化率上升13.46%。表1是中国2001-2012年的城市化率数据，数据来源于《2013中国统计年鉴》。

表1　中国2001-2012年的城市化率

中国的城镇化率与发达国家相比有较大差距，尚处于发展阶段。改革开放的深入和经济的飞速发展，必将提高城镇化水平。准确找到影响城镇化进程的因素，并把握其规律性，对经济发展十分重要。由于城镇化进程受多种因素的影响，且各因素交叉作用十分复杂，在建立模型研究城镇化影响因素时，把所有因素考虑进去既不现实，也不科学，合理选择才是关键。本文选取几个有代表性的经济和社会发展指标，分析城镇化对这些指标的依赖度，以及这些指标在提高城镇化率方面的贡献度。

一、灰色关联度分析贡献因子

(一)灰色关联度模型的建立

由于影响城镇化的因素众多，且各因素之间的关系错综复杂，互相影响，所以选取分析方法时,要使分析方法尽量符合客观实际。传统的数理统计中常用的分析方法有方差分析、回归分析、主成分分析等，但是这些方法所需数据量大、计算过程繁杂,并且还需要样本服从某个典型的概率分布,更受局限的是各因素变量与系统特征变量之间要呈线性关系且各因素之间彼此无关。这些分析方法还很有可能出现定量分析结果与定性分析结果不相符合的情况。而灰色关联度模型就很好地避免了上述缺陷,该模型对观测数据要求不高,分析结果真实可靠。

灰色关联度是两个系统或系统内的各因素随时间变化时，其随着时间或不同对象而变化的关联程度大小的量度。灰色的含义是部分信息已知，部分信息未知，即信息不完全，区别于白(信息完全已知)和黑(信息完全不知)。灰色关联度方法是根据具体的灰色系统的行为特征数据，利用数量有限的数据寻求相关变量之间的数学关系，建立灰色关联度模型。灰色关联度模型是根据序列曲线几何形状的相似程度判断其联系的紧密性,曲线越接近,则相应变量之间的关联度就越大,反之就越小。关联度大的因素就是影响城镇化进程的主要因素，反之，关联度越小，则说明该因素对城镇化的影响不大。通过灰色关联度分析，可以看清哪个指标对影响城镇化进程起着主导作用，哪个指标是潜在因素，分清主次就可以抓住主要矛盾，集中精力进行建设，科学推进城镇化进程。

灰色关联度模型的建立过程如下：

确定分析序列，即确定一个因变量因素和多个自变量因素。因变量数据构成参考序列，自变量数据是比较序列。设定原始序列为

X0=[x0(1)，x0(2)，…，x0(n)]

并且有m个原始数列的比较序列，分别为

Xi=[xi(1)，xi(3)，…，xi(n)]i=1,2，…，m

一般原始序列具有不同的数量级和量纲，不能直接进行比较和运算，为了保证分析结果的准确性，需对数据进行规范化处理。一般情况下，处理方法有两种，即初值化处理和均值化处理。在此，我们对上述数据进行初值化处理。采用每一列中的第一个数Xi(1)，除以这一列中的其他数Xi(k)：

m=9，Xi(k)为i因素第k年的数据。

根据标准化以后的参考序列和比较数列，求出差序列。记

Δi=(Δi(1),Δi(2),…,Δi(n)),i=1,2，…，m

这里求出k时刻各因子与城镇化水平X0(k)的相宜程度。

求两级最大差和最小差。记

其目的是减弱最大或最小对差数太大引起的失真，提高关联系数之间的差异显著性。

求关联系数。

其中p为分辨系数，取值范围是0~1之间。不同的p值对应着不同的关联度，它可以用于提高关联系数之间的差异显著性。P值越小，分辨率越高。一般情况下，p值通常取0.5。

计算关联度。因关联系数是比较数列和参考数列在不同时间的关联程度的值，所以，它不止一个数，为了便于整体比较，有必要将各个时间的关联系数化为一个数值，求其平均值作为比较数列和参考数列之间关联程度的数量度量表示，这是灰色关联度。灰色关联度公式为

δ0i是X0(此为母序列)与Xi(此处为子序列)的关联度。n为数列的长度。关联度越大，说明Xi与X0越接近，即这个指标对城镇化率的贡献越大。

(二)灰色关联度模型指标的选取与数据

城镇化建设水平的高低受到各种因素的影响，如一、二、三产业等经济指标的影响；农村人口的受教育程度越高，便越容易适应城市的生产生活，城镇化进程也就越快等。我们选取经济和社会生活中比较有代表性的一系列指标作为城镇化驱动力的影响因子，进行灰色关联度分析。城镇化率指标有多重解释，也有不同的定义，通常用市镇人口占总人口的比重来表示，记为X0。其他选取的影响因子的指标分别为，X1：第一产业产值(亿元)；X2：二、三产业产值占GDP比重(%)；X3：工业产值占GDP比重(%)；X4：非农从业人员占总从业人员的比重(%)；X5：城镇居民人均可支配收入(元)；X6：农村居民人均纯收入(元)；X7：农村总人口(万人)；X8：人均GDP(亿元)；X9：每10万人拥有在校大学生数(人)。中国2001-2012年来自《2013中国统计年鉴》的各项指标的数据见表2。

表2　中国2001-2012年的各项指标的数据

(三)结果及分析

利用matlab，求出影响城镇化的各因素的灰色关联度为：

δ01=0.6392δ02=0.9991δ03=0.9999

δ04=0.9997δ05=0.7897δ06=0.9233

δ07=0.4054δ08=0.7252δ09=0.9670

对灰色关联度的计算结果记性分析，关联度越高，则意味该因素对城镇化的贡献率越大。则可看出影响程度X3>X4>X2>X9>X6>X5>X8>X1>X7,各因素对城镇化的贡献大小为：工业产值占GDP比重>非农从业人员占总从业人员的比重>二、三产业产值占GDP比重>每10万人拥有在校大学生数>农村居民人均纯收入>城镇居民人均可支配收入>人均GDP>第一产业产值>农村总人口。

从分析结果看，2001年到2012年期间，对城镇化进程最有推动力的因素为第二、三产业，尤其是工业，对城镇化的进程起着最重要的作用，只有先实现工业化，才能实现现代化和城镇化。中国正处于社会主义初级阶段，是发展中国家，所以经济的增长(尤其是经济的宏观长期增长)才是解决问题的关键。大力发展工业，正是推进经济增长的重要手段。

每10万人拥有在校大学生数的影响居于其次，说明受教育程度和人口素质对城镇化有着非常重要的影响。要推进城镇化进程，必须大力发展教育，鼓励农村青少年上大学，提高农村人口的受教育程度，这样才能让农业人口真正适应城镇化后的生活。

农村居民人均纯收入也对城镇化有着重要的影响，其影响要比城镇居民人均可支配收入的影响大。这说明农民自身收入提高之后向城镇迁移的趋势增强所形成的推动力，要大于城镇居民人均收入较高对农民形成的吸引力，意味着相对于农民对城镇高生活水平的向往，农民选择城镇生活(即城镇化)的主要因素是自身收入水平的提高。我们要加快城镇化进程，就要努力提高农民的收入水平。近几年我国农民工的工资有了较大的增长，这不仅是为了维护农民工的利益，而且是加快城镇化进程的重要手段之一。

另外，第一产业产值也是影响城镇化建设的重要因素，但是它对城镇化的贡献率远远小于第二、三产业。人均GDP、农村总人口也有着重要的影响，其中农村总人口的影响程度最小，这说明现阶段计划生育控制人口对我国城镇化进程的影响日益减少，放开单独二孩政策并不会像几十年前那样让农村人越过越穷，农村人口的增加，并不会对城镇化建设造成阻碍。

二、logistic模型预测城镇化率

(一)模型建立

进行城镇化率的发展水平预测，是十分重要的。城镇化的过程包含着多方面的因素，极其复杂，所以模型的选择是关键。Logistic增长曲线模型较为著名，在经济预测中应用较为广泛。

图1　S型曲线

图1是诺瑟姆根据不同国家和地区城镇化进程的共同规律，概括成的一条S型曲线。城镇化一般分为三个阶段。第一阶段城镇化发展水平较低、发展速度较慢，是初级阶段；第二阶段人口迅速向城镇聚集，城镇化发展速度加快，是图中S的中段；第三阶段城镇化已经达到一定水平，城镇化增长趋势变慢甚至停滞。

Logistic增长曲线的一般形式为

该增长曲线有两个重要特征，一是y随着t的增加至+∞而趋向于K，K即是y的饱和值；当t→-∞时，y趋向于0。二是增长速度存在着一个拐点，在拐点之前增长速度越来越快；在拐点之后，增长速度越来越慢，直到速度为0，所以总体曲线近似于S型。a和b是待估计参数，K我们选择给定为1。

由于直接对参数估计不易，所以我们把Logistic增长曲线线性化，然后用线性模型的参数估计方法对a和b进行估计。将上式写成

模型建立后，我们选取20年的数据(数据来源于《2013中国统计年鉴》)，利用回归分析软件求出线性式Z(t)=α+β·t中的系数α和β，最终得到城镇化率的预测曲线。

(二)模型求解

根据近20年的城镇化率计算出的Z(t)和时间的关系，用matlab作散点图2。

图2　散点图

由图2可看出Z(t)和t是线性关系。用统计软件进行参数估计(见图3)，

图3　统计软件的参数估计截图

结果可得出：α=50.00640，β=-0.024879。由图3中数据可以看出拟合程度很好。

中国城镇化率的logistic预测模型为

将时间t代入上式即可以预测城镇化率。计算得到2050年，我国城镇化率将达到73%，基本实现城镇化。

三、研究存在的不足

本文对logistic的研究存在不足之处。化为线性式子再进行拟合，由于时间的区间为1949-2050年，而城镇化率却小于1，自变量和因变量数量级差别较大，这样进行编程计算会存在一定的误差，预测并不十分准确。图4是用matlab绘制的实际城镇化率的统计数据和用本文logistic增长曲线预测模型预测数据的差距。可以看出，在2010年之前，差距还是比较大的。

图4　实际城镇化率的数据和用本文logistic增长曲线预测模型预测数据

预测数据和实际数据出现差异，固然有自变量和因变量数量级差别较大的原因，更主要的原因是增长曲线的a和b是随着年份的变化而变化的。本文求a和b用的是1993-2012年的数据，而随着科技的发展和技术的进步，近20年增长曲线的a和b与建国之初1949年的a和b是不同的。对于参数的计算，应该分时间段完成。但是logistic增长曲线的预测是对未来的预测，而对于未知时间的a和b计算是无法进行的，这值得我们继续研究。

参考文献：

[1]孙中和.灰关联理论及Logistic模型在中国城镇化研究中的应用[J].中国农村观察,2001(6)．

[2]李子奈.计量经济学[M]．北京:清华大学出版社,2003.

[3]薛小荣,党小刚.基于灰色理论的西安土地利用预测研究[J].西安交通大学学报，1999,33(11):47-50．

[4]赵文英.基于改进Logistic模型的黑龙江省城镇化水平预测[J].数学的实践与认识,2013(7).

[责任编辑王南山]

中图分类号：F291.1

文献标识码：A

文章编号：1008-6390(2015)01-0035-05

作者简介：李逸菲(1992-)，女，山东师范大学数学科学学院学生。

收稿日期：2014-11-10