肖凌峰++李明东++郑茹++黄威威++雷舒砚
摘要:以南充市1997-2014年人均GDP和城市化水平为参考依据,建立南充市一元线性回归模型,对其有效性做了检验后得出的结论为:南充市的城市化水平与其人均GDP之间存在着一元线性关系,并且在2020年南充市城市化水平将在60.5%-76.5%之间。
关键词:南充市;回归预测模型;城市化水平一、引言
城市化是现代最有力也是当今世界上持续最长最稳的发展趋势之一。是人口向城市集中的过程[1],其水平的高低也逐渐成为能够反映一个地区经济发展好坏的重要标志。南充市历史悠久,建城至今已有2200多年,独特的文化气息加其特殊的地理位置,从古至今一直是川北重镇,是川东北政治、经济、文化中心和水陆交通要道。自改革开放以来,南充市城市建设突飞猛进,城市化速度加快。2004年,四川省的南充与攀枝花、绵阳、自贡一起,跨入大城市之列[2]。最近,南充市政府正在加大新型城镇化的发展,作为最能代表城市发展的城市化水平指标便显得尤为重要。至2014年南充市全市建成区面积达到228平方公里,其中主城区建成区面积达到113平方公里;农业人口579.95万人,非农人口179.08万人。城市化水平的发展受地理位置、社会经济、自然条件与政治因素等诸多因素的影响,在其城市发展过程中需扬长避短,驱利避害,明确城市的定位,在城市化水平稳步提升的同时其城市布局,产业结构也能够得到健康的调整。本文基于线性回归模型以南充市为例,以其近几年人均GDP和城市化发展水平作为主要依据,建立合适的回归模型,系统的对南充市2020年城市化水平进行预测。
二、假设及建立模型
为了探究四川省南充市城市化的相关问题,用南充市城市人口占其总人口的比重作为衡量城市化水平的指标(设为因变量y),用南充市人均国内生产总值作为衡量经济发展水平的指标(设为自变量x),基于此,分析数据,第一步构建散点图从南充市统计年鉴中获取了1997~ 2014年的城市化水平及人均国内生产总值的统计数据并制成散点图(图1)。
由图1可知,城市化水平随着经济发展水平的提高也相应提升,且近似于一条直线,从而近似认为在1997-2014年间城市化水平y与国内人均生产总值x之间存在着线性关系.
第二步,确立模型。基于以上假设,即可列出一元线性回归的数学模型:yα=β0+β1xα+εα,在上式中,yα是作为代表城市化水平的因变量;xα是作为爱代表人均GDP的自变量,α的取值范围为1997-2014;β0和β1为待定系数;εα为各种随机因素对因变量yα的影响。在数学模型yα=β0+β1xα+εα中,为了确定待定系数β0和β1的值,需采用一定的方法对β0,β1进行估计。若得出的结果为β^0,β^1,即β^0,β^1为β0,β1的估计值,那么就称函数y^=β^0+β^1x为因变量y关于自变量x的一元线性回归方程[3]。
第三步,确定系数。由上述模型可知,为得到相应的函数,首要任务就是确定待定系数β0和β1,最常用的确定估计值的方法是最小二乘法。因其估计出来的β^0,β^1所做出的直线能够最大化接近实际各点数据,也就是说,它能最直接准确地反应变量之间的线性关系。经计算,求出的回归系数(计算过程略):β^1=1.349×10-5 β^0=15.8% 从而得到回归方程为y=15.8%+1.349×10-5x
三、模型的有效性检验
(一)回归方程的F检验。对回归方程进行F检验,第一步计算出上式回归方程的F值,再通过查询F分布表,找出Fα(1,n- 2)的值,若计算出的F值大于所查得的Fα(1,n- 2)的值,则可判定所得出回归方程具有显著性。其中F值的计算公式为:F=SrSe/(n-2),Sr为回归平方和,Sr=∑ni=1(y^i-y-)2,代表x的变化对y的影响;Se被称为残差平方和,Se=∑ni=1(yi-y^i)2,代表实验误差以及其他因素对y值的影响。而St=Sr+ Se称为总离差平方和,代表回归方程的总体误差。第二步,查询F分布表并计算F值。先确定显著性水平α= 0.05,即方程准确程度为95%。在对应的α表中,Fα(1,n-2)的值为相对应α表中(1,n-2)所代表的数值。经计算(计算过程略),F= 84.71查表F0.05(1,18- 2)= 4.49。第三步,比较二值大小可得F>F0.05(1,18- 2),说明在95%的方程准确度的水平下,所算得的回归方程具有显著性意义。
(二)相关系数检验。相关系数是用以反映变量之间相关关系密切程度的统计指标,其线性相关系数R的计算公式为R=LxyLxxLyy其中,Lyy=∑ni=1(yi-y-)2,相关系数的取值范围是 R ≤ 1。经计算,R=09171638,近于1.若R>Rα(n-2),则认为回归方程的线性相关水平是显著的.查询相关系数R检验表:在显著性水平α= 005表中找到n-2所代表的数值,查询可得R0.05(18- 2)= 0.468。相比较可知 R>R0.05(18- 2),说明了在精确度为95%的水平下(即α=005),回归方程的线性相关水平是显著的。
根据以上回归方程的F检验和相关系数检验说明,由城市化水平与人均GDP数据之间建立的城市化水平回归预测模型符合预测要求,可用于南充市城市化水平预测。
四、模型预测
y0的准确程度为95%的取值区间为(y0-2S,y0+2S),其中S2=Sen-2,其中Se=0.0273897,则S= 0.04137458.根据南充市2020年国民经济和社会发展目标,全市人均GDP预计达到39113元。根据回归预测模型y=15.8%+1.349×10-5x计算可得y0=0.685。准确程度为95%(α= 0.05)的取值区间为(60.5%,76.5%),这一结果表明,到2020年,南充市的城市化水平在60.5%至76.5%之间。
五、结论
第一,由于线性回归预测模型能够很好的反应出城市化水平和人均GDP之间的线性关系,所以本文运用线性回归模型预测南充市城市化水平具有较高的精确度和说服力。
第二,南充市城市化水平和人均GDP存在着正比关系,两者互为线性关系,根据南充市回归预测模型的预测,2020年南充市的城市化水平将达到68.5%,其波动范围将在60.5%-76.5%之间,其波动范围较大,证明南充市近几年的发展速率存在着不平稳的情况,波动起伏较大,因此,南充市在经济发展的同时更要注重如何平稳的发展。
第三,随着国家对西部的发展政策日益完善,得益于西部大开发战略,南充市在2000年的国民经济得到了跨越式的发展,在此阶段人民的生活水平质量得到明显提高,进而影响了城市化水平的快速提升。但相比于一些发达地区仍然有较为明显的差距,如何完善经济政策,改良产业结构,改善投资环境仍然是阻碍发展的大问题
参考文献:
[1]许学强,周一星,宁越敏.城市地理学[M].北京:高等教育出版社,1997:43.
[2]陈学珍 论南充市城市发展现状及未来展望[J]四川 西华师范大学