卿俸伶, 李 燕, 王 豪, 刘羽姿, 缪 林, 郑方江
(云南大学 建筑与规划学院, 昆明 650091)
改革开放以来,河南作为人口大省面临着严峻复杂的经济社会发展环境和艰巨繁重的改革发展任务。作为承担着中部崛起的领头羊和排头兵,河南省的经济发展起到了重要作用。2018年河南省生产总值(GDP)已突破48 000亿元,位居全国第五,比2017年增长7.6%以上,占据中部地区的25%以上,稳居中部地区首位[1]。作为农业大省,河南粮食产量已占据全国10%以上。相比之下,大多文献集中于农业因素对河南经济发展的研究[2-5],很多学者忽视了工业、服务业等第二、第三产业对河南经济的影响。其次,河南作为内陆省份,很多经济政策的制定都是学习沿海区域,自身优势不明显。本文通过分析影响河南省经济发展的重要因素,为河南经济社会保持总体平稳、稳中有进发展态势提供启示建议。
多元线性回归主要是研究一个因变量与多个自变量之间的相关关系,还可以通过分析找出对因变量影响显著的自变量。多元线性回归模型是含有多个解释变量的线性回归模型,其方程为
Y=β0+β1X1+β2X2+β3X3+…+βpXp+ε
(1)
式中:X1,X2,X3,…,Xp分别代表自变量;p为自变量个数;ε为随机误差;β为未知参数。如果有n组样本,那么这个多元线性回归,将会组成一个矩阵。
(2)
则该多元线性回归方程矩阵形式可写作Y=Xβ+ε。
主成分分析是采取一种数学降维的方法,找出几个综合变量来代替原来众多的变量,使这些综合变量能尽可能地代表原来变量的信息量,而且彼此之间互不相关。这种通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量叫主成分。用主成分分析筛选变量,可以用较少的计算量来选择量,获得选择最佳变量子集合的效果[6]。
由中国国家统计局官网可查得表1中相关数据[7],其中,投资率是利用固定资产投资额在河南省地区生产总值中所占百分比来衡量固定资产对经济增长的影响;城镇化率用河南省城镇年末常住人口占年末总常住人口的百分比来衡量[8]。根据所选定的数据指标,将河南省的人均地区生产总值确定为因变量Y,来代表河南省的经济发展状况;第一产业增加值占地区生产总值的比重、第二产业增加值占地区生产总值的比重、第三产业增加值占地区生产总值的比重、投资率、财政支出增加值占地区生产总值的比重、城镇化率、居民消费水平指数、教育经费增长率分别确定为因变量X1、X2、X3、X4、X5、X6、X7、X8。可得Y关于X的多元线性回归方程模型为Y=β0+β1X1+β2X2+β3X3+β4X4+β5X5+β6X6+β7X7+β8X8+ε。
表1 1999—2018年河南省经济发展指标原始数据
在河南省1999—2018年统计年鉴中,其中关于人均地区生产总值、投资率、城镇化率、居民消费水平指数和教育经费增长率存在不同程度的数据缺失。缺失值的出现使得数据分析中所表现出的不确定性更加显著,为此使用SPSS统计分析软件通过EM估算统计和回归估算统计进行缺失值分析,从未缺失数据的分布情况中推算出缺失数据的估计值,从而能有效地使用所有数据进行分析,来提高统计结果的可信度。单变量统计见表2,估算标准差见表3。
表2 单变量统计
表3 估算标准差
由表2单变量统计可知,城镇化率具有最多缺失值(30%);教育增长经费次之(15%);人均地区生产总值、投资率、居民消费水平指数最少(5%)。又原始数据中,1999—2004年城镇化率数据均缺失,故舍弃该自变量。余下缺失值可通过替换缺失值方法进行数据填补。
在SPSS统计分析软件中,对人均地区生产总值、投资率、居民消费水平指数和教育经费增长率等变量进行缺失值替换处理。由于人均地区生产总值、投资率和居民消费水平指数等变量缺失值均处于变量数据首尾两端,故采用该点的线性趋势法补填缺失值;教育经费增长率在中间和末端,故先采用邻近点中位数进行补填,后通过该点的线性趋势法补全缺失值。补全数据结果见表4。
表4 1999—2018年替换数据
相关分析是数据统计分析中经常使用的分析方法之一。通过对不同特征或数据间的关系进行分析,发现影响因变量的驱动因素。通过SPSS统计分析软件中的相关分析,得出相关性及显著性水平表(表5),并分析每个自变量之间的相关性。
表5中显示了各变量之间的相关系数,包括自变量和因变量在内的8个变量之间的Pearson相关系数及单尾检验的显著性水平。其中第一产业增加值占地区生产总值的比值、投资率_1、财政支出增加值占地区生产总值的比值等3个自变量与因变量人均地区生产总值之间的相关系数均大于0.90,且显著性相关的概率接近0.00,小于0.01,这表明它们与人均地区生产总值之间存在显著相关性,因此变量之间具有相关性。而人均地区生产总值与这3个影响经济发展的主要因素之间是否具有定量线性关系,在此通过建立一个合适的数学运算模型进行进一步验证,可将上述3个自变量和因变量人均地区生产总值_1相关数据采用逐步回归进行多元线性回归分析。
3.4.1 模型检验
多元线性回归模型的拟合度检验结果见表6,可以看出调整后模型1和模型2的R2拟合优度,模型2的拟合优度明显优于模型1(0.968>0.962)。
从表7中可以看出,模型2中的回归平方和为4 512 584 728.325,残差平方和为131 021 146.292,由于回归平方和占总平方和的97.18%,因此该线性回归模型解释了总平方和的97.18%,解释效果较好。
在表8中,根据3σ原理所显示的预测值和残值的残差统计表中标准残差的最大值为1.529<3,可见样本数据中不存在奇异数据。通过绘制样本数据观测量累积概率P-P图,如图1所示,从左下到右上的样本数据所呈现的散点基本呈直线趋势,由此可以认定样本分布基本上服从正态分布。又根据图2回归标准化残差直方图,可知大部分自变量的残差都符合正态分布。
3.4.2 回归方程模型
表9为两个模型的回归系数,根据表中非标准化系数B值得到逐步回归的两个模型分别为
模型1:Y=-12 304.594+561.544X4;
模型2:Y=-23 341.875+300.643X4+1 960.194X5。
表5 相关性及显著性水平表
表6 模型摘要c
表7 方差分析a
表8 残差统计a
因变量为人均地区生产总值_1图1 回归标准化残差的标准P-P图
由上述分析已知,模型2的拟合度明显优于模型1,且模型中自变量的显著性均小于0.05,故选取模型2作为线性回归方程模型。
由建立的线性回归方程模型Y=-23 341.875+300.643X4+1 960.194X5可知,投资率_1每增加1个百分点,人均地区生产总值可增加300.643元;财政支出增加值占地区生产总值的比值每增加1个百分点,人均地区生产总值可增加1 960.194元;且两者的数值越高,河南省的人均生产总值越高。
因变量为人均地区生产总值_1图2 回归标准化残差直方图
由表9可知,投资率_1及财政支出增加值占地区生产总值的比值的VIF=28.858(方差膨胀因子)处于10~100,故两者均存在较强多重共线性;因此,可通过主成分分析采用数学降维的方法,将变量进行信息浓缩成为互不相关的综合变量。表10为总方差解释,在初始特征值中可知成分1和2的特征值大于1,则合计可解释85.261%的方差,提取成分1和2作为主成分。
表9 回归系数a
表10 总方差解释
成分1和2与各影响因素间均无明显的公因子可解释,则采用因子旋转得到旋转后的成分矩阵,见表11。在凯撒正态化最大方差法旋转后得到的成分矩阵中,成分1与“投资率_1、财政支出增加值占地区生产总值的比值”的相关性较高(>0.9),可定义为“投资影响因子”,成分2与“第二产业增加值占地区生产总值的比值、第三产业增加值占地区生产总值的比值”的相关性较高(>0.9),可定义为“非农产业影响因子”。
表11 旋转后的成分矩阵a
根据表12成分得分系数矩阵模型,可得出各成分表达式为
F1=-0.307X1-0.014X2-0.014X3+0.342X4+0.336X5+0.046X7-0.140X8;
F2=-0.017X1+0.325X2+0.325X3-0.072X4-0.055X5+0.220X7+0.302X8。
表12 成分得分系数矩阵
由于各主成分方差贡献率不同,因此在进行综合评价时要结合主成分贡献率,协调好各主成分之间的侧重关系。以各主成分相对方差贡献率为权重,对主成分得分和相应权重进行线性加权求和构建河南省经济影响因素综合评价函数模型,即Yi=(43.449F1+41.812F2)/85.261;利用该模型计算各影响因素综合得分并对其进行排序,结果见表13。
表13 各影响因素综合得分及排序
由模型可知,“第二、三产业增加值占地区生产总值的比值”等非农产业影响因子(主成分1)综合得分最高,在各影响河南省经济因素中排名首位;“财政支出增加值占地区生产总值的比值、投资率_1”等投资影响因子(主成分2)位居第二;故两者对于河南省经济发展起着积极的正向作用。
在主成分分析模型中,第二、三等产业在成分矩阵中均达到了0.943,且两者同属“非农产业影响因子”在综合得分中位居榜首。因此为实现河南经济繁荣,提高第二、三产业增加值对其至关重要。加快工业、服务业建设来切实提高人均生产总值,实现中原经济繁荣,增强经济发展后劲,促使河南经济跃上新的台阶。
4.2.1 增加固定资产投资
固定资产投资是衡量一个区域经济活力的重要指标,固定资产的增加说明了投资者对经济前景的信心,也为经济的持续发展提供了动力。宋丽智通过协整分析和仿真检验显示固定资产投资与经济增长具有双向的格兰杰因果关系,即我国固定资产投资与经济增长存在相互促进作用[9]。在相关性分析中,投资率与人均地区生产总值相关性最强和显著性水平较高,且两个模型中均包含投资率系数。在主成分分析中,投资率综合得分位居各指标中第四位,且得分在主成分1中位居第二位。因此,扩大固定资产投资来加强投资率是提高人均地区生产总值、优化河南经济的重中之重。
4.2.2 提高政府财政支出
在相关性分析中,财政支出占地区生产总值的比重与人均地区生产总值相关性极强(0.981),在模型2中也含该变量系数。在主成分分析中,其综合得分位居各指标第三位,且得分在主成分1位居首位。因此,在经济增长方面,河南省政府财政支出起到的是积极的正向作用,扩大财政支出对河南省经济发展有着显著效果。