张宣昊
(上海第二工业大学理学院,上海201209)
基于我国财政收入统计模型的应用回归分析案例教学研究
张宣昊
(上海第二工业大学理学院,上海201209)
收集了我国宏观经济指标数据,利用多元线性回归分析方法建立了我国财政收入的统计模型。揭示了影响我国财政收入的主要经济因素,为政府制定经济政策提供依据。同时也为统计专业主干课程“应用回归分析”提供一个综合性教学案例,帮助学生更好地理解并掌握回归分析的统计方法。
回归分析;逐步回归;财政收入;教学案例
“应用回归分析”是统计专业的主干课程。回归分析是确定两个或两个以上变量间相互依赖定量关系的一种常用统计分析方法,运用十分广泛。综合性案例分析是“应用回归分析”教学的一个重要手段,通过实际统计案例能更好地帮助学生快速掌握回归分析这一实用的统计方法。
本文收集了我国宏观经济指标数据(1955~2014)[1],采用逐步回归方法筛选变量并做异方差的处理,建立了我国财政收入的统计回归模型,揭示影响我国财政收入的主要经济因素。具体指标及模型中对应的变量如下:y为财政收入(亿元);x1为交通运输仓储邮电通信业(亿元);x2为批发零售贸易及餐饮业(亿元);x3为黄金储备(万盎司);x4为第三产业(亿元);x5为建筑业(亿元);x6为工业(亿元);x7为第一产业(亿元);x8为第二产业(亿元);x9为人均国内生产总值(元);x10为国内生产总值(亿元);x11为年末总人口(万人);x12为出口总额(亿元);x13为进口总额(亿元);x14为外汇储备(亿美元);x15为进出口总额(亿元)。
通过我国财政收入回归分析的实际案例,可使学生充分理解回归分析方法的统计意义及其应用价值,能帮助教师提高“应用回归分析”课程的教学效果。
多元线性回归是指有多个解释变量的线性回归,用于揭示被解释变量与多个解释变量间的线性关系,多元线性回归的数学模型为:
其中:y为响应变量;xi为自变量(i=1,2,···,p); ε~N(0,σ2)为随机误差项[2-3]。
合理有效的回归模型要求自变量“少而精”[4-5],学生在初步学习回归分析时容易将所有收集到的指标变量加入模型而违背了“少而精”的原则,使得模型效果不理想。通过SPSS统计软件,以财政收入为响应变量,对15个常用经济指标筛选变量[6-7],使学生通过案例更直观地了解筛选变量的过程和方法。
1.1 自变量的选择
利用逐步回归法,经过7步变量筛选得到表1所示的逐步回归系数。
根据表1第7步回归系数得回归模型:
注:回归分析中自变量的选择最常用的有效方法是逐步回归法——从15个经济指标中逐个筛选并检验后加入回归模型中,直到所选变量均通过显著性检验。
1.2 多重共线性的检验与处理
一般经济指标之间本身有较强的相关性,即存在多重共线性现象,而表1所列逐步回归第7步的多个指标存在VIF统计量远大于10的情况,模型拟合效果不佳。依次去除VIF值最大的变量,重新建立模型,如表2所示。
表1 逐步回归系数Tab.1 Stepwise regression coeff i cients
表2 回归系数Tab.2 Regression coeff i cients
可见最终3个自变量的VIF统计量均小于10,即消除多重共线性后的回归模型为
1.3 异方差的检验与处理
异方差是常见的影响回归模型效果的问题,例如建立居民收入与消费水平回归模型时,由于低收入家庭购买的差异性比较小,高收入家庭购买行为的差异很大,导致模型的随机项具有不同的方差,即产生了异方差。当存在异方差时,普通最小二乘估计将不再是最小方差线性无偏估计且参数的显著性检验失效。学生在做回归分析时最容易疏忽的问题之一就是直接对回归参数做最小二乘估计而不做异方差的检验。以下对上述筛选变量后的财政收入模型加以说明与处理。
随着我国经济的高速发展,我国财政收入不断增长[8],确实有必要对模型做异方差的检验与处理。由图1可见,残差分布极其不均匀,模型可能存在异方差。继续用等级相关系数法进一步检验。由表3得残差绝对值与x1的等级相关系数为0.709,残差绝对值与x3的等级相关系数为0.632,残差绝对值与x14的等级相关系数为0.807,可以认为残差绝对值与各自变量显著相关,即模型确实存在异方差。
消除异方差一般可使用加权最小二乘法重新估计参数,选取等级相关系数最大的自变量x3构造权函数,得到输出结果如表4所示,即最终回归模型及标准化模型为:
且模型判定系数R2=0.926,模型有很好的拟合效果。
图1 残差图Fig.1 Residual plots
表3 等级相关系数Tab.3 Rank correlation coeff i cients
表4 回归系数Tab.4 Regression coeff i cients
影响我国财政收入规模的经济因素有很多[9],其中最直接、最能反映财政收入变化规律的是进出口总额、年末总人口数、黄金储备等几个指标。由财政收入的多元线性回归方程得:在其他变量不变的情况下,黄金储备每增加1万盎司,将使得财政收入平均增加0.080亿元;同样在其他变量不变的情况下,年末总人口每增加1万人,财政收入平均减少0.015亿元,进出口总额每增加1亿元,财政收入平均增加0.368亿元。另由标准化的回归方程得:进出口总额对财政收入的影响最大,黄金储备对财政支出的影响相对较小。根据影响财政收入的主要经济因素制定宏观经济政策能使财政收支平衡,是社会总供求平衡和国民经济健康发展的有力保证[10]。
财政收入回归分析过程较充分地运用了多元回归分析过程中的逐步回归法和异方差检验处理法,在教学中可作为一个综合性的案例帮助学生了解筛选变量和做异方差检验的必要性,从而更好地掌握回归分析这一应用广泛的统计方法。
[1]国家统计局.中国统计年鉴(2015光盘版)[M].北京:中国科学出版社,2015.
[2]何晓群,刘文卿.应用回归分析[M].2版.北京:中国人民大学出版社,2011.
[3]王松桂,陈敏,陈立萍.线性统计模型——线性回归分析与方差分析[M].北京:高等教育出版社,1999.
[4]王学民.应用多元分析[M].2版.上海:上海财经大学出版社,2004.
[5]何晓群.多元统计分析[M].4版.上海:中国人民大学出版社,2015.
[6]薛薇.SPSS统计分析方法及应用[M].北京:电子工业出版社,2004.
[7]时立文.SPSS 19.0统计分析从入门到精通[M].北京:清华大学出版社,2012.
[8]刘宏杰.中国财政收入与经济增长之间的定量研究:1978~2006——基于VAR模型的经济计量分析[J].河北经贸大学学报,2008,29(6):5-9.
[9]曾五一,刘小二.中国财政收入与经济增长关系的实证分析[J].统计与信息论坛,2009,24(7):34-39.
[10]李涌波.平衡财政收支保证国民经济长期稳定发展[J].中国财政,1987(9):28-29.
Case of Teaching Study of Applied Regression Analysis Based on Statistical Model of China’s Government Revenue
ZHANG Xuanhao
(School of Sciences,Shanghai Polytechnic University,Shanghai 201209,China)
The data of macroeconomic indicators of China was collected and a statistical model of government revenue using of multiple linear regression analysis was established.It revealed the major economic factors affecting our government revenue and provided the basis of government economic policy.It provided a teaching case of the main statistics courses“Applied Regression Analysis”and helped students to understand and master the regression analysis better.
regression analysis;stepwise regression;government revenue;teaching case
O212.4
A
1001-4543(2017)01-0072-04
10.19570/j.cnki.jsspu.2017.01.013
2016-08-24
张宣昊(1981—),男,上海人,讲师,硕士,主要研究方向为概率统计、最优试验设计。E-mail:xhzhang@sspu.edu.cn。
上海第二工业大学校重点学科(XXKPY1604),上海第二工业大学校重点课程建设(A01GY16F022)资助