[摘 要]文章以湖南省2010—2019年地方财政收入经济指标数据为样本数据,通过Lasso特征选择影响财政收入的关键因素,再建立单个属性的灰色预测模型,对已被Lasso特征筛选出的2020年各解释变量的值进行预测,最后通过支持向量回归预测模型得出2020年湖南省财政收入。
[关键词] 财政收入;Lasso特征选择;灰色预测模型;支持向量回归预测
[DOI]10.13939/j.cnki.zgsc.2021.29.040
財政收入是政府为满足支出需要,并依据相关的权利原则,通过国家财政集中的一定数量的货币或实物资产收入。财政收入直接决定可用财力,能充分发挥财政支持经济建设的职能作用,还能保证基层政治稳定、社会安定以及改革发展的需要。因此,对于财政收入方面的研究极具意义,故本文以湖南省为例对影响该省财政收入的因素进行分析并进行相关预测。
从现有的文献来看,大多采用传统的统计方法,而本文先通过Lasso方法进行特征选择,再基于灰色预测模型预测解释变量的值,最后结合支持向量机回归预测模型进行预测。上述分析与预测步骤均于Python软件下进行代码实现。
1 模型建立
1.1 Lasso变量选择模型
Lasso回归方法通过构建一个惩罚函数得到一个精炼的函数,以缩小特征集的思想,将特征的系数进行压缩并使某些回归系数变成0,用来进行模型的改进与选择。Lasso参数估计定义如下[1]:
2.2 Lasso变量筛选
本文基于Python软件编制的程序对影响湖南省财政收入的变量进行筛选,结果如表1所示。
2.3.2 构建支持向量机回归预测组合模型
对上述影响湖南省财政收入的变量建立支持向量机预测模型,并结合所构建的灰色预测模型所得的影响因素值对财政收入进行预测,所得的结果经整理后如表3所示。
从运行结果可以得知,2020年湖南省财政收入的预测值为5285.784154亿元。同时绘制2010—2019年财政收入真实值与预测值的线形图,如图1所示。
从图1中可以看到模型拟合效果良好,财政收入的真实值与预测值十分贴近,误差较小。
3 结论
利用Lasso回归方法识别影响财政收入的重要影响因素分别为在岗职工工资总额、城镇居民人均可支配收入、常住人口、全社会固定资产投资额、第三产业与第二产业产值比、居民消费水平。同时根据支持向量回归预测各年财政收入的结果与真实值的误差较小,可以认为基于Lasso变量筛选后,建立的灰色预测模型和支持向量回归预测模型是有意义的,预测结果也是较为精准的。
参考文献:
[1]李航.统计学习方法[M].2版.北京:清华大学出版社,2019.
[2]邓华丽,张良均.综合灰色及回归模型的地方财政收入预测法[J].中国管理信息化,2016,19(5):145-148.
[3]徐子卿.贵州省财政收入影响因素分析及预测[J].农村经济与科技,2019,30(6):158-159.
[作者简介]秦权(1998—),男,湖南永州人,广西师范大学数学与统计学院,在读硕士研究生,研究方向:应用统计。