基于Lasso回归法的人口出生率影响因素分析

2018-09-10 07:22刘丽萍

刘丽萍

摘 要:选取国内生产总值(X1)、受高等教育比例(X2)、人均薪酬(X3)、少年儿童抚养比(X4)、老年人口抚养比(X5)这五个涵盖经济发展情况、人口素质以及人口结构方面的变量,采用Lasso回归法,探讨影响人口出生率的因素.研究表明,国内生产总值、人均薪酬、少年儿童抚养比对人口出生率有明显的正向影响.

关键词:人口出生率;Lasso回归;多重共线性问题

[中图分类号]F830.9 [文献标志码]A

文章编号:1003-6180(2018)02-0001-03

Abstract:The five variables, including gross domestic product (X1), higher education proportion (X2), per capita salary (X3), child rearing ratio (X4), and elderly population dependency ratio (X5)are used to discuss the influence of population birth. Lasso regression is used to discuss the factors that affect the birth rate of the population. The study shows that the gross domestic product, per capita salary and child support ratio have a significant positive impact on the birth rate.

Key words:birth rate; Lasso regression; multicollinearity

人口问题与经济发展密切相关,是我国现阶段面临的重大问题之一.我国的人口老龄化现象比较严重,制约着我国的经济发展.伊斯特林[2]的研究表明:一些现代化因素,比如传统的农业社会向现代工业社会的转变使得人们生育理念发生了转变;一些社会压力,比如就业竞争以及生活的不安定,也会导致人们推迟生育的年龄.彭浩然和孟醒[3]运用单位根和协整方法研究了人口出生率与经济发展之间的关系,认为二者之间存在着长期稳定的关系;计划生育是影响我国人口出生率的关键因素.陈卫和史梅[4]采用了全国生殖健康调查数据,从社会经济方面对影响人口出生率的因素进行探讨,认为社会经济因素在影响生育机制时,往往是通过中间变量来实现的;来自不同社会经济背景的妇女,其生育率也存在着显著的差异.谢会萍和朱家明[5]采用Leslie模型对人口结构进行评价和预测;张炜和朱家明[6]采用ARIMA和二次指数平滑法对人口进行组合预测.从1996至2013年,我国人口出生率快速下滑.2015年以后,人口出生率有所回升.除了受“一胎”和“二胎”政策的影响,还有没有其他因素的影响?除了政策以外,影响我国人口增长率的因素还有哪些?笔者采用Lasso方法,从经济、人口结构以及人口素质等方面研究影响人口出生率的因素.

1 Lasso回归法

Robert Tibshirani[7]最早提出了Lasso回归方法,该方法是一种压缩估计方法,它通过在回归模型中引入惩罚函数,将一些不显著变量的回归系数压缩为0.采用Lasso回归方法可以解决多重共线性问题.

2 实证分析

2.1 指标选择

人口出生率(Y)指一年内平均每一千人中出生的人数所占的比例.

出生率=(年出生人数/年平均人数)×1000%.

选取国内生产总值(X1)、受高等教育比例(X2)、人均薪酬(X3)、少年儿童抚养比(X4)、老年人口抚养比(X5)这五个涵盖经济发展情况、人口素质以及人口结构方面的指标,分析它们对人口出生率的影响.[8]

2.2 人口出生率影响因素分析

根据R软甲计算出影响人口出生率5个变量之间的VIF值为21.98,条件数k为101.127,说明自变量之间存在严重的多重共线性,Lasso回归能够很好地解决自变量之间的多重共线性,可以采用Lasso回归法分析影响人口出生率的因素.根据表1建立Lasso回归模型,选择最优变量个数为3.

Lasso回归模型的估计结果为:

Y=0.371 67X1+0.050 83X3+0.157 08X4.

从Lasso回归模型的估计结果可知:解释变量受高等教育比例(X2)和老年人口抚养比(X5)被压缩为0.解释变量国内生产总值(X1)、人均薪酬(X3)、少年儿童抚养比(X4)是影响人口出生率的因素,并且都是正向影响.尤其是X1和X4对人口出生率的影响最为明显,这说明经济发展和少年儿童抚养比对人口出生率影响最大.

3 结论

人口问题是现阶段我国所面临的一大问题,它与经济发展密切相关.本文选取国内生产总值(X1)、受高等教育比例(X2)、人均薪酬(X3)、少年儿童抚养比(X4)、老年人口抚养比(X5)这五个影响人口出生率的变量,采用Lasso回归法,探讨影响人口出生率的因素.研究结果表明,国内生产总值、人均薪酬、少年儿童抚养比是影响人口出生率的重要因素,对人口出生率的影响呈正向.

参考文献

[1] 叶知远,罗仁福.“全面二孩”政策下的北京人口预测[J].中国市场,2018(3):87-89.

[2] Richard Easterlin , Eileen M.Crimmins. The Fertility Revolution: A Supply-Demand Analysis [M]. Chicago: University of Chicago Press, 1985. 1-230.

[3] 彭浩然,孟醒.中国人口出生率下降与经济发展[J]. 统计研究,2014,31(9):44-51.

[4] 陈卫,史梅.中国妇女生育率影响因素再研究[J].中国人口科学,2002(2):49-53.

[5] 谢会萍,朱家明,张素素,等. 基于Leslie模型的人口结构评价分级与预测[J].牡丹江师范学院学报:自然科学版,2017(3):17-20.

[6] 张祎,朱家明.基于ARIMA和二次指数平滑模型的人口组合预测[J]. 牡丹江师范学院学报:自然科学版,2017(1):9-12.

[7] Tibshirani Robert. Regression shrinkage and selection via the Lasso [J]. Journal of the Royal Statistical Society: Series B ( Methodological),1996,58 (1) : 267.

[8] 李松臣, 張世英. 基于逐步回归法的人口出生率影响因素分析[J]. 统计与决策, 2008(4):7-9.

编辑:琳莉