基于广义回归模型的人口出生率下降影响因素分析

2022-06-18 08:00李华炯尹喆轩胡新昱陈彦升
电子元器件与信息技术 2022年4期
关键词:储蓄率出生率储蓄

李华炯,尹喆轩,胡新昱,陈彦升

广州城市理工学院,广东广州,510000

0 引言

截至2019年末,我国年度新增人口跌破500万,创几十年来增量新低。近年来关于对人口出生率影响因素的研究并不少,为寻求导致出生率下降的重要因素,找到有效防止出生率持续下降的方法,本文对相关研究报告进行联合分析,利用针对性模型结合我国最新的人口数据进行更全面的分析。借助数据挖掘技术,使用优化模型预测拟合出生率的发展趋势,得出导致我国出生率下降的主要因素。随后为我国发展道路中面对低出生率这一问题提出可行性方案,根据多方面因素的影响提出有效建议,为政府提供可行性决策。

1 人口出生率的影响因素

在找到所有影响因素的数据后进行汇总,得到共86个以1990-2019年为时间范围的影响因素,并把其分为四大类。包括以围生期疾病粗死亡率(1/10万)、65岁及以上人口占总人口的比重(%)、孕产妇死亡率、15~24岁女性就业人口比率(百分比)等指标为主的人口因素;以高中学校数、中学学校数、幼儿园数、小学毕业人数(万人)等指标为主的教育因素;以刑事犯罪总数、离婚率、调解婚姻家庭纠纷数(件)、城镇登记失业率等指标为主的社会因素;以国内增值税、国内消费税、营业税、企业所得税等指标为主的经济因素[1-15]。

2 数据预处理

在进行数据处理中,有十几个影响因素存在某些年份的缺失值,需要使用缺失值填补方法对数据进行填充。缺失值填补方法主要分为两类:一类为传统缺失值修复方法,即均值替代、移动平均法、空间自回归等;另一类则为新型缺失值修复方法,即随机森林插补法、LSTM神经网络等。在对每种方法都进行了实验后,结果表明,ARIMA时间序列填补缺失值的效果最好,所以本文使用该方法进行缺失值填充。部分影响因素的缺失值填补见表1。

表1 个人所得税缺失值填补表

根据调查显示,从1994年税收改革开始,中国的个人所得征税制度才正式执行,所以ARIMA模型填补缺失值合理。

3 利用广义回归模型研究影响因素对出生率的影响

3.1 灰色关联度分析

灰色关联度分析是一种多因素统计分析的方法,它表明若两个因素变化的趋势具有一致性,即同步变化程度较高,即可谓二者关联程度较高;反之,则较低。由于需要研究对出生率影响程度大的因素,所以文章采取灰色关联度分析研究出生率与影响因素之间的关联度。具体实现步骤见文献[16]。参考表2,大于0.8的影响因素为强相关,所以文章选择出43个与出生率强相关的影响因素,分别为居民家庭恩格尔系数、围生期疾病粗死亡率、0~14岁人口数等影响因素。

表2 关联强度表

3.2 多元回归分析及岭回归

将挑选出来的43个影响因素与出生率做双折线图分析,发现大部分影响因素与出生率存在线性关系,所以使用多元线性回归模型进行分析[17]。双折线图如图1所示(由于指标太多,仅展示部分图片)。

图1 恩格尔系数与出生率的双折线图

通过使用SPSS软件进行计算,发现各影响因素间存在多重共线性关系。尝试使用了手动移除共线性的变量、逐步回归法、增加样本容量、岭回归四种方法后,发现使用岭回归可以有效地解决该问题。因此采用岭回归处理此问题。编写python代码计算得出如下岭回归方程(由于指标过多,只展示部分指标参数):

3.3 预测出生率

本文分别使用岭回归、XGBoost、随机森林、BP神经网络四种模型来对影响因素与出生率进行拟合和调参。具体实现步骤见文献[18-20]。三种模型的回归结果见表3。

表3 模型回归评价表

根据表3的R方,可见BP神经网络的R方0.987为三者中数值最大,且MSE、RMSE最小,则对数据的拟合效果最佳,所以选择BP神经网络模型预测人口出生率。然后通过ARIMA时间序列模型预测出未来六年的43个影响因素数据,代入保存好的BP神经网络模型,预测结果见表4。

表4 出生率预测结果表

表4中2020年预测出的出生率为8.8519%,与2020年国家统计局统计出的人口出生率8.5%非常接近,所以可以证明预测结果较合理。

4 模型结果及提出建议

4.1 模型结果

根据岭回归得出的模型可知,养老保险、储蓄率、性别比、避孕普及率是影响出生率变化趋势的重要因素,其中出生率与养老保险、储蓄率存在正相关关系,与性别比、避孕普及率存在负相关关系。而且公式显示养老保险和储蓄率的相关系数远远大于其他的系数,所以这里本文将经济因素作为影响出生率的第一影响因素。

根据第七次人口普查数据,我国65岁及以上人口比重达到13.5%,人口老龄化程度已高于世界平均水平。当前我国每5名年轻人就需要赡养1位老人,除去其他必要支出,老龄化程度的增高,增加了家庭养老负担。由此可见,经济实力很大一部分都取决了家里老人的生活水平,恢复高生育率、维持大家庭的概率,在目前看来微乎其微,老龄化已成为一种常态。

储蓄水平反映了现代社会的消费能力、物价、以及人们的收入水平,随着现代化社会的加速发展,人们对于金钱的利用率也逐步上升,当前90后、00后逐步成为中国消费的主力军,消费观念发生了根本转变。随着消费文化的盛行,居民的消费意愿明显增强,储蓄意愿明显降低。我国国民储蓄包括居民储蓄、政府储蓄及企业储蓄,而居民储蓄占比最大,将会多方面影响人口出生率。

4.2 提出建议

面对养老保险对人口出生率的影响,有以下建议:

(1)加速健全完善我国养老保险制度,增加参保人数,扩大社会养老保险覆盖率,推动机关事业单位养老保险制度优化改革。实现新型农村社会养老保险和城镇居民社会保险制度全覆盖,减轻家庭养老负担,更有利于改善我国人口出生率现状。

(2)设置合理的养老保险缴费率,增加对养老保险的征缴力度,改善对养老保险的管理。延长工作年限,试点推行弹性退休制度,给予老人可靠的收入来源,减轻社会的养老保险负担。

面对储蓄率对人口出生率的多方面影响,有以下建议:

(1)当人们的收入水平高于消费水平时,多余部分便会作为储蓄,纳入居民储蓄的范畴,而居民的收入水平是承担家庭及其他部分支出的主要来源。因此改善居民收入水平有利于提高储蓄率。

(2)市场物价水平作为居民消费的主要影响因素,市场物价水平的上涨将会导致居民消费水平增加,进而影响人们的储蓄意愿。因此国家应该尽快采取措施,充分发挥市场机制作用和政府宏观调控的有机结合作用。

(3)银行的存款利率作为银行吸收存款的一个经济杠杆,存款利率的提高有利于吸引国民储蓄,提高国民储意愿,从而增加储蓄率。

(4)建立完善的社会保障制度,降低人们对未来支出的不确定性。其是刺激消费需求的前提条件,也是影响我国居民行为的体制性因素。体制因素对居民储蓄的影响程度难以量化,却是可以通过居民收入间接影响居民储蓄。

5 结语

本文通过广义回归模型对出生率下降的影响因素进行分析,发现养老保险、储蓄率、性别比、避孕普及率是影响出生率变化趋势的重要因素。再根据BP神经网络预测出2020年的出生率8.8519%与实际8.5%接近,验证了模型的准确性。综上所述,本文对研究出生率下降过快有较好的参考价值。

猜你喜欢
储蓄率出生率储蓄
储蓄永远是富人思维
No.5 2020年出生率创新低
出生率创新低,都是压力惹的祸吗?
储蓄方法面面观
房价上涨抑制英国出生率:每年少生7000多名婴儿
居民持久收入水平对储蓄率影响的实证研究
不能“妖魔化”中国储蓄率和投资率
人生是一种储蓄