未来我国人口自然增长率预测
——基于BR-BP神经网络

2022-09-05 09:02刘伊宁张添泽张晓于赵丽琴
经济研究导刊 2022年23期
关键词:生育率增长率神经网络

刘伊宁,张添泽,张晓于,赵丽琴

(山西财经大学,太原 030006)

引言

从国家统计局于2021 年公布的“七普”数据可以看出,我国正面临日益严重的人口问题,如出生人口和出生率创下新低,生育意愿低迷,家庭小型化、不婚化成新趋势。目前,我国2020 年总和生育率为1.3,已经低于1.5 的红线,跌入了统计学意义上的“低生育率陷阱”,并且在可以预见的未来,生育率将进一步降低。与此同时,我国人口老龄化速度和规模前所未有,我国正从人口红利期转入人口负担期。

随着“人口问题”日益严重与“人口焦虑”进一步扩大,众多专家学者围绕人口、生育等话题展开研究。张鹏飞通过构建人口精算模型和参数设计研究了全面二孩政策下我国2018—2050 年人口结构发展的动态趋势(张鹏飞,2021)。王广州采用总和生育率间接估计法、孩次递进人口预测方法对中国当前人口形势和未来趋势进行量化估计,认为到2024 年前后中国人口总规模将达到14.07 亿的峰值,此后进入人口负增长时期且下降速度逐年加快。并在此基础上对人口变动背后的社会经济内涵进行深入分析,提出相应公共政策应对策略(王广州,2022)。本文在前人研究的基础上,创新使用改良版的BP 神经网络预测人口增长率,大大提高预测精度,并改善了BP 神经网络容易出现过拟合的现象。

一、基于BP 神经网络对我国人口自然增长率的预测

通过上述分析可知,我国人口现状存在生育率低迷、老龄化日益严重、新生人口快速下滑等问题。为了进一步探究我国人口数量在未来几年的变化趋势,本文采用BR-BP 神经网络方法,对我国从1964—2021 年的人口自然增长率进行拟合,并对未来五年(2022—2026)的人口自然增长率进行预测。数据均来自国家统计局、国家数据网。

(一)BP 神经网络时间序列模型的建立

1.确定数据的输入与输出

在创建神经网络之前,先确定输入数据集和目标数据集。输入数据为原时间序列滞后期的序列,目标数据为原时间序列y。l即为自相关阶数。

根据滑动窗口方法,其时间序列y构造为y(n)=[y(1),y(2),...,y(m),...,y(n)]。y(m)代表第l 期的人口自然增长率。若以l期为当前时刻,自然增长率时间序列y前l期的时间序列可表示为y(m)= [y(m-1),...,y(m)],其中,l即为滑动窗口的大小。在进行人口自然增长率预测时,依据l值,将历年的人口自然增长率依次填入滑动窗口,作为BP 神经网络的输入,进而可得出其在(m+1)时刻的预测值y(m-1)。其示意图如图1。

图1 滑动窗口示意图

2.BR-BP 神经网络的建立

传统的梯度下降BP 神经网络(LM-BP 神经网络)容易出现过拟合的情况,使得网络的泛化能力变差,即网络的训练精度良好,但预测结果往往不够理想。本文利用贝叶斯正则化(Bayesian Regularization)加速神经网络收敛、降低泛化误差等,以实现优化BP 神经网络的目标。

图2 贝叶斯正则化的BP神经网络拓扑结构图

激活函数使用tanh 函数,则第n 个隐藏层第i 个神经元的输入为v=tanh(a+b)

输出层激活函数使用purelin 函数,则输出层输出为y=purelin(β+b)

3.误差函数和训练性能函数

训练性能函数为F=αE+βE

贝叶斯正则化算法将BP 神经网络中各网络权值看作随机变量,能够自适应地修正α、β的参数大小,在保证网络均方误差最小的前提下,能够有效地控制网络的复杂程度。

(二)BR-BP 神经网络的训练和调参

1.基本参数的设定

为了防止过拟合现象,本文设置值训练集数据比例(TrainRatio)为70%,测试集数据比例(TestRatio)为15%,验证集数据比例(ValRatio)为15%。

设置学习速率为0.01,最大迭代次数为1000 次,设置损失函数结果在10epoch 内没有提升,为停止迭代的条件。

2.模型超参数的网格调参

本文所采用的模型涉及到两个超参数,即自回归阶数l 和隐藏层层数n。对于任意的l∈[1,2…10];n∈[10,20…100],两两组合后存在100 种参数组合方式。本文使用MATLAB 软件分别对100 个神经网络进行训练,计算每个神经网络训练后的总误差平方,发现当自回归阶数为6、隐藏层层数达到10 时,模型误差平方和最小,仅有28.17。因此,将这个模型用于预测可得到最优的预测结果。

(三)预测结果和模型评价

设置自回归阶数为6,隐藏层层数为10,其他参数不变,使用MATLAB 软件训练BR-BP 神经网络,该网络大约在10 次迭代时达到收敛,在第46 次迭代时训练集上误差平方和达到最小。残差自相关系数方面,除了0 阶自相关系数为1,其余所有的残差自相关系数都处于[-0.2,0.2]区间之内,说明残差项基本不存在自相关现象。根据测试集的拟合数据和真实数据的回归分析可以得出,斜率接近于1,说明拟合效果非常好。另外,从图3 可以看出,误差较大的时间段集中于1982 年前后和2016 年以后,与两次生育政策重大调整的时期相吻合。

图3 时间序列响应图

(四)预测结果和结论

使用训练好的神经网络对未来五年的人口自然增长率进行预测,得到预测结果分别如表1 所示。可以看出,2022 年起我国的人口自然增长率预计降低到0 以下,若不采取任何措施,我国的人口将陷入负增长,未来3 年内我国的人口自然增长率将持续下降,2025—2026年人口自然增长率才会有增长的趋势,但是仍为负值。

表1 预测结果

二、总结与建议

本文使用BR-BP 神经网络预测我国未来5 年的人口增长率。用贝叶斯正则化算法改善了BP 神经网络容易过度拟合的缺点,实现优化BP 神经网络的目标。结合我国的人口现状分析,发现我国正面临日益严重的人口问题,如陷入“低生育陷阱”、出生人口和出生率创下新低、二孩政策效果不及预期。年轻人生育意愿低迷,不婚、不育观念日趋普遍,未来总和生育率将进一步降低;人口老龄化速度和规模前所未有,我国正从人口红利期转入人口负担期。人口老龄化、少子化带来了一系列重大挑战,如低成本人口数量红利消失、劳动力成本上升,经济潜在增长率下降、社会创新创业活力下降,社会阶层固化、投资率和储蓄率下降、社会抚养比和养老负担加重、政府债务和社保压力上升等。针对以上问题,提出如下的政策建议。

一是全面放开生育。当前正处于第三波婴儿潮中后期,这是出生人口的生育窗口期。全面放开生育,虽然原本不想生的人还是不会生,但是一些想多生的人可以生,不必担心部分地区会因大幅多生导致出生人口激增。

二是加快构建生育支持体系。(1)实行差异化的个税抵扣及经济补贴政策,覆盖从怀孕保健到18 岁或学历教育结束。(2)加大托育服务供给,大力提升0—3 岁入托率,从目前的4%提升至40%,并对隔代照料实行经济鼓励。(3)进一步完善女性就业权益保障,并对企业实行生育税收优惠,加快构建生育成本在国家、企业、家庭之间合理有效的分担机制。(4)加强保障非婚生育的平等权利。(5)加大教育医疗投入,保持房价长期稳定,降低抚养直接成本。

三是放开生育是把选择权还给家庭,不是强制生育。全面放开生育是把生育权从国家计划回归家庭自主,是把生育数量多少的选择权交回给家庭决定,充分尊重每个人的生育意愿。

猜你喜欢
生育率增长率神经网络
低生育率:怀疑、再调查与重复验证
基于人工智能LSTM循环神经网络的学习成绩预测
基于图像处理与卷积神经网络的零件识别
MIV-PSO-BP神经网络用户热负荷预测
韩国生育率创50年来新低
全球生育率,新加坡最低
三次样条和二次删除相辅助的WASD神经网络与日本人口预测
台2016GDP“成功保1”
外籍妈妈提升德国平均生育率
美拭目以待的潜力城市