刘娱,田茂再,2*
1.新疆财经大学统计与数据科学学院,新疆 乌鲁木齐830012;
2.中国人民大学统计学院,北京100872
作为老龄化严重的发展中国家之一,中国将关注中老年退休人员的待遇的相关问题提上日程.2020年伊始,全球爆发了传染规模大、传播速度快的新型冠状病毒肺炎(Corona Virus Disease 2019,COVID-19),此次疫情十分严峻,截至5 月11 日,中国累计确诊已经达到84 450 人,死亡人数总计4 643 人,治愈人数79 533 人,作为易感人群之一的中老年人因其人口基数大、身体健康状况差成为控制疫情的难题.在爆发这次疫情之前,对于离退休人群的关注主要集中在退休后的心理健康方面,此次疫情之后,关注转移至生理健康方面.良好的心理状况和身体状况都建立在一定的经济基础之上,在老龄化日益严重的今天,基本养老金收支不平衡问题会严重影响到中老年人的生活条件,间接影响其身心健康.针对各省域离退休人员的待遇情况,本文通过研究基本养老保险基金支出相关影响因素的时空差异,分析影响变量的时空差异性得出结论,并且提供有效且针对性的建议.
关于基本养老保险基金支出的问题,有很多学者进行过研究.如李琼对2007 年~2016 年中国31 省市的数据分析了中国城镇职工基本养老保险基金区域差异和影响因素.通过研究城镇职工基本养老保险基金发现累计结余的高值区和次高值区的空间分布在东部地区,而次低和低水平则在西部地区和东北地区[1].姚定俊通过分析老龄化趋势对城镇职工养老保险产生的影响,运用精算模型预测出了2017 年~2050 年江苏省城镇职工养老保险收支情况[2].
对于时间和空间纬度的差异性研究,常使用时间地理加权模型,其应用主要集中在空气污染变化趋势的时空分析和城市扩张时空演变.Wu 针对数据中出现的时空自相关和非平稳性问题提出地理时空加权自回归模型(GTWAR),并证明GTWAR 模型比其他模型拟合性更优[3]. Wei Qingbin 研究了2015 年~2018 年中国黑龙江省PM2.5与5 项标准空气污染物(SO2、NO2、PM10、CO、O3)之间的关系,结果发现传统的OLS 和GWR 不足以描述PM2.5的非平稳性,GTWR 模型更适用于该研究数据[4]. 秦文哲以山东省各地市2014 年~2018 年青少年健康为研究目标,利用GTWR 模型研究得到空间分布模式仍表现为“西高、东低、中部居中”的基本格局[5].
结合学者们对时空地理加权回归模型的广泛应用和基本养老保险支出的相关研究,本文在老龄化发展进程加速的背景下,以城镇职工养老保险支出为研究对象,分析各省域对基本养老保险支出的关注情况,探索教育程度、人口因素、经济水平这三个方面对基本养老保险基金支出的影响.研究目标是为离退休人员构建和谐稳定的养老环境,推动养老政策的全面实施,并且为其他人口结构提供借鉴.
关于空间的非平稳性以及解释变量在空间上的影响差异,学者们以GWR 模型作为变量研究空间异质性的重要工具.在实际运用中,GWR 模型也存在一定的缺陷.如该模型只能研究截面数据,缺乏时间维度考虑,相较于面板数据,节点数据具有一定的偶然性,因此分析存在一定的偏差[6].Hung 等考虑到时间维度的变化针对地理加权回归模缺点,提出了时空地理加权(GTWR)模型,模型的表达式为
式中,yi为N ×1 阶因变量矩阵,xik为N × k 阶自变量矩阵,(ui,vi,ti)为时空坐标,N 为省份个数.通常,对i,j 的空间距离可采用各个省域的经度和纬度数据来计算.t 为时间距离,εi~N(0,σ2)为随机误差,βk(ui,vi,ti)为系数函数,是函数βk(ui,vi,ti)在i 点的值.
使用局部线性估计方法对时空加权回归模型的进行估计可求得各回归系数在观测点i 处的估计值:
权重W(ui,vi,ti)设为观测点i 到其他观测点的距离的函数,通常采用高斯距离函数. 除此之外,带宽对GTWR 模型精度也具有影响,在确认模型的空间带宽和时间带宽的时候最常运用的就是交叉确认法,除此之外可按照AIC 准则,即AIC 最小时对应的为最优带宽.
但是如果单纯使用GTWR 模型会缺乏对基本养老金支出差异分位特征的研究.地区间基本养老金差异的低分位点与高分位点会体现社会养老演变过程的两个极端,如果仅使用均值回归可能无法全面的展现体征.考虑到分位数回归能在面板数据因时间和空间差异满足不了正态性假定时展现稳健的估计,因此本文使用分位回归模型,结果可反映不同层次中参数的变化状况,因此可用来研究异质性问题,且在估计中是根据样本信息按不同分位点分割数据进行估计,有利于归类分析.
分位数回归(QR)由Koenker 和Bassett 于1978 年提出,它是传统均值模型的一个补充与改进.在同方差假设违背的情况下,QR 通过因变量的条件分位数来量化异方差对协变量影响,且提供了因变量分布的综合信息.此外,当分布存在不对称和重尾时,样本的中位数(50 %分位数)对中心的汇总能力会优于均值,因此,相较标准的均值回归模型,QR 在异常值存在时表现稳健且灵活.本节参考自王天颖(2017)[7].
在建模之前可对数据使用差分处理,目的是消除个体的固定效应,对于固定个体i,可根据相邻两期的数据具有相同截距项αi的原理,利用差分运算消除模型中的随机效应,有以下数学关系:
选择变量主要根据系统性、可行性、代表性、动态性、可获得性,科学性等原则和参考李琼[1]、邓大松[8]等论文的指标体系的构建以及文献[9 ~14]的内容框架.考虑到我国基本养老保险基金支出主要受人口因素、经济水平以及教育程度所影响.本文选择的指标有城镇职工基本养老保险基金支出、高等教育机构毕业生数、普通本专科、居民人均可支配收入、离退休率=城镇职工离退休人员数目/城镇常住人口数.数据包括2013 年~2018 年间全国31 个省市自治区,主要来源于中国年鉴网络出版总库(CNKI)(http://data.cnki.net),中经网统计数据库(http://tongji.cnki.net/kns55/Dig/MonthData.).
表1 相关变量及统计描述Table 1 Related variables and statistical description
如图1 所见,在31 个省市中上海市的基本养老保险基金支出位居第一,紧随其后的是浙江省,与第三名的江苏省及其他省市拉开了巨大差距.相较于其他地区,地广人稀的西藏是支出数额最少的区域,其次是青海、宁夏、海南这三个地区的支出也相对较少.老龄化程度严重的黑龙江、辽宁、四川这三个省,留守省内的中老年人数目庞大,离退休人员占比数目大,养老金支出数额不容小觑.从时间纬度来看,城镇职工基本养老保险基金支出从2013 年开始增速缓慢,2015 年增速陡然加快,在2016 年支出到达峰顶后开始下降,2017 年后又恢复上升状态.
图1 城镇职工基本养老保险基金支出均值空间差异图Fig.1 The spatial difference of the average expenditure of the basic pension insurance fund for urban employees
图2 城镇职工基本养老保险基金支出均值时间变化图Fig.2 Changes of the mean time of urban workers’basic pension fund expenditure
首先需要运用R 语言对指标进行多重共线性检测,得到各协变量的方差膨胀因子(VIF)值均小于10,证明各个变量中不存在共线性,所以保留全部变量.对变量进行ADF 检验,P 值均小于0.05,认为数据是平稳的,故数据不需要差分或者取对数处理.
利用ArcGIS 10.2.2 时空地理加权回归分析模块,选择自动优化设置带宽,并将时空距离参数比值设置为1.通过对31 个县域6 年间的面板数据进行时空差异分析,得到影响因素的回归系数.选取AIC 准则和拟合优度R2作为模型置信度评价指标.表2 为GTWR 模型结果.
表2 影响因素回归系数统计描述及回归结果Tab.2 Statistical description of regression coefficients of influencing factors and regression results
对比线性回归模型的AIC 为243.27,R2为0.861,调整R2为0.859,从表2 看出,(1)GTWR 模型拟合性比线性模型更优,拟合86 %的数据能充分说明数据信息,AIC 值更小;(2)各变量对城镇职工基本养老保险基金支出的影响不可忽略,其中高等教育毕业生数的影响力最强,居民可支配收入的影响力次之,退休率的影响力最低.
接下来将详细分析三个影响因子的时空变化.
4.1.1 教育水平影响
高等教育机构毕业生数在2013 年~2018 年间对于全国绝大部分地区都具有正向影响.但是在海南省,2013 年~2015 年间其影响力为负,自2016 年之后影响值转为正,且影响力度逐步增强.高等教育毕业生在空间上的差异可分为五个梯队:在西部地区,新疆、西藏两地影响作用最强,随着时间的推移一直保持较高的影响水平;紧接着变量作用于甘肃省、青海省、四川省、云南省、宁夏、陕西、重庆这些区域的影响力也相对较高;属于第三梯队的省市分别是北京、河北、山西、山东、河南、湖北、湖南、贵州、广西;而在2013年至2014 年属于第三梯队的内蒙古自治区在2015 年移动至第二梯队与甘肃省等区域作用力相差不大;对于黑龙江、吉林、辽宁、江苏、安徽、上海、江西、浙江、福建、广东等地影响力一直保持在低水平等级从属于第四梯队;从图中可清晰地看到海南省的影响值波动范围大,由负作用逐年转变为正作用且随后对基本养老保险支出的影响力与其他省市的影响力拉开巨大差距.
4.1.2 人口因素影响
离退休率的影响力与毕业生数这一指标影响作用相似,仅在海南省的影响力为反作用,在其他各地区的作用均为正,且呈现逐年递减趋势.作用最大的区域为新疆、西藏;次之是甘肃、青海、宁夏、四川、云南;接下来是内蒙古、黑龙江、吉林、辽宁、北京、天津、河北、山西、陕西、河南、山东、重庆、贵州;第四梯队省市有江苏、上海、浙江、安徽、湖北、湖南、广西、江西、福建,空间上离退休率影响作用出现集聚特点;自2016年之后黑龙江、吉林、辽宁、北京、天津、河北、山东因影响力减弱掉出第三梯队转入第四梯队,随后内蒙古也在2017 年影响力减弱成为第四梯队一员,西藏因其影响力与新疆拉开距离,自2017 年加入第二梯队.
4.1.3 经济水平影响
居民可支配收入的影响力变化复杂多变.与前两个指标的作用不同,居民可支配收入在2013 年对基本养老支出的影响力在海南省地区作用最强;在西部地区如西藏、四川、云南、重庆、贵州、广西影响力低于海南省;作用在新疆、东北部黑龙江、吉林、辽宁这四个区域的影响力最低;内蒙古、北京、天津、河北、山西、山东、河南、江苏、安徽、上海、浙江影响值也相对较低;甘肃、青海、宁夏、陕西、湖北、湖南、江西、广东、福建影响力处于中间水平,总体上体现在西北部地区以及中部地区影响力偏大.2015 年东北三省的影响力下降放缓加入北京等地区,16 年青海省影响力下降速度加快,移至第二梯队,随后甘肃、宁夏在2017 也加入第二梯队;西藏、陕西、河南、山东成为第三梯队,其他省市不变.除新疆地区影响力一直保持最低以外,居民可支配收入对基本养老金的影响从西北部地区向东南部转移.在2018 年影响力次于海南地区的省市有云南、贵州、广西、重庆、湖北、湖南、广东、安徽、江苏、上海、江西、福建.居民人均可支配收入的回归系数与经济发展差异一致,东北部和东部地区影响系数小于中部地区.地区之间的经济发展水平差异是造成这种情况的主要原因,地区间的收入水平差异大,经济高水平地区居民收入高,参保人数增多保障了养老金支出,因此影响力相对较小,经济相对落后地区,居民可支配收入少导致参保人数的不固定,所以会严重影响离退休人数的生活保障.
总结得到,高等教育毕业生数、离退休率以及居民可支配收入对基本养老保险基金支出的影响力总体上是随着时间的流逝而递减的,这可能是因为各项政策的出台使得养老待遇逐渐公平化,经济、人口、教育等因素的影响得到控制,以全面保证各类生活水平下老年人的生活与健康.空间上变化仍是体现在经济发达地区与经济落后地区之间的差异,各因素对基本养老金支出的影响具有集聚性,具体表现在高等教育毕业生与离退休率的影响力在东部地区、中部地区的值小于西部地区;居民可支配收入的影响系数在西部地区及东北部地区的值低于西南与东南地区.
利用R 软件的rqpd 程序包对31 个省域面板数据进行面板分位数回归,分别求出0.1、0.25、0.5、0.75、0.9 分位点下各变量的影响系数(表3).
分析其回归结果,发现高等教育毕业生数、离退休率以及居民可支配收入在各个分位点下对基本养老保险支出是显著影响的,且回归系数为正,故表现为正向影响.证明受教育人数越多,参保人数就越多,其基本养老金收入就增加,对于离退休人员的支出就随之增加;老龄化水平下离退休人数的增加会造成基本养老金支出的增加;经济因素下,居民可支配收入稳步提高会减少缴费中断等情况的出现,也保障了基本养老金的支出.高等教育毕业生人数的回归系数值比其他变量高,说明在这些指标中对于基本养老金的影响作用最强.总体上面板分位数回归结果与GTWR 模型分析结果一致.
表3 面板分位数回归结果Tab.3 Panel quantile regression results
基于新冠肺炎背景下,深入研究各省域城镇职工基本养老保险基金支出差异及分析其影响因素,利用31 个省份2013 年~2018 年间的面板数据,在时间和空间角度多维分析高等教育毕业生数、离退休率、居民人均可支配收入对基本养老金支出的影响,得出以下结论:
(1)城镇职工基本养老基金支出在空间分布上差异明显. 大部分高值区分布在沿海地区,例如上海市、江苏省、浙江省、辽宁省、山东省以及中部地区四川省.次于高值区的省域主要分布在中部地区例如广东省、黑龙江省、河南省.低值区主要分布在西北地区以及西南地区,如宁夏回族自治区、甘肃省、青海省、西藏自治区、贵州省.针对基本养老金支出分布特点,要确保养老保险覆盖率,实现统筹养老,做到“老有所养”,鼓励离退休人员开展丰富的退休生活,做到“老有所乐”.
(2)结合GTWR 模型和面板分位数回归模型,能够证实人口因素、经济支持、教育水平对基本养老金支出具有正向影响,时空差异表现为高等教育毕业生数、离退休率、居民可支配收入影响力逐年下降,体现了各地区养老待遇的差距逐年减少,但是老龄化严重的东北部地区以及经济发展落后的西北部地区影响力还是较东部地区深远,需要进一步因地制宜.
(3)导致时空差异最关键的因素就是经济发展水平的不同,参考李琼的研究可知在职人员和企业是养老保险收入的主体,当教育水平越高代表工资越高,那么基本养老保险基金的收入也就越多,基金累计结余规模越大,城市环境保护与医疗水平越高离退休人员生活水平越优越[1]. 研究结论与现实情况相吻合,为解决这一问题,关注点在于抓根本原因,解决经济发展不平衡,地区之间收入差异的问题.