城镇家庭年龄结构对消费的非线性影响
——基于机器学习方法的实证检验

2022-12-13 07:25张叶娜冀淑静
西北人口 2022年6期
关键词:年龄结构门限城镇

陆 地,张叶娜,冀淑静

(吉林财经大学统计学院,长春 130117)

一、引 言

充分发挥我国超大规模市场优势和内需潜力,构建国内、国际双循环互相促进的新发展格局成为我国经济增长转型期的主要目标之一。当前我国居民消费水平提升、消费总量扩大,但数据显示仍存在居民消费率偏低,有效需求释放不足等诸多问题。人口年龄结构变动在消费影响因素中一直扮演着重要角色,根据生命周期理论,人口结构中少儿人口和老年人口的比例改变时,会对整个社会消费需求产生影响。从我国人口年龄结构变动来看,由于计划生育政策及生活、医疗条件的改善,使我国长期呈现生育率较低且老龄化程度增强的人口变动特征,而2016年全面实施的“二胎政策”、2021年实施的“三孩政策”又将使得我国人口结构变动更为复杂。由此可见,深入研究人口年龄结构特征对消费需求的影响机制,有针对性地提出扩大内需建议尤为重要。基于此,本文从家庭微观视角出发,结合机器学习LASSO方法揭示城镇家庭年龄结构变化对消费需求的平均影响及分层影响机制,并进一步探究了家庭人口年龄结构特征对消费非线性影响的门限效应,为我国新发展格局下扩大内需目标奠定了基础。

二、文献综述及研究假设

现有国内外文献关于人口年龄结构特征对消费影响的研究主要分为理论研究与实证研究两种类型。理论研究基础一方面源自Modigliani&Brumberg(1954)[1]提出的生命周期理论,该理论认为人的一生可分为不同时期,且具有不同的消费倾向,当社会人口中少儿和老年人口比例增大,则社会平均消费倾向提高。在生命周期理论基础上,部分学者展开一系列研究,但影响结果并不一致,一种观点认为少儿人口和老年人口数量的提升对消费率具有正向影响(Leff,1969)[2],另一种观点却得到少儿人口数量提升增加消费,而老年人口数量提升降低消费的结论(Deaton&Paxson,2000[3];Hock&Weil,2012[4])。另一方面理论基础来自于Samuelson(1958)[5]的家庭储蓄需求假说,该假说提出家庭子女及储蓄均可视为养老工具且能够相互替代,子女数量增多时会减少家庭养老储蓄而增加消费。然而Becker(1981)[6]的研究则认为家庭储蓄需求模型没有考虑子女质量与子女数量之间的替代关系,当净收益相同时,家庭会选择减少子女数量而提升子女质量,子女质量的提升同样会降低家庭储蓄。由此,能够发现理论研究对于人口年龄结构和消费的关系研究具有启发意义,其研究结果却并未达成共识,仍需进一步探讨。

实证研究主要将人口年龄结构对消费的影响划分为少儿抚养比、老年抚养比及总抚养比的作用效果。在少儿抚养比的影响方面,大部分研究认为少儿抚养比的上升会提高消费(毛中根等,2013[7];Kuhn&Prettner,2015[8];周耀东、郑善强,2021[9]),一般情况下,家庭收入在满足基础消费后,一部分将用于抚养子女,另一部分作为预防性储蓄(刘铠豪、刘渝琳,2014)[10]。对于中国独生子女家庭而言,子女往往被视为家庭的核心,父母对子女的消费投入表现出非理性,从而加大教育文娱等消费投入(曹佳斌、王珺,2019)[11]。另一部分研究认为少儿抚养比对消费具有负向影响,如李文星等(2008)[12]应用1989~2014年中国省际数据,发现少儿抚养比对消费率产生较弱的负向效应。李春琦、张杰平(2009)[13]根据中国宏观年度数据发现少儿抚养比对消费形成显著负影响。就老年抚养比对消费的作用效果而言,具有以下三类观点:第一类观点认为老年抚养比提升将促进消费,尤其是文教娱乐等消费,利于扩大内需(王宇鹏,2011[14];黄燕芬等,2019[15])。第二类观点认为老年抚养比对消费产生抑制作用,老年人口会增加养老储蓄而减少消费支出(Modigliani&Cao,2004[16];盛来运等,2021[17])。第三类观点认为老年抚养比对消费具有非线性影响。如于潇、孙猛(2012)[18]发现老年抚养比快递提升阶段对消费具有正向作用,老龄化进入中期阶段,对消费产生抑制,老龄化进入晚期时不会对消费形成影响。臧旭恒、李晓飞(2020)[19]则认为短期内老龄化程度提高将降低消费,长期内老年抚养比提升对消费的正向促进作用将增强。关于总抚养比对消费的作用,宋保庆、林筱文(2010)[20]发现总抚养系数是居民消费倾向重要影响因子,并对消费产生持续负影响。

当前实证研究方法主要采用传统的经济计量模型,相比传统经济计量方法,机器学习方法具有更优越的预测及泛化性能,近年来开始逐渐应用于经济社会科学领域的研究,一方面用于实证分析的模型优化、变量降维及预测,另一方面用于基于因果推断的微观政策效应的评估。在变量降维应用中,监督学习的LASSO回归方法较为常用,该方法主要通过对变量的选择避免了传统计量线性回归方法中过度拟合的问题(Varian,2014)[21]。目前LASSO方法主要用于金融市场(蒋翠侠等,2016)[22]、政策评估(Shi et al.,2020)[23]等问题的研究,对人口经济行为及非线性影响机制的研究较少。人口经济行为研究中,张晓明等(2021)[24]利用LASSO回归筛选工具变量就抑郁倾向对劳动收入影响予以分析,解决了内生性问题;Yu等(2021)[25]采用CHARLS微观调查数据,并应用LASSO方法筛选了主动老龄化的决定性因素。关于变量间非线性影响关系研究,韩猛、白仲林(2021)[26]利用自适应组LASSO估计对门限因子模型进行了改进,并将其应用于金融市场分析,解决了模型选择一致性问题。基于上述文献,机器学习的LASSO方法应用较为广泛,有助于筛选显著影响因素,能够提高估计结果有效性及准确性。

综上所述,相关研究为人口年龄结构对消费的影响关系做出了不同解释,但仍存在改进空间:第一,多数研究从宏观视角就社会整体人口年龄结构变化对消费的影响进行了研究,却忽略了家庭微观个体内人口年龄结构的改变。居民消费往往以家庭个体作为单位,家庭内部人口年龄变动决定了家庭最终消费,从而影响居民整体消费需求。第二,相关研究主要探讨了家庭人口年龄结构对居民消费的平均影响效果,忽视了对不同消费层次需求的作用差异,势必带来研究偏差。从家庭财富及消费偏好角度而言,家庭人口年龄结构对消费的影响较为复杂,主要体现在不同消费层次群体受家庭少儿抚养比与家庭老年抚养比的冲击程度存在差别,一部分家庭会倾向于加强家庭储蓄以满足子女教育、婚嫁及养老费用从而抑制消费,而另一部分家庭伴随其家庭成员中少儿及老年成员数量增多会选择扩张消费。第三,不同学者利用不同国家、地区数据研究了人口年龄结构对消费的影响,但研究结论尚未统一,作为测度人口年龄结构的主要指标,少儿抚养比和老年抚养比对消费的作用存在正向影响、负向影响和不显著等不同的结论。本文将视域聚焦于家庭微观层面,认为产生不同研究结论的原因之一是家庭人口年龄结构对消费的影响存在门限效应,具有非线性影响特征。例如当家庭成员中少儿人口与老年人口同时变化时,若以家庭中少儿人口与老年人口数量比例作为门限阈值,假设家庭少儿抚养比对消费作用为正向影响,家庭老年抚养比对消费作用为负向影响,当家庭中少儿人口数量占比低于门限阈值,家庭人口年龄结构对消费的作用体现为负向影响或不显著;当家庭中少儿人口数量占比高于门限阈值,家庭人口年龄结构对消费的作用体现为正向影响。第四,现有研究主要采用传统计量方法,对于异质性群体而言,传统计量方法不能很好地甄别家庭人口年龄结构对不同消费群体影响的主要因素,从而降低模型拟合结果准确性,而机器学习LASSO 方法能够筛选出最重要的影响因素,提高估计结果的有效性及可信性。由此,基于上述分析本文将利用机器学习的LASSO方法从分布视角深入探索家庭微观个体内部年龄结构变化对居民消费的作用机制,从家庭人口结构变动角度出发为新发展格局下释放有效内需提供启示。并通过实证分析逐一验证如下假设:

假设1:家庭人口年龄结构对不同消费层次家庭影响存在差异。

假设2:家庭人口年龄结构对消费存在非线性影响,具有门限效应。

三、模型设定及变量选取

(一)模型设定

1.基准回归模型设定

本文设定基准回归模型为:

其中,ln_demi为城镇家庭人均消费支出;kid_pi为城镇家庭少儿抚养比,old_pi为城镇家庭老年抚养比,代表家庭人口年龄结构信息;familyi为城镇家庭信息变量,包括家庭可支配收入(ln_incomei)、家庭金融资产(ln_asseti)及家庭规模(familysizei);headi为城镇家庭户主特征,包括户主婚姻状况(marriagei)、受教育年限(eduyi)、健康状况(healthi)及工作性质(jobi);βi(i=1,…,4)表示解释变量参数,β0为截距项,εi为随机干扰项。家庭人均消费、家庭可支配收入及家庭金融资产均作对数处理。

LASSO回归方法结合了机器学习和回归方法的优点,通过对待估参数βi施加限制条件,仅筛选最具影响力的解释变量,使模型获得更好的估计效果,同时可以克服OLS回归模型的缺陷,避免过度拟合、多重共线性及模型稀疏性问题。LASSO方法能够推导出具有最少解释变量个数并拥有良好预测效果的目标函数模型:

此时,n为观测样本量;β代表回归过程中的待估参数;λ为非负正则化参数,即惩罚系数。表示该线性回归模型估计结果的预测误差,作为惩罚函数,用以排除解释能力较弱变量,使其系数βj变为0。若惩罚系数λ取值非常大,则所有解释变量参数均变为0,通过逐渐减小λ的取值,部分参数将由0变为非0值。因此,通过对惩罚系数λ的调整,能够逐一筛选出非0值的参数,此时根据非0值参数出现的顺序,可对应选取出相对重要的解释变量保留在模型中,获得主要解释变量信息。

2.LASSO分位数回归模型设定

基于基准回归模型,将分位数回归模型设定为:

其中τ∈[0,1]为分位点,表示不同消费分位点受到家庭少儿抚养比和老年抚养比、家庭信息及户主特征的影响情况,该影响随不同分位点变化而显现异质性特征。

在τ分位点处回归系数向量估计值可通过式(4)得到:

LASSO分位数回归通过在原目标函数基础上施加惩罚项,将部分变量系数压缩至0,即对控制变量进行降维,在各分位点同时达到变量选择和参数估计的目的,避免过度拟合问题的出现。此时LASSO分位数回归参数估计值为:

其中,λ为惩罚系数,在变量选择时利用AIC 准则进行确定,在各分位点排除解释能力较弱的变量。该方法能够在不同消费分位点筛选出该分位点显著的影响因素,揭示家庭特征对消费的分布影响规律,更为准确地分析家庭人口年龄结构对消费的分层影响规律。

3.门限模型设定

为进一步检验家庭人口年龄结构对消费需求影响的门限效应,选取家庭中少儿人口与老年人口的比值为门限变量。构建门限回归模型如下:

其中,ln_dem为家庭人均消费支出,kid/old_pit为家庭内部少儿人口与老年人口数量的比值,即设定的门限变量,Zit为家庭信息和户主特征等控制变量,γ代表待估计的门限阈值。门限阈值的含义为:当ln_dem≤γ时,城镇人口年龄结构对居民消费需求的影响系数为β1;当ln_dem>γ时,城镇家庭人口年龄结构对居民消费需求的影响系数为β2。若β1≠β2时,说明家庭人口年龄结构对居民消费需求的影响存在非线性关系。双重门槛和三重门槛可通过上式拓展获得。

(二)变量选取

本文基于齐红倩、刘岩(2020)[27]的研究,选取家庭人均消费支出作为被解释变量。对家庭个体而言,家庭成员年龄结构占比对家庭消费需求的倾向不同,少儿人口和老年人口作为家庭中的纯消费者,其占比高低直接影响家庭最终消费,由此选取家庭少儿抚养比和家庭老年抚养比作为解释变量以衡量城镇家庭人口年龄结构的变化,其中家庭老年抚养比定义为家庭中65岁及以上家庭成员数量占15~64岁家庭成员数量的比率,家庭少儿抚养比定义为家庭中14岁及以下家庭成员数量占15~64岁家庭成员数量的比率;设定城镇家庭信息(家庭可支配收入、家庭金融资产及家庭规模)及户主特征(婚姻状况、受教育年限、健康情况及工作性质)作为控制变量,并对家庭人均消费、家庭可支配收入、家庭金融资产取对数形式进行平滑处理。根据CFPS2018 数据,得到家庭人均消费支出对数(ln_dem),核心解释变量家庭老年抚养比(old_p)和家庭少儿抚养比(kid_p),控制变量包括城镇家庭可支配收入(ln_income)、家庭金融资产拥有量(ln_asset)及家庭规模(familysize),户主特征的婚姻状况(marriage)、受教育年限(eduy)、健康状况(health)及工作性质(job)的数据信息(见表1)。

表1 变量描述性统计

为分析城镇家庭人口年龄结构的整体趋势,采用CFPS2018数据计算出含有不同年龄人口家庭占比情况,结果如表2所示。根据比例计算结果发现调查样本家庭成员中含有14岁及以下少儿人口的城镇家庭比例最低,仅为3.44%;家庭成员中含有65岁以上老年人口的城镇家庭比例达到15.30%,仅次于包含15~25 岁、45~55 岁青壮年人口的家庭比例,证明当前我国城镇家庭存在“少子化”“老龄化”的人口年龄结构特征。从家庭人口年龄结构上来看,含有14岁及以下年龄少儿的家庭和含有65岁以上老人的家庭消费更容易受到家庭人口年龄结构变动的冲击,而以劳动年龄人口为主的家庭短期内不会因为人口年龄结构的改变而对其消费需求产生明显刺激(见图1)。

表2 含有不同年龄人口城镇家庭比例

图1 城镇家庭人口年龄累积分布

图2采用非参数核密度方法基于CFPS2018 数据分别拟合城镇家庭老年人口和少儿人口消费支出的分布趋势。就分布形态而言,我国城镇家庭少儿消费支出和老人消费支出分布均呈正偏态分布的特征,表现出明显的“单峰型”形态,说明中、低消费水平的城镇家庭占多数,而高消费支出的家庭占比相对较小。从分布形态对比来看,城镇少儿消费支出分布较老年消费支出分布更为离散且厚尾趋势突出,表明城镇家庭少儿人口消费差距较大且高水平少儿消费家庭比例较高,意味着城镇家庭倾向于对少儿人口的消费投资趋势更为明显。这与郝云飞、臧旭恒(2017)[28]的研究结果相一致,由于家庭中少儿消费与老年消费数量具有竞争关系,在收入一定时,家庭决策会优先倾向于子女消费。由此对于不同消费层次城镇家庭而言,少儿人口引致的消费对其家庭消费决策影响更为显著。

图2 城镇家庭少儿及老年人口消费分布

四、实证分析与讨论

(一)基准回归结果

表3为城镇家庭人口年龄结构对消费需求影响的基准回归结果,具体分析了家庭人口年龄结构特征对消费的平均影响效应。根据OLS基准回归结果,显示城镇家庭人口结构中家庭少儿抚养比及对其消费存在正向影响,家庭少儿抚养比系数弹性为0.0013,表明伴随家庭少儿抚养比提升1%,消费需求增加0.13%;而家庭老年抚养比对消费需求影响并不显著。家庭老年抚养比影响并不显著的主要原因一方面在于含有老年人口的城镇家庭面临养老支出、医疗费用等风险较高,即使家庭成员中老年人口数量增长,消费意愿增强,但此类不确定性风险依旧令城镇家庭优先选择强化预防性储蓄,从而降低增强消费需求的意愿;另一方面原因在于老年人创造财富能力减弱,尽管对产品及服务具有一定需求,仍会抑制需求而减少消费支出。

表3 基准回归结果

为检验回归结果稳健性,采用“OLS+稳健标准误”及LASSO方法再次进行回归,稳健性检验结果与基准回归结果一致,证明该实证结果稳健。通过LASSO回归对影响因素的不确定性干扰进行降维,即通过精炼模型将显著性较小或不显著变量回归系数压缩为0,从而进行变量选择,均值回归的变量选择结果意味着家庭少儿抚养比、家庭老年抚养比、家庭收入、资产、家庭规模、户主受教育水平及工作性质对家庭消费影响更为显著,而婚姻及户主健康程度对家庭消费作用较小,此方法同时进一步对参数予以了校准。能够发现,无论是OLS回归结果,还是LASSO均值回归结果均证明“少子化”人口结构演变趋势是减少居民消费需求的主要原因,但“老龄化”程度增强对家庭消费的平均影响并不显著。

(二)LASSO分位数回归估计结果

表4分析了家庭人口年龄结构对不同消费层次家庭的影响,从LASSO分位数回归结果来看,随着消费分位点提高,家庭少儿抚养比及家庭老年抚养比的系数弹性均逐渐减小,说明城镇家庭人口年龄结构演变对低消费层次家庭的影响强于中、高消费水平的城镇家庭,且较家庭老年抚养比而言,家庭少儿抚养比变化对不同消费水平城镇家庭的影响更为显著。能够发现,城镇家庭倾向于将少儿作为家庭消费的核心,尤其对于中、低消费水平组群而言,其对子女的消费投入视为家庭人力资本投资,目的在于改善家庭未来的经济状况及社会地位。家庭老年抚养比对低消费水平(0.05分位点)、中低消费水平(0.25分位点)的城镇家庭消费具有显著的抑制作用,而对中等消费以上家庭影响并不显著,一方面原因在于拥有老年人口的家庭面临健康等方面的未来风险较高,导致低消费家庭偏好于减少消费支出,增加预防性储蓄;另一方面原因在于老年人口消费偏好以医疗健康、保健休闲的发展型消费为主,但由于崇尚勤俭节约的传统观念,中、高消费家庭的老年人在有限家庭资源条件下,不会随着家庭成员中老年人口比例的提升而相应增加发展型消费支出。

表4 LASSO分位数回归结果

从家庭特征来看,对于不同消费层次家庭,其消费主要影响因素略有差异,通过LASSO模型变量筛选结果来看,家庭可支配收入及家庭规模对消费的影响在不同分位点均显著,且影响程度伴随消费分位点增大而提升,家庭特征中家庭可支配收入影响逐渐增大,家庭规模影响逐渐降低。而家庭资产、户主受教育年限仅对中高以下消费群体的影响显著,户主健康水平及工作性质仅对中低到中高消费群体存在影响。

对比LASSO分位数回归结果与基准回归结果发现,基准回归结果仅考虑了家庭人口年龄结构对消费的平均影响,带来了估计偏差,忽略了家庭老年抚养比对消费的作用。而LASSO分位数回归结果详细考察了对消费分布的影响情况,能够发现家庭老年抚养比对低消费家庭具有负向作用,家庭少儿抚养比对最高消费层次之外的家庭均存在正向影响。伴随家庭内少儿及老年人口数量的共同改变,难以判断家庭人口年龄结构对消费的直接影响,因此需分析其非线性影响关系,以更为细致地识别家庭人口年龄结构对消费的影响机制。

(三)门限模型估计结果

本文基于Hansen程序语言,采用连玉君Crosstm横截面门槛程序包结合Stata15.0运行数据,对家庭年龄结构对消费影响的非线性影响结果进行了检验,如表5所示。结果表明门限估计值均在95%置信区间内,且通过了95%以上的置信水平一致性检验,说明估计值真实可靠。在此基础上,采用Hansen Bootstrap(自举法)模拟出P值来检验门限值的显著性,以检验门限阈值存在性及数量。发现家庭少儿人口与老年人口比值存在单一门限阈值,其门限阈值为100%,意味着当城镇家庭0~14 岁少儿人口占65岁及以上人口的比率达到100%时,即数量持平时,家庭年龄结构对家庭消费需求的冲击程度增强。

表5 城镇人口年龄结构门槛值

表6为城镇家庭年龄结构对消费影响的非线性回归结果,LASSO 回归结果表明城镇家庭人口年龄结构对消费需求具有显著的非线性特征,当城镇家庭个体中14岁及以下年龄的少儿人口占65岁以上家庭成员比例未达到100%时,即家庭内少儿数量小于老年人口数量时,家庭人口年龄结构对家庭消费影响并不显著,只有当城镇家庭内少儿人口占老年人口比率达到100%,其对消费产生正向影响且作用效果显著。此时系数弹性为0.1924,表示当城镇家庭成员中14岁及以下少儿人口占65岁以上家庭成员人口比例达到100%之后,少儿占老年人口比值继续提高1%,家庭消费需求将平均增加19.24%。同样,利用OLS+稳健标准误方法对LASSO回归进行稳健性检验,回归结果与LASSO回归结果基本一致,证明LASSO回归结果真实可靠。

表6 门限回归结果

五、结 论

研究城镇家庭内部人口年龄结构变化对城镇家庭最终消费需求的影响对新发展格局下扩大有效内需具有重要意义。本文基于家庭微观视角,利用微观家庭调查数据CFPS2018,采用机器学习的LASSO分位数回归及门限模型方法就家庭人口年龄结构对消费需求影响机制进行了分析。实证结果表明:第一,家庭人口年龄结构对家庭消费具有显著影响,从均值影响关系来看,家庭少儿抚养比的影响表现为正向效应,家庭老年抚养比的影响并不显著,表明对于城镇居民消费平均变化而言,当家庭内老年人口数量不变时,家庭内部人口中14岁及以下年龄少儿人口的增加对家庭消费需求具有促进作用。第二,从LASSO分位数回归结果来看,伴随消费分位点提高,家庭少儿抚养比和家庭老年抚养比的影响均逐渐减弱,说明家庭内部人口年龄结构的变化对中、低消费水平的城镇家庭影响更为显著,对高消费水平家庭不产生影响,同时识别出不同消费层次家庭的家庭及户主特征主要影响因素,家庭资产、户主受教育年限仅对中高以下消费群体的影响显著,而户主健康水平及工作性质仅对中低到中高消费群体存在影响。第三,以家庭内少儿人口占老年人口比例作为门限阈值进行门限回归,结果表明家庭人口年龄结构消费需求具有非线性作用,非线性影响具体表现为当家庭中少儿占老年人口比例低于门限阈值100%时,即家庭成员中少儿人口数量小于老年人口数量时,即便14岁及以下年龄成员数量增多,家庭消费支出依然不能提高,只有家庭中少儿占老年人口比值突破门限阈值100%,即少儿数量与老年数量持平,才能有效促进家庭消费需求,否则不能释放家庭消费意愿,发挥潜在的需求潜力。

本文发现“少子化”“老龄化”家庭人口年龄结构对城镇居民消费需求总量产生消极影响,尤其限制了占据消费市场主体的中、低消费需求,不利于新发展格局下扩大消费需求的目标。尽管家庭少儿抚养比提升对促进消费产生积极影响,但家庭人口结构中14岁及以下少儿人口数量小幅度提升并不能有效提升消费需求,只有当家庭成员中14岁及以下少儿与65岁以上老年人口数量持平后,家庭成员中少儿数量继续提升才能刺激家庭消费动机,发挥超大消费市场规模作用。因此,通过积极推动生育政策优化人口结构;进一步完善养老保险体系,促进“银发市场”升级等措施,能够缓解人口结构变动对消费需求产生的负向影响,以有效扩大消费需求,推动新发展格局下经济高质量发展。✿

猜你喜欢
年龄结构门限城镇
基于规则的HEV逻辑门限控制策略
具有年龄结构的麻疹传染病模型的稳定性分析
2.5 MPa及以上城镇燃气管道与输气管道区别
文化边城镇远
随机失效门限下指数退化轨道模型的分析与应用
VoLTE感知智能优化
人口总数变化的比例进入潜伏或染病群体的年龄结构传染病模型及稳定性
基于Neyman-Pearson准则的自适应门限干扰抑制算法*
城镇排水系统量化指标体系研究
城镇医保支出为何跑赢消费支出