夏 添,夏 迎
(西南财经大学 经济学院,成都 611130)
提要:近年在国内外经济环境复杂且不稳定的形势下,人口规模所带来的潜在消费力将是国内经济运行的重要一环,但也会给国家社会保障体系带来压力。在制定和调整养老保险政策时,必须要考虑其在施行过程中对居民消费产生的影响。基于2018年《中国家庭追踪调查》数据,采用广义倾向得分匹配方法消除可能存在的样本选择性偏误,将养老保险收入和居民消费支出分别作为处理变量和结果变量,并选定年龄、收入、性别、受教育水平等作为匹配变量。研究发现,养老保险收入与居民消费之间存在倒U形关系,农业户口人群的养老保险收入、消费及工作收入水平普遍低于非农业户口人群,但处理变量的地区效应并不明显。基于研究结果,社会养老保险缴费水平应当在稳定社会养老保险收益预期的基础上,按照居民个体收入水平灵活制定。各地区须采取有效措施提高农村居民收入以及扩大城镇职工基本养老保险的覆盖率,加强医疗保险等多种形式的社会保障,从而进一步促进居民消费水平的提高。
近年来,国内外经济环境发生了巨大变化,复杂的形势使得中国以投资与进口为经济增长驱动力的模式无法平稳运行,这就导致中国国内对经济增长驱动力的迫切需求,而人口规模所带来的潜在消费力将会成为后疫情时代中国经济发展的稳定一环,但同时人口规模也给国家社会保障体系带来压力。
广义的社会保障体系指国家通过立法而制定的社会福利、社会保险、社会救助、社会优抚和安置等各项不同性质、作用的社会保障制度,是我国最重要的社会经济制度之一,以减少“不测风云”对正常生活的影响程度,养老保险制度是其中的关键一环。2009年,国务院在全国开展实施新型农村社会养老保险(以下简称“新农保”)。“新农保”规定,年满16周岁的农村居民、非在校学生和未参加城镇养老保险者均可参与。募集资金方面,“新农保”以农村居民个人缴费、集体缴费和政府补贴3个渠道相结合,之后用募集得到的资金对参保居民给予财政补贴。参保居民的养老金账户由基础养老金及个人账户两部分组成,基础养老金即为国家财政补贴部分。另外,年满60周岁的未参保居民,其符合条件的子女参保,他们也将自动获得每月最低55元的基础养老金。
影响居民消费情况的主要因素中,收入水平、个人偏好、未来预期等内生性因素是一方面,通货膨胀、社会保障等外生因素也是极为重要的一方面。一般来说,社会保障制度设计的原意是为了社会公平,并不是为了促进经济增长或是直接影响居民消费水平,但是政策在运行实施的过程中却不可避免地影响到居民的消费情况。
一般认为,养老保险制度的广泛普及使消费者的消费水平和消费结构均得到提升和改善。通过国民收入再分配,保障了居民未来的基本生活,使得大部分居民的预期发生改变,增加了当前社会有效需求,有意无意地改变了消费者的消费倾向,从而使其消费能力得到一定的释放,也改善了当前的生活水平。国内外研究学者大多数也都遵循此种研究思路,但是不同地区也可能出现与理论不相匹配的现实情况。
国内外经济环境的剧烈波动是否需要继续发展城乡养老保险制度来扩大国内消费需求?养老保险制度在实施过程中是否能够有效提高居民消费水平?针对养老保险实施过程中对居民4类消费的影响,本研究基于2018年《中国家庭追踪调查》数据,对以上问题进行实证分析,进而在当前和未来的政策制定与发展中发挥一定的积极作用。
国内外大多数学者的研究结果都是基于Martin Feldstein于1974年提出的观点发展而来的,Feldstein认为社会保障支出对私人储蓄的作用路径分别存在“资产替代效应”(asset-substitution effect)和“引致退休效应”(retirement effect)两种。“资产替代效应”是在私人储蓄的基础上通过减少未来的不确定性,使居民当期消费倾向上升,从而减少储蓄、扩大消费。“引致退休效应”对消费的影响是负向的,一方面,缴纳社会保险费在一定程度上降低了居民的可支配收入,从而降低现期消费;另一方面,社会保障通过提高退休率、延长人们的寿命,导致人们为了退休后的生活水平会选择把年轻时的大多数收入用于储蓄而非即时消费。Feldstein认为社会保障支出对私人储蓄和消费的影响取决于这两种效应的净效应,大多数国内外学者对社会保障问题的研究也都是以此为基础的。
笔者通过对国内外相关文献和著作的分析与整理,认为关于养老保险和居民消费的关系讨论大致可以分为3种:第一种是促进论,也是大部分学者支持的观点,认为社会保障将会对消费产生正向影响;第二种是抑制论,少部分学者认为社会保障对消费产生了负向影响;第三种是非线性影响论,认为社会保障对消费的影响是显著的,但并不是普通的线性关系,而是可能存在门槛效应等非线性关系。接下来,本文将会对国内外文献按照以上观点进行分类讨论,了解与本问题相关的研究现状。
1.关于养老保险对消费具有促进作用的解释
关于促进论,哈佛教授Martin Feldstein是该观点的代表人物。在SocialSecurity,InducedRetirementandAggregateCapitalFormation一文中,他对美国1929年到1971年的时间序列数据进行了实证分析,认为美国的养老金计划降低了接近50%的储蓄,显然整体来看,美国的社会保障支出对消费水平的影响是正向的[1]。国内研究中,2012年蒋南平教授运用动态GMM方法对我国300多个地级市的数据进行分析,展开了对我国社会保障与居民消费的相关性研究,发现社会保障水平的提高对居民消费具有正向促进作用,但欠发达地区受影响的程度显然比发达地区更为显著[2]。2017年,耿修林教授对1978—2016年《中国统计年鉴》收录的数据进行分析,认为虽然人均社会保障支出对消费的促进作用不如城镇化水平显著,但仍然对居民消费支出产生了较为显著的积极作用,充分发挥了扩大内需在社会经济发展中的作用[3]。
我国学者对养老保险与居民消费关系的讨论大多数是持正面态度的,但也可以看出这种促进作用的程度存在险种差异、人群差异以及地区差异。2017年,范黎波等学者采用2012年中国综合社会学调查的数据,考察了不同类型社会保障对居民消费的影响,发现养老保险对居民消费支出的促进比医疗保险更为显著,并且社会保障对中低消费层次居民的正向影响更明显,即社会保障对居民消费的影响存在城乡、行业和地区上的差异[4]。同年,成峰和席鹏辉通过对中国家庭追踪调查数据库中56个地(市)2010—2014年的微观面板数据分析发现,社会保障支出仅对无自有住房居民的消费具有促进作用,对促进居民消费升级的影响不显著[5]。相似地,2018年,赵青和李珍基于Feldstein的消费函数,利用2011—2013年中国健康与养老追踪调查的数据,研究了养老保险在参保类型和保障水平方面对居民消费的影响,发现在人均初始生活水平较低、经济欠发达地区,公共养老金单位增长所带来的家户边际消费倾向高于经济较为发达地区,城乡基本养老保险参保者的消费支出比未参保者或参加其他类型养老保险的居民更多。这在一定程度上反映了社会基本养老保险这一保障对居民消费是存在带动作用的,不过带动程度也存在人群、地区上的差异[6]。也有学者的研究结论与前两者存在出入,陈利馥等人利用1996—2016年全国和省级面板数据发现,影响我国居民消费率的因素中社会保障对全国和东部地区消费率影响不显著,仅对中西部地区产生显著影响[7]。
国内学者根据养老保险对居民消费存在地区性差异的特点重点关注农村的情况。研究农村居民消费情况的相关文献大多基于2009年起试点实施的新型农村社会养老保险政策。2012年,为了研究“新农保”政策试点实施后对农村居民消费情况的影响,岳爱等人以消费和储蓄生命周期理论为基础,结合实际构建研究框架,对具有全国代表性的农户层面抽样调查数据进行分析,发现“新农保”政策实施后参保农户的家庭日常费用支出显著高于未参保者[8]。 2013年,沈毅和穆怀中根据2011年截面数据消费模型进行实证研究发现,保持其他条件不变,农村养老保险基金支出每增加1亿元,当年可拉动农村居民生活消费支出18亿元左右,并且会对下一年消费产生影响系数约为1.2的正向作用[9]。2019年,杨汝岱教授以中国家庭动态跟踪调查数据和农业农村部调查数据为根据,展开对“新农保”政策消费影响的研究,发现参加“新农保”的家庭比未参保家庭的消费水平高5%~30%,主要促进医疗保健、文化教育娱乐方面的消费,对食品衣着等必需品消费影响有限[10]。同年,国内学者王静教授基于1982—2014年的国家统计年鉴数据,分阶段对社会保障财政支出和农村居民消费的关系进行研究,观察到市场经济体制改革前,社会保障和农村居民消费之间的关系并不显著;改革后有效的社会保障体系能够减少居民当期预防性储蓄,扩大即期消费,两者间存在明显的正相关关系,但是对消费水平的拉动效应较小,影响消费的主要因素仍是收入[11]。还有学者基于以往研究利用2016年《中国劳动力动态调查》数据的实证分析发现,购买商业医疗保险和养老保险对农户人均消费支出存在显著促进作用,但社会保障在农村地区的覆盖率总体偏低[12]。
相比较对农村居民消费的研究,单独研究社会保障支出与城镇居民消费之间的正相关关系的文献较少。王金波从静态和动态两个维度解读了1998—2014年的省级面板数据,发现社会保障支出对城镇居民消费的影响存在十分显著的正效应,政府社会保障支出每增加1万元,带动城镇居民消费支出增加幅度在1.469至4.357个单位内变动,除此之外,研究结果也出现了明显的东、中、西部地区阶梯形递减态势[13]。
2.关于养老保险对消费具有抑制作用的解释
第二种观点是养老保险抑制了消费。1982年,Leimer和Lesnoy在改进了Feldstein财富消费函数的基础上进行实证分析,对Feldstein的研究提出了挑战,认为社会保障财富的计算方式会对结果产生很大影响,于是他们针对1947—1976年的数据,在文章中采用了不同方法估计社会保障对储蓄和消费的影响,包括现行法律、当前替代率、平均替代率、缓慢改变的替代率以及完美远见5种方法,研究得出了社会保障抑制消费的结论[14]。尽管Feldstein对此进行了回应,改进了之前的研究方法[15],但仍然受到了来自Leimer和Lesnoy的质疑[16]。此外,Phillip于1965年发表了《养老金对储蓄的影响》一文,对1958—1959年消费者联盟中约15 000位会员的数据进行分析,发现参加养老金计划会促进人们退休,从而增加储蓄,减少消费[17]。
我国也有部分学者的研究结论支持这一观点。最典型的是白重恩等人于2012年对中国养老保险缴费展开的相关研究,他们对2002—2009年9个省(市)的城镇住户调查数据研究发现,养老保险缴费负担对总消费产生负向影响,并且提高养老保险缴费率会显著抑制参保家庭的消费[18]。同年,刘长庚和张松彪对2005年至2009年我国31个省(市、区)的面板数据进行计量分析,发现养老保障对城镇居民消费支出的影响显著为负,可能的原因是我国基本养老保险制度的企业和个人需要担负的缴费比例较高,降低了城镇居民的可支配收入,进而影响到居民消费支出[19]。2017年,魏勇和杨孟禹利用2004—2015年《中国统计年鉴》和省际面板模型对收入结构、社会保障和消费升级的真实动态关系展开研究,发现较高的社保个人缴费比例对总消费和高档商品消费产生了挤出效应,政府财政社会保障支出对居民基本商品消费有促进作用,但对消费升级产生了微弱阻碍[20]。
3.关于养老保险与居民消费之间为非线性关系的解释
对于养老保险等社会保障与居民消费之间关系的讨论,第三种观点认为两者之间存在非线性关系。2005年,柳清瑞教授通过建立基于养老保险计划的消费决策模型,指出只有养老金替代率保持在适度水平才有利于消费者当期和未来的消费情况[21]。
部分学者通过对各省(市、区)数据的研究,认为农村社会保障对农村居民消费的促进作用存在门槛效应。2017年,刘丹和卢洪友选取2004—2015年中国大陆30个省(市、区)的数据进行研究,发现农村社会保障对农村居民消费存在三重门槛效应,农村社会保障水平提升的幅度越大对农村居民消费的促进作用就越强,并且从地区来看,东、中、西部地区农村社会保障对农村居民消费均存在非线性正向影响[22]。2018年,刘飞等人利用1991年至2015年30个省(市、区)的相关数据进行研究,发现农村社会保障支出对农村居民消费支出的影响存在单一门槛效应,只有当政府的社会保障资金投入量大于某一水平时,社会保障支出才不会被转移成储蓄,进而促进居民消费水平提高[23]。相似地,2020年,赵威基于1991—2017年的省级面板数据进行实证分析,检验了社会保障对城乡消费差距的非线性平抑效应,发现全国和东部地区通过了双重门槛检验,中部和西部通过了单一门槛检验,东部地区的社会保障达到一定阈值后会对居民消费产生挤出效应,并且全国层面上的社会保障对城乡居民消费差距的影响呈现U形,中部和西部的社会保障对城乡居民消费差距的影响呈V形[24]。
此外,张伟基于共生理论认为,农村社会保障和农村居民消费拥有相同的政策制度环境、经济环境和作用主体,因而二者存在共生关系,相互依存。完善的社会保障体系会对农村消费产生带动作用,改变农村居民的消费理念,其投保的积极性会有所增加。当然,社会保障缺乏也会导致农村居民增加医疗、教育、养老等方面的经济支出,不利于农村居民消费结构优化[25]。
通过已有文献可知,养老保险等社会保障对居民消费的影响研究大致可以分为3种看法——促进论、抑制论以及非线性关系论,包括且不限于拉动效应、抑制效应、三重门槛效应、单一门槛效应、非线性平抑效应、U形、V形等多种形式。在这样一种关系的探究中,工作收入水平、地区发展水平、性别差异、险种差异、户口类别甚至消费类型和政治面貌等因素在其中发挥的影响作用不可忽视。国内的相关研究更多关注“新农保”的实施对农户群体以及较落后地区的消费情况是否存在改善效果,或者关注省际面板数据,重点观察一省之内的居民养老保险与消费。国外学者更多关注生命周期中的经济活动,尽可能以数学方式测算出“资产替代效应”和“引致退休效应”,就养老保险对居民储蓄和消费的影响下一个准确的结论。通过已有文献并不能简单地断定养老保险等社会保障对居民消费的影响到底是促进还是阻碍消费水平。同样,养老保险对居民消费产生的影响也存在不确定性,这可能是因为数据样本来源、模型设定、险种以及筹资模式等多种差异性因素。总体来看,国内外大多数学者都认为养老保险等社会保障对居民消费起到了一定的促进作用,更深入的研究是认为两者之间呈现U形或V形等非线性关系。关于样本选择性偏误的问题,上述文献中讨论较少,或给出理论分析但并未提出解决方法。本研究采用广义倾向得分匹配方法来对样本的选择性偏误进行处理,力图减少模型回归误差,对效应做出更为准确的分析。
本研究数据从2018年《中国家庭追踪调查》(CFPS)家庭库和成人库中获得,覆盖了25个省(市、区),共获得14 000多户家庭、40 000多人的微观情况,了解到受访家庭的消费情况、退休与养老、参保项目、家庭的资产和收入、人口特征等多方面的详细数据。
由于涉及的变量较多,在去除相关变量缺失数据,以及问卷回答“不适用”“拒绝回答”“不知道”的数据和其他异常数据后,共筛选得到可用于经济分析的家庭样本5 227个,个体样本12 805个。同时,为了使数据分析更加稳健,本研究进一步对所有连续变量在1%分位数以下以及99%分位数以上的数据进行了缩尾处理,以此消除可能存在的异常值带来的影响。
1.处理变量
一般情况下,衡量养老保险水平可以采用是否参保的虚拟变量、养老保险收入的绝对指标或相对指标。本研究对2018年居民领取的养老保险收入进行标准化处理,将其作为衡量养老保险水平的标准。考虑到数据的特殊性以及家庭中个体与整体的消费特性,在计算得到相对指标之前,对2018年家庭成员领取的养老金收入做平均处理。
2.结果变量
现有研究对居民消费情况的衡量十分复杂且种类繁多。根据研究目的,本研究将重点关注居民个体1年当中的消费支出,主要包括4类:第一类为食物消费支出,包含食品、外出就餐支出等;第二类为日常生活支出,包括邮电通信费、水电燃料费、本地交通费、日用品费、房租支出等;第三类为耐用消费品支出,包含家电家具、衣物、汽车等;第四类为医疗保健教育费用等。此外,由于所用数据库并未收集家庭成员个人的消费支出,因此本文根据家庭样本编码将成人库与家庭库匹配,将家庭消费支出与家庭规模之比作为个人消费支出,匹配到家庭各成员个体的数据中,估计出居民的收入与支出情况。
3.匹配变量
根据学界已有研究,居民获得养老保险收入主要受到城乡分布、受教育程度、婚姻状况、户籍性质、政治面貌等因素的影响。考虑到即使其他几个因素不产生显著影响,将其加入匹配也不会对模型产生影响,而且一般认为个人收入、年龄、性别、地区等因素可能对民众消费水平产生影响,引入这些因素可以提高匹配估计的精度,因此在对样本实施匹配时仍将所有控制变量纳入匹配。需要说明的是,该调查中关于最高学历的选项包括从未上过学、文盲/半文盲(小学未读完)、小学、初中、高中/中专/技校/职高、大专、大学本科、硕士、博士。同时,为了讨论地区效应,按照中国宪法对行政区域的划分将样本所在省、自治区和直辖市划分为7个地区以及其他。考虑到多重共线性等问题,变量具体设置如表1所示。
表1 变量设置
本研究的主要问题是养老金领取额度对居民消费支出水平的影响,若简单采用线性回归,存在收入水平高、受教育程度高的居民参加多种养老保险,从而领取更多养老金的可能。为了分离其他因素对居民消费的影响,且考虑到单一估计养老保险领取金额对居民消费的影响,本研究采用广义倾向得分匹配方法(GPSM)。
广义倾向得分匹配方法由Imbens和Hirano提出并发展。相比于传统倾向得分匹配模型,该方法继承了其核心思想,但突破了PSM中对处理变量必须为二元选择变量的约束,并且保留PSM能够消除自选效应的特性。GPSM能够对连续变量的处理效应进行评估,适用于本文对养老保险金的异质性处理效应的评估。此外,为了描述不同的处理变量所对应结果变量的条件期望,即可以进一步研究处理变量对结果变量的动态影响,Hirano等还进一步建立了剂量反应函数。因此,利用该函数可以在前人研究的基础上进一步分析和验证养老保险收入对居民消费水平的影响是否存在非线性效应[26-27]。
通过查阅文献资料,笔者发现国内外学者大多借鉴2004年Hirano和Imbens提出的GPSM原理及步骤开展研究。实施GPSM方法一般需要满足3个前提假定:(1)处理变量必须是正态分布;(2)共同支撑假定;(3)平衡性质假定。此外,一般来说,广义倾向匹配得分方法基本实施步骤如下:(1)估计处理变量,即养老保险收入的条件分布,并计算广义倾向得分(GPScore,以下记为GPS得分或GPS);(2)根据处理强度T和GPS估计值,构造并估计结果变量Y的条件期望模型:(3)在上述估计基础上,将处理强度T替换为处理变量t,将得分值R替换成得分值的估计函数,得出“平均剂量反应”函数μ(t)和处理效应函数(treatment effect,TE)的估计结果。
在进行GPSM方法的第一步之前,必须检验处理变量是否满足正态分布的严格约束。图1为处理变量insurance的频数直方图,实线为正态分布曲线。根据直方图与正态分布曲线的比较可以看出,有相当数量的居民2018年的养老保险收入多数为0或在0值附近,尽管年度养老保险收入的总体分布散布在一个很大的正数范围内,但在数字0上相当集中。一般来说,变量取0值有两种情况:一是统计值,数据确实为0;二是缺省值,对方不知道、不确定、不适用或拒绝回答等。从图2更详细的核密度曲线上发现,该变量是典型的截尾数据,不符合广义倾向得分匹配方法对处理变量的严格正态分布假定。接下来,本研究对处理变量进行了取对数处理及正态分布检验,所得结果见图3和图4。
同样地,图3为变量insurance的对数形式的频数直方图,图4为其对应的核密度曲线,实线均为正态分布曲线。从频数直方图、核密度曲线与正态分布曲线的比较可以看出,双峰曲线同样不符合严格正态分布假定。此外,本文在数据分析软件中对变量数据进行了平方变换、box-cox变换等,但是均未通过软件的正态分布检验,因此可以认为本文处理变量并不满足Hirano等人提出的GPSM方法中的严格正态分布约束。
图1 变量insurance的频数直方图与正态分布曲线比较
图2 变量insurance的核密度线与正态分布曲线比较
图3 变量ln insurance的频数直方图与正态分布曲线比较
图4 变量ln insurance的核密度线与正态分布曲线比较
为了解决这样的问题,本文采用Barbara和Marco于2014年提出的方法,对GPSM方法中的第一步进行修改,即用GLM回归代替第一步中的一般线性回归[28]。采用GLM的模型不同于普通回归的点在于:第一,处理变量T的分布不必是正态分布或不必接近正态分布;第二,处理均值的变换与解释变量线性相关。可以用以下数字语言的形式进行描述:
f(T)=c(T,φ)exp{[Tθ-a(θ)]/φ},
(1)
g{E(T)}=β′X。
(2)
式(1)表示处理变量的分布属于指数族。式(2)中,g(·)是一种单调可微的函数,通常称作链接函数(link funtion),表示一个变换形式与X中所包含的解释变量线性相关。a(θ)通常被称作分布族(family),取决于处理变量的性质,它决定了其条件分布函数为正态分布、伯努利分布、泊松分布等,并且不管所选分布如何,均存在以下关系,其中,点表示对θ的一阶导数和二阶导数:
(3)
那么,根据以上方法,针对样本中大量集中于0值的数据,本研究只需要修改GPSM的第一步,确定处理变量的分布族以及链接函数,即可进行回归分析。
本文对处理变量进行标准化处理后,得到[0,1]之间的处理强度。针对[0,1]范围内并且大量集中于端点的变量,在一篇2018年的文献中找到了合适的函数模型。该作者研究出口补贴对企业出口密集度影响时,采用了1996年Papke和Wooldridge提出的Fractional Logit模型来解决这类数据分布问题[29]。该模型不仅可以对处理变量强度在[0,1]区间内的一般情况进行分析,而且可以处理位于区间端点的特殊情况,即GPSM方法第一步中,处理强度作为因变量时取值为0或者1的极端情况。 本研究将采用以上方法和模型对2018年《中国家庭追踪调查》数据进行处理和回归分析,消除样本中的选择性偏误,深入估计养老保险收入对居民消费水平的影响。
由于涉及变量较多,在去除相关变量缺失数据以及回答“不适用”“拒绝回答”“不知道”的数据和其他异常数据后,共筛选得到可用样本12 805个。按农业户口与非农业户口进行分组讨论,将2018年居民的主要情况做描述性统计(如表2所示),连续变量的单位均为全年累计数据。
表2 模型主要变量的描述性统计
非农户口一组中,消费支出的观测值最小值为789.33元,最大值为51 436元;工作收入的最大值为115 000元;养老保险收入最小为0元,最大为50 000元,均值为11 429元。而在农户群体中,消费支出的最小值为524元,最大值为47 785元;工作收入最大值为115 000元;总样本中,男女人数比为6 404∶6 401,约为50.01∶49.99,性比结构较为均衡,但非农业户口中男性占比为0.514,农业户口中男性占比为0.49,差异较大。养老保险收入最小值与最大值同非农一致,农业户口群体均值为2 010元,远低于非农户口群体,这也说明农村地区养老保险水平仍有提升的空间。样本中农业户口人群参保项目包括农村养老保险(简称“老农保”)、新型农村社会养老保险(“新农保”)以及企业补充养老保险等,非农业户口人群参保项目包括基本养老保险、城镇居民养老保险、企业补充养老保险、商业养老保险等,但由于数据统计问题无法获得详细分类的各类养老保险收入,本研究暂不讨论险种差异。
对居民消费水平以及其他变量进行初步回归后,得到年养老保险收入对居民消费支出的影响估计系数为0.17,工作收入的影响估计系数为0.09,男性的影响估计系数为-0.07,农业户口的影响估计系数为-0.18,均在99%的置信水平上显著,也就是说,控制其他条件,提高养老保险收入1%,居民平均消费支出预计将会提高0.17%。据此提出本研究的假说:养老保险收入提高对居民消费支出具有显著正效应。但上述回归仅为初步回归,存在一定的误差。接下来,本研究将通过广义倾向得分匹配方法(GPSM)消除选择性偏误,对假设进行稳健的因果效应分析。
按照广义倾向得分匹配法(GPS)的实施步骤,首先对居民养老保险收入的条件分布进行估计。在本文中,处理变量因为并未通过正态分布检验,说明样本是严重有偏的。为了解决这样的问题,本文采用广义线性回归方法(GLM)对广义倾向得分匹配方法的第一步进行替代。STATA中使用的命令语句为doseresponse2,该语句放松了对变量的严格正态分布约束,适用于本研究的样本。本文为尽量满足正态分布和同方差假定,以及研究模型中对处理变量的要求,对变量消费支出y做取自然对数处理,记为结果变量Y,对变量养老保险收入insurance以及匹配变量工作收入income做标准化处理,使其取值在[0,1]之间,分别记为处理变量T及inc。
除了收入变量(inc)之外,本文还选取了年龄(age)、性别(male)、是否在婚并且有配偶(married)、受教育程度(edu0~edu7)、是否为共产党员(cparty)、是否为农村户口(ahr)以及地区等作为匹配变量,以提高估计精度,已对变量的具体含义给出了详细定义。本文进行广义倾向得分匹配方法的第一步是对2018年居民养老保险收入与其他匹配变量进行回归分析,得到养老保险收入条件分布函数的系数估计结果。从表3中模型的回归结果和AIC统计量(Akaike information criterion,赤池信息量准则)等于0.453 0来看,匹配变量对处理变量的拟合效果较好。
首先,从该模型回归系数来看,被解释变量养老保险收入(T)与工作收入(inc)之间呈现负相关关系,即工作收入越高的人,其领取的养老保险收入越少,这可能是因为在统计到的样本中,不工作的退休老人比工作的年轻人收入少。其次,年龄(age)与养老保险收入显著正相关,原因可能是养老保险收入只有年龄达到项目规定年龄时才会发放,因此对该系数不必过多解释。再者,从变量性别(male)的系数上来看,男性的养老金收入显著低于女性,该结果与大多数学者的研究结论相悖。多数学者认为由于女性就业率相对较低、养老保险制度差异、受教育机会不均等、职业上的工资差异、家务负担等问题,一般女性老人养老保险参保状况及水平普遍较低。分别对比总样本和60周岁以上样本的人口结构,发现男女比例分别为50.01∶49.99和50.16∶49.83,男女退休老人人口数量相差不大,本研究得出相反结论与样本人口结构并无太大关联。根据另一些学者的研究认为可能有另外的因素弥补了性别上的终生收入差距[30],从而缩小和消除养老保险收入上的性别差异,如女性越来越强的参与工作意愿、较高的兼职工作率以及较长的预期寿命和婚姻伴侣行为方面的差异,而女性预期寿命高意味着缴款回报率较高,终生养老金与男性差异较小甚至更高。
表3 处理变量T的条件期望模型回归结果
此外,就受教育水平(edu0~edu7)而言,最高学历为从未上过学、未读完小学、小学的人群,养老保险收入显著低于较高学历的人群。就政治面貌(cparty)而言,共产党员人群养老保险收入显著高于非党员,这可能是因为共产党员积极响应政策、收入较为稳定等。值得关注的是,拥有农村户口(ahr)的居民养老保险收入显著低于非农户口的居民,这也意味着农村地区养老保险制度还有待进一步完善和发展。最后,该模型中婚姻状况(married)变量以及多数地区变量的估计系数并不显著。在婚人群的养老保险收入与其他婚姻状况的人群并无显著差别。根据变量east及northeast估计系数认为我国东部和东北地区的居民所领取的养老保险收入显著高于其他地区居民,这与当地经济发展水平、医疗卫生水平等因素息息相关,而其他地区的估计系数并不能说明其他地区居民之间所领取的养老保险收入存在着显著差别。
估计出处理变量养老保险收入的条件分布之后,便可计算GPS得分。基于表3列出的条件分布函数回归结果得出GPS分值的描述性分析(如表4所示)。接下来,本文将进行广义倾向匹配得分方法的第二步——估计结果变量的条件分布,即居民消费水平的条件期望模型。
表4 GPS得分的描述性统计
根据以上步骤计算得到的GPS估计值和处理变量T,进行GPSM方法的第二步——估计居民消费水平(Y)的条件分布。由于假定主效应(T和GPS)不能从结果变量的估计方程中去除,因此本文在优先保证T和GPS的保留与显著下,逐次加入二次项、三次项以及交互项。本研究原定估计结果变量条件期望模型的最高次幂为三次,但是,为了达到减少模型的多重共线性以及尽量不遗漏相关变量形式的目的,本文对最高次幂为三次和二次的模型分别进行了回归处理并比较,得到的具体结果如表5所示,系数显著性良好地实现了研究预期。
(4)
(5)
表5中回归系数一栏分别列出了两种回归模型,模型(4)和模型(5)均是对2018年总体样本回归所得到的估计结果。从各个系数的显著性来看,这两个模型对结果变量的条件分布估计效果都处于较好的水平。模型(4)中只有GPS2并未通过10%显著性水平上的t检验,其余项均在1%或5%的显著水平上显著,拟合效果良好。但从以上两种模型的拟合效果以及F统计量综合看来,加入变量的多次项容易导致多重共线性的增强,因此本文将以二次项作为变量的最高次幂,将原定最高次幂为三次的回归模型更换为模型(5),将其作为居民消费水平条件分布函数的估计模型。
表5 结果变量居民消费水平(Y)的条件期望模型回归
从各个系数的显著性来看,该模型能够较好地估计居民消费水平的条件分布。本文假设养老保险收入对居民消费具有显著的正向影响,而研究得到的结果是处理变量T的回归系数在模型中显著不等于0,与前人研究结论基本一致。处理变量的二次项系数同样显著不等于0,符号为负,可以认为养老保险收入对居民消费水平的影响更符合一种倒U形关系,而非简单的线性相关关系。模型(5)在加入GPS2以及交互项之后,均不影响主效应的显著度,因此本文认为模型(5)拟合效果良好,比较符合现实与研究预期。
根据广义倾向匹配得分方法,第三步根据以上两个步骤得出的估计模型和GPS得分值,对处理强度和得分值进行替换,分别带入处理变量T和得分值估计函数r(t,X),从而得到养老保险收入对居民消费影响的剂量反应函数(dose-response function)以及处理效应函数(treatment effect function,TE)的估计结果。
本文在GPSM方法的最后一步中将标准化的居民养老保险收入的衡量指标即处理强度在取值[0,1]的范围内划分为100个子区间,然后在每个子区间估计出养老保险收入对居民消费水平的因果效应,之后将这些因果效应的各个区间合并,即得到剂量反应函数,函数曲线估计范围如图5所示。图5中分别绘出了函数曲线在置信度95%水平下的估计上界和估计下界。
图5 养老保险收入对居民消费水平的剂量反应函数曲线
图5显示,2018年养老保险收入与居民消费水平呈倒U形关系,即当处理变量低于某一个值时,随着居民养老保险收入的增加,其消费水平会随之增加,但是随着领取的养老保险金越来越多,居民消费水平不会一直增加,而是到达顶峰后逐渐降低。因此,从促进消费的角度来看,居民领取的养老保险金并非越多越好,这一结论也支持了一些已有研究的观点。
这样一种倒U形关系可以解释为在拐点到来之前,随着养老保险收入的增加,作为居民的转移性收入,居民个体的可支配收入增加,改变了其消费约束和消费倾向,因此居民的消费支出是在不断提高的。拐点之后,养老保险收入的增加逐渐对居民消费产生了一定的挤出效应,其中原因可能是随着经济的发展,居民的收入逐渐增加,处于较高收入水平的居民群体所缴纳的社会保险费用就更多,因而可支配收入的减少在一定程度上又降低了该群体的消费倾向。这与一些学者认为的居民收入不确定性将会影响养老保险与居民消费之间的效应相符合。
为研究参加养老保险对居民消费水平的处理效应,本文根据剂量反应函数的估计结果进一步得到了处理效应函数。图6中的处理效应呈现出线性负相关关系,这表明对居民个体来说,其领取的养老保险收入相比于未参保人群,其净效应是逐渐递减的。如果把养老保险收入的取值范围划分成两部分(以图6中虚线与函数值为零时,函数所对应的 X 轴上的交点为界限),在交点之前,随着养老保险收入的增加,相对于未参保居民而言,居民领取养老保险收入更能提升居民的消费水平,但是随着领取的养老保险收入的不断增加,这种相对优势会呈现一种下降趋势。
图6 养老保险收入的处理强度对居民消费水平的处理效应函数
虽然这种相对优势在不断下降,但居民理性的做法应当是在交点之前积极参保领取养老保险收入,该范围被称为有效区域。而在交点之后,领取养老保险收入的增加相对于不参保或不领取养老保险收入来说,对居民消费的效应是负向的,此时理性做法应当是不再增加养老保险领取收入,该部分被称为无效区域。无效区域出现的原因可能是继续增加领取养老保险收入已经超过了居民所能提升的消费空间,甚至过度转移成了居民储蓄。这时增加养老保险收入领取给居民消费带来的效益小于居民储蓄所能带来的效益。进一步计算剂量反应函数倒U形关系的拐点区间和处理效用函数的无效区域点区间,得到剂量反应函数拐点(B)的估计区间为(0.91,0.92),以及处理效应函数无效区域点(A)的估计区间为(0.32,0.33)。
如果将以上估计的剂量反应函数与处理效用函数放到一张图上(见图7),可以看出样本的无效区域点(A)在拐点(B)的左侧。在有效区域内(A点左侧),增加居民养老保险收入对提高其消费水平的影响是正向的。但是在无效区域点至拐点之间(A点至B点),可以看出,即使已经达到无效区域点,但之后的一段区间内,继续增加养老保险收入仍然可以进一步提高居民的消费水平,然而其效率并不如有效区域。也就是说,在无效区域点(A)之后,与其继续增加居民养老保险收入,不如寻找新的驱动力来提高居民的消费水平。
图7 养老保险收入的剂量反应函数和处理效应函数
但是,这种问题也是有办法解决的,可以考虑通过制定补充措施来实现有效区域点的右移。例如,健全社会保障体系,完善医疗保险、社会救助等制度,减少老年居民生活中的不便之处,改善其未来预期,避免养老保险收入向储蓄的过度转化,从而提高居民的消费和生活水平,最终实现剂量反应函数拐点与处理效应函数无效区域点的重合。
本文选取《中国家庭追踪调查》2018年的基线调查数据,利用广义倾向得分匹配方法(GPSM),深入而细致地探讨了养老保险对居民消费支出的影响,需要注意的是,居民消费支出仅包括对食物消费支出、日常生活支出、耐用消费品支出以及医疗保健教育支出。研究发现:(1)养老保险收入与居民消费水平之间是一种倒U形关系,并且居民领取养老金相比于不领取养老金,所获得的相对优势是逐渐下降的。随着养老保险收入的不断增加,居民用于储蓄所获得的效益逐渐大于消费,居民消费水平不再提高,从而陷入一种继续提高养老保险收入的无效区域,并且无效区域的出现早于倒U形曲线拐点,说明在无效区域点到达拐点之前,虽然提高居民养老保险收入能够对消费产生正向效应,但这种效应在逐渐减弱。(2)在对农业户口人群及非农业户口人群进行分组描述性讨论下,本文初步发现,农户群体的4类消费支出之和、工作收入、养老保险收入总体来看普遍低于非农户群体。(3)分地区来看,东部、东北、北部、中部、南部地区对养老保险收入具有从高至低排序的正向关系,西北、西南地区的养老保险收入领取为负向关系。但是除了东部与东北地区的显著为正之外,其余系数均不显著,因此本研究尚不能对地区效应下定论。但可以说明的是,除部分地区之外,我国大部分地区现阶段的养老保险制度和社会保障体系还有完善的空间。
基于以上结论,本文提出以下几点建议:(1)稳定社会养老保险的收益预期以提高居民当期消费倾向。人们面对生活中的各种不确定性和风险挑战时,储蓄率提升,消费倾向降低。尤其当进入老年阶段时,退休、身体机能下降以及患病风险增加的问题会给居民生活带来很多不确定性。因此,人们需要提前备好预防性储蓄,而养老保险制度能够为老人提供稳定的养老收入,可以大大提高居民的消费倾向。因此,政府须保持政策执行的稳定性以及财政的可持续性,从而达到提高居民消费倾向和生活水平的作用。(2)按照居民个体收入水平,灵活制定社会养老保险缴费水平。本研究发现,部分居民参加了不止一项养老保险项目,少则一两项,多则四五项。除此之外,居民养老保险缴费也会影响当期可支配收入,产生“挤出效应”,当缴费水平过高时,反而会对个体的消费产生限制。因此,社会养老保险制度缴费水平应与居民收入灵活匹配。政府在条件允许的情况下,可以积极扩大对参保居民的缴费补贴,减免或降低低收入群体和困难群体的养老保险缴费比例。(3)采取切实有效的措施,逐步提高农村居民的收入。研究发现,农村居民养老保险领取金额均值远低于非农业户口人群。自2014年国务院实施统一的城乡居民基本养老保险制度至今,城乡差距、中西部与东部地区差距虽有所缩小但仍然存在。政府可以通过制定一系列惠农政策,降低生产与运销等农业活动的成本,增加农村居民收入,扩大其收入渠道和来源,提高农村居民消费水平,使其消费潜力转化为经济增长的驱动力,促进国内经济平稳运行。(4)扩大城镇职工基本养老保险的覆盖率,加强医疗保险、社会养老保险等多种形式的社会保障。虽然我国已实现城乡基本养老保险制度全覆盖,但存在“碎片化”“多元化”现象,并且提供的养老收入水平较低,保障力度不够,需要不断扩大、提高城镇职工基本养老保险覆盖率和养老收入水平,使医疗保险体系同步发展,防止因病致贫、因病返贫和老无所依现象的发生,也避免社会养老保险等支出过度转化为居民储蓄,进而促进居民消费水平提高。