杨玉萍
[内容摘要]健康作为一种人力资本,对提高个人收入有着重要的影响。本文基于CFPS的数据.采用分位数回归的方法,考察健康的收入回报在不同收入水平人群上的差异。研究结果发现收入水平越低,健康资本的收入回报越高,这一现象在城市和农村都存在。进一步地,城乡之间健康的收入效应也存在差异,在各个收入分布位置,农村的健康收入回报都高于城市。基于此发现,结合当前医疗卫生服务情况,本文提出了提高低收入者和农村人口医疗服务保障的建议,以完善医疗卫生服务配置和改善收入分配。
[关键词]健康;收入效应;分位数回归
一、引言
健康问题一直是社会关注的热点。作为人的一项“可行能力”和基本自由(Sen,2002),健康关乎着个人的福利问题。在人力资本理论中,健康和教育一样,是提高个人生产力和收入的一种重要人力资本。“病来如山倒”,体现了疾病对人体的破坏力,一场大病,足以拖垮一个普通家庭,产生因病致贫、因病返贫的现象。世界卫生组织的数据显示,在低收入国家每年大约有2%-7%的人口因病致贫。因此,个人健康对于收入提高起着基础性的作用。
学界们已就健康与收入的关系进行了不少的探讨,主要包括健康的收入效应和收入的健康效应两个方面。但前者研究的较少,而且大部分集中在工业化国家。近年来,发展中国家的健康卫生问题也得到了广泛关注,健康对就业和收入的关系研究逐渐得到了重视。大部分研究认为健康对就业和收入有显著影响(Lee,1982;Strauss,1986;Stem,1996;Schultz and Tamel,1997;Ivaschenko,2003;张车伟,2003;魏众,2004;刘国恩等,2004;苑会娜,2009)。健康影响收入的机制主要有四种(Bloom and Canning,2000):(1)健康的人在体力、脑力或者认知能力上都更加充沛,能工作更长的时间,直接提升了劳动生产力;(2)健康的人往往更长寿,更有动力为其教育进行投资;(3)期望寿命更长促进了个人在生产阶段的储蓄,为投资储备了更多的货币资本;(4)更健康的人群意味着更低的死亡率,家庭大量生育的必要性降低了,从而使人口增长率降低和人口平均年龄提高。人口结构的这一变化提高了工作年龄人群的比例,从而拉动人均收入和经济增长。
国内这方面的研究从张车伟(2003)开始,也验证了健康对收入的促进作用。张车伟(2003)利用家庭生产函数对贫困地区的种植业进行分析,证明健康对种植业生产具有显著影响。随后,魏众(2004)则发现了健康对农村非农就业和工资的重要作用。侯风云(2004a、2004b)估计了农村劳动力和农村外出劳动力各项人力资本的收益率。刘国恩等(2004)实证探讨了个人健康对家庭人均收入的正向影响,进一步发现农村的健康经济回报比城市大,女性比男性的健康回报更大。高梦滔等(2005)讨论了健康风险对农户收入的影响,发现大病冲击对随后12年里农户的人均纯收入有显著的负面影响。
可见,现阶段国内关于健康资本对收入的研究较少,主要分析集中于农村,对于城市和不同收入阶层的健康对收入的影响尚缺乏进一步的深入研究。我们注意到,现实中一些低收入者,往往由于健康的原因很难进入劳动力市场获得收入;同时不同收入人群他们的工作类型存在着差异,对健康的依赖程度也不一样。其次,低收入者往往较难获得有效的医疗服务,抵御疾病风险的能力较为脆弱,容易因病致贫、因病返贫,尤其是在农村地区。据北京晨报报道,2009年全国450万户在档困难职工中,其中40%因病致贫。Ye Li et al.(2012)利用中国第四次全国卫生服务调查数据分析,发现发生灾难性卫生支出的比率为13.0%,致贫比率为7.5%,其中农村的灾难性支出比例高于城市,低收入群体的灾难性支出比例较高,随着收入的增加,这一比例逐渐下降。因此,正如教育对不同收入的人群的回报存在差异一样(刘生龙,2008),自然而然的问题是,对于不同收入的人群,健康资本的收入回报是否存在差异呢?城乡之间是否存在差异?城乡内部不同收入阶层是否存在健康的回报差异?这些问题对于改善收入分配和医疗服务配置有着重要意义。但已有文献在这方面的探讨较为缺乏。
分位数回归是考察收入分布上差异效应的有效方法。自Koenker和Bassett在1978年提出以来,由于分位数回归能够考察解释变量对被解释变量在扰动项的不同分位点上的异质性影响,在收入分配等方面得到了广泛的应用。近几年来,随着微观数据的可得性增加,分位数回归的各种扩展不断涌现,成为微观计量的一块前沿。本文将采用分位数回归的方法,考察健康资本对于不同收入群体的收入效应,并区分城市和农村进行分析。最后我们将结合当前医疗服务的现状,提出完善医疗卫生服务配置和促进公平的建议。
文章的结构安排如下:第一部分是引言,介绍健康与收入的研究背景和文献回顾,第二部分提出理论假说,第三部分是实证设计,第四部分是实证结果及分析,第五部分是总结。
二、理论假说
根据Becker(1964)的人力资本理论和已有的研究结论,健康对于收入有促进作用。那么健康的收入效应会随着收入的增加发生什么变化呢?健康的收入回报在农村和城市又分别如何呢?
前面提到健康影响收入的渠道主要有4种,本文采用微观数据,主要是基于第一种机制分析,即健康资本影响个人劳动生产力从而影响收入。不同的职业性质对健康的依赖不一样,而不同人群的职业分布是有差异的,因而健康的收入效应在不同人群中也不一样。这里构建了简单的理论模型对此进行说明。假设厂商的产出由健康资本H和其他生产要素X生产(Y=F(H,X)),健康资本的报酬为r,其他生产要素的报酬为w,各要素市场为完全竞争市场。居民提供生产要素并获得报酬用于消费C,不进行储蓄。描述如下:
正如刘国恩等(2004)指出,疾病的影响对体力劳动者来说,具有直接性和显著性。农业劳动主要以体力活动为主,这一性质使得农村劳动力相对于城市劳动力更多依赖于体力劳动,因此健康的影响也越大。对于城市劳动力而言,收入更多取决于固定工资,而且工资还受到非市场力量(如社会关系)等的影响,劳动的边际生产率不等于实际工资;另外,大多数城市职工还享有相对健全的福利保护,因此城市个人收入受到疾病影响的程度,特别是短期冲击,相对农村人口来说应该有限得多。因此,无论是长期还是短期,对于农村劳动力来说,身体的健康状态都是农业生产和收入创造的关键因素。
同时,一般而言,低收入者大多从事体力性活动,而且当前的医疗筹资和医疗服务利用存在累退性(解垩,2009),低收入群体在医疗服务获得上比高收入阶层弱。Ye Li et al(2012)的实证结果发现低收入群体的灾难性支出比例较高,随着收入的增加,这一比例逐渐下降。因而健康的影响对于低收入阶层比高收入阶层更大。
根据现阶段职业的分布情况,考虑到体力性劳动工作或农业工作对健康的要求更高,健康对其收入的影响也越大。本文提出以下假说:
假说1:不同收入人群的健康收入效应存在差异,收入水平越低,健康的收入效应越大。
假说2:农村的健康收入效应高于城市。
三、实证分析
(一)模型设计
根据现有研究,在微观层面,个人收入的影响因素主要归纳为人力资本和社会资本因素(苑会娜,2009)。基于传统的收入生产函数理论,健康是提高劳动力质量和个人生产力的重要人力资本形式。目前对个人收入的研究大多基于Mincer(1974)的模型。本文采用这一做法,将个人的健康状况作为人力资本变量引入模型,考察个人健康状况对个人收入的影响。此外,模型中还考虑社会资本和其他人力资本因素。具体的分位数回归模型如下:
y=dατ+xβτ+ε
其中,y表示个人收入,d表示健康状况,x表示控制变量,r表示分位数。控制变量中包含其他人力资本因素、社会资本和个人特征变量。其中,其他人力资本因素包括个人的教育水平和工作情况,社会资本包括婚姻状况、所在地,个人特征变量包括年龄、性别。这些控制变量的选择参考了魏众(2004)和苑会娜(2009)的选取方法。
(二)估计方法
Koenker和Bassett(1978)提出的分位数回归方法能够考察解释变量对被解释变量在扰动项不同分位点上的异质性影响。收入分布的不同位置往往在各种经济现象和行为中都存在差异,因此分位数回归在收入相关的研究中倍受青睐。例如,Omar Arias et al(2001)运用分位数回归分析了教育对个人收入的异质回报,姜励卿等(2012)就采用分位数回归分析不同工资水平下公共部门与非公共部门的工资差异。因而本文使用分位数回归的方法是合理的,能检验健康资本对不同收入水平群体的回报是否存在异质性。
同时,考虑到健康和收入之间的相互影响,因此方程中的健康变量存在内生性,从而使OLS方法估计的系数有偏。目前健康经济学问题中处理内生性的方法主要有联立方程、Heckman两阶段估计模型和工具变量方法。其中使用较多的是两种基于工具变量的方法:2SPS(Two-stage predictor substitution)和2SRI(Two-stageresidual inclusion)(Terza et al,2008),_18j它们能用于具有内生性的非线性函数的估计。2SPS在第一阶段先将内生变量对工具变量回归,得到拟合值代替内生变量进入第二阶段回归;2SRI是将第一阶段内生变量对工具变量回归的残差作为额外的变量进入第二阶段回归。应用在分位数回归中克服内生性主要体现为相应的两种:第一种是早期的Two-stage Quantile Regression做法,即第一阶段先将解释变量投影到所有的工具变量空间上,生成拟合值,第二阶段再对拟合值作分位数回归;第二种是控制函数方法,第一阶段也是先将解释变量对工具变量回归,将残差加入第二阶段分位数回归中。Terza et al(2008)指出,在一般参数估计中,2SRI的估计是一致的,而2SPS则不一定,模拟的结果也更支持2SRI。本文同时采用2SRI和2SPS两种方法进行估计。
(三)变量和数据
本文使用数据全部来自北京大学“985”项目资助、北京大学中国社会科学调查中心执行的中国家庭追踪调查(CFPS)。CFPS数据样本覆盖25个省份16000户家庭及其成员。现公布的2010年的数据,涵盖了中国居民教育、收入、健康等经济与非经济问题,是一项综合性的社会跟踪调查,为微观个体问题的研究提供了有力的数据支撑。本文的变量如下所示:
现有研究中对健康的衡量指标包括主观评价、机体功能等。其中使用因子分析方法提取健康指标的做法使用较为广泛(Baldwin & Johnson,1994;魏众,2004)。考虑到数据的可得性,本文对一系列的指标进行因子分析获得个人健康状况。CFPS中设计了关于个人身体状况的4个客观问题,具体为:“您的双手是否能够接触到颈根”、“您的双手是否能够接触到后腰”、“坐一段时间后您能马上从椅子上站起来吗”、“您能捡起地上的书吗”。本文将答案整理为三级,用1—3分别代表“不能”、“只能单手触及、需依靠物体、需坐着捡”、“双手都能触及、不需依靠物体、能站着捡”。数值越大,表示身体健康情况越好。进行因子分析,提取特征值大于1的因子作为健康状况的变量。从表2中可以看出,4个客观问题的变量都与因子1正相关,即因子l能较好地反映身体的健康状况。
在工具变量选择上,现有研究大多采用当地食品价格和卫生服务设施等作为健康的工具变量(Schuhz and Tansel,1997;2001),本文借鉴这一做法,采用“用最快捷的方式从您家到最近医疗点需要时间”作为健康状况的工具变量。通常,到最近医疗点所需时间越短,反映了个人所处的地方卫生服务设施越完善,从而方便个人看病、改善健康状况。此变量与健康负相关。
四、实证结果及分析
(一)描述性统计
本文去除了收入小于0、变量值缺省、拒绝回答和不知道的数据,由于65岁以上人群一般不属于劳动力范围,也予以剔除,本文最终得到样本18371个。各变量的描述性统计如表3所示.
表4是各变量的相关性分析。从表4中可以看到,个人收入与健康水平正相关,且在1%的水平上显著。其他影响个人收入的因素中,男性收入显著高一些,城市的个人收入显著较高,婚姻能显著提高个人收入,有工作者的收入显著高一些,受教育年限越长收入越高,年龄与收入负相关,与理论和实际相符。同时工具变量与健康水平显著负相关,符合预期。
(二)收入与健康水平的初步检验
本文首先采用OLS方法对模型进行估计,简单分析收入与健康水平的总体关系。如表5所示,在全样本中,健康与收入显著正相关,健康水平越高,个人收入也会提高。在控制变量的影响中,城市的收入显著高于农村,男性收入显著高于女性,年龄与收入显著负相关,受教育年限与收入显著正相关,有工作者收入显著高于没有工作者,婚姻显著提高个人收入。
(三)不同收入水平下健康的收入回报
本文考察的重点是不同收入水平下健康资本的收入回报是否存在差异。首先,在没有考虑内生性的情况下,分位数回归的结果如表6显示。无论是全部样本还是在城乡分样本中,健康依然会显著地增加个人收入,但是随着收入水平的增加,健康的收入效应会逐渐将低。以全样本为例,在10%、25%、50%、75%、90%的分位数上,健康的收入效应分别为0.107、0.076、0.066、0.055、0.021,依次梯度降低,城乡内部也呈现这一特征。假说l初步得到验证。但是就不同的收入分位数而言,城市的健康收入回报略高于乡村,但由于存在内生性,这一结果有偏,还待继续检验。
接着,考虑到健康与收入之间的相互影响使上述的结果有偏,本文选取工具变量“用最快捷的方式从您家到最近医疗点需要时间”,采用2SRI方法解决内生性。根据Staiger和Stock(1997)的经验法则,在只有一个内生变量时,第一阶段回归的F值大于10,则表明不存在弱工具变量的问题。在第一阶段的回归中,工具变量的系数是-0.000726,显著为负,F值为151.74,因此“用最快捷的方式从您家到最近医疗点需要时间”不是弱工具变量。
2SRI方法的结果如表6所示,与没有考虑内生性的情况相类似,但系数普遍增加。根据表6和上图,对全样本和城乡分样本而言,健康对于提高个人收入的作用随着收入的增加而逐渐降低,但在90%的高收入分位上都不显著。在10%、25%、50%、75%、90%的分位数上,全样本的健康收入效应分别为0.107、O.076、0.066、0.055、0.021,城市的健康收入回报分别为0.202、0.099、0.073、0.064、0.02,农村的健康收入回报分别是0.09、0.056、0.058、0.032、0.007。对城市样本而言,在25%以上的收入分位,健康的收入效应不再显著。对农村样本而言,健康的收入效应都为正,除了在90%分位上不显著外,各分位的系数都很显著,并在低收入的25%分位上健康对收入的回报最大。值得注意的是,克服内生性以后,除了10%的分位外,其余分位数上,乡村的健康收入回报都高于城市。总之,假说1和假说2基本得到了验证。
(四)稳健性检验
由于收入大于等于0,因此存在受限因变量的情况,若不考虑这种情况,估计的结果可能是有偏的。考虑下限为0的删失情况,这里采用Tobit模型重新做上述的实证过程。与表5、表6的数据相比,在考虑受限因变量的情况下,估计的结果基本一致,如表7和表8所示。即随着收入的增加,健康的收入效应逐渐降低;总体而言,农村的健康收入回报在各分位点上高于城市,验证了两个假说,结论是稳健的。
五、结论
本文从不同收入人群的角度出发,采用分位数回归,考察健康的收入效应以及其城乡差异。这是一个分析健康与收入关系的新鲜角度,有助于研究医疗服务的公平性和收入分配问题。实证的结果发现,不同收入人群健康的收入效应是有显著差异的,收入水平较低的人群,健康的收入回报较高,随着收入的增加,健康的收入回报逐渐下降。这一结论在城市和乡村内部也成立,但是农村在各个收入分位点的健康收入回报一般高于城市。这反映了健康资本对提高低收入群体和农村收入有着重要的作用。一个可能的解释是不同收入群体、城乡人群之间工作类型存在差异。同时,城市和高收入群体能得到更好的医疗服务,而且他们大多收入来源于固定的工资,受疾病的冲击影响较少。这些原因使得低收入者和农村的健康收入效应较大,较好地解释了上述的健康收入效应的差异。
根据本文的结论,健康资本在提高低收入阶层和农村收入中有着重要作用,因而普及基本医疗服务、减少医疗服务配置的不均等不仅有助于改善低收入群体和农村的健康水平,而且能够起到减贫和促进公平的作用。从医疗服务筹资的角度看,应落实完善城镇居民基本医保、城镇职工医保和农村医保三个医保体系,完善大病医保制度,确保人人都享有基本的医疗保险,对于困难的群体和地区,政府应加大补贴,解决因病致贫、因病返贫问题。从医疗服务的可及性看,完善社区医疗点,尤其是加快农村诊所和社区卫生服务站的建设,建立起“小病到社区,大病到医院”的就医顺序,增加低收入群体和农村的医疗可及性。在医疗服务利用的公平性上,除了完善医疗服务的筹资和可及性以外,还应加大对社区医疗点、各等级医院在门诊、治疗、药物等方面的监督管理,使各个医疗机构的运作规范透明。