曹 晖,罗楚亮,武翰涛
(1.上海大学 经济学院,上海 200444;2.中国人民大学 劳动人事学院,北京100875;3.中国人民大学 社会与人口学院,北京 100875)
长期严重的收入差距可能导致阶层固化、社会代际流动性减弱,进而对社会政策选择和发展取向产生重要影响。一些研究发现代际收入弹性处于比较高的水平,这意味着父辈对于子代的收入具有较为重要的影响。在较早的研究中,Becker与Tomes(1986)估计美国代际收入弹性只有0.2,[1]1153-1189但后续研究表明,如果考虑到估计方法中的偏差,代际收入弹性通常在0.4~0.6之间(Chetty et al.,2014)。[2]1553-1623代际收入弹性估计结果的上升,不仅意味着父辈收入对于子代收入具有更强的影响,而且这种影响的持续性(persistence)也将更强。例如,当代际收入弹性为0.2时,祖辈收入增长1%将导致孙辈收入上升0.04%;而如果代际收入弹性上升至0.4,则这种隔代效应将达到0.36%。后一种情形下,祖辈的收入优势显然是不能忽略的。随着我国居民收入分布长期处于严重不均等状态,一些研究发现我国收入代际流动性有下降倾向(Fan et al.,2019),[3]202-230社会上所流行的各种“二代”现象,也是代际固化的表现。
一些研究文献试图探讨代际收入弹性的影响因素。Becker et al.(2018)强调,资本市场的不完善以及人力资本生产的互补性成为影响代际传递的重要后天因素。[4]S7-S25经济体制转型对于我国代际收入流动性的影响是人们关注的重要问题。孙三百等(2013)指出劳动力无法自由流动是代际收入弹性增大的重要动因[5]147-159;阳义南(2018)发现市场化改革使父辈对子代的影响下降了0.8%[6]128-141;但Fan et al.(2021)认为市场化改革使得代际收入弹性从0.390增加到0.442[3]202-230。一些研究文献强调教育公共财政支出(范子英,2020)[7]48-67,205、家庭决策(刘怡等,2017)[8]60-72等方面对代际流动的影响。上述因素对于收入代际流动性无疑具有重要的影响,但本文认为,社会文化背景对于收入流动也可能具有重要的影响,这一机制也将导致收入流动性的变动可能具有更强的“路径依赖”。
众所周知,人类发展经历了漫长的农业时期,而我国幅员辽阔,各地耕作的作物也有诸多不同。在长期的农业生产实践中,耕作不同作物的群体形成了各自的社会习俗,这些习俗慢慢积淀并传递下来,最终塑造了今天人类的行为。Talhelm et al.(2014)据此开创性地提出了所谓的“水稻理论”,并引起了学者的广泛重视。[9]603-608在一系列研究中,Talhelm指出水稻种植高度依赖精细的灌溉系统,要求大量的劳动力协作,因此有利于培养协作思想,并塑造较为严格的社会规范,但也因此有可能阻碍创新;而小麦种植更多地依靠降雨,一个人或少数几个人便可以应付,这就有利于形成个人主义思想,并形成较为松散的社会规范,促进创造性活动的开展。[10]19816-19824,[11]1-9随后一些研究为Talhelm等人的观点提供了支持。Zhu et al.(2019)使用我国2 000多个县的数据,在控制多种因素之后发现适合小麦生产的地区的确有更多的人均专利申请;[12]126-147而丁从明等(2020)则使用CFPS数据探讨了它对女性地位的影响,他们发现水稻的精耕细作促进了水稻区女性的劳动参与,从而提高了她们的家庭和社会地位。[13]3-25
由于水稻种植鼓励亲友和邻里的协作,因此这一地区更容易形成小范围的社会网络。譬如丁从明等(2018)就发现水稻区更容易形成亲友近邻间更高的受限制信任模式。[14]135-164从某种意义上说,所谓“拼爹”就是指父辈通过自己的社会关系网络为子代获得超越规则的优势,这在强调社会网络的社会中可能表现得更为严重。杨瑞龙等(2010)提供了父辈的社会资本和政治资本对于代际传递发挥重要促进作用的直接证据。[15]871-890此外,Liu和Zong(2018)使用CHARLS数据发现水稻种植面积增加一个百分点会导致子女对父母的转移支付增加0.2~0.4个百分点,即不同作物种植区域之间可能存在着代际转移的差异。[16]249-280综合这些证据,我们提出待检验假说:适宜水稻生产地区的代际流动性较之适合小麦生产地区的代际流动性更低。
基于水稻和小麦种植过程中所形成的社会互动关系,已有研究文献从水稻和小麦种植区域来区分不同的社会文化类型,进而讨论其对于当前社会行为和社会现象所产生的影响。本文也沿袭这一基本思路,利用2005年1%人口抽样调查数据和联合国粮农组织(FAO)的数据(1)http://www.fao.org。,估计了水稻/小麦作物适宜度对代际收入弹性的影响。
本文的回归模型可以表示为:
lnINCc=β0+β1lnINCp+β2Suit+γlnINCp×Suit+f(Agec)+φ(Agep)+θZ+μProv+ε
下标c代表子代,下标p代表父代。被解释变量lnINCc是子代收入的对数,解释变量lnINCp是父代收入的对数,Suit是水稻/小麦的种植适宜度的相对度量。β1为代际收入弹性。lnINCp与Suit的交互项系数衡量了社会文化对于代际收入弹性的影响。参照惯例,本文在所有回归设定中都控制了父子年龄的多项式以及子女的性别。在一些回归设定中,还控制了城市特征、所在地省份以及户口省份固定效应等。
1.收入、教育等个体特征
本文的个人信息主要来自2005年1%人口抽样调查,并采用2010—2016年中国家庭跟踪调查数据(CFPS)进行稳健性验证。2005年1%人口抽样调查覆盖了1.31%的全国人口,国家统计局从中随机抽取1/5提供给研究机构,约为258万个个人样本。该调查中询问了月收入、教育、年龄等信息。根据成员与户主的关系,可以识别出父辈与子代的对应关系。本文以子代收入的对数作为被解释变量,父代收入对数为主要的解释变量。除了绝对水平,收入度量也采用了年龄组内标准化的形式,即参照Fan et al.(2021)的做法[3]202-230,将所有人口按照年龄在20~30、30~40、40~50、50以上分为四组,计算父辈和子代在各自年龄组的收入百分位排序。
本文所使用的数据剔除了所有的集体户,并且只保留了城市家庭(2)2005年1%人口抽样调查共有市、镇、县三种居住地类型。只保留市的做法,可以尽可能地剥离当前农业生产活动的直接影响,居住在城市里的人大多数不会从事农业活动。。在家庭户中,本文只考察父子以及父女关系。父代限制在80岁以下,子代限制在20岁以上并完成学业,父代至少比子代大16岁。最终本文得到15 628对父子对。样本人群基本特征如表1所示,其中包括收入、年龄、性别、教育、民族以及家庭规模等。从中不难看出,子代的教育水平有明显的提高,突出体现在最高学历为高中和大学的比例上升,最高学历为小学的比例下降。父代的收入略高于子代收入,这可能是他们工作年限更长导致。
2005年1%抽样调查尽管有样本容量大和代表性强的优点,但该数据只有2005年截面信息,因而只能得到暂时收入而无法得到终身收入。Solon(1992)指出用暂时收入代替终身收入会导致代际收入弹性的低估[17]393-408,此外,还可能存在生命周期偏误和同住偏误(韩军辉、龙志和,2011)[18]26-38,111。因此,本文采用了中国家庭追踪调查数据(CFPS),该数据由北京大学中国社会数据调查中心组织收集,旨在追踪个体、家庭、社区三个层次的动态状况。本文使用2010—2016年四期数据进行分析,该数据覆盖25个省,目标样本16 000户,涵盖收入、教育、个体特征等。本文将根据其多期数据特征构造终身收入的度量指标,并根据非同住成员的信息,参照Fan et al.(2021)的思路纠正同住偏差[3]202-230。
具体地,首先根据家庭成员关系,识别出父辈与子代组合,保留年龄大于20岁的子代和小于80岁的父辈城镇样本,并要求父子年龄至少相差16岁。对不同年份的收入水平按照省份CPI进行平减,保留至少出现两次的观测值进行逐年平均得到终身收入。接下来采用Heckman两步法分别估计父辈和子代的收入,在选择方程和结果方程中都包括了年龄、年龄平方、教育水平等变量,并控制了省份固定效应和年份固定效应,选择方程中以兄弟姐妹人数作为排除约束(exclusive restriction),因为兄弟姐妹越多越有可能不与父辈同住而导致收入无法被观测,从而得到父辈和子代终身收入的估计值。
2.水稻、小麦种植适宜度
本文在分析中没有采用实际种植数据,而是采用种植适宜度数据(3)有一些研究(如Talhelm et al.,2014;丁从明、董诗涵、杨悦瑶,2020)采用作物的实际种植面积作为解释变量,而使用省一级的种植适宜度作为工具变量。这种做法不能确定工具变量是否能满足排他性约束。本文直接采用城市级别的适宜度数据,更有可能避免内生性问题。一个例子就是我国东北并不适宜水稻种植,但现在东北大米却声名远扬。,这是因为实际种植可能不仅反映了历史上与种植作物有关的文化,还包含了很多其他因素,比如农业现代化生产技术等。相对于实际种植面积,历史种植适宜度与当期的不可观测因素不相关。水稻/小麦种植适宜度指标来自联合国粮农组织提供的作物种植适宜度栅格数据。本文在城市层面进行加总,得到的数据取值在0~10 000之间。我们参照Zhu et al.(2019)的做法,构造了这两种作物的相对适宜度,用ln((1+rice)/(1+wheat))来衡量,之所以要加1,是因为我们有不少地区某种作物的种植适宜度为0。[12]126-147如果这个指标的取值大于零,就意味着相对于种植小麦这个地区更适宜种植水稻。如果这个指标的取值为负,那么就意味着更适宜种植小麦。在有一些设定中,我们需要考察水稻和小麦的单独效应,因此我们将适宜度除以10 000,得到了两种作物各自的适宜度。
3.城市层面变量
城市层面的变量包括根据ArcGis计算得到的每个城市的经纬度,并据此计算了到海岸线的距离;从《中国地面气候资料日值数据库》中获得了1951—2014年752个气象观测站及自动站的每天20时至次日20时降雨和气温的信息,将之在每个城市逐日平均;手动搜集了各地级市的坡度、海拔。这些构成了本文的控制变量。不难理解,这些因素都会和作物种植适宜度相关,而本文要检验的假说是水稻/小麦文化的影响,所以要尽量剥离作物的自然属性。此外,本文还使用2005年1%人口抽样调查数据并根据户籍人口和常住人口计算了城市的流动人口比例。
4.社会经济变量
变量还包括了2005年的城市人均GDP以及2005年的人均教育事业费支出,用以衡量社会经济因素是否会减小水稻文化的影响。
上述各变量的描述性特征可见表1:
表1 主要变量描述统计
父代年龄53.1665.78056.9408.841父代民族(少数民族=1,汉族=0)0.0350.185家庭规模3.8531.429父代教育:小学0.3170.4650.3060.247父代教育:初中0.3960.4890.4010.490父代教育:高中0.1830.3860.2160.412父代教育:大学0.1040.3050.0760.266水稻适宜度0.1360.1250.1320.130小麦适宜度0.2760.1410.3090.140水稻小麦相对适宜度-1.2541.716-1.5612.000日均20时~次日20时降雨(毫米)3.3461.6313.1031.490日均温度(摄氏度)15.134.88914.1314.758坡度10.4635.3810.2615.140经度115.2516.127115.7336.330纬度32.2196.71133.3286.058海拔超过500米所占比例0.2420.3430.2390.340到海岸线距离(千米)306.763361.238370.965369.2202005年全市人均地区生产总值(元)23 541.9516 783.8820 760.817 798.292005年市辖区平均每人教育支出(元)448.892374.797405.826348.709
基于2005年1%人口抽样调查数据,得到的基本回归结果见表2,被解释变量为子代月收入的对数。文化传统以前文所介绍的水稻小麦相对适宜度衡量,主要解释变量为父代收入的对数、水稻小麦相对适宜度以及二者的交叉乘积项。
表2的第一列只控制了子代性别、子代与父亲的年龄及其平方项以及父亲的少数民族身份和家庭规模。第二列和第三列加入了可能影响小麦水稻种植的自然特征。这也是在城市层面的外生特征,包括经纬度、气温、降雨、坡度、海拔、到海岸线的距离等。第二列和第三列的差异在于控制地区效应的不同方式,第二列仅仅区分了南方和北方地区(4)如果该城市处于我国北方取1,否则取0。本文的北方包括北京、河北、黑龙江、河南、吉林、辽宁、内蒙古、山西、山东、天津、新疆、宁夏、甘肃等省份,其他省份为南方。,第三列则以省份固定效应的方式来体现地区效应。所有的回归结果都在城市层面计算聚类标准误。
表2 基本回归结果(2005年1%人口抽样调查)
从表2可以看出,水稻地区对代际传递有促进作用,控制了地理气候特征以及省级固定效应后,水稻小麦相对适宜度每增加1,会导致代际收入弹性上升1.97%。不同设定得到的交互项估计结果有差别,但符号保持一致。因此,水稻文化区域中,收入代际弹性更高,也就是代际固化更为严重。
Chetty et al.(2014)指出对数收入估算代际流动性容易导致出现不稳定的结果,因此建议采用rank-rank回归,即利用子代和父代各自的收入等级回归以估计收入代际流动性。[2]1553-1623表3的前两列将父代和子代的对数收入分别替换为相应的百分比收入位序,其他变量与表2相同。限于篇幅,这里只给出父辈收入、水稻小麦相对种植适宜度以及两者交叉项的回归系数,其他控制变量的估计结果从略。表3中以子代收入等级为被解释变量,回归结果显示,父辈收入等级的估计系数显著为正,即父辈收入等级越高,子代收入等级也会显著的提高。水稻小麦相对种植适宜度与父代收入等级的估计系数也是显著为正的,这表明水稻区域的收入代际传递性更强,收入代际流动性更差。
表3 改变度量形式
尽管Talhelm et al.(2014)提出的解释被笼统地称为水稻理论,但其实包含两个相对独立的部分,一个是关于水稻的,一个是关于小麦的[9]603-608。将它们分开考察有助于我们理解二者的相对重要性。因此表3的第二个稳健性分析是分别采用水稻和小麦宜植度与父辈收入做交互,以此来识别不同文化区域的收入代际流动性差异。
从表3可以看出,水稻宜植度和父辈收入对数的交互项为正,而小麦宜植度和父辈收入对数的交互项为负,这是和本文的预期吻合的。同时也可发现,水稻宜植度的估计系数值较小且不显著,而小麦宜植度的估计系数值较大且高度显著。这表明水稻小麦相对种植适宜度的估计结果主要由小麦驱动,即生活在小麦区的人们会有更高的代际流动性。Talhelm et al.(2014)认为小麦区的人们更倾向于个人主义和分析式思维,这或许是导致代际流动加强的主要原因。[9]603-608而水稻区的结果之所以不显著,一个可能的解释是水稻文化有利于培养整体性思维、忠诚、裙带关系,但也有利于培养协作精神。水稻区的人们更重视家族传承重视代际互助,但也会更在意邻里和谐,更有意愿适应环境。
另一个可能影响本文估计结果的因素是人口迁移。人口迁移可能改变城市的人口构成,进而影响社会环境和相应的行为方式。要剔除这一因素的影响,最好的处理办法是控制历史上的大规模移民信息。但限于数据可获得性,本文没有控制历史上的人口迁移,而是试图通过控制当代的劳动力迁移,以说明人口迁移可能在多大程度上影响到文化传统对于收入代际流动性的影响。
表4以两种方式来反映人口流动的影响。一是剔除父辈和子代是流动人口的个人样本,比较没有发生过流动的人群中文化传统对其收入代际流动性的影响;二是将城市根据流动人口占比进行区分,讨论流动人口不同占比的城市中文化传统对于收入代际流动的效应。表4的前三列估计结果表明,剔除父辈和子代是流动人口的样本,父代收入对数的估计系数有所下降,即代际收入弹性减小,但仍然有较高的估计值,并且在1%的水平上是显著的。水稻小麦相对种植适宜度与父代收入对数的交叉项也仍是显著为正的。这表明剔除流动人口,“水稻理论”依然成立。代际收入弹性的减小可能反映了我们的样本只包括能够识别父子的家庭户,不包含集体户,而很多没有举家迁移的流动人口更多地包含在集体户中,相比较后者,我们样本中的流动人口家庭会具有更强的代际传递性。
表4 人口流动的影响
表4的后两列估计结果显示,如果根据2005年小普查全样本数据计算出的每个城市的流动人口占比,将样本分为两种类型,一种是流动人口占比高于中位数的,另一种是流动人口占比低于中位数的,则可以发现水稻小麦相对种植适宜度与父辈收入对数的交叉乘积项在流动人口占比较低的城市中是显著为正的,而在流动人口占比高的城市中,这一效应不显著。因为流动人口占比越低的城市中,较少受到外来文化的影响,当地的文化传统将会被更多地保留。
上述回归结果表明,以水稻小麦种植所形成的社会文化对于收入代际流动性具有重要影响。水稻种植适宜度较高的区域中,代际收入弹性要显著的更高一些。一个自然的问题是,这种效应是否会随着经济发展程度提高而有所改变。为此,表5在估计模型中加入了各省份在2005年的人均GDP对数值以及该变量与父代收入对数的交叉项来控制经济发展程度的影响。表5第一列估计结果表明,控制经济发展程度后,水稻小麦相对种植适宜度与父代收入对数的交叉项估计系数从表2中的0.019 7下降至0.015 0。这表明,经济发展程度将会降低文化传统对于收入代际流动性的影响。当然,这一交叉项的估计系数仍然显著为正,这也表明即便控制经济发展程度,文化传统对于收入代际流动性的影响依然存在。表5第二列的估计结果中,人均地区GDP与父代收入对数交叉项的估计系数是不显著的,这意味着经济发展本身并不会带来收入代际流动性的改变。不难理解,经济发展是否改变代际收入流动性,取决于特定的经济发展模式和经济政策。
表5 经济发展与公共教育经费的影响
人均教育经费支出也具有类似的效应。这一变量衡量了当地教育公共支出状况。一般说来,公共教育支出增加,可能会降低人们为了获得教育所需支付的私人投入。这将倾向于降低教育投资对于家庭收入等社会经济状况的依赖,从而有助于低收入人群。表5的后两列估计结果表明,控制人均教育经费支出明显降低了文化传统对于收入代际传递性的影响程度。与人均地区GDP所不同的是,人均教育经费支出本身也会具有降低代际收入弹性的效应,表现在人均教育经费支出与父代收入的交叉项显著为负。
2005年全国人口1%抽样调查数据虽然在地区层面上具有较好的代表性,但数据的截面属性导致无法缓解代际收入流动性估计中的暂时性收入偏差,缺乏扩展家庭信息也无法讨论同住偏差,即无法观测到不同住子女与父代的收入传递关系。为此,这一部分采用了2010年至2016年的中国家庭追踪调查数据(CFPS),根据不同年份的收入信息更为合理地构造终身收入的代理变量,并根据扩展家庭成员信息纠正同住偏差。当然,按照相同的样本选择原则,基于CFPS所得到的有效样本数量要小很多,城市层面的代表性方面也可能会存在不足。
表6重复了前面基于人口调查数据的主要回归结果。从基准回归模型来看,父代终身收入对数的估计系数为0.370 3,比表2的0.455 9有明显下降,基于CFPS数据的终身收入所计算的代际流动性要更高一些(5)一般而言,基于终身收入计算得到的代际收入弹性要比截面收入更高一些。这是因为终身收入的估算方式会在一定程度上降低衰减偏误(attenuation bias)。表6基准回归和表2最后一列的父代终身收入对数回归系数的差异主要是由于数据不同造成的。如果基于CFPS的年度截面数据,所得到的代际收入弹性明显要低许多。。水稻小麦相对种植适宜度与父代终身收入对数交叉项也是显著为正的,表明文化传统对于收入代际流动性仍然具有不利的影响。分别考察水稻和小麦的种植适宜度,表7也显示出小麦种植适宜度与父代终身收入对数的交叉项显著为负,与表3的结果类似。将城市根据流动人口占比区分为低流动和高流动城市,结果发现CFPS数据中,文化传递对于收入代际弹性的影响也主要发生在低流动城市。
表6 纠正暂时收入偏差和同住偏差的估计结果
与表5类似,在控制经济发展程度后,水稻小麦相对种植适宜度与父代终身收入对数的交叉项仍然是显著的,但估计系数有所下降,仍然显著为正。这也表明,经济发展会降低文化传统对于收入代际传递的影响。在控制人均教育经费支出后,表6最后一列回归中水稻小麦相对种植适宜度与父代终身收入对数的交叉项已经不再显著。这一结果如果不是由于样本代表性不足所导致的偏误,那么将对改善公共教育支出以促进代际收入流动提供重要的政策预期。
基于农作物种植过程可能形成的长期社会网络文化差异,本文以水稻和小麦种植的区域适宜度作为社会网络文化禀赋的代理变量,考察了这种差异对于收入代际流动性的影响。根据人口调查数据发现水稻小麦相对宜植度对于收入代际弹性具有重要的影响。水稻相对小麦的宜植度越高,收入代际弹性也显著更高。而这一作用机制主要来自于小麦种植适宜度对代际收入的负弹性。换言之,越适宜于种植小麦的区域,收入代际流动性更高。这一效应在采用CFPS数据、rank-rank回归、剔除牧区和渔猎、控制人口流动后仍然成立。这些现象与水稻种植中所强调的协作精神和社会网络等文化传统相关,表明社会文化传统在代际收入流动中起到一定作用;控制经济发展程度和公共教育经费支出,能在一定程度上降低社会文化传统在代际收入传递中的影响,增强代际收入流动性。
本文的实证结果对于理解我国收入差距及其动态变化提供了重要的视角。无论是横向的收入差距还是纵向的收入代际流动,都可能受到社会文化传统的深层制约。这一现象意味着改善收入分布、促进机会公平必将是一个缓慢的过程,因为文化的影响在长期中具有持续的“惰性”。当然,本文的研究也显示,经济发展、公共教育投资将会降低文化传统对于代际收入流动的不利影响,进而提高收入代际流动性、促进机会公平。这对于相应的公共政策无疑具有重要的启示。