曾永明 张利国
(1.江西财经大学 生态经济研究院,江西 南昌 330013;2.江西财经大学 经济学院,江西 南昌 330013)
2017年中国流动人口规模达2.44亿,占总人口的18%。庞大的流动人口中绝大多数是农民工,依据2015年全国流动人口动态监测调查数据估算,其占比达到81.6%。由于农民工的身份具有农民和工人的复合性,与城市工人相比其农业户籍属性处于弱势地位,主要表现在就业市场和工资水平上,一般将其称为“户籍歧视”。户籍歧视使得农民工工资被隐性地消减,微观上造成农民工个体收入的减损,宏观上则扩大了城乡居民的收入差距,加剧城乡二元结构分割[1]。只因户籍的不同,农民工在城镇劳动力市场上遭受歧视性的待遇,这严重阻碍了其与本地城市居民的经济同化过程[2]。因此户籍歧视问题对农民工工资率的影响成为社会反响强烈、学界广泛关注的热点[3]。
农民工除了复合性的农民与工人身份,还有一个重要特征是“流动性”,即外来人口。作为一个深受千年儒家文化熏陶的文明古国,“家文化”始终是中华民族核心文化之一,由此形成的“熟人社会”即富有人情味的交往传统,也导致了在市场化条件下,偏爱本地劳动者情况[4]。农民工就成了被本地人歧视的“外来人口”,一般称其为“地域歧视”,地域歧视的存在使得外地人口工资率远低于本地人口[5]。
目前关于户籍歧视、地域歧视与农民工工资率的研究成果其实比较丰富。其中关于户籍歧视的主流分析方法是工资分解,通过各种分解理论方法解释工资的来源:多少基于禀赋差异,多少基于户籍歧视。Meng和Zhang使用Brown分解方法发现1995年户籍歧视因素对上海民工和工人的收入差异的贡献高达100%[6]。王美艳分别用Oaxaca和Brown的分解方法分析我国大城市农民工和城市工人的工资差距时发现,户籍歧视可以解释2000年工资差距的76%、2005年工资差距的54%[7][8]。孟凡强和邓保国基于中国综合社会调查2006年数据,釆用Melly提出的分位数分解方法[9],分析发现全国及东、中、西部城乡劳动力由户籍歧视造成的工资差异在低分位数到高分位数上升过程中均呈现缩小的趋势,说明工资收入越高的群体,其在工资获得方面所遭受的户籍歧视程度越低[10]。章莉和蔡文鑫使用无条件分位数分解方法对2007年中国劳动力市场的收入户籍歧视程度进行了考察,结果显示户籍歧视可以解释农民工和城镇职工平均收入差距的近三分之一[11]。关于地域歧视,其概念未能统一,范围模糊,相对户籍歧视更为复杂。陈科汝就认为地域歧视是因户籍不同而造成的区别对待,户籍制度是其制度性根源[12];陈东军和谢红彬认为城市人歧视农村人,既属于户籍歧视,也属于地域歧视[13]。这都表明地域歧视更为隐性和复杂,与户籍歧视可能存在交互影响。地域歧视中最突出、最常见的是“外地人”歧视。由于本地人在诸多方面相对外地人存在明显的亲缘或地缘优势,且熟人社会中,为了避免“得罪”潜在的“贵人”,用人单位总是倾向于优待本地员工,反过来“遭罪”的就是外地人,其中工资率水平就是典型表现。刘亮等通过第六次人口普查的区域数据研究发现,外来劳动力在获得一级市场的就业机会方面受到了明显的地域歧视[14]。张皓星利用2011年中国家庭金融调查数据发现我国劳动力市场存在着明显的地域歧视现象:本地人比外地人工资高出46.8%[4]。
应该说既有研究对户籍歧视、地域歧视和农民工工资率差异的关系展开了深入分析,但依然有值得商榷之处。其一,在研究户籍歧视时,由于地域歧视的隐性特征,直接从工资差异中分解出的户籍歧视是有偏估计。比如王美艳通过“五普”数据和Brown分解方法分析外地劳动力和本地劳动力的工资差异,认为户籍歧视能解释43%[15]。不过仔细推敲发现,部分外来劳动力具有两个特征:拥有外地户口及拥有农业户口,因此导致外地劳动力和本地劳动力之间工资差距的因素除了户籍歧视外,还可能包括地域歧视。其二,同时关注户籍歧视和地域歧视的研究非常鲜见,现有文献在考察户籍歧视问题时大多忽视了地域歧视[14]。文献梳理发现具有代表性的研究是章元等对两种歧视的同步关注,其将城市劳动力市场区分为本地工人、本地农民、外地工人和外地农民,分割之后再两两组合即可分别估算户籍歧视和地域歧视[16][17],堪称经典,不过依然有不足:将全体农业户口和全体非农户口作为户籍差异的表征,这其实也是其他多数关于户籍歧视研究常见的处理方式,看似合理,其实是值得商榷的,这也是本文即将梳理的第三个商榷点。其三,样本可比性产生的内生性偏误。绝大多数研究都是直接将农业户口和非农业户口分别作为研究的实验组和参照组。这种比照方式的不足在于农业户口和非农业户口的差异不只是户籍而已,更多的是包含了社会资本、人力资本、教育程度等,在估计户籍歧视对工资的影响时,会因样本选择产生严重的内生性,一般也会得到高估户籍作用的结果。此时的户籍歧视没有剔除其他内生于户籍的因素的影响,农业户口与非农户口是两个群体的综合差异,而不是独立的户籍差异。为此,研究户籍歧视,以所有的非农户口作为参照组有欠妥当。
鉴于既有文献的不足,本文期望达到以下目的或创新:第一是同步研究户籍歧视和地域歧视,并尽量剥离出“纯”户籍歧视和“纯”地域歧视,同时讨论两者可能的相互影响,这对流动人口更为有意义,因为大部分流动人口兼具农业户口和外来人口两个特征。第二是寻求更为合适的比较对象,尽量保持对象的同质性,最大程度降低样本选择产生的内生性偏误。本文选择“农转非”居民作为参照组,而不是全体非农人口,这一点对本研究非常关键,也是对既有研究的一种推进。经历过“农转非”的城市居民在特征上具有和农业人口最为相近的禀赋条件和个体特征,包括社会资本、生活环境、教育过程等方面的体验,尤其是有农业户口经历,相对而言具有较大的可比性,可以最大限度剔除农业户口与非农户口除了户籍之外的其他差异的影响,从而降低样本选择误差产生的内生性,更加精准估计户籍制度对工资率的独立影响效应。众所周知,非农人口只有部分是“农转非”而来,剩下的大部分非农人口的信息因与农民工群体差距大而会影响估计结论,既有研究几乎都存在这一问题,本文尝试进行矫正。对于这点创新,数据是关键。幸运的是2015年全国流动人口动态监测调查(MDMS)相比之前的几轮调查提供了更为细化的户籍登记信息,不再局限于农业户口和非农户口两种,还包含“农转非”样本,实为难得的研究数据。第三是利用倾向值匹配方法进一步控制内生性,并进行稳健性检验,从而得到较为稳健可靠的估计结果和研究结论。尽管如此,本文可能依然存在不足。农转非与农民工的比较研究不乏文献,但农转非产生的渠道可能不同,包括选择性农转非和政策性农转非,它们本身可能存在机制差异[18]。但鉴于MDMS数据的局限,本文不能区分和比较选择性农转非和政策性农转非的差异。也正因如此,选择倾向值匹配方法可能难以完全消除选择性偏差带来的影响。本文后续部分的内容安排为:第二部分是数据与变量,阐释本文样本与既有研究的差异和优势;第三部分是实证研究,分析户籍歧视与地域歧视对农民工工资率的影响;第四部分是结论与讨论。
本文数据来自2015年全国流动人口动态监测调查。该调查是由原国家卫生和计划生育委员会(当前为国家卫生和健康委员会)组织的在流入地对流动人口进行的连续断面调查。以在流入地居住一个月以上,非本区(县、市)户籍的15~59 周岁流动人口为调查对象,2015年全国流动人口卫生计生动态监测调查在流动人口全员信息系统2014年年报数据基础上建立的抽样框中选取,采取分层、多阶段、与规模成比例的PPS 方法进行抽样;调查区域涵盖全国内地31个省、市、自治区,总计20.6万个样本。其中为了与流动人口进行比较,在北京、上海、大连、无锡、杭州、合肥、广州、贵阳等8个城市对本地户籍(区、市县)15周岁及以上男性和女性人口进行了调查,获得1.6万个样本。
基于研究目的,不是所有样本都适合实证研究。首先,本文的研究对象是农民工,按照对农民工的一般理解,主要是以“务工”而获取工资的那部分人口,不是私营企业主或雇主,因此在MDMS中与之对应的样本为就业身份是“雇员”的人口(筛选后流动人口调查有96511个“雇员”样本,本地户籍调查有7483个“雇员”样本)。其次,MDMS中将户籍登记类型记录为农业户口、非农业户口、农业转居民户口(“农转非”)和非农转居民户口四种,本文研究户籍对工资的影响,其中参照组与实验组(农民工)的样本特征需要尽量一致,选取具有城市户籍的“农转非”群体作为参照组,因为他们和农民工群体具有最为相近的特征,尤其是农业户口经历,而这些经历往往和社会资本、教育、个人禀赋等影响工资水平的因素相关,能大大降低样本选择偏差带来的内生性(进一步筛选后流动人口调查中农业户口样本有78711个,“农转非”样本有1288个;本地户籍调查中农业户口样本有301个,“农转非”样本有442个)。最终在剔除跨境流动等可能影响结果的样本后,流动人口总样本为79916个,本地户籍人口总样本743个。应该说数据和样本选择是本文区别于既有文献的一个关键特征和研究推进。
依据本文研究目的,设定的核心变量如下:(1)工资。和多数实证研究一样,基于小时工资率进行考察,2015年全国流动人口动态监测调查询问了调查时点上一周的工作小时数和上个月(四月)的工资,将周工作小时数乘以月平均周数(四月为30天,约4.29周)计为月工作小时数,然后将月收入除以月工作时间得到小时工资率,在模型实证时取自然对数作为因变量。(2)户籍。本文关键是考察户籍与地域差异对农民工工资率的影响,其中户籍是关键,其不仅将居民分为“农业户口”和“非农业户口”,还因人口的流动性分为“本地户口”和“外地户口”,当考察本地户籍人口时,仅含“纯”户籍歧视;当考察流动人口时,则同时包含户籍歧视和地域歧视。2015年全国流动人口动态监测调查数据收集到四种户籍登记类型:农业户口、非农业户口、农业转居民户口(“农转非”)和非农转居民户口。上文已重点讨论了本文样本选择的考究,关键是尽量排除两种类型样本的异质性,使其具有可比性,这也是本文区别于多数既有文献的进步。本文的户籍是一个二值变量,其中农业户籍取值1,“农转非”户籍取值0。(3)流动范围。相对于本地户籍人口,流动人口的跨区流动性可能是影响工资率的重要因素。全国流动人口动态监测调查登记了样本的流动范围,包括市内跨区(市县)、省内跨市以及跨省(剔除跨境样本)。(4)流动时间。该指标反映流动人口在流入地的时长,通常来说流动时间越长,其经验可能越多、工作稳定性可能越好,这会影响到最终的工资率。(5)农转非与农民工选择性差异,比如社会保障和人力资本健康水平等,这些显然会影响两者的工资率差异。但鉴于2015年MDMS调查数据的限制,没有直接可用的指标,这里基于“您目前参加下列何种社会医疗保险?”问题进行代替,该问题既考虑到社会保障,又侧重医疗健康,因此以此来作为控制社会保障状况、人力资本健康水平的变量。
影响工资率的因素非常多,也得到很多研究证实,在估计户籍歧视和地域歧视对农民工工资率的影响效应时需对这些因素加以控制。主要包括性别、年龄(基于明瑟工资方程,还考虑年龄的平方;需要说明的是因调查数据中无“经验”的代理变量,以年龄替代“经验”指标)、婚姻(已婚或未婚)、受教育年限(未上学为0年、小学6年、初中9年、高中12年、大学专科15年、大学本科16年、研究生及以上20年)、职业类型(将国家机关、党群组织、企事业单位负责人,专业技术人员,公务员,办事人员和有关人员归为一类:管理干部和专业技术人员;将经商、商贩、餐饮、家政、保洁、保安、装修以及其他商业、服务业人员归为一类:商业服务人员;农、林、牧、渔、水利业生产人员和生产、运输、建筑、其他生产、运输设备操作人员及有关人员归为一类:生产运输人员;无固定职业和其他归为一类:其他职业人员,后文实证时以该类为参照组)等等。
本文同时研究户籍歧视与地域歧视,即有四个研究样本(两两比较,如图1):外地农业人口、外地“农转非”、本地农业人口、本地“农转非”,对他们分别两两组合形成四种样本类型:流动人口、本地人口、外地与本地农业人口和外地与本地“农转非”人口,前两者可以估计户籍歧视,后两者则可估计地域歧视。为了达到研究目标,这里简要给出实证策略,说明如何使用不同样本解决样本选择问题,进而在最大限度降低样本选择偏差的基础上估计户籍歧视和地域歧视。
图1 本文对户籍歧视、地域歧视估计的实证策略与分析框架
首先,对于户籍歧视,当考察本地户籍人口时,仅含纯户籍歧视。由于本地人口不存在地域流动性,可估计出“纯”户籍歧视。当考察流动人口时,则因为外来人口的样本特征,同时包含户籍歧视和地域歧视,所以得到的是“户地双歧视”,户地双歧视的估计结果是包含了捆绑在户籍歧视中的地域歧视(本文称为户籍捆绑性地域歧视),而户籍捆绑性地域歧视可以通过本地人口的“纯”户籍歧视剥离出来:即户地双歧视扣除纯户籍歧视的剩余部分。
其次,对于地域歧视,仅从流动人口和本地人口的样本分类中无法直接估计出地域歧视,需要对调查样本进行再分类,将流动人口和本地人口中的农业户籍和“农转非”户籍重新组合,得到两类新样本:外地与本地农业户籍以及外地与本地“农转非”户籍。显然这两类样本都分别具有相同户籍,这样就可以消除户籍的影响而将纯地域歧视估计出来,同时在相同条件下(比如都显著)比较两者的差异。其中通过外地与本地农业户籍人口样本,消除户籍的影响可估计出地域歧视;通过外地“农转非”和本地“农转非”也可估计得到他们之间的地域歧视;而且两组估计都因没有户籍的干扰,估计结果都为纯地域歧视。如此,本文在样本选择问题上做了最大努力以提升可比性并降低选择偏差,能得到更为接近真实无偏的估计结果。
首先通过OLS 回归估计户籍歧视对农民工工资率的减损作用,样本分为流动人口和本地人口,为了具有可比性,基本结果仅包含流动人口和本地人口共同拥有的属性(变量),暂不考虑流动人口的特有影响变量,后文将专门进行讨论。表1为户籍歧视对农民工工资影响的基本估计结果。先看流动人口样本,第(1)列为基准明瑟方程;第(2)列为增加户籍因素后的估计结果;第(3)列为增加控制变量的估计结果,其中拟合优度从0.0734增加到了0.1440,几乎增加了1倍,这说明户籍歧视确实对农民工工资率差异具有较强的解释力。具体结果显示,农业户籍农民工要比“农转非”城市居民工资率显著低6.9%,表明户籍歧视确实存在。其他可观测的变量回归结果符合既有研究结论,以模型(3)为例,受教育年限每增加1年能提升流动人口3.6%的工资率;年龄(经验)则与工资率存在显著的倒U型关系,根据方程估算得到拐点年龄约为41.8岁,即平均来说流动人口在42岁左右的中年时期工资率最高;男性流动人口工资率要比女性高出24%;已婚流动人口则比未婚流动人口工资率平均高出8.4%;相比其他职业,管理干部和专业技术人员要高出18.5%的工资率,生产运输人员要高出5.6%的工资,而农民工群体从业规模最大的商业服务人员工资最低,比其他职业人员要低2.4%;参加了至少一种社会医疗保险的流动人口要比未参加任何一种医保的流动人口工资率高2%左右,显示了社会保障和人力资本健康水平对工资率的促进作用。再看本地户籍人口,其结论基本和流动人口样本一致,不再逐个赘述。其中本文关心的核心变量显示本地户籍人口中农业户籍农民工要比“农转非”居民工资率显著低6.4%左右,同样证实了户籍歧视的存在;对于社会学研究经常关注的性别工资差异,本地户籍中的男性工资要比女性高出14.3%,相对于流动人口该指标要低10%,表明性别歧视在流动人口中表现得更明显,这可能与女性经历“农转非”成为城市居民后的身份地位提升和性别平等意识增强有关。
为了流动人口与本地户籍人口估计的可比性,上节的基本结果估计中未考虑流动人口的特有属性,这些属性的特有性使得流动人口受到的影响更复杂,如果遗漏这些重要因素将产生模型设定偏差从而导致内生性问题。相对于本地户籍人口,流动人口的特有属性是“流动”,包括跨区流动、跨市流动和跨省流动,这是户籍歧视发生的空间基础,遗漏这些变量显然会低估流动人口的户籍歧视程度,因此需要在模型设定时加以考虑。同时流动时间(在流入地的持续时间)也对流动人口户籍歧视的估计产生影响。为此,本节将从流动人口的这些属性特征着手进一步分析,表2报告了补充重要遗漏变量后流动人口户籍歧视的再估计结果。
表1 户籍歧视对农民工工资率减损的估计结果
注:括号内数值为稳健标准误,***、**、*分别表示1%、5%和10%的显著性,下表同。
表2 补充重要遗漏变量后流动人口户籍歧视的再估计
注:限于篇幅,控制变量结果未在表中报告,有兴趣的读者可向作者获取,下表同。
为了对比,再次报告了表1中模型(3)的估计结果,其中户籍歧视程度为6.9%。模型(7)是考虑流动范围后的估计结果,显示户籍歧视程度大幅度提升,达到9.1%;其中长距离的跨省流动要比短距离的跨区流动工资率平均高出17.6%,中距离的跨市流动也要比跨区流动高出6.7%。模型(8)则同时考虑了流动时间,户籍歧视程度进一步上升到9.3%;不过,流动时间越长,农民工工资率反而越低,尽管比例仅为0.2%,但有显著影响。可能的解释是流动农民工受到歧视,使得晋升、涨薪并不与工作年限成正比关系,同时流动农民工换工作的频率非常高,稳定就业的持续工作时间不长,使其流动时间和工作年限不等同,因此长期不稳定的就业形势可能导致工资率反而有轻微的下降。
需要说明的是,因为流动人口的角色特征是“外地人口”,计量模型不能消除他们本身是外地人口的事实,估计户籍歧视时应该含有地域歧视的成分,不是纯户籍歧视,这与后文估计纯地域歧视的模型(9)有所差别。此时的“户籍歧视”其实是户籍歧视与地域歧视的“捆绑”(本文定义为“户地双歧视”)。
鉴于此,能否分解出流动人口“户地双歧视”中的户籍歧视和地域歧视呢?本文认为可以。依据本文的样本类型,流动人口样本包括“外地工人和外地农民”,本地人口包括“本地工人和本地农民”,其中后者已经估计出“纯”户籍歧视,将流动人口样本估计的“户地双歧视”扣减本地户籍人口样本估计的“纯”户籍歧视则代表隐含在户籍歧视中的地域歧视。所以隐含的假设是:流动人口样本估计的户籍歧视程度(“户地双歧视”)要大于本地户籍人口样本估计的户籍歧视程度。这一点从表1中可以看出来,流动人口的户籍歧视程度是6.9%(“户地双歧视”),本地人口的户籍歧视程度是6.4%(“纯”户籍歧视),确实前者大于后者,证明了假设。不过两者差异仅为0.5%,即地域歧视程度很低,相对于“纯”户籍歧视可以忽略,这可能存在估计偏差,通过以上分析发现产生估计偏差的原因在于变量遗漏产生的内生性。如果比较模型(8)中9.3%的户籍歧视程度(“户地双歧视”)与模型(6)中6.4%的“纯”户籍歧视,提升了2.9%,这一数值其实可以理解为“户地双歧视”中的地域歧视,它可能是由于流动人口中的农业人口和“农转非”人口同时受到本地人的地域歧视而在计量估计时相互抵消、无法识别和分解,从而被“捆绑”到户籍歧视估计结果中(本文且称为户籍捆绑性地域歧视),这就导致了解读偏差。不过本节“户地双歧视”中的地域歧视不同于后文要进一步分析的地域歧视,后者需要像估计“纯”户籍歧视一样估计出“纯”地域歧视,下面将对此展开讨论。
为了估计“纯”地域歧视的影响,首先对样本进行再分类,将流动人口和本地人口中的农业户籍和“农转非”户籍同时分开再重新组合,得到两类新样本:外地与本地农业户籍以及外地与本地“农转非”户籍。显然这两类样本都分别具有相同户籍,这样就可以消除户籍的影响而将“纯”地域歧视估计出来,将流动人口(外地人口)赋值为1,本地人口作为参照组赋值为0,即可估计出“纯”地域歧视,结果报告于表3。先看外地与本地农业户籍样本,模型(9)显示外来人口受到显著地域歧视,其工资率大约比本地人口低7.6%,该值即可称为“纯”地域歧视;同样长距离跨省流动和中距离跨市流动要比短距离跨区流动的农民工工资率要高。再看外地和本地“农转非”户籍样本,模型(10)显示尽管地域歧视变量的系数符号为负,但并不显著,即“农转非”居民之间不存在外地与本地工资率的差异。这些估计结果表明地域歧视具有选择性,仅存在于农民工群体;地域歧视会对农民工产生减损效应,对“农转非”的城市居民则无影响。如果回顾户籍歧视估计结果,可以发现户籍歧视具有普遍性,即外地人口和本地人口中的农民工工资率都要低于“农转非”群体。综合两者发现,农民工群体显然同时受到户籍歧视和地域歧视的影响。回顾章元等(2011)的研究结论[16][17]:外地城市居民的工资率显著高于本地城市居民的工资率,这和现实观感不一致,该文进行了比较合理的解释。本文却不显著,原因可能是户籍捆绑性地域歧视(即存在地域歧视的结果,外地城市居民的工资率显著低于本地城市居民工资率)抵消了本来潜在的估计结果(即章元等数据样本的结果:外地城市居民的工资率显著高于本地城市居民工资率),使得结果不显著。这表明尽管外地与本地城市居民之间不存在纯地域歧视,但可能存在户籍捆绑性地域歧视,后者依然对工资率发挥减损效应。
为了进一步分析户籍歧视和地域歧视的作用,继续对流动人口和本地户籍全样本进行估计。模型(11)单独估计户籍歧视,全样本显示户籍歧视达到10.5%;模型(12)单独估计地域歧视,全样本显示地域歧视达到11.8%。模型(13)则同步估计户籍歧视和地域歧视,结果显示两者的程度分别下降到8.9%和6.8%;单独估计和同步估计的变化说明两者之间可能本质上是交互关联的,户籍歧视和地域歧视会相互影响,户籍歧视本身具有地域歧视的属性,户籍是产生户籍歧视和地域歧视的最根本原因,这也证明了上文流动人口可能存在的“户地双歧视”特征。经全样本分析,举一个例子来说明:一位在异地大城市务工的农民工,首先因为户籍歧视工资率减损8.9%,又因为地域歧视,工资率再减损6.8%,在其他条件不变的情况下,相比当地“农转非”工人总工资要减损15.7%,这是一个相当大的差距,而且不是与当地的一般非农户籍城市居民的差异,可见户籍歧视和地域歧视会严重消减农民工工资率,构建平等、公正的社会环境还有很长的路要走。
表3 地域歧视对农民工工资的减损估计结果
注:流动范围参照组同表2,限于篇幅不重复列出。
尽管本文在参照组样本选择和流动人口特有的遗漏变量处理上已经最大程度减缓了内生性问题,但依然还可能存在估计偏差,这是因为户籍歧视与地域歧视外生于工资率的假设在OLS回归模型中难以信服,依旧可能存在“农转非”样本选择偏差:那些成为“农转非”的居民本身可能就有更好的禀赋条件,和农业人口可能还存在较大的差异,内生性并没有完全消除,因此需要进一步处理内生性偏误。当前处理内生性的方式以工具变量法或2SLS估计为主,寻找户籍的工具变量研究并不缺乏,温兴祥以农村土地是否被征收作为户籍的工具变量[2],张皓星以姓氏作为户籍的工具变量[4];不过研究地域歧视,如何寻找工具变量存在困难,研究比较鲜见。更棘手的是,本文利用的数据中并没有很好的工具变量(包括姓氏信息也没有)来代理户籍和地域。为此需要寻找其他方法进行分析,当前削减选择偏差、控制内生性影响的另一个比较流行而且有效的办法是倾向值匹配分析(propensity score matching,PSM)。该方法的核心思想是从参照组中选择最匹配干预组的样本,通过计算干预组和匹配后的参照组差值得到平均处理效应(ATT),即干预效应。本文PSM估计过程的直观解释是:以户籍歧视为例,将“农转非”居民设为干预组,对农业户口参照组中每个样本可能成为“农转非”的概率进行估计,然后选出那些与“农转非”居民具有相同特征的匹配样本作为对照,当每个干预组样本都找到了最匹配的参照组样本时,便能对这两组样本进行有效的比较研究了。然后再来看他们的区别:如果干预组与匹配后的参照组确实存在工资率差异(ATT显著),那么就可以确信在工资率上是存在户籍歧视的;地域歧视的PSM估计过程同理。
接下来本文通过倾向值匹配方法来估算平均处理效应ATT,本文的ATT是指农民获得城市户籍后(成为“农转非”)是否能提升工资率,或者本地人口是否比流动人口具有更高的工资率,因此可以有效证明户籍歧视和地域歧视是否导致农民工与城市工人工资率差异,并且能有效处理内生性问题。需要注意的是,根据一般的匹配规则,本文将“农转非”居民和本地居民分别作为户籍歧视和地域歧视的干预组(处理组),而农业人口与流动人口分别作为参照组(控制组),因此ATT估计结果称为平均处理效应,表示相对于农业人口而言,“农转非”居民的工资率高出比例;或者相对于流动人口而言,本地居民的工资率高出比例,这正好与OLS估计中的处理相反,需要注意含义的解读。
为了增强可靠性和稳健性,通过核匹配和最近邻域匹配两种方式进行样本选择匹配,ATT估计结果报告于表4。以核匹配为例,户籍歧视的ATT估计中,无论是本地户籍人口还是流动人口都显示:相对于农业人口,“农转非”居民的工资率要高,反过来说就是农业人口要比“农转非”居民工资率低。其中本地户籍人口中的农业人口要比“农转非”居民工资率低8.9%,流动人口中的农业人口要比“农转非”居民工资低13.6%,而且都通过了1%的显著性检验。地域歧视的ATT估计中,发现本地与外地农业人口之间存在地域歧视,歧视程度约为4.2%;但是本地与外地“农转非”居民之间的地域歧视则不显著,考虑到样本选择优势,本文认为两者之间不存在地域歧视产生的工资率差异。最近邻域匹配结果基本相同,但是本地与外地农业人口之间的地域歧视不显著,本文无法做出精确的解释,这也可能成为本文不足,但不能因此否定核匹配和OLS的结论,从概率上来说,3种独立的方式得到2:1的结果,有理由认为本地与外地农业人口之间存在地域歧视的结论更适宜。应该说总体上ATT估计与OLS估计结果是一致的,通过ATT估计验证了户籍歧视和地域歧视的存在,且不同样本具有一定的异质性,也证明了OLS估计结果的稳健性,本文的研究结论比较可信。
表4 户籍歧视与地域歧视对农民工工资减损的ATT估计结果
本文利用2015年全国流动人口动态监测调查数据分析了户籍歧视和地域歧视对农民工工资率的减损效应。对于户籍歧视,鉴于既有研究关于本议题的最大不足——样本可比性较差而产生内生性偏误,本文以农业人口和经历过“农转非”的居民(而不是全体非农人口)作为样本,来尽量估计出独立的户籍歧视而剔除其他不可控制变量的影响,分别通过流动人口样本和本地人口样本得到户籍歧视估计结果。对于地域歧视,将选择的样本进行重新分类组合,分别通过外地与本地农业人口样本、外地与本地“农转非”人口样本估计得到地域歧视估计结果。同时考虑到流动人口的特殊属性,专门对流动人口进行单独分析,并提出流动人口特有的“户地双歧视”概念。经过一系列样本估计、模型比较和归纳总结,并利用倾向值匹配方法进行内生性处理和稳健性检验,得到的主要结论有:
第一,通过本地人口样本估计发现,在其他条件不变时,户籍歧视使得农民工工资率要比“农转非”的城市居民减损6.4%。这一数值是独立的户籍因素对农民工工资率的影响效应。本文估计的“纯”户籍歧视程度相对既有研究显著偏低,这是因为现有研究成果的户籍歧视程度包含的不可控制信息太多,并不是独立的户籍歧视,本文的研究在样本选择上更可信。
第二,通过外地与本地农业户籍人口样本,消除户籍的影响可估计出地域歧视使工资率减损7.6%;而外地“农转非”和本地“农转非”之间的地域歧视不显著。综合户籍歧视和地域歧视估计结果发现,农民工既受到户籍歧视又受到地域歧视,而“农转非”本身不含有户籍歧视,地域歧视估计也不显著。这些估计结果表明户籍歧视具有普遍性,而地域歧视具有选择性,仅存在于农民工群体。
第三,流动人口有“外来人口”属性,因此流动农民工同时兼具“农业人口”和“外来人口”特征,“户地双歧视”使工资率减损9.3%,通过本地人口的“纯”户籍歧视剥离得到户籍捆绑性地域歧视的影响大约为2.9%。户籍捆绑性地域歧视是因为外来农业户籍人口和外来的“农转非”人口同时受到地域歧视而无法在估计中消除,但确实是存在的,因此,尽管通过外地“农转非”和本地“农转非”估计得到他们之间的“纯”地域歧视不显著,但户籍捆绑性地域歧视仍能发挥作用。
第四,户籍歧视和地域歧视既是独立的又是相互关联的,这从全样本独立估计户籍歧视、独立估计地域歧视和同时估计两者的参数变化中可以得到验证。这种关联性的主要来源是户籍制度,户籍歧视本身具有地域歧视的属性,户籍是产生户籍歧视和地域歧视的最根本原因。
综合以上研究结论,证明了户籍歧视和地域歧视两种独立而又相互关联的制度性因素和非制度性因素对农民工工资率具有显著的减损效应。如何构建城乡平等、区域平等的就业市场环境,消除户籍歧视和地域歧视是政府需要持续努力的方向,其中户籍改革是核心。当前我国正在进行户籍改革,逐步破除户籍障碍。户籍歧视的根本来源是政策制度,但直接原因是用人单位或企业的不平等行为,所以,户籍改革需要政府和市场联合行动。另外,地域歧视与户籍歧视是两种独立的力量,因而政府需要采取不同的政策措施来应对。随着户籍改革深化,甚至完全取消户籍制度,市场对农民工的地域歧视依然难以消除,地域歧视问题需要长期的文化、思维的转变和精神文明的引导才有望解决,尤其在受儒家文化和“熟人社会”文化熏陶的我国。
同时,鉴于本文估计的户籍歧视是独立的“一纸证件”的工资率减损效应,未来的研究可以进一步评估户籍改革的成效,即通过比较2016年、2017年或今后的调查数据,检验户籍歧视程度的变化,这在一定程度上可以判断户籍改革成效,因为具有可比性的样本能最大程度排除其他因素的影响,得到更加客观、独立的户籍改革效应评估结论。这一评估的实现依赖于调查样本的持续性,如果今后全国流动人口动态监测调查数据持续获取“农转非”这一宝贵的样本数据,则本文的样本设计可以成为户籍改革成效评估的参考方式。