周玉龙 孙久文
解决不平衡与不充分问题已经成为我国经济社会发展的首要任务,其中脱贫攻坚问题得到了各界的高度重视。我国 1986年开始实施以国贫县为重点的有组织、有计划、大规模扶贫开发战略,目标是发展生产、消除贫困。扶贫开发政策实施以来,我国的贫困状况得到显著改善,农村贫困人口由 1978年的 2.5亿人②按1978年年人均收入100元的绝对贫困线计。减少到 2016年的3046万人③引自《2017年国民经济和社会发展统计公报》,按照每人每年2300元(2010年不变价)的农村扶贫标准计算。,但排除经济发展等空间中性的因素,基于地区的扶贫开发政策对农民增收起到的作用尚未可知。因此,必须对过去 30年的扶贫开发政策进行科学系统的评估,才能为新时代打赢脱贫攻坚战提供合理的理论指导。
认定政策贡献最直接和常用的方法有两种,一是纵向比较贫困地区扶贫开发政策实施前后的贫困水平,二是横向比较受政策扶持与否的区县的发展水平。但是这种单重差分能够识别扶贫开发政策效果的前提是其他因素不会影响贫困水平,或能够充分控制这些因素。值得指出的是,影响贫困状况的因素比较复杂,例如与扶贫开发战略实施同期的改革开放带来的高速经济增长对减贫的效果十分显著(Ravillion和 Chen,2007;汪三贵,2008),导致经济增长效应和政策效应难以分辨,这些因素在国贫县和非国贫县间往往存在系统差别。因此,以上简单的纵向或横向比较难以准确识别扶贫开发的政策贡献。
解决以上问题的有效方法是随机控制实验方法。因此,本文关注国贫县调整的准自然实验,利用双重差分以及合成控制法减弱国贫县选择的内生性以及其他不可观测变量的干扰,能够更严格地评估政策效果。另外,本文使用 1990—2010年的县域面板数据,有助于控制不随时间改变的区县因素对评估的影响;更重要的是本文的数据在时间维度上覆盖了扶贫开发政策实施的大部分时间周期,有助于识别政策的长期效果。再者,本文研究以国贫县为瞄准对象的一揽子扶贫开发政策的有效性,避免了不同类别政策效果的混淆问题,同时也更有助于从整体上探讨以国贫县为政策目标这种制度安排的实施效果,为更加精准的扶贫制度改革提供理论基础。最后,本文对造成扶贫开发“政策陷阱”的政府“乱作为”机制进行了实证检验,能够提供一定的政策启示。
本文的研究结果表明,扶贫开发政策能够有效促进国贫县的经济发展,同时短期会显著提高被扶持地区的农民收入约 10%~17%,但长期来看,十年之后政策的增收效应逐渐减弱,甚至可能阻碍农民增收。说明过去的扶贫开发政策在长期存在“政策陷阱”效应。本文进一步将以上结论的原因分为地方政府的“不作为”和“乱作为”机制。实证分析表明,“乱作为”机制是以上“政策陷阱”的主要原因,即地方政府能够有效利用扶贫开发资源发展第二产业,从而促进当地的经济增长,但这对其他有利于提高农民收入产业的发展造成挤出效应,从而阻碍农民脱贫增收。另外,本文利用多种稳健性检验方法验证了以上结论。
研究某项政策对发展的影响评估是经济学领域的经典主题(Khandker等,2010),本文关注的“基于地区”(place-based)的区域开发政策在世界各地都有大量案例,其有效性评价也获得了持久的关注(Ravallion,2007;Glaeser和 Gottlieb,2008;Neumark和Simpson,2014)。
欧美发达地区的开发政策起步较早,例如美国的田纳西流域管理局(TVA)计划、阿巴拉契亚区域委员会(ARC)计划和授权特区(EZ)计划以及欧洲的基金等,大量文献也使用随机控制实验的方法对各项政策进行了短期和长期效应的评估,但多数案例中,不管是不同政策还是同一政策的不同研究往往没有一致的结论。Kline和Moretti(2014)评估了TVA实施100年的成效,他们认为TVA能够通过基础设施改善和集聚经济影响经济发展,其中前者的效果尤其明显,但后者的收益则可能被其他地区的损失抵消。Isserman和 Rephann(1995)研究了ARC实施 26年的影响,他们发现1969—1991年间,与控制组相比,阿巴拉契亚地区的收入增长快 48%,人口增长快5%,人均收入增长快 17%,但作者同时谨慎地认为,由于自选择内生性的存在,处理组的高增长并不一定归因于ARC的项目。关于 EZ计划效果的结论更为复杂。Hanson(2009)发现该计划并没有有效改善就业和贫困发生率,但显著提高了房产价值(Krupka和Noonan,2009)。Reynolds和Rohlin(2015)在研究EZ计划的分配效应时发现低收入者的生活水平并没有得到有效改善,反而让迁移进来的高收入者受益更多。Busso等(2013)的结论则相反,他们认为,计划提高了被扶持地区的就业和工资,而相应的人口和生活成本并没有上升。Neumark和Simpson (2014)对世界各国类似政策的研究的综述中并没有发现企业特区政策能够影响就业和总体福利的证据,对更细致的政策分配效应研究仍然十分必要。
具体到中国,我国的扶贫开发政策研究文献也较为丰富。Park等(2002)的研究表明扶贫开发政策使得国贫县农村居民收入在 1985—1992年比非国贫县增长快2.28%,1992—1995年则快 0.91%。刘朝明和张衔(1999)、毛捷等(2012)、Meng(2013)以及王艺明和刘志红(2016)关注了 1994—2000年中国第一个全国性扶贫计划——“八七扶贫攻坚计划”——的影响,他们的研究都认为该计划短期内显著提高了农民收入,但长期的扶贫效果并不显著。Park和 Wang(2010)以及张彬斌(2013)探讨了2001年以来新时期扶贫开发的政策效果,前者发现新时期农村扶贫开发的成效并不显著,仅在政策实施第八年到第九年才有3%左右的增收效应,而后者利用了村级的住户调查数据,发现政策为富裕家庭带来的收益更多,但对贫困户增收效果并不显著。从另一个角度看,由于数据可得性和其发挥的重要作用,另有一些研究对我国扶贫资金的绩效进行了评估。总体而言,扶贫资金对减贫的作用较为显著( 昉蔡 等,2001;刘冬梅,2001),但细分的财政发展资金、扶贫贴息贷款和“以工代赈”资金等不同类型的扶贫资金效果各异,研究结论并不一致(陈凡和杨越,2003;曹洪民等,2003;朱乾宇,2003)。
可见,开发政策评价是一个受到广泛关注的话题,大量研究也在这个方向做了努力,已有对发达国家开发政策的研究不仅关注了政策对区域总体发展的短期影响,同时还研究了长期效应,而对我国的扶贫开发效果评价却多数集中在 10年以内的短期视野中,这无疑忽视了政策能否能够培育扶持地区内生减贫动力的重要问题。另外,很多研究发现扶贫开发政策的长期效果不甚理想,这背后的机制也亟需进一步研究。
因此,本文利用上世纪 90年代到本世纪头 10年的县域面板数据,借助国贫县名单的调整,通过双重差分以及合成控制法模拟自然实验,构建国贫县发展的反事实情况,通过与实际情况比较来更严格地评估扶贫开发政策的短期和长期效果并深入研究扶贫开发政策效应背后的原因机制。
从1986年我国认定的第一批258个到最近2011年认定的592个国贫县①到1988年各省同时认定了370个省级贫困县,但认定标准并不透明,同时扶贫工作主要由地方政府负责,力度较小(Park等,2002),因此不作为本文的主要研究对象。,国贫县名单在这期间进行了数次调整。其中 1986年的认定标准为 1985年人均纯收入低于150元,但革命老区和少数民族自治县的标准扩大到200元,对中国革命做出重要贡献的老革命根据地和内蒙、新疆和青海的一部分有特殊困难的少数民族自治县的标准提高到300元。1993年认定的国贫县标准为各县1990年农民人均纯收入低于300元。在1986年确定的国贫县中,83个贫困县农民人均纯收入低于150元,82个县在150~200元之间,93个县在200~300元之间。只有三分之一的县符合150元的最低标准,表明贫困县的选择标准是一种“软约束”,国贫县可能是自然禀赋条件最差的地区,但也可能存在大量“例外情况”②参考报道《17县骗资金:贫困县如何扶贫?》,http://view.news.qq.com/original/intouchtoday/n2658.html。,这也成为之后国贫县制度最严重的问题之一(李飞,2014)。这种情况的存在提高了国贫县选择的随机性,从而有利于改善本文的因果识别效果。
《中国农村扶贫开发纲要(2001—2010年)》进行的国贫县调整主要包括四个方面。(1)全国贫困县总数保持不变,依然为592个;(2)除河北和海南以外东部沿海地区的省市,包括辽宁、山东、浙江、福建、广东的贫困县由各省自行扶持,退出国家扶持贫困县名单,腾出 33个贫困县的名额;(3)将西藏整体作为一个扶贫单位,单独列入计划,其原有的 5个贫困县名额相应让出;(4)其他省贫困县具体的调整方案是:各省重点县数量的确定采用“631”指数法,即各省贫困人口占全国的比重占 60%的权重(其中绝对贫困人口与低收入人口各占 80%和 20%比例),农民人均纯收入较低的县数所占全国比例占 30%比重(人均纯收入一般地区以 1300元为标准,老区、少数民族和边疆地区人均纯收入标准提高到1500元)、人均GDP低的县数(低于2700元)占全国比例和人均财政收入低的县数占全国的比例(低于120元)合占10%的权重;各省根据指数法确定的重点县数量在省内确定具体的县,报国务院扶贫开发领导小组审核、备案。
尽管不同扶贫开发时期的政策细节有所差异,但总体而言,作为扶贫开发“主战场”的国贫县会排他性地享受一系列扶贫开发资金扶持、信贷优惠、财税优惠和经济开发优惠等政策。
一方面,在扶贫资金方面,八七扶贫攻坚时期的相关规定要求,“国家各项扶贫资金必须全部用于国家重点扶持的贫困县”,2001—2010年的中央财政扶贫资金中“以工代赈资金和新增财政扶贫资金全部用于国定贫困县”,发展资金则重点用于国定贫困县。在2011—2020年间,“中央财政专项扶贫资金主要投向国家确定的连片特困地区和扶贫开发工作重点县、贫困村,其中新增部分主要用于连片特困地区”①详见1996年公布的《中共中央、国务院关于尽快解决农村贫困人口温饱问题的决定》、1997年公布实施的《国家扶贫资金管理办法》、2000年公布的《财政扶贫资金管理办法(试行)(财农字[2000]18号)》以及2011年公布的《财政扶贫资金管理办法(财农[2011]412号)》。。可见,2010年之前国家的扶贫开发主要瞄准国贫县,但之后的扶贫瞄准对象更加泛化,因此本文主要关注2010年之前的国贫县发展情况。
根据1986—2010年的数据测算,国贫县每年县均可以获得扶贫资金投入3500万元,占同期县均财政收入的 9.97%。历年的具体情况可见图1,可以发现国贫县扶贫资金的投入总量和县均扶贫投入在不断增加,到2010年已经超过500亿,尽管扶贫资金占地方财政收入的比重呈下降趋势,但其比重最高超过了35%,最低仍然在5%左右。这充分表明了国贫县获得资金支持力度之大。
另一方面,在非资金的扶贫项目和政策优惠方面,东西协作和定点帮扶多以国贫县集中的地区或国贫县为对象,各种劳动力培训转移项目主要在国贫县实施,信贷扶贫资金支持的农业产业化项目也集中在国贫县。贫困地区的义务教育工程、“一费制”改革、两免一补和高招加分等教育政策往往从重点县开始实施,国贫县的农业税也先于其他县免除。另外,还有其他一些产业和税收等优惠政策专门针对国贫县实施。
可见,在现有制度安排下,被认定成为国贫县便意味着本地能够从中央获得大量额外的财政转移支付和政策优惠。国贫县的认定调整和其享受资金及政策优惠的排他性为本文模拟自然实验的情境提供了条件:首先,本文可以通过某个区县是否被列入国贫县来区别某个区县是否受到了扶贫开发政策的处理,即可以定义列入国贫县的区县为处理组,其他为控制组;其次,国贫县名单的调整提供了构建反事实情况的必要条件;最后,未严格按照贫困状况进行的名单调整使得列入国贫县名单的很可能并非最贫困的区县,提高了处理组的变异程度和处理分配的随机性,有利于精准识别因果效应。
由于除了扶贫开发政策之外,区县特定的因素(如地理位置、资源禀赋等)以及发展政策等随时间可变的可见或不可见因素同时会影响农民收入,普通的最小二乘法并不能保证控制所有相关因素,会导致遗漏变量偏差。双重差分(DID)可以缓解这种问题,其主要逻辑是做组内处理前后和组间同期的两次差分,前者可以消除组内个体随时间固定因素的干扰,后者可以排除经济总体冲击的干扰,这样在自然实验的基础上,就可以估计处理的因果效应。
在满足随机分配和平行趋势的前提下,可以通过方程(1)实现本文的DID估计:
其中,Y为农民人均纯收入,Controls为其他控制变量,ε为回归残差。对受到政策扶持的区县来说povertycountyc=1,反之为0;如果政策实施的时间为t,则在t年之前的aftert=0,之后的为1。下标c指代区县,t为时间。
具体到本文的研究中,我国的农村扶贫开发具有连续性,为了避免只有一轮扶贫开发被列为国贫县的样本的干扰,本文将1993年和2001年两轮国贫县认定中都被列入国贫县名单的区县作为处理组,一直未被列入国贫县名单的作为控制组,排除只有一轮被认定为国贫县的样本的影响,并将1993年作为接受处理时间,1990—1992年作为处理前时期,1993年之后作为处理后时期。
另外,2001年的国贫县调整中部分区县不再作为国贫县接受政策扶持,而又有部分区县进入了国贫县名单,但这些样本数量较少,利用DID方法无法保证研究信度。本文利用合成控制法(Abadie和Gardeazabal,2003)有效利用这部分变异。该方法的基本思路是:虽然难以寻找和处理组完全类似的对照组,但是通过将所有非国贫县按照相关变量构造一个与处理组最接近的对照组作为处理组的反事实样本,然后将其与国贫县进行比较就可以得出扶贫开发政策的因果效应。
具体来看,合成控制法最重要的是要求利用控制组的个体构建一个合理的“合成”处理组,即构建一个对控制组进行加权平均之后与处理组相关特征最一致的个体。其中计算权重的方法是选取相关影响结果的处理前或非时变变量,让这些变量的加权平均与各自对应处理组的变量差别最小,亦即求解以下最优化问题:
其中ωk为第k个控制组个体的权重,Xi为用于合成的第i个变量,K为控制组。
其统计推断信息可以利用置换法获得。
具体到本文的情境,本文利用2001年的国贫县调整变动,主要是因为2011年之前,扶贫开发政策施行的主战场一直为国贫县,而之后则开始向国贫县以外延伸,同时1993年的相关数据缺失严重。具体来看,本文比较新被列入国贫县名单的区县与利用非国贫县合成的虚拟国贫县的农民增收情况,从而得到扶贫开发政策的因果效应。
由于大部分时期内国贫县都是我国扶贫开发政策的主战场,因此本文主要利用上世纪90年代以来的县级面板数据,具体年限为1990—2010年。被基于数据可得性的考量,本文选择覆盖东中西三大板块、少数民族县、山区县、革命老区县以及边境县等特殊区域的河北、内蒙古、江西、贵州和甘肃五省数据作为基础数据,包括472个县级行政区,其中有170个国贫县。数据来源为相应年份的《中国县域统计年鉴》《中国农村贫困监测报告》以及各省统计年鉴等。
农村扶贫开发的根本目标是提高贫困人口收入水平,因此在考虑数据可得性的前提下,本文选取区县农民人均年纯收入(farmerincome)作为因变量,取对数值进行回归。根据国贫县评选的标准,控制变量主要选取了以滞后一期的人均 GDP(pergdp)、人均财政收入(perfiscalin)、第二产业增加值占 GDP比重(structure)变量,在合成和匹配时还加入了是否是少数民族县(peoplecounty)、山区县(mountcounty)和革命老区县(revocounty)等表征政策、自然禀赋和地理条件的变量。在合成控制法的推断中,根据尽量拟合处理前处理组和合成组的原则,本文还加入了1990年、1995年和2000年的农民人均年纯收入变量,所有价格变量都利用各省农村消费者价格指数调整为 1990年不变价格。
各变量的描述性统计如表1所示。从发展的平均水平看,21世纪前后10年我国的农民收入、人均GDP、人均财政收入和工业化水平都有了大幅提高,但国贫县与非国贫县的差距并没有有效缩小,而从工业化水平的角度看,国贫县2010年的工业化水平相较于1990年提高了80%,远高于非国贫县的50%的工业化水平增幅。另外,值得注意的是,到 2010年,国贫县的人均 GDP和财政收入指标极值已经接近甚至超过了非国贫县,这表明有的国贫县发展已经接近甚至超过了普通区县,但整体发展差距巨大①参考媒体报道“有多少百强县仍是国家级贫困县?”,http://society.people.com.cn/GB/15731868.html。。
表1 变量描述性统计表
首先,本文使用双重差分方法对扶贫开发政策的短期效应,也就是列入国贫县对农民10年内的增收效应进行了检验,由于国贫县认定会考虑区县的人均GDP和财政情况,另外考虑产业结构对农民收入有直接影响,因此回归控制了相关变量。结果如表2所示,第(1)~(7)列分别为以1990年为基期,1993年之后不同年份作为处理后时期的回归结果。
双重差分项中2000年之前年份的系数基本显著为正,且系数的绝对值在逐渐提高。这说明随着时间推移,扶贫开发政策的增收效果逐渐显现,平均而言,排除经济增长因素后,列入国贫县第二年可以使农民增收超过10个百分点,之后的效果逐渐提高至第七年的约17个百分点。本文认为这种效果的由小变大原因是多种扶贫开发政策生效有一定的时滞性。例如以工代赈政策中国家安排以工代赈投入建设农村小型基础设施工程,贫困农民参加以工代赈工程建设,获得劳务报酬,直接增加收入,但项目的实施需要进行各种行政手续,农民收入的取得也往往在项目完成之后。另外,其他教育培训和开发类项目同样需要一定的时间才能提高农民收入,从而造成政策效果的滞后效应。
另外,1995年作为处理后时期的结果不显著,可能存在异常值或周期性因素的干扰,在稳健性检验中本文将进一步排除这种干扰。2000年作为处理后时期的结果则并不显著。政策实施到2000年时效果不再显著,初步表明扶贫开发政策长期效果可能并不理想。
表2 短期农民增收效应的双重差分结果
控制变量中,人均GDP和人均财政收入的系数皆显著为正,表明总体经济发展水平以及地方政府财力对农民收入提高有显著的促进作用。工业化水平变量的系数显著为负,本文认为,相较于农业和服务业企业,由于工业企业往往是资本密集型的非“利贫性”企业,因此工业化的提高会导致非“利贫性”增长,从而对农民收入造成负面影响。这种机制将在后文进行更细致的检验。
为了检验长期效果,本文进一步以1990年为扶贫开发政策实施前时期,2000之后的不同年份作为处理后时期分别进行检验,结果如表3所示。
表3 长期农民增收效应的双重差分结果
2000—2005年之间的双重差分系数皆不再显著且转为负值,说明被扶持的第八年之后,扶贫开发政策对农民收入的促进作用已经不再显著,可以认为这段时期我国农村地区脱贫的主要动力来自于涵盖所有地区的经济增长,而非瞄准国贫县的政策干预。这与 Park和 Wang(2010)以及张彬斌(2013)等人对 2001—2010年新时期农村扶贫开发的研究结论一致。2005年之后,双重差分系数开始变为显著为负,表明扶贫开发政策反而降低了农民收入约6~8个百分点,瞄准国贫县的扶贫开发出现了“政策陷阱”效应。
另外,控制变量中,人均 GDP和财政收入变量系数皆显著为正,表明当地经济发展的总体水平与农民收入水平可以同步提高。以第二产业增加值比重衡量的产业结构系数显著为负,表明在其他条件不变的情况下,工业发展的确与农民增收的目标存在一定的矛盾性。
为了更充分地利用样本信息同时降低可能的异常值影响,本文以江西、贵州和甘肃三省①内蒙古 2001年没有加入新国贫县,而河北只有一个国贫县调整且数据缺失较为严重,因此未考察这两个省的情况。各自新被列入国贫县名单的区县取平均形成三个各省国贫县的处理组,利用各省的非国贫县合成为对照组。江西的吉安县、乐安县和万安县,贵州的道真县、江口县、锦屏县和思南县以及甘肃②合作市也是2001年新国贫县,但其在1996年才成立,数据不足,因此未考虑。的合水县、两当县、麦积区、宁县、夏河县和镇原县在2001年被新列入国贫县名单,因此本文首先分别将三省这些区县的各总量指标取均值,形成每省一个的三个“平均国贫县”作为处理组,接着进一步将其他对应各省未列入新一轮国贫县名单的区县作为对照组进行合成控制。通过求解公式(3)的最优化问题,可以获得对照组各区县的比重ωk,具体的结果如表4所示。
表4 合成国贫县的区县及其权重
其中合成指标包括是否是少数民族县、山区县或革命老区县的虚拟变量、人均GDP、人均财政收入以及 1990年、1995年和 2000年的农民收入以进行充分拟合,各省合成国贫县与实际国贫县和非国贫县的各指标比较如表5所示。可以看出实际国贫县与非国贫县的各指标差别明显,但合成国贫县与实际国贫县的对应特征(尤其是各处理前时期的农民收入)十分接近,可见将合成国贫县当作国贫县的反事实(counterfac tual)情况是合理的。
表5 参加合成变量的拟合与对比
图2为实际国贫县与合成国贫县平均农民年纯收入的对比,其中(a)~(c)分别为江西、贵州和甘肃的情况,可见三省中新列入国贫县的区县并没有显示出显著的农民增收效应,甚至在江西和贵州的新国贫县农民收入增长开始慢于非国贫县,这与之前的扶贫开发可能造成“政策陷阱”,即阻碍农民增收的结论保持了一致。江西的非国贫县都昌县在合成国贫县时被赋予了最大的权重,意味着其与国贫县特征最为接近,因此本文选其进行合成控制作为安慰剂检验①即将实际未受处理的样本假设为处理组进行合成控制,检验政策效应是否来自于样本共同的非政策因素。,结果如图(d)所示,与图(a)~(c)相比,图中在 2001年前后实际农民收入始终与拟合农民收入保持了高度一致性,并没有出现合成样本高于实际样本的偏离。这说明合成控制法很好的拟合了其收入走势,证明了国贫县效应不会提高反而会降低农民收入的结论并非其他共同偶然因素造成的,这进一步论证了本文的结论。
造成扶贫开发“政策陷阱”的原因较为复杂,但根据地方政府对政策资源的利用情况,总体可以将其分为两种机制②感谢审稿人提出的扶贫开发政策可能直接影响脱贫的机制,但由于本文关注的是瞄准国贫县的扶贫开发政策,研究期间相关的政策和资源主要用于支持通过区域开发而带动居民脱贫的项目,并非通过直接转移支付降低贫困,因此可以忽略这种机制的干扰。。
一种是国贫县政府未能有效利用政策资源的“不作为”机制。具体来看,首先,国贫县一般是经济社会发展较为落后的地区,其制度环境也往往不尽完善,因此政策实行过程中的资源漏出以及精英俘获问题会严重降低扶贫的精准性(周玉龙和孙久文,2017;汪三贵等,2004),从而造成资源浪费;其次,我国的国贫县认定周期约为十年,缺乏动态识别和退出机制,因此入选国贫县名单意味着当地可以享受数年的扶贫开发政策扶持,而且发展越落后越有利于继续争取下一周期的扶持,导致从政府到贫困人口都没有足够的激励争取“脱贫摘帽”,由此形成对政策和资金“等靠要”的路径依赖(匡远配和汪三贵,2012);最后一个必然存在的原因是扶贫开发至今已经取得了显著成就,大量贫困人口已经摆脱贫困,剩余的扶贫对象往往脱贫难度最大,这不可避免的导致扶贫政策边际效应递减。以上的“不作为”机制可能解释国贫县短期增收效果明显,而长期增收效应消失的现象却无法解释扶贫开发政策对农民收入的负面作用。
因此,本文考察另一种解释,由于扶贫开发重要的目标是发展生产,从而带动人口脱贫,但这种机制生效的前提是国贫县能够实现“利贫性”增长,也就是降低贫困的增长。如果地方政府有效利用了政策资源,但将其投入到了非“利贫性”产业中,从而对“利贫性”的产业造成了挤出,那么便会造成加剧贫困的增长模式,产生“政策陷阱”。在我国的分权式政治激励体制下,地方政府往往更重视GDP增长,而忽略农民的收入提高及其自我创收能力的培养(周黎安,2004),使得扶贫开发资源可能被挪用于发展见效快的以第二产业为代表的资本密集型产业(刘瑞明和赵仁杰,2015),忽视对贫困人口人力资本积累以及软环境建设的投资,无法培养农民自身的创收能力。同时,长期来看,如果扶贫开发的政策资源如果被大量投入到资本密集型产业发展中,甚至形成路径依赖,就可能会对能够有效提高贫困人口报酬的劳动力密集型产业造成挤出,此时尽管地方 GDP会有增长,但这种资本密集型产业导向的外部扶持反而可能降低农民收入。
对此,本文对以上两种机制的相对重要性进行检验。如果“不作为”机制成立,那么国贫县的总体经济发展水平不会受到政策的显著影响。基于这种推论,本文以调整到 1990年不变价格的实际GDP和人均实际GDP为结果变量,分别做扶贫开发政策的双重差分检验,结果分别如表6和表7所示。
表6 实际GDP增长效应的双重差分结果
表7 人均实际GDP增长效应的双重差分结果
两种检验的结果相似,多数年份的双重差分系数结果皆显著为正,不管是从短期还是长期看,扶贫开发政策都能够有效促进国贫县的经济增长,且随着时间推移这种增长效应越来越强。基于国贫县的扶贫开发政策的实施有益于当地经济总体增长,且在短期内农民收入增长和总体经济增长能够同步实现,但长期则削弱了政策对农民增收的效果。这表明国贫县政府能够充分利用扶贫开发资源,相对于“不作为”机制,“乱作为”机制可能是扶贫开发“政策陷阱”更重要的原因。
基于以上结果,本文进一步对扶贫开发政策是否导致国贫县产业结构变迁进行检验以考察“乱作为”机制的存在性。表3中产业结构系数显著为负的结果已经表明,相对于第一、三产业,资本密集型的第二产业不利于农民收入的提高。因此,本文以第二产业增加值占 GDP比重作为因变量进行双重差分检验,验证相对于非工业,非“利贫性”的第二产业是否的确发展更快,结果如表8所示。
表8 产业结构效应的双重差分结果
可以看出,多数年份双重差分项的系数为正,且在 2004年之后系数多显著为正。说明扶贫开发政策在短期内并未改变国贫县的产业结构,但长期促进了国贫县第二产业的发展,第一产业和第三产业发展却相对滞后,进一步验证了长期中国贫县将扶贫开发资源更多地投向了资本密集型产业的发展而不利于农民增收这一“乱作为”机制。
以上DID方法的应用是在自然实验的情境之上的,即需要满足随机性和同质性假设条件(陈林和伍海军,2015),换句话说,在运用DID方法之前,需要检验处理组和控制组在政策实施前的结果变量变化是否有相同的趋势。
因此,本文对进行 DID检验的结果变量进行了平行趋势检验,结果如图3所示。从图(a)~(d)中可以看出,在“八七”计划开始之前,国贫县和非国贫县的农民收入、GDP、人均GDP和产业结构演化趋势较为相似,因此可以认为利用双重差分能够有效识别政策效果。以上的实证研究结果较为可靠。
为了保证结论的稳健性,本文进一步试图纠正可能存在的样本选择偏误。Baum-Snow等(2017)、Duranton和Turner(2012)和Faber(2014)在纠正交通基础设施建设的自选择性时将历史铁路线路和地理因素等当作工具变量,但是合理的工具变量往往很难获得。还有的研究利用了断点回归(RD)方法估计局部处理效应来降低处理的自选择效应(毛捷等,2012;Meng,2013),但 RD方法的假设前提是在断点附近的处理状态无法通过控制相关变量进行人为干预,而国贫县的资格恰恰可以通过数据操纵等手段来获得,现实中这种现象也极有可能存在(匡远配和汪三贵,2012)。
幸运的是,如果这种选择偏误是基于可观测的变量,例如区县发展水平和要素禀赋等因素,那么本文就可以通过倾向得分值匹配(PSM)方法重新调整处理组和控制组,获得尽可能随机分配的样本。
PSM 方法要求首先估算出每个区县的倾向得分 P(X)(即其他特征变量 X给定的情况下,被认定为国贫县的概率),然后根据这个概率寻找最接近的处理组和控制组对进行匹配,将匹配后的控制组作为处理组的反事实情况。在匹配样本满足条件独立分布和共同支撑的假设下,扶贫开发对发展的因果效应即匹配对在共同支撑域的结果变量差的均值,如式(4)所示。
如上所述,PSM 方法需要满足一个重要的假设条件,即决定处理分布的变量都是可观测而且可得的变量,而在国贫县的确定过程中,正如之前指出的,尽管一些原则性的规则是确定且透明的,但其中仍然有很多模糊性的因素,利用PSM需要克服遗漏变量的困难,如果不可观测的其他因素影响国贫县的认定,匹配结果就不能满足处理外生的独立性假设,则PSM的结果就是有偏的。
对此,在本研究的背景下,本文引入结合以上两种方法优点的双重差分倾向得分值匹配(PSMDID)估计(Heckman等,1997),以便充分利用数据的面板特性来克服自选择和遗漏变量的内生性问题。PSMDID的估计量可以用式(5)获得:
PSMDID估计量的主要优点在于其在样本的双重差分基础上进行匹配(Fan,2010),从而能有效利用面板数据结构,排除非时变和共同因素的干扰,同时有效解决样本自选择引起的内生性问题。
使用PSMDID方法要求通过共同支撑和平衡性检验,图4中(a)和(b)分别展示了两个检验的结果。
图中(a)图为是否列入国贫县名单的倾向得分值,纵轴为样本数,国贫县的得分值平均高于非国贫县,但大量样本处在二者的共同得分区间,因此保证了足够的共同支撑样本数。(b)图为匹配前后控制变量的平衡性检验,可见除 revocounty变量外,其他变量的国贫县和非国贫县偏差显著降低,可以认为匹配过程通过了平衡性检验。
表9展示了PSMDID的结果,与以上DID的结果保持了一定的一致性。列入国贫县在3年至5年的短期内增收效果显著,但2000年及之后这种国贫县的农民收入增长反而开始落后于非国贫县,意味着某个国贫县如果未被列入国贫县名单,农民收入增长的速度可能更高,扶贫开发政策的干预反而干扰了增长本身的脱贫效应。这进一步印证了之前表明的与国贫县联系的扶贫开发政策可能使其陷入“政策陷阱”的结论。
表9 农民增收效应的PSMDID结果
为了消除周期波动的干扰,本文取1998年、2005年及其前后一年的对应变量取平均值,作为处理后时期分别利用 DID和 PSMDID方法进行检验。结果如表10所示,其中双重差分项的系数符号和显著性与未取平均值时保持了一致。到1998年,列入国贫县能够显著提高农民收入,但到 2005年,这种效应已经消失甚至开始阻碍农民增收,进一步证实了结论的稳健性。
表10 消除波动的检验结果
续表10
本文利用 DID 和合成控制法,使用河北、内蒙古、江西、贵州和甘肃五省 1990—2010年的县域数据考察了国贫县受到的扶贫开发政策扶持在短期和长期内是否有利于农民增收的问题。本研究发现,扶贫开发政策短期会显著提高被扶持的农民收入约10%~17%,但长期来看,十年之后这种增收效应会逐渐减弱,甚至开始阻碍农民增收约 6%~8%,说明扶贫开发政策在长期存在“政策陷阱”效应。进一步的机制分析表明,地方政府能够有效利用扶贫开发资源促进当地的经济增长,但国贫县第二产业的发展速度比其他产业更快,可能对其他有利于提高农民收入产业的发展造成挤出效应,从而阻碍农民脱贫增收。
本文的研究结论主要有三点政策启示。首先,要严格监管扶贫开发资源的使用用途,建立科学的评价制度以避免资源分配者的“乱作为”行为,防止其被用于发展不利于贫困人口收入增加的项目。其次,要合理调整国贫县的政绩激励,进一步降低经济增长目标的考察权重,鼓励发展最有助于农民增收的劳动力密集型产业。最后,当前国贫县认定的十年周期是扶贫开发政策陷阱的重要原因,尽管根据中央部署,2020年国贫县将全部“脱帽”,国贫县的调整问题将不复存在,但新的扶贫战略也要重视瞄准对象的动态退出和进入机制设计,提高扶贫开发资源的利用效率。