2019年的诺贝尔经济学奖项公布后,质疑声随即相伴而来,有人质疑随机实地实验方法 (简称RCT 法)本身,也有人质疑实验研究与反贫困实践的兼容性,还有人质疑这种研究的意义和高度。质疑者中不乏鼎鼎大名的学者,比如同样长期研究贫困问题的诺贝尔经济学奖得主迪顿(A.Deaton)①Deaton,A.“Instruments,Randomization,and Learning about Development”.Journal of Economic Literature,2010,48 (2):424-455.,不过即便迪顿对RCT 法提出了尖锐的批评,但也承认这是一种有价值的研究方法②Deaton,A.,and N.Cartwright.“Understanding and Misunderstanding Randomized Controlled Trials”.Social Science&Medicine,2018,210:2-21.。实际上,专业性的质疑主要还是集中在RCT 法本身,且这类质疑并不仅仅局限在经济学领域。自从1925年费希尔(R.Fisher)提出随机实地实验方法的基本思想和理论③巴纳吉、迪弗洛和克雷默在其文章中强调了费希尔的贡献。参见Banerjee,A.,Duflo,E.,and M.Kremer.“The Influence of Randomized Controlled Trials on Development Economics Research and on Development Policy”.The State of Economics,The State of the World Conference,2016.,它相继在农业、医学、工业工程等领域大放异彩,比如它成为医学中的黄金标准④Bothwell,L.,Greene,J.,Podolsky,S.,and D.Jones.“Assessing the Gold Standard—Lessons from the History of RCTs”.New England Journal of Medicine,2016,374 (22):2175-2181.。而经济学领域虽然在此期间也逐步引入RCT 法,但直到20世纪90年代,随着巴纳吉 (A.Banerjee)、迪弗洛 (E.Duflo)和克雷默(M.Kremer)为代表的经济学家在发展经济学领域广泛使用该法,并使得发展经济学重新焕发生机,RCT 法才真正得到经济学家的重视。
发展经济学的衰落很大程度上是缺乏理论和科学研究方法所致。早期的发展经济学更多地从地方实践中提炼理论和经验,并据此上升到政策设计。由于这种地方实践仅仅是局部观察,缺乏一般性,导致后来出现普遍的政策失灵,使得发展经济学备受质疑。尽管后来一些发展经济学家试图把地方发展经验和主流理论与方法结合起来,进而形成了所谓的发展微观经济学、发展宏观经济学等分支①普兰纳布·巴德汉、克里斯托夫·尤迪:《发展微观经济学》,北京,北京大学出版社,2002;皮埃尔·理查德·阿根诺、彼得·蒙蒂尔:《发展宏观经济学》,北京,北京大学出版社,2004。,但这样做的一个直接后果就是,发展经济学作为一个独立学科慢慢消失了,其研究的问题则分别转化为主流的微观和宏观经济问题的一部分,以至于发展问题只是主流经济学在特定局限条件下的应用。
研究发展问题所面临的最大困难在于地方实践的独特性。如何从特定局限条件下的实践中推断出具有一般性的理论见解和政策思路? 这需要借助科学的方法对实践的效果本身做出评估。发展经济学走入低谷,就是因为缺乏科学评估地方实践的研究方法。就实践谈实践,不讲局限条件地将某种特定实践经验轻易推广到其他情景,常常会陷入外部有效性的困境,从而让发展政策备受质疑。在实验方法兴起之前,尽管很多研究者努力采用倾向得分匹配、双重差分和断点回归等技术来控制地方实践评估中的偏误②比如贝特兰等对双重差分方法的检验和质疑。参见Bertrand,M.,Duflo,E.,and S.Mullainathan.“How Much Should We Trust Differences-in-Differences Estimates?”.Quarterly Journal of Economics,2004,119 (1):249-275.,但正如诺贝尔经济学奖得主迪弗洛和克雷默所指出的,即便采用这些技术,仍然可能存在各种未知的偏误,从而错误估计政策效果③Duflo,E.,and M.Kremer.“Use of Randomization in the Evaluation of Development Effectiveness”.In Pitman,G.K.,Feinstein,O.N.,and G.K.Ingram (eds.).Evaluating Development Effectiveness,Vol.7.New Brunswick,NJand London,UK:Transaction Publishers,2005,pp.205231.。而随机实地实验方法以及后来兴起的其他实地实验方法能够在一定程度上克服过去旧有方法的不足,有效降低政策评估的偏误,从而有助于人们寻找更准确的政策设计路径。如巴纳吉和迪弗洛指出的,实地实验在理论检验、数据采集、评估和改善政策的外部有效性、可复制、细致干预及寻找政策的局限条件等方面都具有较大的优势④Banerjee,A.,and E.Duflo.“An Introduction to the‘Handbook of Field Experiments’”.In Banerjee,A.,and E.Duflo(eds.).Handbook of Field Experiments,Vol.1.Amsterdam:Elsevier,2017,pp.124.。
实验方法和发展经济学的结合可谓天作之合。20世纪90年代初,印度为改进女性的基层政治参与,立法要求各邦必须为女性提供三分之一的行政村负责人席位,村庄的选择采取随机方法。这相当于构造了一个天然的随机实地实验。查托帕迪 (R.Chattopadhyay)和迪弗洛抓住这一难得的研究机会,运用随机实地实验方法研究女性领导人对政治决策的影响。⑤Chattopadhyay,R.,and E.Duflo.“Women as Policy Makers:Evidence from a Randomized Policy Experiment in India”.Econometrica,2004,72 (5):1409-1443.这项研究的成功令一些新锐经济学家备受激励,这些学者开始构思并尝试在欠发达地区开展类似的实地实验,以评估某些地方实践的绩效,以期为政策设计提供更好的依据。与此同时,一些发展中国家的非政府组织(Non-Governmental Organization,NGO)也试图科学评估已有的社会服务实践,并在此基础上改进设计,以提高社会服务的绩效。特别是在反贫困方面,一些机制在各地区地方实践中取得了成功,而另一些机制则缺乏效果,因此实践者迫切需要经济学家给出解答。正是在这种大背景下,包括巴纳吉、迪弗洛和克雷默等在内的新锐经济学家与相关地区的地方政府及NGO 合作,开展了一系列随机实地实验研究,内容遍及反贫困、教育、健康等多个公共领域,并发现了一些行之有效的助推机制,切切实实改进了当地老百姓的福利。
正因为随机实地实验及其他实地实验方法在政策评估方面具有得天独厚的优势,所以从20世纪90年代开始,针对发展中国家和地区的地方实践的研究开始广泛运用这类方法,并由此形成一股新的发展经济学的研究潮流。克雷默等用“行为发展经济学”一词概括了这些研究进展①Kremer,M.,Rao,G.,and F.Schilbach.“Behavioral Development Economics”.In Bernheim,B.D.,Della Vigna,S.,and D.Laibson (eds.).Handbook of Behavioral Economics:Foundations and Applications 1.Vol.2.Amsterdam:Elsevier,2019,pp.345-458.,宣告新的发展经济学的复活,并意味着作为一个学科的发展经济学的新分支的诞生。如果把近三十年发展经济学的实验研究和传统发展经济学做一个对比,新的发展经济学具有如下五个鲜明特点:第一,研究对象不再局限于地方实践的经验总结,而是针对地方实践的一般性研究,并且更强调随机性和可复制性,从而可以显著改进相关研究的外部有效性。第二,研究方法不再局限于地方实践的既定数据采集和计量分析,而是通过实验方法生成相关数据,并基于这些数据对特定的政策和机制进行评估,从而使相关研究避免了地方特色的影响。第三,研究的意图不再是被动地提炼理论,或者说不再依据具体的地方实践来形成地方特色的理论,而是从某些理论逻辑出发,进行实验设计。这样既可以有效证伪理论,也可以主动发现新的理论。第四,研究的多样性大大提高。实验方法本身并不局限于随机实地实验,其他实地实验方法同样可以运用,甚至可以结合实验室实验进行特定的机制研究。这就可以根据实际问题匹配相应的方法,不仅可以让研究更具有针对性,大大提高研究的内部有效性,而且还能大幅度增进研究的灵活性。第五,在政策设计上,摆脱了传统发展政策的空洞化和盲目性,寻求干预政策和助推政策的有效组合,更有针对性地矫正政府、市场、其他中间组织以及参与人的行为。
与传统的发展经济学关注宏大主题不同,实验发展经济学更关心一个具体领域中的一些具体机制的可实施性及其效果。近三十年来,实验发展经济学家在教育、卫生健康、收入和储蓄等领域进行深度耕耘,做出了卓有成效的研究。这些研究在一定程度上改变了传统发展经济学的固有思维,揭示了一些新的视角和新的因果关系,发现了一些新机制。事实上,有些新的研究成果已经改变了相关领域的政策设计,并正在发挥积极作用。
对欠发达经济体而言,人力资本水平低是一个普遍存在的关键问题,如何通过教育来提高人力资本水平? 传统发展经济学给出了部分政策设计思路,但并没有起到合意的效果。究其原因,是相关教育政策要么受限于特定的地方实践的局限条件,要么为了满足普适性,而过于原则化,缺乏制度的适应性。实验发展经济学家通过实验方法研究发现,教育领域的一些细节因素被忽略了,而恰恰是这些细节决定了政策的成败。具体来说,这些细节包括以下四个方面:
(1)降低上学成本。教育有助于提高收入水平,这是个共识性观点②Duflo,E.“Schooling and Labor Market Consequences of School Construction in Indonesia:Evidence from an Unusual Policy Experiment”.American Economic Review,2001,91 (4):795-813.,但欠发达经济体所面临的一个难题在于,即便教育得到重视,当地低收入家庭也很难负担高昂的上学费用,从而导致这些家庭的孩子很少接受教育,这是造成欠发达经济体人力资本水平低的重要原因。除了依靠政府推进义务教育外,一些旨在降低上学成本的助推机制被广泛采用,“现金转移项目”是其中之一。比如,舒尔茨(T.P.Schultz)的实地实验研究发现,通过为墨西哥贫困家庭的母亲提供教育补助,能够有效改善孩子的受教育机会。①Schultz,T.P.“School Subsidies for the Poor:Evaluating the Mexican Progresa Poverty Program”.Journal of Development Economics,2004,74 (1):199-250.在此基础上,巴里 (J.Berry)进一步发现,当父母认知能力较强时,对父母提供激励能使孩子获得更好的教育;反之,当孩子的父母认知能力较差时,直接对孩子提供激励的效果更好。②Berry,J.“Child Control in Education Decisions:An Evaluation of Targeted Incentives to Learn in India”.Journal of Human Resources,2015,50 (4):1051-1080.另一些机制包括向贫困地区的孩子提供免费的教科书、知识彩图绘本和校服等学习和生活用品,但这些助推机制效果各异。一些研究发现,免费提供教科书或者绘本有效提高了学生和老师的课堂参与率,但对学生的学习成绩只有短期影响。③Glewwe,P.,Kremer,M.,and S.Moulin.“Many Children Left Behind?Textbooks and Test Scores in Kenya”.American Economic Journal:Applied Economics,2009,1 (1):112-135;Glewwe,P.,Kremer,M.,Moulin,S.,and E.Zitzewitz.“Retrospective vs.Prospective Analyses of School Inputs:The Case of Flip Charts in Kenya”.Journal of Development Economics,2004,74 (1):251-268.同样,免费提供校服在短期内可以使最初不拥有校服的学生缺勤率降低55%,但从八年的时间线来看,该措施并没有明显地延长学生的受教育年限。④Evans,D.,and M.Ngatia.“School Costs,Short-Run Participation,and Long-Run Outcomes:Evidence from Kenya”.Policy Research Working Paper No.8421,2018.
(2)合理激励学生和教师。尽管许多发展中国家和地区通过义务教育制度和一些助推机制大幅度降低了上学成本,但仍然存在数量众多的辍学儿童。学者们认为这可能和有效激励的缺失有关,并由此推测奖学金制度是一个很有效的办法。比如,克雷默等的实验研究发现,给学习好的女生发放奖学金,会持续提高这些女生的学习成绩,并且会同时提高这些女生的男同学们的学习成绩。而后者可以看作是奖学金制度产生的政策溢出效应。⑤Kremer,M.,Miguel,E.,and R.Thornton.“Incentives to Learn”.Review of Economics and Statistics,2009,91(3):437-456.
由于学生的课堂参与率及学习成绩还取决于教师的能力和努力,有效激励教师的行为就显得非常重要。一些地方把教师作为公务员类型来激励,通常的做法是采取工资加奖金制度,把教师奖金与学生的培养状况和成绩挂钩。然而,格莱维(P.Glewwe)等的实地实验研究发现,奖金制度不仅没有显著提升教师的到课率,而且更麻烦的是,这种做法激励教师设法快速提高学生成绩,而不是提升知识水平。⑥Glewwe,P.,Ilias,N.,and M.Kremer.“Teacher Incentives”.American Economic Journal:Applied Economics,2010,2(3):205-227.另一些地方则采取了合同制的做法。迪弗洛、迪帕 (P.Dupas)和克雷默的研究发现,与公务员教师相比,合同制教师面临续约压力,其教学努力程度会更高,教学综合绩效会更好。⑦Duflo,E.,Dupas,P.,and M.Kremer.“Peer Effects,Teacher Incentives,and the Impact of Tracking:Evidence from a Randomized Evaluation in Kenya”.American Economic Review,2011,101 (5):1739-1774.此外,有些研究还发现引入家长的监督有助于提高教学质量。⑧Duflo,E.,Dupas,P.,and M.Kremer.“School Governance,Teacher Incentives,and Pupil-Teacher Ratios:Experimental Evidence from Kenyan Primary Schools”.Journal of Public Economics,2015,123 (C):92110.
(3)完善教学服务。学校的基础设施投入、制度安排以及教学服务等对教育质量的改进至关重要。⑨Kremer,M.,and A.Holla.“Improving Education in the Developing World:What Have We Learned from Randomized Evaluations?”.Annual Review of Economics,2009,1 (1):513-542.迄今的研究发现,教学服务的助推机制设计可以显著提升教育质量,例如,教学中增设一个环节,为学生提供明确的教育回报率信息,这一助推机制可以有效降低辍学率10Jensen,R.“The(Perceived)Returns to Education and the Demand for Schooling”.Quarterly Journal of Economics,2010,125 (2):515-548.;为学生提供计算机,可以有效增强学生在学习过程中的计算能力训练,从而可以持续提高学生的成绩。①Banerjee,A.,Cole,S.,Duflo,E.,and L.Linden.“Remedying Education:Evidence from Two Randomized Experiments in India”.Quarterly Journal of Economics,2007,122 (3):1235-1264.另外,研究也发现学校参与提供一些公共卫生服务可以有效改善教育状况。比如,学校有组织地为学生提供药物治疗可以有效避免肠道蠕虫病的大规模传播,可以有效减少学生因病旷课的情况②Miguel,E.,and M.Kremer.“Worms:Identifying Impacts on Education and Health in the Presence of Treatment Externalities”.Econometrica,2004,72 (1):159-217.,进而有效提高学生入学率,改善学生的学习成绩。
一般来说,发展中国家和地区普遍存在卫生条件差、疾病防范意识不足、生活习惯落后及特殊的地理环境因素等问题,众多低收入人口饱受疾病的困扰。疾病的大规模传播极大地损害了人们的身体健康,不仅大幅降低人力资本水平,而且耗费大量的医疗资源,严重制约了当地的经济发展,阻碍了当地居民福利水平的改善。实验经济学家研究发现,这些地方存在一个共同的问题,即卫生健康支出结构扭曲,高昂的医疗卫生支出和低水平的预防保健支出并存,此时,稍微增加预防性健康投资就可能大幅度改善卫生健康现状。③Dupas,P.“Health Behavior in Developing Countries”.Annual Review of Economics,2011,3 (1):425-449.具体而言,调整卫生健康支出结构的助推机制主要有:
(1)推广预防性健康用品。发展中国家和地区的相关机构往往通过补贴的方式激励贫困地区的家庭购买预防性健康用品。然而,这类补贴支出很高,但效果有限。一个原因在于这些物品的微观价格机制的作用被忽视了。预防性健康用品的定价很重要。科恩 (J.Cohen)等就此问题,分别对长效抗疟疾驱虫蚊帐和家庭饮用水消毒剂的定价策略进行了实验研究。④Cohen,J.,and P.Dupas.“Free Distribution or Cost-Sharing? Evidence from a Randomized Malaria Prevention Experiment”.Quarterly Journal of Economics,2010,125 (1):1-45;Ashraf,N.,Berry,J.,and J.M.Shapiro.“Can Higher Prices Stimulate Product Use? Evidence from a Field Experiment in Zambia”.American Economic Review,2010,100 (5):2383-2413.在肯尼亚和赞比亚的两项实地实验中,这些研究者将预防性健康用品分别按照不同的价格向人们出售。实验结果发现,当这类物品定价较高时,价格可以把那些更倾向于使用这类产品的人筛选出来,但这些产品的使用概率变化很小。与之不同,通过向贫困家庭提供免费的预防性健康用品,则可以有效提高这类物品的使用概率,同时产生显著的正外部性。也就是说,这类产品的定价策略应着眼于提高产品的使用率。此外,其他相关的研究还发现,预防性健康投资存在家庭结构差异。比如,母亲更愿意为孩子的健康进行投资⑤Meredith,J.,Robinson,J.,Walker,S.,and B.Wydick.“Keeping the Doctor Away:Experimental Evidence on Investment in Preventative Health Products”.Journal of Development Economics,2013,105:196210.;提供与疾病相关的信息或要求家庭做出购买承诺都不会显著增加预防性产品的购买⑥Dupas,P.“What Matters(and What Does Not)in Households'Decision to Invest in Malaria Prevention?”.American Economic Review,2009,99 (2):224230.。这意味着助推机制的设计应更有针对性。
(2)重视公共卫生服务。欠发达地区通常更重视经济发展,而对公共卫生服务的投入不够。实际上,现有的实地实验研究表明,在预防各种流行病方面,公共卫生服务能起到非常有效的作用。例如,克雷默等在肯尼亚的研究发现,采用管道引流源头水技术,可以有效保护饮用水的水质,使得饮用水受到粪便污染的概率下降66%,儿童腹泻的患病率下降近四分之一。⑦Kremer,M.,Leino,J.,Miguel,E.,and A.P.Zwane.“Spring Cleaning:Rural Water Impacts,Valuation,and Property Rights Institutions”.Quarterly Journal of Economics,2011,126 (1):145-205.其他一些研究同样发现了公共卫生服务的巨大作用。例如,为个人提供HIV 检测结果可以增加HIV 阳性患者购买避孕套的概率①Thornton,R.“The Demand for,and Impact of,Learning HIV Status”.American Economic Review,2008,98 (5):1829-1863.;定期定点提供疫苗接种服务可以使贫困地区的幼儿疫苗接种率由6%上升至18%,并且发放小型实物激励和依靠社区中心人物传递信息都对进一步提高接种率有促进作用。②Banerjee,A.,Duflo,E.,Glennerster,R.,and D.Kothari.“Improving Immunisation Coverage in Rural India:Clustered Randomised Controlled Evaluation of Immunisation Campaigns with and without Incentives”.BMJ:British Medical Journal,2010,340:1291;Banerjee,A.,Chandrasekhar,A.G.,Duflo,E.,and M.O.Jackson.“Using Gossips to Spread Information:Theory and Evidence from Two Randomized Controlled Trials”.Review of Economic Studies,2019,86 (6):2453-2490.不仅如此,公共卫生服务还具有显著的正溢出效应。一些研究发现,给一所学校的学生发放驱虫药物治疗相关疾病时,不仅该学校学生的寄生虫患病率显著下降,而且所在区域相邻学校的学生的寄生虫患病率也显著下降了。③Miguel,E.,and M.Kremer.“Worms:Identifying Impacts on Education and Health in the Presence of Treatment Externalities”.Econometrica,2004,72 (1):159-217.另外,公共卫生宣传活动的作用也不容小觑。比如,在学校开设HIV/AIDS的教育课程可以有效减少性传播疾病的风险。④Duflo,E.,Dupas,P.,and M.Kremer.“Education,HIV,and Early Fertility:Experimental Evidence from Kenya”.American Economic Review,2015,105 (9):2757-2797.
(3)避免不良生活习惯。避免某些不良的生活习惯,尤其是抽烟、酗酒等成瘾行为,能够显著改善人们的健康水平。实验发展经济学的研究发现,自我控制机制的设计有助于人们戒除不良生活习惯。比如,吉内(X.Giné)等和席尔巴赫 (F.Schilbach)就发现,承诺机制能帮助贫困人口显著改变抽烟和酗酒等不良生活习惯。⑤Giné,X.,Karlan,D.,and J.Zinman.“Put Your Money Where Your Butt Is:A Commitment Contract for Smoking Cessation”.American Economic Journal:Applied Economics,2010,2 (4):213-235;Schilbach,F.“Alcohol and Selfcontrol:A Field Experiment in India”.American Economic Review,2019,109 (4):1290-1322.值得注意的是,承诺机制有其局限性,因为其作用依赖一定的条件,以至于在特定情况下这种机制反而可能会使贫困人口的生活状况更糟。⑥Bai,L.,Handel,B.,Miguel,E.,and G.Rao.“Self-control and Demand for Preventive Health:Evidence from Hypertension in India”.NBER Working Paper No.23727,2017.
提高低收入家庭的收入和储蓄是欠发达经济体所面临的一大难题,实验发展经济学在这方面也做出了重要贡献。
(1)提高收入的助推机制设计。与发达经济体不同,发展中国家和地区非正式就业现象比较普遍,自我雇佣岗位占比较高,流动性较大,岗位的附加值较低。⑦Kremer,M.,Rao,G.,and F.Schilbach.“Behavioral Development Economics”.In Bernheim,B.D.,Della Vigna,S.,and D.Laibson (eds.).Handbook of Behavioral Economics:Foundations and Applications 1,Vol.2.Amsterdam:Elsevier,2019,pp.345-458.同时,农民、农民工和普通服务业从业人员是发展中国家和地区贫困人口的主要组成部分。这些人口的抗风险能力差,所在行业的生产率水平低,价值创造能力弱,这就导致了贫困人口收支两难的窘迫局面。迪弗洛、克雷默和罗宾逊(J.Robinson)利用实地实验研究了肯尼亚西部农村的农业生产,发现如果农民能够合理地使用化肥,农业产出收入将非常可观。⑧Duflo,E.,Kremer,M.,and J.Robinson.“How High Are Rates of Return to Fertilizer? Evidence from Field Experiments in Kenya”.American Economic Review,2008,98 (2):482-488.他们进一步设计了一个助推机制,要求在临近施肥时,给购买化肥的农民提供一个限时折扣。结果这个机制显著优化了农民购买和使用化肥的行为,使得农业产出和农民的农业收入得到了显著提高⑨Duflo,E.,Kremer,M.,and J.Robinson.“Nudging Farmers to Use Fertilizer:Theory and Experimental Evidence from Kenya”.American Economic Review,2011,101 (6):2350-2390.,而且其效果优于当地政府此前采取的提前出售化肥代金券、承诺免费送货上门等方法。此外,针对贫困地区灵活用工岗位劳动供给不足的问题,实验发展经济学家也发现了一些有效的助推机制。比如,与用工单位签订承诺工作量合同,会显著提高劳动者的工作努力水平和工资收入①Kaur,S.,Kremer,M.,and S.Mullainathan.“Self-control at Work”.Journal of Political Economy,2015,123 (6):1227-1277.;或者,给定一个收入的参照目标,有助于将劳动者的劳动供给和收入维持在参照水平上②Dupas,P.,Robinson,J.,and S.Saavedra.“The Daily Grind:Cash Needs and Labor Supply”.Journal of Economic Behavior and Organization,2020,177:399-414.。
(2)提高家庭储蓄水平的助推机制设计。贫困人口收入不稳定,抗风险能力差,有计划的储蓄就显得至关重要。实验发展经济学的研究发现,承诺机制的设计可以有效帮助认知能力较差的贫困人口提高储蓄水平③Thaler,R.,and S.Benartzi.“Save More Tomorrow:Using Behavioral Economics to Increase Employee Saving”.Journal of Political Economy,2004,112 (S1):164;Ashraf,N.,Karlan,D.,and W.Yin.“Tying Odysseus to the Mast:Evidence from a Commitment Savings Product in the Philippines”.Quarterly Journal of Economics,2006,121 (2):635-672.,特别是可以帮助贫困人口更合理地支配储蓄。比如,迪帕和罗宾逊设计了专用于健康的承诺储蓄账户,能帮助贫困地区增加至少66%的预防性健康投资。④Dupas,P.,and J.Robinson.“Why Don't the Poor Save More? Evidence from Health Savings Experiments”.American Economic Review,2013,103 (4):1138-1171.相关研究还发现,给银行储户发送提醒储蓄的短信也能在一定程度上达到增加储蓄的目的。⑤Akbas,M.,Ariely,D.,Robalino,D.,and M.Weber.“How to Help the Poor Informal Workers to Save a Bit:Evidence from a Field Experiment in Kenya”.IZA Discussion Paper No.10024,2016.
实验发展经济学在近三十年迅速崛起,成为一个热门的经济学分支,巴纳吉、迪弗洛和克雷默三位领军人物功不可没,获得诺贝尔经济学奖也是迟早的事。海克曼 (J.Heckman)充分肯定了随机实地实验为经济学带来的巨大影响,但也指出,早期随机实地实验研究并未涉及参数估计、实验结果的经济解释和政策相关性等深层次问题。⑥Heckman,J.“Randomization and Social Policy Evaluation”.In Manski,C.,and I.Garfinkel (eds.).Evaluating Welfare and Training Programs.Cambridge:Harvard University Press,1992,pp.201-230.从20世纪90年代开始,新一代实验发展经济学家努力改善随机实地实验方法,试图解决海克曼等所指出的问题。虽然随机实地实验方法逐步得到了经济学界的广泛认可,但伴随着实验发展经济学的成功,更大的争议随之而来。这些争议主要集中在两个方面:一是随机实地实验方法究竟可靠与否? 二是实验发展经济学有一套统一的理论体系吗?
对随机实地实验方法的质疑主要集中在外部有效性问题上。质疑者普遍认为,随机实地实验研究所得出的结论缺乏外部有效性,因而即便发展经济学引入了随机实地实验方法,也无法摆脱地方特征的命运。事实上,传统发展经济学就是因为基于地方经验的总结导致相关的研究结论缺乏一般性,从而被人诟病。现在,实验发展经济学试图通过随机实地实验来解决地方经验的局限,从而获得外部有效性的大幅改善。然而,质疑者依旧认为这远远不够,其中最具代表性的质疑来自2015年诺贝尔经济学奖得主迪顿。在他看来,尽管随机实地实验是一种可行的研究方法,但和主流研究方法相比,其样本还是过于特殊,以至于外部有效性的缺失使得实验研究成果不具备推广意义和应用价值。⑦Deaton,A.“Randomization in the Tropics Revisited:A Theme and Eleven Variations”.NBER Working Paper No.27600,2020.迪顿承认随机实地实验假设最少,能避免主观偏见,但坚持认为随机实地实验很难准确估计样本的平均处理效果,估计结果也仅适用于被试,很难推广到非被试群体。随机实地实验不应该仅仅追求什么东西有用,而是应该追求“为什么这些东西有用”。①Deaton,A.,and N.Cartwright.“Understanding and Misunderstanding Randomized Controlled Trials”.Social Science and Medicine,2018,210:2-21.实际上,迪顿正确指出了随机实地实验在因果推断和机制识别方面的一些不足,而实验发展经济学家自身也越来越重视寻求融入更多的理论和方法,以解决这些不足。
随机实地实验的外部有效性备受质疑的另一个原因是它同样可能依赖本地的各项特定条件,一旦这些条件发生变化,实验结果就可能不显著。这与传统发展经济学有类似之处。例如,实验研究的确发现,免费发放教科书改变了肯尼亚农村儿童的课堂学习行为。②Glewwe,P.,Kremer,M.,and S.Moulin.“Many Children Left Behind?Textbooks and Test Scores in Kenya”.American Economic Journal:Applied Economics,2009,1 (1):112-135.但对教科书资源不怎么匮乏的地区,免费发放教科书似乎就没什么作用了。针对这一问题,实验发展经济学家试图在不同地区进行可复制实验,如果不同地区的可复制实验的结果类似,就能够说明所研究的机制具有一般性,也就解决了外部有效性难题。比如巴纳吉等选取孟买和巴罗达两个地点同时开展相同的教学助推实验,得到了类似的实验结果,这说明该研究是有外部有效性的。③Banerjee,A.,Cole,S.,Duflo,E.,and L.Linden.“Remedying Education:Evidence from Two Randomized Experiments in India”.Quarterly Journal of Economics,2007,122 (3):1235-1264.问题在于,可复制实验会面临归纳谬误。两个地区实验结果类似,不等于第三个地区的实验结果也类似。这依然没有彻底回答外部有效性质疑。
随机实地实验的核心在于良好的随机化,这样可以帮助研究者排除非实验处理因素的干扰。但现实的实验设计可能因为受到各种条件制约,无法做到良好的随机化。比如,受制于当地的社会网络、技术条件、语言、习俗、权威、官僚体系以及其他干扰因素等等,无法真正随机获取样本。因此,一些研究者认为,研究者应该详细报告针对防范估计偏误的研究设计细节。不过,虽然RCT法存在很多估计偏误,但这不意味着实验结果不可靠。④Eble,A.,Boone,P.,and D.Elbourne.“On Minimizing the Risk of Bias in Randomized Controlled Trials in Economics”.Policy Research Working Paper No.7746,2016.随机实地实验的估计偏误也可以通过特定的技术方法来解决。⑤Molina Millán,T.,and K.Macours.“Attrition in Randomized Control Trials:Using Tracking Information to Correct Bias”.IZA Discussion Paper No.10711,2017.还有一些学者进行了不同估计方法的对比研究。比如,德赫加 (R.Dehejia)将六种常用的非实验估计方法(工具变量、断点回归、直接匹配、倾向得分匹配、线性回归和非参数方法)与随机实地实验方法进行对比,发现随机实地实验的内部有效性占优。假如实地实验的被试范围扩大,估计效果的外部有效性会接近非实验估计方法。因此,这些方法各有优缺点,应该互补使用,而不是替代关系。⑥Dehejia,R.“Experimental and Non-Experimental Methods in Development Economics:A Porous Dialectic”.Journal of Globalization and Development,2015,6 (1):47-69.随机实地实验还可能面临一般均衡效应和溢出效应的质疑。研究者正试图通过模型推演和优化实验设计来捕捉这类效应。⑦Banerjee,A.,Banerji,R.,Berry,J.,Duflo,E.,Kannan,H.,Mukherji,S.,Shotland,M.,and M.Walton.“From Proof of Concept to Scalable Policies:Challenges and Solutions,with an Application”.Journal of Economic Perspectives,2017,31 (4):73-102.总之,和其他研究方法类似,随机实地实验方法有利有弊,实验发展经济学家正不断努力,通过发展相关的理论,优化实验方法,来更好地回应各方的质疑。
实验发展经济学的另一个问题是缺乏一个统一的理论体系。克雷默等用行为发展经济学来概括近三十年实验发展经济学的贡献⑧Kremer,M.,Rao,G.,and F.Schilbach.“Behavioral Development Economics”.In Bernheim,B.D.,Della Vigna,S.,and D.Laibson (eds.).Handbook of Behavioral Economics:Foundations and Applications 1,Vol.2.Amsterdam:Elsevier,2019,pp.345-458.,但似乎不是很确切。随机实地实验是方法,不是理论,克雷默等的定义仅仅适用于研究发展问题的行为因素,而不适用于研究非行为部分。例如,贫困地区的儿童辍学难题,从行为经济学的视角考虑,可能是父母的短视或者其他认知偏见所致;相应的助推机制设计就是针对这些认知偏见进行行为干预,以图解决子女教育激励。而从非行为经济学的视角看,儿童辍学恰恰是父母在给定约束下的理性决策,因为无法承担上学成本,或者教育的预期回报率过低。这种情况下,机制设计就不是着眼于行为干预,而是基于成本收益和信息约束的机制设计,这意味着通行的补贴等政策是很重要的。
本文认为,发展经济学近三十年最有影响的研究主要还是体现在随机实地实验的应用上,把这些领域中的新进展和新趋势概括为“实验发展经济学”可能更为合理,因为这些研究是通过实验方法来研究发展问题,可以基于行为经济学的理论,也可以基于非行为经济学的理论。实验发展经济学在理论上亟须解决两大问题:一是理论内核。迄今实验发展经济学的研究和传统发展经济学在理论上并无实质性的关联,只是都在关注发展问题。这就导致实验发展经济学更像是实验经济学在发展领域的一个应用,而不是推进发展经济学的理论构建。而传统发展经济学自身也存在理论内核不清的难题。实际上,近三十年的实验发展经济学研究得到了很多有趣的结论,这些结论将有助于重构传统发展经济学的理论。从这个角度讲,克雷默等提出行为发展经济学的说法也许是一个好的方向,通过行为经济学理论来重构传统发展经济学理论,可能是有趣且有意义的探索。二是实验发展经济学摆脱不了实验经济学的固有弊端,即研究的问题过于细碎,而发展问题恰恰都是大问题、综合性问题。细碎问题的深入研究从科学研究的视角是合适的,但从发展问题的解决视角是不合适的。用普里切特(L.Pritchett)的话来说,现有RCT 法研究的成果都构不成发展问题的重大因素①兰特·普里切特在许多学术文章、公开讲座和网络平台上表达过对于RCT 法的质疑。参见Pritchett,L.,and J.Sandefur.“Context Matters for Size:Why External Validity Claims and Development Practice Do Not Mix”.Journal of Globalization and Development,2014,4 (2):161-197;Pritchett,L.,and J.Sandefur.“Learning from Experiments When Context Matters”.American Economic Review,2015,105 (5):471-475;Pritchett,L.“Using‘Random’Right:New Insights from IDinsight Team”.Center for Global Development:Commentary and Analysis,December 10,2015;Pritchett,L.“Is Your Impact Evaluation Asking Questions That Matter? A Four Part Smell Test”.Center for Global Development:Commentary and Analysis,November 6,2014.,很多时候实验发展经济学家提出的助推机制看起来有种隔靴搔痒的感觉,并没有对既存的各种重要发展问题给出有效的整体性解决方案。这也是这些研究饱受诟病的地方。要避免这类不足,就需要将实验方法和其他研究方法结合起来。即便是实验方法本身,也需要考虑将随机实地实验和其他实地实验及实验室实验方法有机结合起来,而不是仅仅强调随机实地实验本身。
实验发展经济学对我国尤其重要。我国改革开放的过程实际上是各种试验的过程,但这种试验不是实验经济学所讲的实验,因为通常试验都是基于试点获取经验,并不考虑随机性,不考虑干预机制的设计,没有对照组和实验组,也没有数据的系统采集和深度挖掘。如果把试验上升到实验经济学的实验,将有助于降低试错成本,改进政策调节的精准性。所幸,近年来随机实地实验研究开始在我国生根发芽,以中国人民大学经济学院陆方文教授等为代表的学者做了一系列的实地实验研究,相关研究成果令人关注。陆方文和罗俊等对实地实验的相关研究成果进行了系统的评述②陆方文:《随机实地实验:方法、趋势和展望》,载 《经济评论》,2017 (4);罗俊、汪丁丁、叶航、陈叶烽:《走向真实世界的实验经济学——田野实验研究综述》,载 《经济学 (季刊)》,2015 (3)。。在实验发展经济学方面,研究者主要集中在教育和反贫困两大领域。教育领域的研究侧重同群效应的检验。例如,陆方文等在一所中学中进行了随机排座实验,发现班级内的不同组群之间同样存在同群效应,且该效应的强弱与女性邻座学生的数量有关,这意味着可以通过合理的分组来改进教育绩效①Lu,F.,and M.L.Anderson.“Peer Effects in Microenvironments:The Benefits of Homogeneous Classroom Groups”.Journal of Labor Economics,2015,31 (1):91-122.;王春超和钟锦鹏通过对小学生的随机排座研究同样发现了同群效应对学生非认知能力的影响②王春超、钟锦鹏:《同群效应与非认知能力——基于儿童的随机实地实验研究》,载 《经济研究》,2018 (12)。。反贫困研究方面,董志强和赵俊首次使用实地实验方法研究了我国农村留守儿童的行为,发现留守儿童更倾向于规避竞争,竞争偏好较弱,这势必对其未来的成长产生负面影响。③董志强、赵俊:《“留守”与儿童竞争偏好:一项实地实验研究》,载 《经济学动态》,2019 (4)。莫(D.Mo)等研究了城市外来务工人员子女的行为,通过实地实验研究发现,向这些孩子提供计算机辅助教学会显著提升学生的数学成绩。④Mo,D.,Swinnen,J.,Zhang,L.,Yi,H.,Qu,Q.,Boswell,M.,and S.Rozelle.“Can One-to-One Computing Narrow the Digital Divide and the Educational Gap in China? The Case of Beijing Migrant Schools”.World Development,2013,46:14-29.当前,我国正处在全面深化改革的进程中,而实验发展经济学研究能够为政策设计提供良好的理论支撑。正如陆方文教授所言,我国层出不穷的政策试点为实验研究者们提供了一个“天然的大实验场”⑤陆方文:《随机实地实验:方法、趋势和展望》,载 《经济评论》,2017 (4);陆方文:《随机实地实验:理论、方法和在中国的运用》,北京,科学出版社,2020。。可以预见,实验发展经济学在我国的普及和推广,将有助于我国的治理现代化目标更好地实现。