张华
十九大报告提出,当前中国社会主要矛盾已经转化为人民日益增长的美好生活需要和不平衡不充分的发展之间的矛盾。城乡发展不平衡作为不平衡不充分发展的重要表现形式之一,将直接导致城乡居民之间的收入差距。从城乡居民收入的情况来看(图1),改革开放以来,城镇居民人均可支配收入从1978年的343元增加至39251元,增幅高达113倍;农村居民人均纯收入从1978年的134元增加至14617元,增幅高达108倍。同时,城乡居民收入比波动幅度较大,存在三个下降时期,分别是1978—1983年、1994—1997年和2008年之后,原因分别是家庭联产承包责任制、农副产品收购价格提高以及农业税取消和农副产品价格上涨。整体来看,中国城乡收入差距呈现不断扩大的趋势,几轮收入差距缩小主要由短期因素导致(陈斌开和曹文举,2013)。十九大报告对当前形势的基本判断是,城乡区域发展和居民收入分配差距依然较大。
图1 1978—2018年中国城乡居民收入及收入差距的演变趋势
毋庸置疑,缩小城乡收入差距不仅是解决当前社会主要矛盾的应有之义,更是全面建成小康社会和实现全体人民共同富裕的必然要求。鉴于缩小城乡收入差距重大的现实意义,学术界一直致力于研究城乡收入差距不断扩大的原因,从而寻求缩小差距的方案。大量文献表明,城市偏向的政府政策在城乡收入差距不断扩大的过程中扮演着极为重要的角色。这些城市偏向型政策包括城乡分割的行政管理制度(陆铭和陈钊,2004)、户籍歧视(万海远和李实,2013)、城市偏向的教育经费投入以及农副产品价格控制、不合理的税费负担、歧视性的社会福利和保障体系等(陈斌开和林毅夫,2013)。从根源上讲,政府优先发展重工业的战略导致了上述众多城市偏向型政策(林毅夫等,1994),然而这一战略是在战争威胁尚未完全消除的国际大环境下的必然选择。
归根结底,城乡收入差距不断扩大的原因是城镇居民收入增长快于农村居民,而农村居民收入仍在增长,只是增长幅度相对较小,并不存在城乡居民收入两极分化的现象(李实,2018)。为了提高农村居民收入和缩小城乡收入差距,近年来中央政府出台诸多政策,如农业直补、义务教育免费、新农村合作医疗等惠农政策,以及西部大开发等区域政策等(陈斌开和曹文举,2013)。其中,尤以西部大开发最引人注目。实施西部大开发战略,是党中央、国务院在世纪之交作出的重大决策(冯俊诚和张克中,2016)。西部大开发战略的实施范围为12个西部省份和3个民族自治州,面积为685万平方公里,约占全国的71.4%,覆盖人口约占全国人口的29%,跨时50年。根据政策实施的地理面积和人口,西部大开发战略一直以来是世界上最大的区位导向性政策(Ma et al.,2017)。那么,需要思考的问题是,西部大开发战略是否有效降低了城乡收入差距?以及,西部大开发战略是否同步提升了城镇居民收入和农村居民收入?厘清上述问题,有利于严谨、客观地评估西部大开发政策的成就及面临的问题,这对于缩小城乡收入差距、治理中国的贫困人口问题以及解决社会主要矛盾具有重大的现实意义。
相比于以往文献,本文可能的边际贡献主要体现在:第一,识别策略上,本文采取空间断点回归方法,比较毗邻西部大开发边界线左右两侧县区的城乡收入差距的差异,而处于边界线周边县区的社会经济特征可以认为是无差异的,从而较好地处理遗漏变量问题。第二,丰富了西部大开发的相关研究,有利于多维度、多视角地评估西部大开发的政策效应。现有文献对西部大开发的政策评估主要聚焦于经济增长方面(刘生龙等,2009;刘瑞明和赵仁杰,2015;Ma et al.,2017;蒲龙,2017;谭周令和程豹,2018),也有少数文献关注于转移支付(雷根强等,2015;王丽艳和马光荣,2018)、税收收入(罗鸣令等,2019)、政府规模(冯俊诚和张克中,2016)、产业结构(袁航和朱承亮,2018)、旅游发展(Deng et al.,2019)、企业生产率和新企业进入(吴辉航等,2017;Liu et al.,2019)等方面。本文从城乡收入差距方面进行了补充。同时,本文也丰富了方兴未艾的区位导向性政策评估的文献。第三,拓展了城乡收入差距的相关研究。在宏观层面,既有关于城乡收入差距的文献绝大多数集中于省份层面(陈斌开和林毅夫,2013;刘贯春,2017)与城市层面(谢冬水,2018;余泳泽和潘妍,2019)的研究。本文提供了来自县级层面的证据,样本量更大,研究结论更具有说服力。另外,本文还考察了西部大开发对城乡收入差距影响的区域与年份异质性,并同步探讨了西部大开发对城镇居民收入和农村居民收入的影响。
西部大开发是中国在改革开放后实施时间最长、影响范围最广的一项区域发展战略(刘瑞明和赵仁杰,2015)。这一战略来源于邓小平的“两个大局”的战略构想。“两个大局”本质上是一种“先不平衡发展后共同发展”的战略思路。在这种背景下,改革开放初期中国实行向东部地区倾斜的区域发展战略,到20世纪90年代中期已经形成了典型的东部、中部和西部三大经济地带,东部富裕、中部次之、西部贫穷(刘生龙等,2009)。数据显示,1999年西部地区人均GDP为560美元,少于东中部省份一半以上,大致相当于津巴布韦的水平,GDP总量占全国的比重仅有17.5%(Ma et al.,2017)。此时,帮助和加快西部地区发展已是大势所趋、如箭在弦,这对于缩小地区差距、加强民族团结、保障边疆安全和社会稳定具有重要的经济和政治意义,也是“两个大局”的重要内容。
1998年5月,时任国家领导人江泽民提出要“逐步加快开发西部地区”。随后,1999年6月17日,在西安举行的西北五省区国有企业改革和发展座谈会上,江泽民首次明确提出要实施西部大开发战略。1999年9月,中共十五届四中全会通过《中共中央关于国有企业改革和发展若干重大问题的决定》,明确提出“国家要实施西部大开发战略”。1999年11月,中央经济工作会议正式确认,西部大开发战略于2000年启动。2000年1月,国务院成立西部地区开发领导小组;2000年3月,国务院西部开发办正式开始运作;2000年6月,西部地区开发领导小组第一次会议决定,西部大开发的实施范围为12个西部省、自治区、直辖市,以及湖南省湘西土家族苗族自治州、湖北省恩施土家族苗族自治州、吉林省延边朝鲜族自治州3个民族自治州。根据政策实施的地理面积和人口,西部大开发战略成为世界上最大的区位导向性政策。
为了保证西部大开发战略的顺利实施,中央政府陆续出台了多项政策规划,主要包括:2001年关于西部大开发若干政策措施的实施意见、2002年“十五”西部开发总体规划、2007年西部大开发“十一五”规划、2012年西部大开发“十二五”规划、2017年西部大开发“十三五”规划等。根据政策文件,西部大开发的战略目标是,到21世纪中叶,努力建成一个经济繁荣、社会进步、生活安定、民族团结、山川秀美、人民富裕的新的西部地区;西部大开发跨时50年,分为三个阶段,包括奠定基础阶段(2001—2010年)、加速发展阶段(2011—2030年)和现代化阶段(2031—2050年);西部大开发持续关注的领域主要包括加大基础设施投资、促进工业化发展和提高教育、医疗、社会保障等公共品的供给;西部大开发的倾斜政策主要包括提供更多的转移支付、信贷支持和税收优惠政策。
本文主要涉及三个方面的文献:城乡收入差距的相关研究、西部大开发的政策评估、西部大开发与城乡收入差距的相关研究。由于现有关于城乡收入差距的研究较为成熟,主要聚焦于探索城乡收入差距的影响因素,因此本文不再赘述。
既有文献从多个研究视角评估了西部大开发的政策效应,研究结论并不相同,不仅有肯定西部大开发的正面作用,也有批评西部大开发的负面作用,甚至两者兼有。具体如下:
(1) 西部大开发具有正面效应。刘生龙等(2009)利用1987—2007年中国省级面板数据和双重差分方法,发现西部大开发显著增加实际人均GDP增长率,并且主要通过实物资本和基础设施投资的途径促使区域经济从趋异转向收敛。蒲龙(2017)利用1999—2010年444个国家贫困县的面板数据和双重差分方法,发现西部大开发显著促进西部地区国家贫困县的经济增长。吴辉航等(2017)立足于企业的微观视角,借助于双重差分方法,发现西部大开发显著降低西部地区的企业所得税,进一步提升西部边界城市企业的全要素生产率。Liu et al.(2019)利用双重差分和三重差分方法,发现西部大开发显著增加了新企业的进入数量。不同于上述文献依托于双重差分方法的估计框架,Deng et al.(2019)采取断点回归方法,利用2002—2010年中国285个城市的数据,发现西部大开发显著促进了西部地区的旅游业发展。
(2) 西部大开发具有负面效应。基于1994—2012年中国283个城市的面板数据,刘瑞明和赵仁杰(2015)利用PSM-DID方法,发现西部大开发并未有效推动西部地区GDP和人均GDP的增长,意味着西部大开发的政策效应并没有得到有效发挥,存在“政策陷阱”。冯俊诚和张克中(2016)利用1997年、1998年和2000年中国1117个县的面板数据,采用双重差分方法,发现西部大开发导致西部县级政府规模的大幅扩张。
(3) 西部大开发兼具正负双重效应。Ma et al.(2017)利用1999—2014年中国1957个县域的数据,借助于空间地理断点回归的方法,发现西部大开发促使GDP增长率年均提高1.5%,这种推动作用源于工业部门的扩张;同时,西部大开发显著降低劳动增长率,减少企业利润率和专利数量。袁航和朱承亮(2018)利用1994—2015年中国285个城市的面板数据,采用PSM-DID方法,发现西部大开发能够促进西部地区产业结构的合理化,但未促进产业结构的高级化,甚至存在抑制作用。谭周令和程豹(2018)利用1992—2014年中国省级面板数据,采用合成控制法,发现西部大开发显著促进内蒙古、重庆、陕西、青海和宁夏的经济发展,而显著降低广西、云南和新疆的经济发展。罗鸣令等(2019)利用1998—2007年13个省份188个县的面板数据,借助于双重差分方法,发现西部大开发对政策分界线西侧县的增值税和营业税收入具有显著的提升作用,但是税基的增长是以相邻地区的税基流失为代价,佐证了区域性税收优惠政策存在负外部性。
与本文紧密关联的文献是毛其淋(2011)和邵传林(2014)的研究。毛其淋(2011)利用1995—2008年中国29个省份的面板数据,借助于双重差分方法,发现西部大开发显著缩小了西部地区的收入不平等,并且这一缩小效应主要通过提高外资比重、加快城市化进程和扩大财政支农支出等途径实现。类似于毛其淋(2011)的研究思路,邵传林(2014)利用1985—2011年中国30个省份的面板数据,采用双重差分方法,发现西部大开发导致西部地区城乡收入差距的水平值相对于样本均值增加了5.7~8.5个百分点,表明西部大开发对城乡收入差距具有显著的加剧效应。
梳理上述文献可知,现有文献更多地从经济增长、税收收入、产业结构和旅游发展等方面评估西部大开发的政策效应,较少关注西部大开发对城乡收入差距的影响。毛其淋(2011)、邵传林(2014)与本文主题密切相关,均立足于省份层面和采取双重差分方法,然而研究结论却南辕北辙。由于西部地区的资源禀赋、地理区位等方面相异于东中部地区,因此处理组与控制组存在较大的异质性,从而导致双重差分方法的估计框架并不适用(Ma et al.,2017)。同时,基于省份层面的研究,样本量较小,也不能考虑湘西州、恩施州和延边州3个民族自治州的特殊样本。鉴于此,本文基于县级面板数据,采取空间断点回归(regression discontinuity design,RD)的方法,以县区到西部大开发边界线的最短距离作为RD函数形式的驱动变量,从而能够捕获边界线周围不可观测的相关因素,更有效地处理内生性问题,为西部大开发与城乡收入差距之间的因果关系提供更为干净的识别。
为了识别西部大开发战略对城乡收入差距的影响,本文遵循Almond et al.(2009)、Dell(2010)、Ma et al.(2017)、Deng et al.(2019)等文献的思路,利用空间断点回归的方法,设定如下计量模型:
(1)
其中,i、p和t分别表示县区、省份和年份;被解释变量Yit表示县区城乡收入差距。模型核心解释变量WDSi表示县区是否实施西部大开发战略的虚拟变量,边界线左侧的县区是处理组,取值为1;边界线右侧的县区是控制组,取值为0。由于西部大开发的实施范围为12个西部省、自治区、直辖市以及3个民族自治州(湘西州、恩施州和延边州),因此本文遵循王丽艳和马光荣(2018)的做法,将边界线定义为中西部省份之间的行政分界线,以及湘西、恩施两个民族自治州的边界线,即将传统中的中西部分界线进行了外扩。同时,由于延边州距离边界线太远,并不符合本文的识别策略,因此回归样本中排除了延边州下辖的县区。WDSi的估计系数β是本文最为关注的,其捕捉了西部大开发战略影响城乡收入差距的净效应。如果β<0且显著,则表明西部大开发显著缩小城乡收入差距;如果β>0且显著,则表明西部大开发显著扩大城乡收入差距;如果β不显著,则表明西部大开发对城乡收入差距的作用效果不明显。
式(1)中,Distancei为驱动变量(forcing variable),表示为i县到边界线的最短距离,并且处理组县区的距离取正值,控制组县区的距离取负值,距离为0的点构成本文的分界线,即断点。F(Distancei)是驱动变量Distancei的平滑函数,一般定义为断点两边的低阶多项式模型;WDS·F(Distancei)是西部大开发变量与F(Distancei)的交叉项,这种做法使模型设定更具一般化,即断点两边的低阶多项式模型具有不同的斜率。一定意义上,上述控制地理位置的函数形式能够捕获边界线周围不可观测的相关因素。另外,Xit表示一组控制变量,以控制其他因素对县区城乡收入差距的影响。up为省份固定效应,以控制省份间不随时间变化的因素,如地理因素和资源禀赋的差异等;λt为年份固定效应,以控制特定年份对所有县区造成影响的因素,如全国性的宏观调控政策等。εit表示随机误差项,为了控制潜在的异方差、时序相关和横截面相关等问题,本文将标准误聚类(Cluster)到县区层面。
实际上,式(1)是RD平均处理效应估计的参数方法,这种方法存在F(Distancei)函数形式设置不确定的问题。另一种RD估计是非参数方法的局部线性回归,即最小化下列函数:
(2)
式(2)中,K(·)为核函数,h为带宽。核函数主要包括三类:三角内核(Triangular kernel)、Epanechnikov内核(本文以Epanech.表示)和均匀内核(Uniform kernel)。根据Lee and Lemieux(2010)的建议,三角内核更适于边界估计,因此本文局部线性回归的估计结果中以三角内核为主。式(1)与式(2)两种RD估计方法各有优劣。Imbens and Lemieux(2008)、Lee and Lemieux(2010)认为,局部线性回归能够避免边界上收敛速度慢的问题,可以减少估计值的偏误;同时,Gelman and Imbens(2019)发现,参数方法存在多项式阶数选择的敏感问题以及其他不受欢迎的统计特性。鉴于此,本文实证部分以局部线性回归为主,以参数方法的全局多项式回归为辅。这一实证策略也被Ebenstein et al.(2017)和He et al.(2018)所运用。
本文采用的样本为2000—2014年中国2009个县、县级市、区的面板数据。所需数据来自于《中国县市社会经济统计年鉴》《中国区域经济统计年鉴》《中国统计年鉴》等;各县到边界线的最短距离通过ArcGIS软件测算。同时,由于缺少县区和城市层面的价格指数,因此以货币单位的名义变量均以相应省级层面的价格指数进行消胀处理,调整为以2000年为基期的不变价格。此外,为了剔除极端值的影响,本文遵循马光荣等(2016)的做法,对被解释变量和控制变量最高和最低的1%样本进行缩尾法(Winsorize)处理。
(1) 被解释变量:城乡收入差距。国家统计局一般采用城镇居民人均可支配收入与农村居民人均纯收入的比值衡量城乡收入差距,既有相关文献关于省份层面(陈斌开和林毅夫,2013;刘贯春,2017)与城市层面(谢冬水,2018;余泳泽和潘妍,2019)的研究均沿用了这种度量方法。然而在县级层面,城镇居民人均可支配收入的数据并不可得,官方统计年鉴只公布了2014年之前城镇在岗职工平均工资的数据,因此本文参考刘冲等(2013)、雷根强等(2015)和谭之博等(2015)的做法,以城镇在岗职工平均工资与农村居民人均纯收入的比值衡量城乡收入差距,并且将样本时间范围限定为2000—2014年。虽然该指标与统计局的计算指标存在偏差,但既有文献(雷根强等,2015)利用省级数据发现,两种指标的相关系数超过80%,且在1%水平上显著,所以该指标依然具有一定的代表性。
(2) 核心解释变量:西部大开发。本文以虚拟变量来表示西部大开发变量,如果某县区实施西部大开发战略,则取值为1,否则为0。自2000年以来,西部大开发战略的实施范围一直未变,这意味着本文的核心解释变量不随时间而变。因此,在方程(1)关于个体固定效应的控制中,本文参考雷根强等(2015)、马光荣等(2016)的做法,控制了省份固定效应。
(3) 驱动变量:县区到边界线的距离。鉴于RD模型设定的需要,处理组县区(边界线左侧)的距离取正值,控制组县区(边界线右侧)的距离取负值。关于最短距离的测算,本文使用了两种方法:一是以辖区质心到边界线的最短距离来衡量;二是以县政府所在地(行政中心)到边界线的最短距离来衡量。由于既有文献(Chen et al.,2013;Ebenstein et al.,2017;Ma et al.,2017)普遍使用了第一种方法,因此下文实证以第一种方法为主,第二种方法则作为稳健性检验。
(4) 控制变量。为了控制其他变量对城乡收入差距的影响,本文参考陈斌开和林毅夫(2013)、雷根强等(2015)、刘贯春(2017)、Chen et al.(2018)、谢冬水(2018)、余泳泽和潘妍(2019)的研究,引入如下控制变量:产业结构、人口密度、城镇投资、金融发展、教育水平、财政收入、人均收入的一次方项和平方项。关于控制变量的度量,产业结构以第二产业增加值占GDP的比重衡量;人口密度以各地区年末人口总数与辖区面积比值的对数衡量;城镇投资以城镇固定资产投资占GDP比重衡量;金融发展的度量遵循陈诗一和陈登科(2018)的做法,以人均金融机构各项贷款余额的对数衡量;教育水平以中学生人数占总人口比重衡量;财政收入以人均金融机构各项贷款余额的对数衡量;人均收入以各地区人均实际GDP的对数衡量。表1报告了主要变量的变量定义和描述性统计。与既有使用县级面板数据的文献相比,变量分布并未发现明显差异,均在合理范围之内,从而保证研究数据的可靠性。
表1 各变量的定义和描述性统计分析
在进入断点回归分析之前,本文先以图形的方式直观地展示县区到边界线的距离与城乡收入差距之间的关系(见图2)。图中的垂直线代表是否实施西部大开发战略的分界线,分界线右侧表示处理组,左侧为控制组;散点代表在箱体范围内城乡收入差距的平均值,使用平均值进行拟合能够更好地避免原始数据的噪音;曲线代表对边界线两侧的散点进行非线性回归所得到的城乡收入差距的拟合值。容易看到,在边界线处,处理组县区的城乡收入差距存在明显的向上跳跃,这说明实施西部大开发战略县区的城乡收入差距要明显高于未实施地区。根据图2的结果,城乡收入差距存在明显的断点,初步证明处理变量和结果变量的因果关系,下文实证分析将对这一关系进行详细的探讨。
图2 边界线两侧城乡收入差距的跳跃
表2报告了西部大开发对城乡收入差距影响的基本回归结果。作为参考,第(1)列至第(2)列给出了利用OLS方法的估计结果。可以发现,在控制省份和年份固定效应之后,西部大开发的估计系数为正,且在1%水平上显著,说明西部大开发战略显著扩大城乡收入差距。进一步纳入控制变量,西部大开发的估计系数有所下降,但依然显著为正。在此基础之上,表2第(3)列至第(8)列给出了利用RD方法的局部线性回归的估计结果,依次是三角内核、Epanechnikov内核和均匀内核的模型设定。回归结果表明,无论模型采取何种核函数,以及是否包含控制变量,西部大开发的估计系数在六类模型中均大于零,且通过1%的显著性水平检验。这说明西部大开发战略总体上不利于缩小城乡收入差距,一致于邵传林(2014)的研究结论,意味着西部大开发战略对城乡收入差距具有扩大效应,存在“政策陷阱”。从估计系数的数值上看,在给定其他条件不变的情况下,相比于控制组县区,实施西部大开发战略的县区的城乡收入差距平均提升1.60~1.68。由于城乡收入差距在样本期间的均值为5.27,这一估计系数表明西部大开发战略扩大了城乡收入差距30.4%~31.9%,因此扩大效应在经济意义上也十分显著。
表2 西部大开发对城乡收入差距影响的基本回归结果
注:括号内数值为聚类到县区层面的稳健标准误,*、**、***分别表示10%、5%、1%的显著水平。
从研究结论上看,本文发现西部大开发战略不利的方面,从城乡收入差距的视角呼应了下列文献。刘瑞明和赵仁杰(2015)发现,西部大开发战略降低了西部地区的人力资本水平,阻碍了产业结构调整;冯俊诚和张克中(2016)发现,西部大开发战略导致西部县级政府规模大幅扩张;Ma et al.(2017)发现,西部大开发战略并没有提升TFP,甚至降低企业利润率和专利数量,以及降低地区劳动增长率;袁航和朱承亮(2018)发现,西部大开发战略并未促进产业结构高级化;罗鸣令等(2019)发现,距离西部大开发边界线越近的地区,税基流失越明显,证实了区域性税收优惠政策存在负外部性。因此,中央政府在实施区位导向性政策时,要谨防优惠政策由“馅饼”演变成“陷阱”。
对于控制变量而言,二产比重显著加剧城乡收入差距,符合于经济直觉,从侧面折射出优先发展重工业的战略是中国城乡收入差距扩大的重要原因(陈斌开和林毅夫,2013)。人口密度的估计系数显著为负,说明人口密度越高,越有利于促进城乡收入差距的收敛。这可能是因为,人口密度可以提升人际间人力资本和劳动技能的正向溢出效应,有利于推动城镇居民和农村居民之间的收入水平收敛,从而缩小城乡收入差距。城镇投资对城乡收入差距的影响表现为扩大作用,说明城镇投资所引致的高附加值投资主要集中在城市,提高了城镇居民收入,从而加剧城乡收入差距。金融发展和中学生比重的估计系数并不显著,说明两者并不是中国县区城乡收入差距扩大的主要原因。人均财政收入与城乡收入差距呈正相关关系,这可能是因为人均财政收入越高,县区地方政府财政压力越小,越有动力和能力倾向于实施城市偏向的各种政策。人均收入的一次方项显著为负,平方项显著为正,说明样本期内人均收入与城乡收入差距之间存显著的U型曲线关系,即城乡收入差距随着经济发展先下降后上升,一致于陈斌开和林毅夫(2013)、谢冬水(2018)的研究结论。这意味着在经济发展起步阶段,农村居民收入增加更快从而缓解城乡收入差距;随着经济发展水平不断提升,具有较高劳动技能和能力的农村居民很可能转变为城市居民,进而导致城乡收入差距被进一步拉大。上述结论反映出城乡收入差距并不会随着经济发展而自然地缩小。
使用断点回归进行因果识别需要满足以下假设条件:局部随机化假设和连续性假设。局部随机化假设认为,经济个体无法精确操作驱动变量。由于本文采用的是地理断点,每个县都可以在地图上做出非常清晰的定位,因而不存在边界线附近右侧某个县为了享受西部大开发战略,事前将其人为划分为边界线左侧。同时,这也是地理断点回归设计的特色之一(Keele and Titiunik,2015)。
第二个识别假设是连续性假设,意为除了西部大开发战略,其他所有影响城乡收入差距的因素在边界线处都连续。若不满足该假设,那么RD模型的估计结果还捕获了其他变量对城乡收入差距的影响,即城乡收入差距的跳跃并不能归因于西部大开发战略,从而导致本文的估计偏误。遵循Meng(2013)、雷根强等(2015)、王丽艳和马光荣(2018)等文献的一般做法,本文利用RD模型检验控制变量的连续性。表3报告了三角核函数下局部线性回归的结果。可以发现,在以八个控制变量为被解释变量的回归中,西部大开发的估计系数均不显著,这说明各控制变量在边界处均无显著差异,不存在跳跃,满足假设条件,具有连续性。这可能的原因是,虽然西部大开发边界线绝大部分与省份边界线重合,但是绝大多数省份不以大山脉、大江大河作为界线(Ma et al.,2017)。中国当前的省份边界线形成于元朝和明朝,当时统治者为了避免地方政府利用地形优势实现分裂割据,阻止其削弱中央政府的统治力和影响力,从而有意识地打破自然条件的制约,造成犬牙交错的特点(王丽艳和马光荣,2017)。这有力解释了边界线两侧较为相似的经济、人文等特征。
表3 控制变量连续性检验的回归结果
注:括号内数值为聚类到县区层面的稳健标准误;*、**、***分别表示10%、5%、1%的显著水平。
3.4.1 收入差距的区域异质性
上文检验了西部大开发对城乡收入差距的总体影响,然而这种基于样本总体的分析可能掩盖了潜在的区域差异,即西部大开发的城乡收入差距效应在不同城乡收入差距程度的区域可能存在差异。鉴于上述考虑,本文按照城乡收入差距程度将样本平均分为四类,分别是低收入差距的区域(低于25分位点)、中低收入差距的区域(介于25~50分位点)、中高收入差距的区域(介于50~75分位点)和高收入差距的区域(高于75分位点)。
基于上述四类样本,图3绘制了不同分位点样本中县区到边界线的距离与城乡收入差距之间的关系。容易看出,在低、中低和中高收入差距的样本中,处理组县区的城乡收入差距在边界线处存在明显的向上跳跃,一致于图2中总体样本的结果;与此相反,在高收入差距的样本中,处理组县区的城乡收入差距却在边界线处存在明显的向下跳跃,为西部大开发战略在高收入差距的样本中具有缩小城乡收入差距的作用提供了初步证据。
图3 不同城乡收入差距的区域在断点处的跳跃
为了进一步佐证图3所揭示的结论,本文基于三角核函数的局部线性回归方法进行估计,结果见表4。需要提及,由于在低和中低收入差距的样本中,由最优带宽确定的回归观测值较少,因此模型并没有控制省份固定效应。由表4可知,在低、中低和中高收入差距的样本中,西部大开发的估计系数为正,并且在低和中高收入差距的样本中至少通过5%的显著性水平检验,这说明在低于城乡收入差距75分位点的样本中,西部大开发对城乡收入差距具有扩大效应;与此相反,在高收入差距的样本中,西部大开发的估计系数显著为负,这说明在高于城乡收入差距75分位点的样本中,西部大开发对城乡收入差距具有缩小效应。综上,西部大开发对城乡收入差距影响随着收入差距程度的不同而发生变化,在城乡收入差距最悬殊的区域,西部大开发能够显著降低城乡收入差距,一致于图3的结论。
表4 西部大开发对城乡收入差距影响的地区异质性
注:括号内数值为聚类到县区层面的稳健标准误;*、**、***分别表示10%、5%、1%的显著水平。
3.4.2 政策效应的年份异质性
虽然前文基本回归结果提供了西部大开发扩大城乡收入差距的证据,但是这一证据反映的是平均处理效应,从而忽视了不同年份的动态特点。作为国家级战略,西部大开发是实现区域协调发展的重大举措,对地区增长的作用受到配套政策和地方政府执行经验的影响(刘瑞明和赵仁杰,2015)。随着西部大开发战略的逐步实施,相应配套政策渐渐完善,地方政府的政策执行能力也日益增强,可以预期,西部大开发的城乡收入差距效应将存在年份上的异质性。为了检验这种异质性,本文遵循He et al.(2018)的研究思路,对方程(2)利用年份截面数据进行回归,并将每一个年份西部大开发的估计系数及其95%的置信区间绘制在图4中。需要说明的是,由于2000—2001年以及2011—2014年城乡收入差距的缺失值较多,因此本文并没有考察这些年份。
图4 西部大开发对城乡收入差距影响的年份异质性注:(1)RD的估计方法是局部线性回归,核函数是triangular kernel; (2)图中小圆圈为估计系数,虚线为估计系数95%的置信区间;(3)由于2000年和2001年以及2011—2014年城乡收入差距的缺失值较多,因此分年份西部大开发效应的估计并没有考察这些年份。
从图4容易看出,除了2010年,其余年份西部大开发的估计系数均显著大于零,估计值介于1.34~2.26。从时间趋势上看,西部大开发对城乡收入差距的扩大效应整体上呈现先增加后减小的倒U型曲线。具体而言,西部大开发的政策效应在2005年达到波峰;同时,相比于基准回归模型中的平均处理效应(表2),2004—2007年的政策效应高于平均值,而2002—2003年和2008—2010年的政策效应则低于平均值。图4的结论表明,在西部大开发战略处于奠定基础的第一阶段,相比于农村居民收入的增长速度,城镇居民收入的增长速度先快后慢,从而导致西部大开发的政策效应呈倒U型的演变趋势。
3.5.1 参数方法
理论上,RD的估计方法包括参数方法和非参数方法。前文的实证内容均使用的是基于方程(2)的局部线性回归方法,属于非参数方法。为了检验上文结论是否对不同的估计方法保持稳健,本节将使用基于方程(1)的参数方法进行估计,回归结果见表5。其中,第(1)列至第(4)列模型是全样本的多项式回归,多项式阶数分别是四次、三次、二次和一次。可以发现,四类模型中,西部大开发的估计系数在1%的水平上显著为正,并且在数值大小上也与局部线性回归方法的结果较为接近,佐证了上文结论。在此基础上,第(5)列至第(7)列模型进一步限制样本范围,分别设定了1000km、500km和100km三类带宽。关于不同带宽的多项式阶数选择问题,本文参考He et al.(2018)的做法,对于较宽的前两类带宽,本文采取二阶多项式;而对于较窄的100km带宽,本文采取线性回归。回归结果表明,西部大开发的估计系数依然显著为正。因此,参数方法支持“西部大开发对城乡收入差距具有扩大效应”的核心结论,证明上文结论对不同的估计方法保持稳健。
表5 参数方法的回归结果
注:括号内数值为聚类到县区层面的稳健标准误;*、**、***分别表示10%、5%、1%的显著水平。
3.5.2 驱动变量的重新测算
本文属于地理边界的断点回归设计,而驱动变量的测算涉及“面(县区)”到“线(边界线)”的最短距离问题。为了检验上文结论是否受到驱动变量不同衡量方法的影响,本文进一步以县政府所在地到边界线的最短距离进行稳健性检验。究其原因,某一地区县政府所在地往往是该地区的行政中心,资本、劳动力等经济要素往往围绕行政中心流动。表6报告了相应的回归结果。其中,第(1)列至第(3)列模型使用局部线性回归方法,第(4)列至第(8)列模型使用参数回归方法。可以发现,无论模型采取何种核函数,抑或是各种多项式阶数和不同带宽设定,西部大开发的估计系数在八类模型中均显著大于零,且在数值上也较为接近,表明上文结论对不同驱动变量的衡量方法保持稳健。
表6 驱动变量重新测算的回归结果
注:括号内数值为聚类到县区层面的稳健标准误;*、**、***分别表示10%、5%、1%的显著水平。
3.5.3 排除国家贫困县的样本
1994—2000年,中国实施了由政府主导的“八七扶贫攻坚计划”,确定了592个国家贫困县。该计划使中央和省级政府明显提升对贫困县的转移支付力度,从而促使贫困县获得更多的财力支持(毛捷等,2012),显著提高了农村居民人均收入(Meng,2013)。2001年,国务院扶贫领导小组颁布了《中国农村扶贫开发纲要(2001—2010)》,重新认定了贫困县名单,取消沿海发达地区的县,增加中西部地区的贫困县数量,并保持总数不变。考虑到贫困县主要位于西部地区的事实,各级政府对贫困县的支持政策可能“污染”西部大开发的城乡收入差距效应。鉴于此,本文剔除国家贫困县的样本重新进行回归,估计结果见表7。可以发现,在局部线性回归模型和参数回归模型中,西部大开发的估计系数均显著大于零,支持前文的核心结论。
表7 剔除国家贫困县的回归结果
注:括号内数值为聚类到县区层面的稳健标准误;*、**、***分别表示10%、5%、1%的显著水平。
3.5.4 考虑政策外部性
虽然上文检验了断点回归的有效性,但是如果西部大开发的相关政策产生了某些外部性,那么将会威胁到本文的研究结论。也就是说,西部大开发的相关政策只能影响到处理组的县区,而不能影响控制组的县区。一旦位于边界线以东的企业为了享受西部大开发的优惠政策,而将资本、劳动力等生产要素迁移到边界线以西的处理组县区,那么则产生了外部性效应。事实上,2001年西部大开发地区开始实施税收优惠政策,其中以企业所得税优惠力度最大,税率降低54%。这种税率差异导致西部大开发地区成为“税收洼地”,从而导致生产要素由高税率地区流向低税率地区。罗鸣令等(2019)证实,西部地区税基的增长是以相邻地区的税基流失为代价,即税收优惠政策存在负外部性。
理论上,政策外部性的大小与企业离边界线的距离紧密相关。这是因为,企业离边界线的距离越远,迁移成本则越高。企业是否迁移的最终决策取决于迁移后享受政策优惠的正效应与迁移成本负效应的综合作用。基于上述思路,本文参考Ma et al.(2017)、Ehrlich and Seidel(2018)的做法,排除靠近边界线两侧的观测值以避免由于企业迁移而导致的外部性效应。表8报告了剔除距离边界线50km和100km之内的观测值之后的回归结果。可以发现,十二类模型中,西部大开发的估计系数均显著大于零,依然支持前文的核心结论。这说明,本文结论不太可能被边界处的政策外部性所驱使。
3.5.5 考虑中部崛起战略的影响
本文的识别策略是,比较毗邻西部大开发边界线左右两侧县区的城乡收入差距的差异。一个潜在的假定是,边界线右侧的县区不受西部大开发政策的影响。事实上,自中央政府2000年实施西部大开发战略以来,东部地区优先发展和西部地区加快发展导致了中部地区的“塌陷”现象,形成了经济发展速度的“洼地”。为改善这种发展趋势和促进中部地区发展,中央政府于2004年提出中部崛起战略,随后国务院于2006年颁布实施《关于促进中部地区崛起的若干意见》,标志着中部崛起战略正式启动。从发展战略性质上看,中部崛起战略亦属于国家层面的区位导向性政策,这可能导致中部崛起战略具有西部大开发战略类似的功能。换句话说,中部崛起战略有可能“污染”本文的控制组,进一步导致西部大开发战略的政策效应的偏误。鉴于此,本文采取两种手段进行处理:一是使用中部崛起战略实施之前的样本,即使用2000—2005年的样本;二是排除实施中部崛起战略的县区,即删除山西、安徽、江西、河南、湖北和湖南中部六省下辖的县区。表9报告了相关回归结果,可以发现,十六类模型中,西部大开发的估计系数均显著大于零,依然支持前文的核心结论。这说明,本文结论并没有受到中部崛起战略的威胁。
3.5.6 安慰剂检验
虽然上文证明可观测的控制变量在边界处满足连续性假设,但依然可能存在某些影响城乡收入差距不可观测的变量,而它们是不能被直接检验的。为了排除西部大开发对城乡收入差距的影响受到遗漏变量干扰的可能性,本文参考Ma et al.(2017)的做法,通过设置假的边界线进行安慰剂检验。具体而言,本文首先将真实边界线向西移动200km,并将带宽设定为100km。如此,假的处理组和假的控制组均位于真实边界线以西,均享受西部大开发政策,因此不应该观察到“假边界线”两侧城乡收入差距存在差异。表10第(1)和(2)列分别报告了以质心和行政中心测度驱动变量的估计结果。可以发现,假的西部大开发的估计系数均不显著,说明“假边界线”两侧城乡收入差距不存在差异。类似上述操作,本文将真实边界线向东移动200km,并将带宽设定为100km,使回归样本均位于真实边界线以东,估计结果见表10第(3)列和第(4)列。可以发现,假的西部大开发的估计系数依然不显著,再次凸显本文结论的稳健性。
表8 考虑政策外部性的回归结果
注:括号内数值为聚类到县区层面的稳健标准误;*、**、***分别表示10%、5%、1%的显著水平。
表9 考虑中部崛起战略影响的回归结果
注:括号内数值为聚类到县区层面的稳健标准误,*、**、***分别表示10%、5%、1%的显著水平。
表10 安慰剂检验的回归结果
注:括号内数值为聚类到县区层面的稳健标准误,*、**、***分别表示10%、5%、1%的显著水平。
上文实证内容识别了西部大开发与城乡收入差距之间的因果关系,但还没有提供证据解释西部大开发加剧城乡收入差距的背后原因。由于城乡收入差距是以城镇在岗职工平均工资与农村居民人均纯收入的比值来衡量,因此本文参考雷根强等(2015)的思路,分别考察西部大开发对城镇居民收入与农村居民收入的影响。具体做法是,以城镇在岗职工平均工资与农村居民人均纯收入分别代替方程(1)和方程(2)中的被解释变量进行回归。
图5 边界线两侧城镇居民收入的跳跃
图6 边界线两侧农村居民收入的跳跃
在进入断点回归分析之前,图5和图6分别绘制了县区到边界线的距离与城镇居民收入、农村居民收入两两之间的关系。容易看出,在边界线处,处理组县区的城镇居民收入存在明显的向上跳跃,这说明实施西部大开发战略县区的城镇居民收入要明显高于未实施地区;与此相反,处理组县区的农村居民收入存在明显的向下跳跃,这说明实施西部大开发战略县区的城镇居民收入要明显高于未实施地区。根据图5和图6的结果,城镇居民收入和农村居民收入均存在明显的断点,初步证明西部大开发增加了城镇居民收入,而减少了农村居民收入,从而导致西部大开发对城乡收入差距呈扩大效应。
为了进一步佐证图5和图6所揭示的结论,本文使用断点回归方法进行估计。表11报告了西部大开发对城镇居民收入影响的回归结果。可以发现,无论模型采取局部线性回归方法,还是采取参数回归方法,西部大开发的估计系数在八类模型中均在1%的水平上显著大于零,说明西部大开发显著提升了城镇居民收入。从估计系数的数值上看,在给定其他条件不变的情况下,相比于控制组县区,实施西部大开发战略的县区的城镇居民收入平均提升0.16左右。
表11 西部大开发对城镇居民收入影响的回归结果
注:括号内数值为聚类到县区层面的稳健标准误;*、**、***分别表示10%、5%、1%的显著水平。
与此同时,表12报告了西部大开发对农村居民收入影响的回归结果。可以发现,在局部线性回归模型和参数回归模型中,西部大开发的估计系数均小于零,且至少在5%水平上显著,说明西部大开发显著降低了农村居民收入。从估计系数的数值上看,在给定其他条件不变的情况下,相比于控制组县区,实施西部大开发战略的县区的农村居民收入平均降低0.10~0.16。
表12 西部大开发对农村居民收入影响的回归结果
注:括号内数值为聚类到县区层面的稳健标准误;*、**、***分别表示10%、5%、1%的显著水平。
综上,西部大开发显著提升了城镇居民收入,而显著降低了农村居民收入,这是城乡收入差距扩大的背后原因。这一研究结论对于不同估计方法、不同核函数、不同多项式和不同带宽设定都保持稳健性。究其原因,西部大开发各种政策均指向基础设施投资和促进工业化发展,尤其是重工业部门和资本密集型部门的发展,而较少支持农业和服务业部门的发展。例如,中央政府鼓励发展的440个制造业之中,重工业行业有381个,轻工业行业有59个,而服务业行业只有28个(Ma et al.,2017)。正是基于这种政策导向,相比于农村居民,城镇居民从西部大开发战略中获益更多。这也呼应了既有文献的观点,鼓励资本密集型部门等重工业优先发展的政府战略是城乡收入差距扩大的重要原因之一(陈斌开和林毅夫,2013)。
为了进一步分析西部大开发加剧城乡收入差距的原因,本文从影响城镇居民收入和农村居民收入的产业发展水平和从业人员数量两方面进行考察。基于数据的可获得性,本文检验了西部大开发战略对三大产业发展以及单位从业人员、乡村从业人员的影响,并选取了六类变量,分别是人均第一产业增加值增长率、人均第二产业增加值增长率、人均第三产业增加值增长率、单位从业人员、乡村从业人员和农林牧渔业从业人员,其中后三类变量均取对数。
表13报告了西部大开发对三大产业发展和不同职业从业人员影响的回归结果。可以发现,在局部线性回归模型和参数回归模型中,西部大开发显著抑制了第一产业的发展,而显著促进了第三产业的发展,对第二产业的影响并不显著;同时,西部大开发显著降低乡村从业人员数,而对单位从业人员数的影响并不显著。由于农村居民收入与第一产业发展水平、乡村从业人员数紧密相关,而第二三产业发展水平以及单位从业人员数直接关系到城镇居民的收入状况,因此上述结论提供了西部大开发不利于农村居民收入的证据,同时西部大开发可能通过促进第三产业发展水平而提升城镇居民收入。囿于数据的可获得原因,表13给出的证据可能只是间接、侧面和探索性的。
表13 拓展分析的回归结果
续表
注:(1)括号内数值为聚类到县区层面的稳健标准误;*、**、***分别表示10%、5%、1%的显著水平;(2)Panel A和Panel B方程中均包括控制变量、省份固定效应和年份固定效应。
2000年,中央政府对西部12个省份实施西部大开发战略,大力投资基础设施和鼓励发展各类制造业,迄今已经二十年。西部大开发战略作为世界上最大的区位导向性政策,准确评估其政策效果具有重要的理论与实践意义。然而,既有文献较少关注西部大开发对城乡收入差距的影响,并且难以处理两者因果关系识别之中的遗漏变量问题。鉴于此,本文将西部大开发视为一次准自然实验,采用2000—2014年中国2009个县域的面板数据,使用空间断点回归的方法识别了西部大开发与城乡收入差距之间的因果关系。研究发现:(1)整体上,相比于未实施西部大开发战略的县区,实施西部大开发战略的县区的城乡收入差距平均提升1.60~1.68,超过样本均值的30%,意味着西部大开发对城乡收入差距具有扩大效应;(2)西部大开发的城乡收入差距效应在不同城乡收入差距程度的区域存在异质性,在低于城乡收入差距75分位点的区域表现为扩大效应,而在高于城乡收入差距75分位点的区域则表现为缩小效应;(3)从年份动态效应上看,2002—2010年,西部大开发对城乡收入差距的扩大效应呈先增加后减小的倒U型曲线;(4)机制分析表明,西部大开发显著提升了城镇居民收入,而显著降低了农村居民收入,这是城乡收入差距扩大的背后原因。同时,本文研究结论对于不同估计方法、不同带宽设定、不同驱动变量定义,以及在考虑特殊样本与政策外部性的情况下都保持稳健性。
本文的研究对于完善和深化西部大开发战略,切实提升农村居民收入和有效缩小城乡收入差距具有重要的政策含义。一方面,促进城乡要素合理配置,健全城乡协调发展机制。《西部大开发“十三五”规划》强调,按照人人享有的要求,稳步提高城乡居民收入,使西部各族人民群众在共享发展中更有获得感,朝着共同富裕稳步前进。因此,在资源分配的过程中,兼顾效率与公平,不应过度偏颇城市,由偏向城市发展转变为城市与农村协同发展。同时,加强农村基础设施建设,提高农村基本公共服务供给水平,切实实现城乡之间公共服务的均等化。另一方面,各级政府应努力提高西部地区农村居民收入。以农村“扶贫攻坚”和“乡村振兴”战略为契机,全面落实强农惠农富农政策,努力发展农村事业和乡村产业,实施“科教兴农”发展战略,加强农村劳动力培训以提升农村居民人力资本,进而提高西部农村居民的实际收入。由于西部地区集中了大量的革命老区、少数民族地区以及边疆地区,也是国家级贫困县的聚集地,所以提高西部地区的农村居民收入对于打赢脱贫攻坚战具有重要意义。