基于因果推断的反事实测评技术研究

2022-04-20 06:15:47张建军孙成金吕海燕

河南科技 2022年5期

张建军孙成金吕海燕

摘要：因果推断一直是经济学领域关注的重点，由Fisher创立的对照试验法是进行因果推断的黄金标准，然而，在许多领域，特别是社会科学研究中，公共政策很难实现随机对照试验，得到的往往是观察性数据。因此，采用反事实测评技术获得对照组，是解决社会科学研究领域因果效应问题的关键。笔者利用截面数据间存在的共同驱动因素，采用逐步回归方法研究了因果推断的反事实测评技术，并以河南省公共政策为例，计算得到了政策执行后的净效应，为评估公共政策效应提供了量化评价方法。

关键词：因果推断;公共政策;反事实;逐步回归;测评

中图分类号：F224.9 文献标志码：A 文章编号：1003-5168（2022）5-0145-04

DOI：10.19968/j.cnki.hnkj.1003-5168.2022.05.033

The Counterfactual Evaluation Technology Based on Causal Inference

ZHANG Jianjun SUN Chengjin LYU Haiyan

（Collage of Information and Management Science of Henan Agricultural University， Zhengzhou 450002，China）

Abstract： Causal inference has always been the focus of attention in the field of economics， The control experiment founded by Fisher is the gold standard for causal inference. However， it is difficult for public policy to realize randomized controlled trials especially in social science research， and the results are often observational data. Therefore， the use of counterfactual evaluation technology to obtain the control group is the key to solve the problem of causal effect in the field of social science research. This paper studies the counterfactual evaluation technology of causal inference based on the common driving factors between cross-sectional data and stepwise regression method. The author calculates the net effect after the implementation of the policy taking the public policy of Henan Province as an example， to provide a quantitative evaluation method for evaluating the policy effect.

Keywords： causal inference;public policy; counterfactual; stepwise regression; evaluation

0 引言

因果效應起源于对新药治疗效果的评价，后来被用于评估公共政策实施后的效果。因果效应的评估一般采用简单差分法，即通过比较受影响的群体和没有受影响群体的差异来评估政策效果。然而，由于在对象选择上的偏差，计算的结果往往与真实情况存在一定偏差。例如，考察农村经济合作社产生的减贫效应，对单个农户而言，处理效应就是参与合作社的收入减去假如没有参与合作社的收入。事实上，参与和不参与只能选其一，所以无法得到单个个体的因果效应。Rubin建立了一种潜在结果模型，即每个个体存在两个潜在结果，不同个体潜在结果不同，所以可以将潜在结果视为来自二维总体的一次随机抽样，处理组总体均值减去对照组总体均值被定义为平均因果效应，这样就从总体期望的角度定义了平均因果效应[1]。针对社会科学研究中的因果效应问题，相关文献主要围绕两个方面展开研究。一方面，通过倾向得分匹配（PSM）消除选择性偏差，如张淑辉等采用山西省和甘肃省的调研数据，基于倾向得分匹配和logit模型，对参与农村新型合作组织的农户收入变化进行分析[2];舒扬等采用倾向得分方法研究了雾霾是否促进旅游消费问题[3]。另一方面，利用双重差分法（DID）消除时间增量影响。该方法借助处理组和对照组的观察结果开展研究，不需要建立处理对象的反事实结果。具体过程是，先将处理组政策干预前后的目标值差分，但是没有消除由于时间变化而产生的增量影响，再将对照组也做差分处理，最后，将处理组的差分结果减去对照组的差分结果，这样就剔除了政策干预效果中时间产生的增量。例如，邓蓉蓉等运用双重差分方法实证研究了国家低碳试点对试点城市碳排放绩效的影响效应[4];范红忠等采用双重差分方法估计了高新区建设对城市技术进步的影响[5]。

通过对文献的梳理不难看出，因果推断已经被广泛应用于社会科学研究领域的各个领域，而且越来越受到政府部门和研究者的重视，但仍存在一些问题，如公共政策评估有时候只关注一个地区、一个城市或国家的干预效果，此时其他任何控制个体都与干预个体存在较大差异，无法通过匹配的方法确立对照组。为了解决这一问题，笔者通过合成控制法，借助多元逐步回归建立了处理对象的反事实预测模型，并以河南省扶贫公共政策为例进一步实证分析。本研究的先进性体现在解决了社会科学研究领域因果效应推断中的关键技术问题，建立了政策实践效果量化评价模型与算法，研究成果将为政策实践绩效评价提供理论基础。

1 反事实测评技术的理论分析

1.1 基本假定

对于面板数据，所有横截面单元之间存在一些共同的驱动因素，尽管它们对每个横截面单元的影响程度可能不同，却让同一截面的个体之间产生相关性，因此借助这些相关性，可以建立处理组对象的反事实测评模型[6]。

模型基本假定如下，设[y0it]表示没有政策干预下，第i个单元在t时刻的结果，[y1it]表示接受政策干预的结果，假定这些潜在结果的生成过程为多元因子模型，用式（1）表示。

[y0it=bi′ft+αi+εit（i=1，2，...，N，t=1，2，...，T）] （1）

式中：[ft]表示横截面单元个体之间随时间变化的共同因素向量，[bi′]为不随时间变化但可能随个体变化的常数，[αi]为个体固定效应，[εit]为随机扰动项，满足[E（εit）=0]。

将[t]时刻同一截面的[N]个单元数据写成向量，令[y0t=（y01t，y02t，...，y0Nt）]，[α=（α1，α2，...，αN）]，[εt=（ε1t，ε2t，...，εNt）]，共同因子系数矩阵[B=（b1，b2，...，bN）]，得到方程矩阵形式（2）。

[y0t=Bft+α+εt] （2）

式（2）表明，个体结果由两部分构成：影响所有个体结果的事变共同因子[ft]，个体固定效应[α]以及个体扰动项[εt]。模型存在一些假设：一是个体特质部分之间是不相关的，个体结果之间的相关性主要是由共同因子造成的，但是共同因子對个体的影响可以不同;二是截面个体数大于共同因子数，并且除共同因子之外，个体之间没有溢出效应。

根据式（2）基本假定，第i个单元在t时刻的处理效应定义为：[Δit=y1it-y0it]，然而，不能同时观察到两个潜在结果[y0it]和[y1it]，实际观测结果[yit=ωity1it+（1-ωit）y0it]。

其中，变量[ωit=]0或1，[ωit=]1表示第i个单元在t时刻受到政策干预，否则取0。假设时间[T1]之前没有政策干预，则容易看出[yit=y0it][（t=1，2，...，T1）]，从时间[T1+1]开始，第[p]个单元受到政策干预，则[ypt=y1pt][（t=T1+1，...，T）]，并且假定其余[N-1]个单元没有受到这一政策的干预，即[yit=y0it][（i=1，...，p-1，p+1，...，N， t=1，...，T）]。

如果能识别出模型中的[bi、ft]、[αi ]，则可以利用该模型预测政策干预后的反事实结果。然而，个体固定效应和共同因子都是不可观测的，无法直接估计干预组个体事后的政策效应。由于所有个体受到时变共同因子的影响，事后共同因子的影响将体现在控制组的观测结果中，故可以从事后控制组的观测结果中反推出时变因子，并利用事前干预组观测结果与控制组事前观测结果之间受共同因子影响而造成的相关关系，估计出事后如果干预组个体没有受到政策干预的反事实结果。政策实施后，由于潜在结果[y0pt][（t=T1+1，...，T）]的数据缺失，需要对这一时期政策没有干预下的数据进行预测，利用同一个横截面上的单元受到共同因素的驱动，基于[T1+1]到[T]时段没有政策干预的数据[yit=y0it][（i≠p）]，对目标对象反事实结果进行建模，如果模型拟合效果较好，则可以使用该拟合模型对缺失数据进行预测。

1.2 模型建立

建立最优的回归方程是实现回归合成法的关键，这里的最优通常指模型中包含所有对目标变量影响显著的解释变量，剔除影响不显著的变量，实现这一目标通常有两种方法，一种是全子集法;另一种是最优子集的变量筛选法。2012年Hsiao提出了一种两步法，首先，一次选择[1，2，...，N]个控制组个体进入模型，利用拟合优度值来选择模型;然后，利用模型选择标准，选择最优的模型，选择标准定义为[AIC（p）=T0lne′0e0T0+2（p+2）]，其中[p]为模型中包含的控制组个体数，[e0]为回归残差向量。如果有[m]个控制组进入模型时，共需要估计[CmN]个模型。从计算过程可以看出，该方法属于全子集法的一种，但是计算量很大，而且忽视了变量间的多重共线性[7]。

鉴于此，本研究与现有研究文献不同，采用逐步回归法代替全子集法，研究社会科学领域政策评估中的反事实测评技术，并以河南省扶贫政策为例进行了实证分析，从定量评价视角，为政策效应的合理评估提供理论支撑。

2 反事实测评技术的应用研究

2.1 建立逐步回归方程

本研究以河南省扶贫政策效应为例，基于反事实测评技术进行因果效应的实证分析。首先，选取辽宁省、山东省、广东省、福建省、江苏省、浙江省6个没有贫困县的省份为对照组控制组，并以河南省农村居民纯收入为被解释变量，这六省农村居民纯收入为解释变量，基于1978年到2003年时段数据，建立数学模型，数据来源于河南省统计年鉴。然后，采用多元线性回归进行分析，结果发现解释变量间存在多重共线性，回归系数不满足显著性要求。为了解决这一问题，本研究引入逐步回归数学模型，逐步回归是将解释变量逐个引入模型，对入选的变量再进行t检验，确保每次引入变量回归方程中始终包含显著性变量，最后得到最优的解释变量集。借助SPSS软件，剔除不显著变量，得到显著性检验结果，如表1所示。

根据表1中的检验结果，容易得到拟合方程（3）。

[y=7.223+0.712x1-0.227x2+0.332x3] （3）

式中：[y]为河南省农村居民人均纯收入，[x1]、[x2]和[x3]分别表示山东、浙江和福建的农村居民人均纯收入。

2.2 政策的因果效应

將1978—2003年解释变量的数值代入模型，得到各年份河南省农村居民人均纯收入的拟合值（见图1），计算得到平均相对误差仅为0.023 53，模型拟合精度较高，因此，可以用该模型预测河南省2004—2018年农村居民人均纯收入的反事实数据，并计算各年份因果效应，具体结果见表2。

图2是2004年以来河南省农村居民人均纯收入减去合成河南省人均收入得到的政策效应，从变化曲线可以看出，河南省扶贫政策效应整体呈现平稳提升态势，并逐步放大，特别是2012到2014年，政策扶贫效应变化率最大，出现加速上涨，原因是多方面的，2012年国务院发布了《关于大力实施促进中部地区崛起战略的若干意见》加大了对中原地区的政策支持，河南省的经济发展迎来了前所未有的战略发展期。2016年河南省连续发布了《河南省电网脱贫专项方案》《河南省水利脱贫专项方案》以及《河南省困难残疾人生活补贴和重度残疾人护理补贴实施办法》。随着这些扶贫方案的实施，2016—2018年河南省的扶贫政策处理效应继续呈现加速上扬。但是，这一政策效应在统计上是否显著呢？笔者将采用类似于随机置换检验方法，进一步证明效应评估在政策上的显著性。

2.3 政策效应的显著性检验

为了检验估计的政策效应是否显著，参考Abadie等提出的类似于置换检验的推断方法[8]，从控制组逐一选出作为伪干预对象，接着利用同样的回归合成控制法计算政策效应，可以得到类似于图3的政策效应路径。对于控制组的6个省份，共得到6个政策效应路径。然后观察河南省在图中的分布位置，如果非常极端，说明估计的政策效应是显著的。从图3中可以看出，福建、山东、广东和江苏4个省份扶贫政策出现负效应，而河南省的政策效应位于所有路径分布的极端位置，特别是2014年以后，对照组中没有一个省份的效应路径在河南省上方，因而，可以否定没有政策效应的原假设，证明了河南省扶贫政策效应是显著的。

3 结语

因果效应的评估广泛应用在社会、教育和健康项目实践效果的评估问题上，但是在这些领域很难实现随机对照试验。基于此，笔者利用横截面单元个体之间随时间变化的共同因素，研究了因果效应评估的反事实测评技术，建立了该领域问题的量化评价模型与算法。并以河南省扶贫公共政策为例，进行实证分析，验证了研究方法的有效性和可行性，研究成果将为政策实践绩效评价提供理论支撑。

参考文献：

[1] RUBIN D B. Estimating causal effects of treatments in randomized and nonrandomized studies[J]. Journal of Educational Psychology，1974，66（5）：688-701.

[2] 张淑辉，沈宇丹，高雷虹.合作经济组织扶贫的农户收入效应：基于倾向得分匹配法的实证分析[J].华东经济管理，2018，32（9）：165-172.

[3] 舒扬，伍津钊.雾霾污染促进了城市旅游消费吗：基于澳门博彩旅游和PSM方法的证据[J].经济研究参考，2018（1）：30-40.

[4] 邓蓉蓉，詹晶.低碳试点促进了试点城市的碳减排绩效吗：基于双重差分方法的实证[J].系统工程，2017，35（11）：68-73.

[5] 范红忠，陈洲.高新区建设推动了城市技术进步吗：基于双重差分方法的验证[J].金融与经济，2018（5）：63-66.

[6] HSIAO C H， STEVE C， SHUI K W. A panel data approach for program evaluation： Measuing the benefits of political and economic integration of Hongkong with mainland China[J].Journal of Applied Econometrics，2012，27（5）：705-740.

[7] ALBERTO A， ALEXIS D， JENS H. Synthetic control methods for comparative case studies estimating the effect of california’s tobacco control program[J].Journal of the American Statistical Association， 2010，105（490）：493-505.