文/叶成城
在社会科学中,方法论的争论是如此普遍而纷杂,尤其是政治学界普遍认为存在两种完全不同的范式,即定性方法论范式和定量方法论范式,二者之间存在激烈的争论。这类方法论的争端与辩论很大程度上来自加里·金(Gary King)、罗伯特·基欧汉(Robert Keohane)和悉尼·维巴(Sidney Verba)(以下合称“KKV”)所合著的《社会科学中的研究设计:定性研究中的科学推论》一书的讨论。金等人在著作里的讨论及对其的批判,事实上存在两种类型的错误,一定程度地导致了方法论研究的困惑,因此有必要予以澄清。
第一种误区认为,定性研究和定量研究是同一种研究方法,两者之间的差异仅仅在于样本数量。KKV的这类错误实质上是由于将定量方法作为主要标准,并试图将这类标准推广到定性研究的领域。第二种误区则处于另外一个极端,它认为定量研究和定性研究是两种截然不同的研究方法。KKV第一种误区中的许多问题,已经在所谓的“后KKV时代”得到一定的解决。但KKV的绝大多数批评者们过于强调两者之间的差异,反而导致较少地讨论这些方法背后逻辑的相通之处。
本文的目的在于通过探究各类方法理论背后的逻辑,讨论各类研究方法的优势和劣势的逻辑根源,借此重新审视KKV和后KKV时代对于方法论的误区和偏见,从而打破定量和定性研究之间的隔阂。本文试图以科学的研究设计为出发点,探讨理论构建过程中的逻辑、样本与方法的考量。
由于社会科学多数情况下无法进行大规模的重复实验,因此社会科学的核心思想是通过控制变量来达到准实验状态,这需要通过案例比较来实现。比较是控制变量和建立变量间普遍性关系的方法,它是一种归纳推理。约翰·斯图亚特·密尔(John Stuart Mill)最早在他的《逻辑体系》一书中提到了归纳推理的“密尔五法”,分别是求异法、求同法、求同求异法、共变法和求余法。
(一)求异法即通过最小化差异来求异。求异法核心逻辑是,在其他条件一致时,导致结果不同的差异即为原因。求异法成立的前提是严格的准实验状态,否则就可能因为无法消除竞争性解释而降低理论的可信度。求异法的优势在于可以依赖较少的案例,而其缺陷在于很难找到两个只有条件不同而其他因素都一样的案例。因此,研究者在最大程度地控制差异之后,往往还需要解释为什么其他的差异(竞争性解释)并不重要。
(二)求同法即通过最大化差异来求同,其核心逻辑是在其他条件都具有极大差异的情况下,如果仍然能够达到相同的结果,事物间的共性即为其原因。求同法的优势在于其能够在存在较大差异的时候仍然维持较少的变量。但求同法是密尔方法中逻辑较弱的一种方法,其缺陷在于,如果无法说明其他因素不重要,由于无法解决变量和结果之间存在的“多重因果性”,即各类变量/原因相加导致的相同结果,就会降低理论的解释力。
(三)由于求同法的逻辑较弱,密尔提出了求同法和求异法的共同使用,即在小组内部求同,在小组之间求差异。假设将案例分为两组:在其中一组中,因素A出现(记作A),而在另一组中,因素A不出现(记作~A)。在这两个小组之间使用求异法,即只有A的差异而其他因素不同,最终它们导致了不同的结果;与此同时,小组内部虽然其他因素存在较大的差异,但是因为共同原因A又达成了相同的结果,这时认为A是结果Y的原因就具有较强的说服力。
(四)共变法是通过控制其他条件不变,观察到A和Y共同发生变化,可以认为两者之间存在因果性或者是共同原因导致了变化的一致性。在自然科学中,研究者可以通过控制和重复试验,明确观察到A和Y之间的因果性;但是在社会科学中,研究者往往只能事后通过既有数据进行判断,因此只能观测到相关性。共变法往往无法直接区分因果倒置和内生性问题,同时也无法区分伪相关,因为自变量和因变量之间的相关性可能是共同原因导致的,而两者之间不存在因果关系。
(五)求余法即认为存在原因A+B+C导致了结果a+b+c,如果可以确信A是a的原因,而B是b的原因,则可以推断C是c的原因。上述四种方法本质上属于归纳法,而求余法则存在演绎逻辑,需要通过推理得出结论。求余法在个案的研究中存在较大的优势,可以通过排除法迅速找到现象的原因。求余法同样存在一定的局限,它需要基于原因之间互相独立的假设,即原因A、B、C之间不存在互相干扰,否则就无法通过排除法进行推理。
前文阐述了案例研究的基本逻辑,在此基础上文章进一步讨论案例比较的方法。对于案例选取的规则恰恰是基于对第二部分所述的各类研究方法的优势和缺陷。在案例选择中需要避免三个方面的错误。第一,避免简单的举例法。事实上,多数情况下我们总能够找到符合理论的例子,当然这种“理论”也往往会存在诸多反例。第二,避免基于“情怀”或者便利的案例选择。要在对总体的样本和理论把握的前提下,依据最小化差异的原则进行筛选,否则,就有可能会出现无法满足最大相似性的情况,从而损害了案例比较的因果解释力。第三,避免只关注重大事件。没有发生的事件——往往是反面案例——同样重要。
在确立了研究的基本问题之后,恰当的案例选取是实证研究的核心环节,而案例本身的特征也决定了采取何种研究方法,需要以问题而非研究方法为导向。问题性质和时空范围的限制往往已经决定了可以选择的样本数量,而样本数量又进一步限制了研究方法的选取。
根据样本数量的多少,研究类型分为单案例研究、小样本研究、中等样本研究和大样本研究。首先,单案例研究往往因为案例的特殊性较强,缺乏相似的案例进行比较,因此只能进行个案研究进行深度挖掘,通常采用过程追踪的方法。单案例研究的作用是发现理论,其优势是可以具备更加细致的过程追踪,但所发掘的理论的推广性是有限的。其次,小样本研究更加注重案例本身的细节,以“深度”见长。小样本研究通常采用定性分析的方法,它更容易发现和提出理论假说,也可以借助控制变量法来检验理论。再次,中等样本的研究是查尔斯·拉金(Charles Ragin)所提出的,认为用定性比较分析(Qualitative Comparative Analysis,QCA)可以解决案例研究和回归分析无法解决的中等样本,即样本数量在12~30之间的情况。中等样本研究更加重视样本的同质性和外部效度,往往只能够检验假设,通常不能直接产生机制性的解释。最后,大样本研究通常需要样本数量大于30,更加具备广度。大样本研究建立在同质性假设的基础上,它更加重视样本的外部效度和平均效应,因此它只能够进行统计推断。
表1 案例数量和研究特性
不同的样本量涉及不同的研究方法,单案例、小样本、中等样本和大样本研究分别对应了过程追踪、质性比较、QCA和定量分析四种方法。
(一)单案例与过程追踪。詹姆斯·马奥尼(James Mahoney)提出了过程追踪中的几个基本步骤,包括了三种检验方式,分别是寻找线索、进行必要性检验和进行充分性检验。大卫·科利尔(David Collier)总结了过程追踪的四个基本步骤:首先,通过可疑线索提供研究基础;其次,通过必要性检验来排除不可能的原因;再次,寻找充分条件确定假设;最后,综合此前的线索推理得出充分必要条件。
(二)质性比较往往用于小样本研究,步骤大致如下:(1)声明案例选择的理由(排除无关案例);(2)列出变量的类型交叉表格;(3)区分案例的作用,对正面案例和负面案例进行对比,检验结果是否在正面案例中出现,而在负面案例中不出现;(4)解释与理论预期不相符合的反例;(5)通过过程追踪来明晰从自变量到因变量的因果机制。由于观测值较少,忽略案例内部特性的讨论往往缺乏足够证据,它需要以案例内部的深度挖掘为主,通过过程追踪强化因果解释。例如X→Y只有1~3个样本,可信度不高;但是如果在这几个案例中都形成证据链,并在因果链上都能找到证据,解释的有效性就大大增强了。
(三)定性比较分析更重视案例间的平均效应,在中等样本并且存在较多解释变量时,定性比较分析能够提供有效的分析。定性比较分析结合定性和定量分析两种方法的长处,将研究的各个案例都视作整体,并分析案例中的解释条件及其组合,从而有效处理蕴涵在案例中的复杂因果关系。QCA在政治学和历史社会学领域使用得更为广泛,主要方法有清晰集分析、模糊集分析和多值分析,主要处理自变量和因变量全部都是虚拟变量的数据,而模糊集理论的运用则一定程度使其可以处理连续变量。QCA的步骤是一个寻找近似充要条件的过程。首先,需要对单个变量进行必要性检验,通常非A相对于非Y的吻合度大于0.9即可以将A视为必要条件;其次,剔除作为必要条件的变量和不具备必要条件的样本重新检验,察看结果出现可能性最高的组合,寻找此前提下的充分条件;最后,结合充分和必要条件,通过布尔代数合并充分条件,计算出最后的充分必要条件。
(四)定量分析是经济学和社会学中最为常用的方法,它的基本逻辑是基于共变法和对频数的统计。定量分析通常是基于推断性统计,回归分析则是最为常见的定量方法之一,大致分为五个步骤。第一,确定研究问题的自变量和因变量,形成待检验的假设。第二,测量变量和生成数据之后,对数据进行处理和描述性统计,例如给出变量之间的相关系数、方差、极值等数据。第三,建立统计模型进行参数估计和假设检验。以t检验为例,在控制了基本变量后,如果自变量的系数为0的概率低于一定程度(如0.05或者0.01),则可以认为能够拒绝原假设,从而证实其结论。第四,对检查模型结果进行稳健性检验,通过变换测量方式和控制变量察看模型是否稳健。第五,对统计结果进行分析,通常情况下,由于定量分析往往只能解释原因和结果之间的相关性,对于结果的分析往往依赖于理论和专业知识。
需要看到的是,上述四种研究方法的逻辑是不一致的。个案追踪和小样本比较都可以视作是定性研究,而QCA和回归分析则更接近于定量研究。定量研究依赖于数据集的观测值(Data-Set Observation,DSOs),而定性研究则更加依赖于因果过程的观测值(Causal-Process Observation,CPOs)。这种逻辑的差异也导致了定性研究和定量研究在样本选择上的差异。后者通过随机性使定量分析的残差符合正态分布,因此强调选择的随机性和无偏性;而前者则是基于对因果机制的探索,事实上很多对“半负面案例”的选择不可避免地会带来样本选择偏差。
在这些方法中,过程追踪和质性分析更加偏向于案例内部效度,它们的差异在于,质性分析一定程度依赖案例间的比较得出因果推断,但是离开了对案例的深入研究来谈平均效应,质性分析会出现“小样本谬误”。QCA和定量分析更重视案例间的平均效应,即通过统计自变量的频数来讨论它们对于因变量的平均影响。而QCA和定量分析的差异在于对频数的统计,QCA重在寻找类型组合导致结果出现的概率;而定量方法如回归分析则建立在高斯分布的基础上,通过拒绝自变量系数为0的原假设来确立自变量对因变量的影响。
前文所述的四种样本类型对应了四种基本方法,但是这种对应和界线并不是绝对的。这四种方法各自都存在一定的缺陷,这种缺陷源自它们对应的密尔方法,采用混合方法可以一定程度上弥补各自的缺陷和增强解释力。
混合方法通过结合或者部分结合定量和定性方法来避免单一方法的缺陷。混合方法的主要目的包括寻求不同方法的研究结果的聚合、扩大特定项目的广度和范围、互相补充或者发现悖论、通过不同方法推进研究等。对于不同混合策略的选择,往往也受到样本特性的影响,例如在样本较大时,定量研究的优势会更加明显,反之亦然。
无论是定量还是定性方法都有着各自的优点和局限,在使用任何一种方法或者混合方法时,研究者都要明白它们的适用范围,而样本数量和样本特性则是对适用范围最基本的限制。社会科学中的研究设计,既是一门科学,也是一种艺术。一方面,社会科学有严格的内部逻辑过程,具有一定的操作程序和流程,通过数据集和因果过程的观测值作为实证证据可以增加因果分析的可信度,即尽可能地提高X是Y的原因的可能性。另一方面,社会科学又是一门艺术,科学方法也仅仅是诸多研究方法中的一种。研究者对于研究问题和解释变量的选择,往往受到自身的经历、价值观念或者语言文化背景的深刻影响。研究论文本身也有篇幅的限制,无法穷尽方法和案例,因此如何进行谋篇布局也需要经验和艺术。