耿曙陈玮
作为一个学科领域,“比较政治”最为特殊之处,在其并非以研究主题——例如国际关系、民主转型等——而是依研究方法来界定其学科内涵①这部分可以参考一些讨论比较方法的经典论著,例如阿兰·利普哈特(Arend Lijphart),Comparative Politics and the Comparative Method,American Political Science Review,65:3(Sep.,1971),pp.682-693。其余可以作为入门参考者如:马太·杜甘(Mattei Dogan)&多米尼克·帕莱西 (Dominique Pelassy),How to Compare Nations:Strategies in Comparative Politics,London,Chatham House,2nd.ed.,1990; 马太·杜甘 (Mattei Dogan)& 阿里·卡赞斯吉 (Ali Kazancigil)eds.,Comparing Nations:Concepts,Strategies,Substance,Oxford,UK & Cambridge,MA:Blackwell,1994。介绍到中文世界者,如淦克超编译《政治研究与科学方法》,台北:幼狮出版社1973年版;盖伊·彼得斯(B.Guy Peters)《比较政治的理论与方法》,陈永芳译,台北:韦伯文化出版社2003年版;尼克劳斯·扎哈里亚迪斯(Nikolaos Zahariadis)eds.,《比较政治学:理论、案例与方法》,宁骚、欧阳景根译,北京大学出版社2008年版;马太·杜甘(Mattei Dogan)《国家的比较:为什么比较,如何比较,拿什么比较》,文强译,社科文献出版社2010年版。。因此,比较政治在鼓励跨国的定量研究,又接纳严控的实验研究的同时,对运用“比较方法”的案例研究,更该给予高度重视才是。但倘若考察国际“比较政治”的发展,我们不难发现:定量方法似乎才是时下主流②这部分稍微考察几份比政研究的核心期刊如:World Politics,Comparative Political Studies,Comparative Politics,International Organization,还有其他政治学科期刊如:American Political Science Review,Journal of Politics等所刊登的比政领域论文便知。。那么,中国学者在投身比较政治时——尤其采取比较视角、对话社科理论的“中国研究”时——是否应优先选择定量研究,甚至舍此之外别无它途?
如果把取材于中国经验的比较政治研究,视为广义的“中国研究”①根据一般看法,“中国研究”(China study)属于“区域研究”(area study),而后者则与比较政治研究的范畴重叠,虽然区域研究侧重案例经验,比较政治研究则强调理论建构,其实不妨视两者为同份事业的一体两面。换言之,中国研究可视为中国经验与比较政治理论的接通与对话。,那么,平心而论,后者仍相当落后。首先,比较政治领域中少有源于中国经验的理论或概念;其次,倘若不计“海外华裔”,学科承认的中国学者也是凤毛麟角。更让人遗憾的是,即便在自身“中国研究”领域中,中国学者的贡献也相对有限:方法细密、论证严谨的著作,仍多出自外籍学者之手。鉴于科研成果的落后,国内学界自盼迎头赶上,于是制定各种“赶超”政策——如人才引进、指标考核、提倡方法等,不一而足——但这种“追赶/挤压型”的发展,却也可能造成揠苗助长,盲从国际潮流,轻弃自身优势,结果则邯郸学步,一事无成。
那么,中国学者如何是好?根据“工欲善其事,必先利其器”的原则,中国研究振衰起敝的起点,应该就是咱们的短板:研究方法的选择与强化。有鉴于此,本文将比较定量与定性方法的短长,并推荐灵活易使的“案例方法”②一般而言,定性研究必然借助案例方法,而运用案例方法作为研究设计时,性质上总不脱定性研究的范畴,两者不易截然划分。因此,本文倾向于将两者交替使用,不特别作出区分。,作为学者从事经验研究、建构比较政治理论的利器。但在接受与运用案例方法前,我们必须澄清部分流传广泛的“迷思”(myth),驳斥这些似是而非的信念,藉此确认案例方法的理论意义,并附带说明如何善用方法,建构比较政治理论。
基于上述目的,下文分为几个部分。首先,笔者扼要论证案例方法的优势:认为处于中国研究脉络下,定量方法颇多障碍,案例方法反而别具空间。之后,笔者将澄清几项涉及案例方法的“迷思”。前两项与案例方法的性质有关,分别为“案例与定量的区别何在?”,(第二节),以及“案例与理论的关系为何?”(第三节)。后两节则探讨基于“案例研究”的理论意义③文中“案例研究”即采用“案例方法”的经验研究。,以及如何通过研究设计,发挥其建构理论的功能。因此,笔者将分别探讨“案例研究如何进行控制?”(第四节)以及“案例研究能否加以类推?”(第五节)两个问题。在澄清上述四项方法论的迷思后,笔者呼吁国人反思“是否唯定量为科学?”并平心考察案例与定量方法的各自优势,选择运用于不同的时机与主题,促成比较政治与中国研究的发展、茁壮。
由于社科研究的先进国家,大量运用定量方法,取得了良好的科研成绩,令国内学者艳羡不已。因此,前述学界的“跃进”心态,除了反映在人才引进、发表奖励外,也普遍鼓励学界运用定量方法。国内部分学科的学术期刊,充斥“唯技术论”的倾向:只问方法是否前沿,不论内容有无意义。对于定量分析的泛滥,将定量方法引入社会科学研究的要角邓肯 (Otis D.Duncan),也不免有所感慨:
经常可以看到这种我称之为“统计至上”观 (statisticism)的病态:把“统计计算”与“社科研究”混为一谈,天真地以为统计分析就是科学方法的完备基础,盲目地认为凭统计公式就能检验所有实质理论,或者找到各个“原因”的相对重要 (对“因变量”的相对影响);同时幻想着一旦厘清了那些随意凑合变量间的“共变关系”,就可以因此证明了“因果关系”,而且还能清楚解释了该项“因果关系”④参见谢宇《社会学方法与定量研究》,社科文献出版社2006年版,第7页。。
无论是邓肯,还是乐于引用此语的学者谢宇都表示了他们的担心:定量方法的盲目滥用,往往产生大量的劣质成果,投入全无意义,只是祸枣灾梨。
也就是说,倘若“中国研究”的目的在于提炼中国经验,总结为比较政治的理论,那么,对具备多种方法训练的研究者来说,必非“唯某某方法是用”,更非“只某某方法可依”;相反,学者必须掌握各种工具的优势与局限,贴切地运用于不同的主题与时机。反观中国学界所追求的潮流,却似乎与此背道而驰;自居前沿的社科学者,急于拥抱定量手段,对其他方法弃若敝屣,似乎唯有能力未及者,才愿抱残守缺。但根据作者的观察,在当前“中国研究”的环境中,定量方法经常左支右绌,运用颇有困难;反之,案例方法反而运用自如,能够发挥中国学者所长,不仅足以发掘可喜的成果,更能作为定量研究的前驱。因此,笔者认为,“案例方法”似乎更值得学者留心,将其开发为强化比较政治研究中“中国研究”的凭藉。此处“定量不易,案例先行”的观点,乃是建立在如下几项观察上。
定量方法的运用,最广泛者首推二手数据的分析。西方社科先进,大量运用统计手段,分析各种政府统计数据,取得大量研究成果。但在中国研究领域中,二手数据一般“取得不易”,其原因有如下几项。首先,许多亟须研究的领域,往往不见系统收集的数据。其次,政府或所属研究机构的调查数据,往往未必公开可得。虽然有时也能私下取得,但一则常有人待价而沽,二则此类数据也无法公开复测 (replicate)。最后也最麻烦的是,政府的统计数据未必可信,一则其多来自“层层上报”,但所谓“数字出官,官出数字”,有的单位有意夸大成效,有的则不免暗地短报;二则各地口径未必齐一,搜集过程不够严谨,编排数据时有误谬。
倘若二手数据未必可得,那么自行搜集的一手数据呢?这部分却又往往“耗费巨大”。这首先与中国国家规模有关,论及人口、国土,他国望尘莫及。因此,“照规范操作”的抽样与调查,往往所费不赀。其次,缺乏国家资源与常设机构,调查团队经常临时凑数,调查的落实与材料的核实都比较困难。此外,同样麻烦的是相关单位的事先审核,过程往往旷日费时。因此,中国研究的调查数据经常耗费巨大,成效不彰,曾经参与其间的学者,往往苦不堪言。
除了数据问题外,研究者还面临“训练滞后”的问题。由于仍缺训练有素的师资、适切规划的培养过程,加上并未成熟的学术环境 (如论文审查等),定量研究的学术社群仍处于缓慢成长阶段,未能跨越“量变到质变”的门槛,这也是为何各种劣质定量研究大量产生的原因。
此外,最困难的问题是“概念成形”。一般而言,不同于案例研究的灵活机动,可以且战且走,随时调整,定量研究早在调研开始之前,就必须设定有清晰、稳定而能推广的概念,否则将无法据以搜集数据。但一则由于中国地区差异巨大,二则因为社会变迁快速,三则在各个研究领域中,缺乏可资援引的前期研究,凡此皆不利于“理论概念”的形成与积累,优质的定量研究也就无从开展。今日的研究者多只能乞灵于概念移植,但西方概念均有其形成的脉络,如果硬搬硬套,可能会“失之毫厘,谬以千里”。
我们在汲取、提炼中国经验时,定量方法除上述取得不易、耗费巨大、训练滞后与概念成形等问题外,其他还有对诸如问卷手段的质疑,这与文化习惯、社会信任、当面情分 (social desirability bias)等有关。综合上述难处,虽然西方曾靠定量方法,获致良好成果,但放眼当前的中国社会与科研组织,定量方法往往运用不易。强行采用的结果,就是大量劣质滥造的定量著作 (经常见诸三流的经济学期刊)。但这样的投入是否明智,值得反思与检讨。
相较定量方法的困窘,案例方法却具有明显优势,颇有大展手脚的空间。若与之前所述对照,案例方法具有如下的“相对优势”。首先,针对定量数据“取得不易”的问题。案例研究的素材,往往自行搜集,不必假手他人,而且由于研究者亲身参与,资料素材更可信赖。其次,由于案例研究资料数量较小,仅需小型调查团队,便于运用私人管道,避免“耗费巨大”。此外,也由于调查规模小,不采问卷手段,毋须旷日耗时的行政审核与经费申请。至于“训练滞后”问题,虽然同样困扰学者,但因研究团队较小,切磋成长都容易许多。最后,定量研究最困难的“概念成形”问题,恰能展现案例研究的优势:研究者一面调查探索,一面重构概念,随时引进地方视角、全新理解。换言之,对于案例研究而言,前述四大难题均未构成困扰。从这个角度来看,在当今中国的研究环境中,“中国研究”与“案例方法”间,或许存在某种“选择性的亲好”(elective affinity或Wahlverwandtschaft,韦伯取自化学反应的概念),两者更易彼此提携相辅相成。
当然,话说回来,既然定量方法开展不易,案例方法为何未广受青睐?对此,根据笔者观察,其中症结在“迷思”弄人:案例研究被认为不是社会科学、无法建构理论、研究发现也不能类推适用。但这些“似是而非的信念”究竟从何而来?其实多来自案例/定性研究者自己的论述。对此,笔者曾经考察涉及案例或定性研究的方法著作,发现其大概不出如下几类。首先为“实践型”的方法著述,多数取材于自身经验,同时提出个人建议。其次为“理论型”的方法讨论,经常“扯起虎皮做大旗”,摭拾各种“反实证”思潮——从诠释理论到象征互动,从人类学到后现代——多就哲学层面发挥,讨论也都高来高去,研究本身着墨不多。
当然,也有少数著作结合实践与理论,且能条理细致,说明清晰者,但其中最大的问题,在于如何厘清“案例方法”与“社会科学”的关系。对此发言的学者,颇多个人设想,多就“常见的案例研究”或“自身的案例研究”,率尔发言,结果率多一隅之见①例如殷国瑞(Robert K.Yin)流传极广的案例研究教材,基本不出其个人体会,看不出作者方法论的训练,参考殷国瑞(Robert K.Yin)《案例研究:设计与方法》,周海涛等译,重庆大学出版社2004年第3版。此外,国内比较重要如潘绥铭等有关研究方法如何运用于中国研究的讨论中,其涉及“定性方法”的第8章却出现许多严重的误解,见潘绥铭、黄盈盈、王东《论方法:社会学调查的本土实践与升华》,中国人民大学出版社2011年版,第194-218页。其次,介绍定性方法的名家如陈向明、田野调查做得灵气的学者如吴毅,对于定性/案例研究设计的看法,也都是作者无法赞同的。参考陈向明《从一个到全体:质的研究结果的推论问题》,《教育研究与实验》2000年第2期(总69期),第1-7页;吴毅《何以个案、为何叙述——对经典农村研究方法质疑的反思》,《探索与争鸣》2007年第4期,第22-25页。例如吴毅认为:“个案研究属于学术研究中‘质的研究方法’的范畴,说到底,它最为根本的目的并不在于为科学——实证化研究——积累量的和类型学的样本(这也正是在此路径上个案研究始终无法解脱方法论困惑的根本原因),而是要为理解社会的多样性和复杂性提供案例。”见上文,第23页。此外,王宁有关案例方法(他称为“个案”)的讨论,虽多言之成理,而且不乏新意,但仍多为个人思考所得,与案例研究的方法论无关。参考王宁《代表性还是典型性?个案的属性与个案研究方法的逻辑基础》,《社会学研究》2002年第5期,第123-125页;王宁《个案研究的代表性问题与抽样逻辑》,《甘肃社会科学》2007年第5期,第1-4页;王宁《个案研究中的样本属性与外推逻辑》,《公共行政评论》2008年第3期,第44-54页。。由于学者少从方法论角度去思考、评价案例方法,后者的科学地位始终未见厘清,结果前述偏“实践”型的定性方法,描绘多似“艺术”:行家老手虽能总结经验,却说不出任何道理,其中奥妙得“自己体会”或“做久便知”。另一方面,前述偏“理论”的方法著作,则倾向于“夸大/扩大”定性方法与实证思潮的歧异,并使其观点合理化,如“定性研究只描述不解释”、“案例研究与实证观点目的不同、出发不同,所谈的研究是两回事”。似乎案例方法与社会科学绝缘,想追求“科学”,请乞灵定量方法。
这当然纯属误解,否则出现系统的定量方法前,就不存在社会科学的研究了。针对上述似是而非的信念,本文将逐一进行分辨。面对妾身未明的“案例方法”,首先得确认其方法论的地位与特征,厘清诸如:(1)定性或案例方法为何?(2)其与社会科学的关系如何?(3)如何设计出能够构建理论的案例研究?等等问题,方能有效澄清涉及“案例方法”的种种迷思。
因此,本文第二节是针对“案例”与“定量”关系的分辨,指出两者区别不在“样本大小”而在“度量层次”;第三节是对“案例”与“理论”关系的反思,主张建构理论并非案例所短,两者各有所长。这两节的重心均在厘清案例研究的性质。第四节探讨“案例方法”与“变量控制”的关系,回答其能否有效厘清因果关系;第五节则涉及“案例方法”如何进行“选样—类推”,主张案例方法可以在“总体”不明的情况下,藉由理论引导,进行研究发现的类推。这两节都涉及案例方法在方法学上的地位与特性。总之,笔者希望通过这样的讨论与厘清,为“科学的”案例方法辩护,希望中国学者能善用案例研究所长,逐步强化中国研究的水平。笔者必须声明,本文限于篇幅,无法旁征博引,也不涉既有辩论,主要侧重于如何设计研究方能具备理论意义。
我们首先面临的问题便是“何谓案例研究”?如同一般理解,作为定性研究的案例方法,通常涉及少量案例的深入探究,而定量方法则着重大量数据的系统分析①在研究设计上,定性方法必然以案例为手段,因此也可视为案例方法(casemethod/case study/case studies)。对于定性/案例方法的性质,可以参考约翰·格林(John Gerring),What Is a Case Study and What Is It Good for?American Political Science Review,98:2(May,2004),pp.341-354,对此提出细致的界定。其他有关定性/案例方法的与研究设计,可以参考查尔斯·瑞根(Charles C.Ragin),The Comparative Method:Moving Beyond Qualitative and Quantitative Strategies,Berkeley& LA:University of California Press,1987;查尔斯·瑞根(Charles C.Ragin)&霍华德·贝克(Howard S.Becker)eds.,What Isa Case?:Exploring the Foundations of Social Inquiry,Cambridge& New York,Cambridge University Press,1992;亚历山大·乔治(Alexander L.George)&安德鲁·贝内特(Andrew Bennett),Case Studies and Theory Development in the Social Sciences,Cambridge,MA:The MIT Press,2005;约翰·格林 (John Gerring),Case Study Research:Principlesand Practices,Cambridge&New York:Cambridge University Press,2007等著作。这些均未介绍到中文世界,例外是刚付梓的盖瑞·金恩(Gary King),罗伯特·可罕(Robert Keohane)&悉尼·沃巴(Sidney Verba),《好研究如何设计:用量化逻辑做质化研究》,盛智明、韩佳译,台北:群学出版社2012年版。。但首先,并非“不用统计”便是定性或案例研究,因为许多著述属于规范论证、哲学思辨或文献梳理,并不属于经验研究,也就未必能以定性、定量来划分。换言之,定性、定量的区分,基本上只能在经验研究中为之②换言之,我们可以将“经验研究”的研究方法,依其搜集/运用材料的形式,区别为“定量方法”与“定性/案例方法”两大类,非经验研究则不在范畴之内,参考前注。。其次,定性与定量的不同,是否表现在案例多寡呢?不少学者分别将两者称为“大量案例研究”(large-N analysis/research)与“少量案例研究”(small-N analysis/research)③例如查尔斯·瑞根(Charles C.Ragin),The Comparative Method:Moving beyond Qualitative and Quantitative Strategies,Berkeley& LA:University of California Press,1987;便如此称呼。,这样的思考是否适切呢?这个在西方日渐流行的划分方式,便是本文检讨的第一项迷思。
根据笔者的看法,定量与定性或案例方法之别,主要在“素材的性质”④国内习惯将data迳译为数据,其实data既可以是定量,也可以是定性形式,译为“资料”或“素材”更为合适。,而非“样本的大小”。其中原因有两点:第一,定量方法也经常处理相对少量的数据 (例如基于t分配的统计分析),而定性方法也能处理相对多量的案例⑤例如本文作者所参与的台商研究团队,结合香港大学、台湾政大与上海财大的人力,迄今已积累超过四百份的深度访谈案例,已发表成果可参考林瑞华、胡伟星、耿曙《“阶级差异”或“认同制约”?大陆台湾人当地融入的分析》,《中国大陆研究》,54:4(2011年12月),第29-56页。。因此,若以案例数量来区分,肯定会有模糊难辨处。第二,虽然定量研究经常涉及大量案例,而定性研究一般处理少量案例,但案例多寡是结果而非原因。由于定性研究缺乏单一、清晰的“度量标准”,需要耗费大量时间进行“度量”⑥这里是比拟定量方法的用语,在定性研究当中,这部分工作其实是 (1)反复探索、(2)尝试刻画、(3)判别性质(定其“性”),最后 (4)加以类属(“定类度量”)的过程。,因而不易进行大量案例的分析。换言之,案例多寡不是两种手段“本质上”的差异,只要度量标准清晰、人力物力许可,案例多寡其实是可以有弹性的。基于以上两点原因,我们不应以“大量或少量”作为定性或定量方法的判断标准⑦当然,更深刻的观察,如同朱天飚老师阅读本文初稿所提的意见:“上述large-N vs small-N的区分,存在一定的语义上的歧义。因为定量研究的‘数据’应该是对案例就该‘变量’的观察,因此,‘一个数据’就是‘一个单位的观察’。而对定性或案例研究而言,所谓‘数据’似乎指的是‘案例’的数目,‘一个数据’其实是‘一个案例’。”换言之,此处所谓“数据的大小”与“案例的多寡”,按照朱老师的分析,“恐怕无法直接相比,它们是两个性质的东西”。。
那么,定性、定量的区别何在?根据笔者的看法,两者差别表现在“度量层次” (level of measurement)上。定性方法一般处理“定类数据”(nominal/categorical-level data)而定量方法则起码得是“定序数据”(ordinal-level data),理想上是“定距数据”(interval-level data)⑧在定序数据的分析方法(categorical data analysis)尚未发展普及之前,部分学者将“定序数据”直接视为“定距数据”进行分析,这当然不很妥当。但我们也从中可知,“排序”是通向定量研究的起点,而“定序”也成为定性、定量的风水岭。。但我们进一步追问,为何存在度量层次的不同?为何有些概念可以精确度量,而另一些只能简单分类呢?其中关键在“概念”或“概念化”(conceptualization)的特性⑨因为“概念”决定我们度量的“现实”为何,而度量的结果才是“素材/数据”。。我们可以拿女孩的姿色举例。眼睛大小当然可以排序,甚至可以计算眼睛与脸蛋的比例,但“漂亮”可以排序吗?如果很难排序做出“定序数据”,那又如何进一步利用标准尺度来给分,进一步做成“定距数据”?眼睛大小是个“单面概念” (one-dimensional concept),因此容易在单一层面上进行比较排序,但如“漂亮”之类概念,涉及大眼睛、高鼻梁、小嘴巴……还有更多特质时,那就没法就单一层面来比较排序。也因此,在考虑“漂亮”这个内涵丰富而多面的概念时,我们仅能将姿色简单分类为“漂亮”、“平凡”与“偏丑”,再要进一步给出具体的排序或给分,其实都不容易。
总结上面的说法,定性、定量的差别源于其所研究的“概念”不同,定量方法涉及的概念,相对简单清楚,容易精细地度量 (度量层次高);也由于存在单一清晰的“度量标准”,定量方法才能进行大量案例的分析。反之,定性方法所处理的概念,通常属于“多面概念”,各个层面的关系不易厘清,因此连排序都不容易,遑论高层次的度量;也因为无法提出单一、清晰的“度量标准”,必须不断探索考察,方能准确地判别类属,所以难于进行标准一致、大量案例的分析。但这里也必须说明,某个概念即便包含“多个层面”的特质,但若能厘清各特质彼此关系时:例如 (1)各层面相互独立,彼此属于简单累加或加权累加的关系,(2)或者可采用“家族亲似”(family resemblance)原则①参考盖瑞·葛兹(Gary Goertz)对此的系统介绍,盖瑞·葛兹(Gary Goertz)《社会科学概念:方法论的思考》,徐子婷、梁书宁、朱玉译,台北:韦伯文化出版社2010年版。,例如大眼睛、高鼻梁与小嘴巴三者若居其二,即为“漂亮”,此时各“单面”特质可以各个析分、分别度量,然后再加总结果,这样还是可以藉此进行高层次的度量,也适合于定量的研究方法。
为何某些概念无法找到“单一、清晰的度量标准”呢?一方面是“不觉必要”,因为“只要深入案例,原来清晰的‘度量标准’自然会变得模糊,那是因为案例具体反映出了事物的复杂性、特殊性和个殊性。牵涉越复杂,度量标准就越难统一。因此案例分析才转而对变量间的交互关系,以及上述关系与背景环境 (context,蕴含各种结构力量)的互动,进行深度探索,而不是本着‘单一、清晰’标准继续扩大观察。反之,定量研究更企图“研究大量案例,藉此捕捉现象的规律性、普遍性和共同性。这是因为它在度量的过程中‘抽象’掉大部分的细节。而定性研究更能反映事物的复杂性、特殊性和个殊性,因为它既深入案例之中,考察案例内在的动因与机制;也超越案例之外,考察案例与其背景环境的关系,无法更不愿‘抽象’掉那么多东西”②本节引文出自朱天飚老师,取自他对本文初稿的评论。。从这个角度来说,一旦深入案例之中,问题就变得复杂,再不能大喇喇地“一刀切”;而这基于“单一、清晰”标准的“一刀切”,只能在远距观察、粗浅了解的情况下为之。
另一方面,没找到“单一、清晰的度量标准”的原因是实在找不到。倘若所处理者是个“多个层面”的概念,各层面特质的关系又难以厘清时,就无法通过“拆解析分、分别度量”的方式,解决此处的度量层次问题。其中最典型的是,该概念蕴含的各个特质并非彼此独立,一旦凑合在一起,可能会出现“浮现/生成特质”③参考郭秋永《方法论上个体主义与全体主义之争执:一个提示性的分析》,台北:“中研院”,1985,可参考http://www.rchss.sinica.edu.tw/NewWeb/files/archive/167_6c4b9410.pdf。,将使得原概念无法通过“析分—还原”方式来定量操作。就像大眼睛、挺鼻梁与小嘴巴几个特质,分开看也许不觉得什么,可一旦组合到一张脸上,而且搭配得协调合度,就突然“生出”绝美这个特质了。这就像涂尔干所说的,“总体大于部分的加总”。此时,新浮现的“整体特质”,将无法还原为各层面的组合,而各特质的分别度量,也就无法回头合成前述的整体特质。因此,我们只能运用定性方法,从考察分类起步了。
综合上述讨论,定性、定量的区别主要在双方处理的概念是否“适于”量化 (以“定序”或以上的度量层次进行精确的度量)。若是,请大方采用定量方法;若不然,则还得回头考虑案例研究。毕竟,两者均属科学活动,均能建构社科理论。
接续的第二项迷思,是不少学者认为定性或案例方法只能“描述过程、展现机制”,却不能够或不适合建立理论。这又是有问题的看法。否则在定量方法成熟发展之前,人类社会是否就没有理论?当然不是。而且根据上节的分辨,定性、定量的区别主要在概念度量,这与“分析对象”(素材)有关,却与“分析目的”(理论)无关。因此,定性定量之别与是否建构理论,其实是两相独立的命题。定性方法可以描述案例,也可以建构理论,就如同定量方法,同样可以描述案例、建构理论。也许如某些学者所言,现有的案例研究多在“描述性质”,但这不代表它们只能描述①对于这类相关概念的掌握,作者推荐一册让人读了兴趣盎然的著作:李丹(Daniel Little)《理解农民中国:社会科学哲学的案例研究》,张天虹、张洪量、张胜波译,凤凰出版集团2008年版,不熟悉“方法论”语言的读者,不妨从本书后半部读起。。此外,前引迷思也还存在自相矛盾的成分。因为社会科学之所以能经世济民,正在于其理论知识;不图建构理论,社科研究的“实践”何在?
学者所说的“描述过程、展现机制”,旨在帮助“提出假说”。“提出假说”本是“建构理论”工作的一部分 (另一部分是“验证假说”)。一面思考如何“描述过程、展现机制”,一面声称绝不意图“建构理论”,岂非有矛盾?同时,在理论建构的过程中,对“机制”(causalmechanisms)的说明与对“共变”(co-variation)的检验,其实是理论成立的两大要件②对于因果机制的讨论,可参考彭玉生《社会科学中的因果分析》,《社会学研究》2011年第3期,第1-31页;刘骥、张玲、陈子恪《社会科学为什么要找因果机制:一种打开黑箱、强调能动的方法论尝试》,《公共行政评论》2011年第4期,第50-84页。利用定量方法确认因果关系可参考史丹利·利柏森(Stanley Lieberson),《量化的反思:重探社会研究的逻辑》,陈孟君译,台北:巨流,1996;利用定性方法为之,则推荐前举盖瑞·金恩(Gary King)、罗伯特·可罕(Robert Keohane)&悉尼·沃巴(Sidney Verba)《好研究如何设计:用量化逻辑做质化研究》。。按照部分学者所言,案例方法有助于说明机制、提出假说;但它能否检测共变、验证假说呢?答案当然是肯定的。理论的形式是一组“关系”,亦即概念/变量间的“共变”关系③此处variable可以是“定性”也可以是“定量”,类似之前的“资料”而非“数据”,所以翻译为“变项”比较合理,否则迳译为“变量”,可能有“定量沙文主义”的嫌疑。。那么只要能够区别“概念/变量”的“变化”——无论此“区别”到哪个层次——我们都能考察“概念/变量”是否“变化”或“共变”?典型如“类别变量”与“类别变量”间的交叉分析 (cross-analysis),当然可以用来考察两者间的因果联系,还可以进行“卡方独立性检定”(χ2-test of independence)。
案例方法当然长于“描述过程、展现机制”,原因在“定性研究的特点是度量/抽象层次比较低,定量研究在相对层次较高,很多丰富的细节被省略、抛却了,因此后者更易找出规律”④⑤ 本段落引文摘自朱天飚老师的评论,他并补充道:“我觉得还是需要强调定性研究的优势,即‘直接展示因果机制’。因此不仅是通过立意选样来达到控制变项和展示共变过程 (无论怎样,案例都不会太多),而且是通过深入案例,直接展示因果机制。‘立意选样’(也是对抽象程度不高的一个科学补救)加‘展示机制’使定性研究成为不差的科学工具。”。即便如此,我们应该还是可以运用定性方法所长,再接通“变量控制”来展示或检验“共变过程”。当然,有得必有失,“定性分析在理论建构方面的优势,在于其用度量/抽象层次低这个代价换来了‘描述过程、展示机制’这个优势。换言之,不深入案例如何直接展示机制?但深入了案例又带来度量/抽象层次的减低。定量分析因为不愿深入案例,所以无法直接展示机制”⑤,从这个角度来看,双方各有得失,因此可说各有所长,适合于不同主题、不同目的的研究。
当然,前引学者的意见也未必认为定性或案例研究“无法”检验共变,而是说其作为一种“少量案例”的研究,共变检验的能力很弱。此时又衍生出两个问题:一是这种共变可否严谨考察,这是本文第四节的内容;二是这种共变能否类推适用,这是本文第五节的内容。
诚如前述,部分学者认为案例研究无法“建构理论”,原因在不能有效控制其他变量,没法进行严谨的检证,厘清“自变量”与“因变量”间的关系。这是有关案例方法的第三项迷思。对此,若能明辨案例与定量方法的差别,我们将不难发现,两者之别只是控制形式不同。
所谓社会科学的建构,尤其在理论验证的部分,关键在“控制”,通过控制解决一个结果究竟为哪个/些原因所影响,而非另外一些原因所造成 (所谓“因果混淆”confounding问题)。因此,一般认为“控制”是验证的核心,实验、比较与统计是常见的控制形式/验证的方法:三种方法各有优劣,其中的“比较”就是以案例方法来进行控制的手段。具体而言,比较手段是通过考察案例、找到类似特质 (因此将其“设为相等”ceteris paribus/holding constant/other things being equal),藉此达到控制的效果,然后进行推敲,确认因果关系。当然,就研究设计而言,根据弥尔 (John Stuart Mill)的归纳逻辑,学者常用“[同中]求异”、“[异中]求同”、“最似案例”(MSSD)、“最异案例”(MDSD)、“区域研究”等手段,都是意在“控制的观察”(controlled observation)。
由此不难发现,案例研究方法只能进行“有限的控制”:每次进行“比较/控制的观察”时,由于寻觅“相同/似变量”的困难,经常只能设少量变量为相同。例如找到两个文化背景类似、发展水平类似、社会结构类似、政治体制类似的国家,之后观察“产业政策”对于“经济增长”的影响。但由于世上不存在完全类似的案例,因此,我们只能找“主要变量”相似的案例;而在判断“主要变量”时,则有赖理论的指导。但上述有关研究方法的“通说”,并不意味案例方法只能提供有限或较弱的控制。因为,上面所言只是“单次”的控制,而案例研究通常能通过“逐次的控制”,编织出一套“完整的控制”。换言之,案例方法的控制看似较弱,可是藉由理论指导、逐次展开后,作为控制的手段,案例方法可以做得与定量几乎一样好。
此话怎讲?定量方法通常以统计模型为手段 (主要为“多元分析”multivariate analysis),创造出“其他情况相同”的效果,同时控制多个变量的影响①由于独立变异的案例数大,即便受限于“自由度”(degree of freedom),还是能够同时控制多个变量。。这看似控制力道无穷,但实际上,若无相关理论指导,需要控制的变量理论上趋于无限多 (任何因素都可能影响结果,干扰因果关系的论证);但实际研究过程中,过量的控制并不“经济” (违反“简约原则”principle of parsimony),一般纳入模型的变量相当有限 (超过7—8个变量的统计模型已经不多)。换言之,定量方法看似长于控制,可是那是“盲目设定模型”时的优势;定量也需要理论/文献指导,一旦案例、定量研究都取得理论/文献指导后 (很多无关的干扰变量已经被排除),双方所需要控制的变量都是有限的,定量的优势就不再明显。当然,定量仍然在“同时控制”较多变量上存在优势;相对而言,案例方法则需要更多的耐心,通过理论指导,逐一展开推敲与控制,才能严谨地提出因果论证。就此而言,案例研究需要多些时间,也需要研究社群的针砭与协力。
退一步看,定量方法之所以能够维系其科学地位,其实依靠了两个机制:一个是前述“控制”,藉此进行严谨验证;另一个则是“抽样”,目的在将结果类推。就逻辑上说,两个机制相互独立,定量方法则兼而有之。那么案例方法又如何?根据前节所述,就控制考察而言,案例方法并不逊色,但若就抽样来看呢?案例研究案例既少,也非“概率抽样”(probability sampling),不好声称“代表性”(representativeness),也就谈不上类推适用②参考前引王宁两文《个案研究的代表性问题与抽样逻辑》与《个案研究中的样本属性与外推逻辑》,《公共行政评论》,以及陈涛《个案研究“代表性”的方法论考辨》,《江南大学学报》2011年第3期,第64-68页。但王富伟对此有不同看法,认为“但这一提问[有关代表性]其实并不恰当,因为‘代表性’属于统计调查研究的问题”,与“案例方法”的逻辑基本无关。参考王富伟《个案研究的意义和限度》,《社会学研究》2012年第5期,第161-183页。。那么,“类推”是不是案例方法的软肋?这是第四项,也是最难回应的一项迷思。
首先,“随机抽样”不等于“随意抽样”。前者必须经过精心设计,方能获得“概率样本”(probability sample),也才能确认样本代表性。此处概率抽样的前提在建立“抽样框”(sampling frame)的基础上——乃就“总体”(population或称“母体”)列出清单编号,以备后续随机抽取。换言之,研究者必先确定“总体”的范围和结构,才能进一步概率抽样;一旦缺乏“总体”的信息,概率抽样将成缘木求鱼。因此,若从抽样角度考察,研究者面临两种情境:“总体明确”与“总体未明”,前者当然追求概率样本,但倘若是后者,研究者如何是好?
其次,此处“能否抽样”之难与“定量案例”之别,本来是相互独立的;但不幸的是,案例研究的对象,总是处于“总体未明”的状况。换言之,它之所以难以类推,问题不在方法本身,关键在研究对象的“总体”,范围未能清晰界定、结构未能准确掌握、案例未能逐一确认。这虽是非战之罪,但既然案例研究必须与“总体未明”相伴随,自然仍须解决问题①何况一般情况下,定性研究样本量偏小,即便属“概率样本”,推论误差也常大到难以接受。。这就诞生了适用于案例方法的选样技巧。
既然缺乏随机抽样的前提,案例研究当然没法“随机抽样”。但人为的“刻意选样”,凭什么侈言代表性,又凭什么据以类推呢?案例方法选样的逻辑如下:首先,根据理论假说的指导,研究者将所能取得的案例,划分出一些“同质”的群体;此时,“组内”差异尽量求小,“组间”差异尽量求大。其次,根据“极大化差异”(maximize variation)原则,就上述“所有”群体各选少量案例,进行深入的考察,然后“验证、修正或否证”之前的理论假说。举例而言,我们可以藉阶级理论引导,将某个社会分划为五大阶级,倘若阶级理论准确,阶级影响关键,那么每个阶级之内,组内同质极高②这当中存在一个“结构主义”(structuralism)倾向的预设,强调由小看大、见微知著,比较类似“拓展个案”方法(extended casemethod)。参考麦克·布若维(Michael Burawoy),The Extended Case Method,Social Theory,16:1(Jan.1988),pp.4-33;或卢晖临、李雪《如何走出个案:从个案研究到扩展个案研究》,《中国社会科学》2007年第1期,第118-130页。,其中任选案例,即可“代表”组内其余。研究者可在前述五个阶级之中,各选一个家庭案例 (此时各案例间“阶级差异”最大),然后考察他们的消费行为,看看是否一如理论假说预言,然后回头“验证、修正或否证”之前所本的阶级理论。
根据上述的做法,首先,案例研究所试图创造的是 “[类型]代表性”(而非 “[总体]代表性”),其推论基础建立在根据理论取得的案例“同质性”上。这种思路,其实也常用在一般抽样方法中,“分层/组抽样”(stratified sampling)即是。其次,案例研究在各有“代表性案例”之后,进一步运用“极大化差异”原则,通过自变量最大的变异,取得研究假说最强、最完整的检验 (亦即将假说应用于“最不同”的各种情境,观察其是否仍然成立)。退一步考察,案例研究由于缺乏依据“推论统计”进行的抽样方法,因此不能通过“概率样本”取得样本代表性。案例方法因而转向“建立类型” (typology),然后根据“类型同质”,获得一定的案例代表性。然后藉此案例直接与理论对话,“验证、修正或否证”理论假说。案例方法与“实验设计”类似,两者都不问“整体”情况,也不通过“样本—整体”的关系,均直接与理论对话③由于缺乏“样本—整体”关系的考察,即便“随机分派—实验控制”的设计,本于“抽样—统计”的学者仍然未必能够接受,参考前引谢宇《社会学方法与定量研究》,2006年版,第27页。。
综上所述,定量方法通常运用“随机选样”,必须有清晰的“总体”,在抽样时通常弃置理论的指导 (刻意的盲目),避免造成验证时渗入偏见。反之,案例方法通常采用“立意选样”,无需明确的“总体”,但必须接受理论假说的指导,方能进行有意义的案例挑选。当然,此时存在“立意选样”的质疑,即“是否专门挑选能配合自己结论的案例纳入研究”?但此刻仍有研究同行的反馈与针砭,这也是为何如笔者前述,案例或定性研究更需要一个活跃的社群/网络,彼此协力研究的原因。讨论到此,也许读者仍感觉“随机抽样”更加牢靠,但笔者重申,这样的优势来自“总体”信息的掌握,既非“定量”所强,也非“案例”所缺,这其实与方法无关。
本文始于案例与定量方法的短长,根据笔者看法,若运用于中国研究,定量方法常见四类困难,藉此则可凸出案例方法的相对优势。笔者讨论的目的,当然不在贬低定量研究,而在说明各自优势何在。因此,若能齐备方法训练④西方学者习惯以“随身工具匣”(toolkit),比喻学者的方法训练。,并能善加选择运用,最有助于比较政治/中国研究。本文接续讨论了有关案例研究的四项迷思。首先是针对案例方法的界定,笔者认为案例、定量的差别不在案例多寡,而在概念究竟是否适于量化?适合以“高度量层次”分辨者采定量手段,否则请考虑案例方法。其次,笔者分析了案例方法与理论建构的关系,说明两者绝不互斥,案例方法当然可用于“社会科学”。接下来,笔者针对案例方法“概念不易量化、只取少量案例”的特性,造成的 (1)不易控制、(2)难以类推的两项质疑进行厘清。案例方法当然可以有效控制、厘清因果,不过难于“同时”控制多项变量,必须逐一控制,逐步厘清理论观点。在此过程中,有赖理论的引导,分辨考察的变量,加上社群的协力,彼此相互针砭,这些都对“案例研究”格外重要。根据前文所述,案例方法也能进行类推,不过因为缺乏“总体”信息,必须另辟蹊径。研究者因此通过“类型辨别”与“最强验证”的设计,直接进行理论的检验与外推。换言之,在依序分辨四大迷思之后,笔者认为,案例、定量各有所长,学者必须兼容并蓄,不搞本位主义,才能视需要而选用,促进比较政治研究与中国研究的进步。
此处又回到“中国研究”。我们若从历史角度看,“中国研究”之所以遥落人后,其实不难理解。毕竟深刻、成熟的著述,需要时间酝酿、提炼与传播,最后才能成为学界运用的理论概念。但诚如本文开头所言,即便针对当代中国的议题,西方学者也常居于主流,中国学者反须参考其成果,对话其理论。当然,国内学者虽对此颇多质疑,认为这些成果“隔靴搔痒”,误读误判,但问题在中国学界这边,又拿出哪些让人面无愧色的研究成果?
面对目前社科研究的低度发展,一个可喜的趋势是“经验研究的转向”:越来越多的国内学者——尤其是青年学者——逐渐抛弃早期“清谈式”、“译介式”的著作形式,走向数据分析、实地调查的研究。但如何搭配此经验研究的潮流,催生出出色的科研成果,其中关键还在如何运用方法。但如本文所论述,部分学者因此急于拥抱定量方法,但倘若既无前驱研究可以引导,也少“本土概念”可以援用,贸然盲从主流的结果,只能制造劣质成果。有鉴于此,笔者乃建议因地制宜,视需要选择方法,方能济中国研究的不足①对于初入行的读者,作者特别推荐两件小品,一个是斯蒂芬·范埃弗拉(Stephen van Evera)的《政治学研究方法指南》,陈琪译,北京大学出版社2006年版的第2章,第47-83页;另一个是汤京平《个案研究〉》《社会及行为科学研究法二:质性研究法》,瞿海源等编,2012年版,第241-270页,两者均清晰可读,而且颇多切实可行的指导。若希望进一步探究,则不妨参考指导设计的丹尼尔·卡拉曼尼(Daniele Caramani)《基于布尔代数的比较法导论》,蒋勤译,格致/上海人民出版社2012年版,以及富含实例的芭芭拉·格迪斯(Barbara Geddes)《范式与沙堡:比较政治学中的理论建构与研究设计》,陈子恪、刘骥等译,重庆大学出版社2012年版。。但由于国内学界对案例方法颇多误解,笔者不得不有所分辨,“余岂好辩哉,余不得已也”。