李莉文黄永亮
(1. 北京外国语大学 教务处,北京 100089;2.河北师范大学 外国语学院,河北 石家庄 050024)
《特尔斐报告》(TheDelphiReport)是指《批判性思维——以教育评估和教学为目的的专家共识声明》(CriticalThinking:AStatementofExpertConsensusforPurposesofEducationalAssessmentandInstruction),因该成果的研究过程始终采用特尔斐研究法(Delphi method)而得名。有观点认为,《特尔斐报告》中批判性思维的界定是两个最具影响的批判性思维定义之一(武宏志,2004),是批判性思维研究的“里程碑”(Davies et al.,2015:10),对世界范围内的教育机构、政府部门、商业团体等都有着深远的影响(Facione,2015)。
《特尔斐报告》中批判性思维的定义大致是21世纪初引入我国教育领域的。岳晓东(2000)在考察西方学者对批判性思维的认识及其研究时,介绍了《特尔斐报告》中批判性思维的界定及内涵。洪淑媛(2003)在介绍西方批判性思维概念时,简单提及了《特尔斐报告》中批判性思维的定义。武宏志(2004)在介绍《特尔斐报告》中批判性思维的界定和内涵的同时,简要提及了《特尔斐报告》研制所运用的特尔斐研究法。《特尔斐报告》中批判性思维的定义对我国外语教育领域的影响尤为深刻,批判性思维能力的培养已在外语教育中占有重要位置。以文秋芳教授为代表的学者,将《特尔斐报告》中批判性思维界定的认知能力(cognitive skills)和情感特质(affective dispositions)“双维结构模型”(文秋芳,2008:30)作为重要的理论支撑,构建了高层次思维能力层级理论模型(文秋芳,2008),以及修订后的思辨能力层级理论模型(文秋芳 等,2009;文秋芳,2012),并据此进行了历时十余年的系列研究。我国《普通高等学校本科专业类教学质量国家标准》(教育部高等学校教学指导委员会)(2018)和《普通高等学校本科外国语言文学类专业教学指南》(教育部高等学校外国语言文学类专业教学指导委员会)(2020)以《特尔斐报告》中批判性思维的界定为蓝本,从认知能力和情感特质两个维度定义思辨能力,将其作为我国外国语言文学类教学质量评价的关键指标和该专业类学生培养的关键能力。马利红(2021)简要介绍了特尔斐研究法,采用此法构建了外语写作思辨能力评价指标。然而,目前国内尚未见《特尔斐报告》的专项研究,亦未见对特尔斐研究法的专门探讨。因此,有必要全面、清晰地了解《特尔斐报告》的目标、共识和方法,这也有助于30余年前发布的《特尔斐报告》更好地服务于我国外语教育事业。
《特尔斐报告》是随着北美批判性思维运动的深入开展而出现的研究成果。为了能够较准确地理解《特尔斐报告》中批判性思维界定的专家共识,我们首先要了解报告研制的背景。
依据理查德·保罗(Richard Paul)(2011)的考察,批判性思维的研究可分为三个阶段:(1)20世纪70年代哲学家主导的形式逻辑和非形式逻辑阶段,该阶段聚焦论证逻辑结构的确定和论证过程的评价;(2)始于20世纪80年代教育领域专家广泛参与的、关注学习者个体发展的阶段,该阶段逐渐聚焦批判性思维与态度、情感、直觉、创造性等个体特征的关系,开始关注学习者自身;(3)21世纪方兴未艾的批判性思维理论发展的阶段,该阶段侧重批判性思维理论的建构。上述阶段既相对独立,又不乏重叠之处。
《特尔斐报告》的研制过程正值批判性思维研究开始关注学习者个体发展的阶段,该阶段迎来了批判性思维研究的新势头:大学开设批判性思维课程,中小学课程规划中设置批判性思维教育目标,批判性思维教材和教师队伍的批判性思维培训项目增长迅速。到80年代末,批判性思维已彻底告别“作坊手工业”时代(Facione,1990:2)。随着批判性思维运动的蓬勃开展,北美教育领域对批判性思维研究萌生了新的期待。这主要表现为:(1)批判性思维教学应聚焦学习者如何解决问题及其推理过程;(2)批判性思维教育应关注优秀的批判性思维者应具备的认知技能和情感特质;(3)批判性思维评测应侧重学习者得出答案的批判性思维过程的质量,而非仅仅停留在问题的答案正确与否(Facione,1990)。也就是说,要厘清批判性思维的界定、批判性思维教育涵盖的典型技能与特质、批判性思维教学的有效途径,以及如何在更大的范围内评测批判性思维。为此,《特尔斐报告》将研制目标设定为:提供一个“足够清晰、准确、丰富的批判性思维界定”(Facione,1990:6),以此“指导各学段的批判性思维测评与相关课程的开发”(Facione,1990:6)。为了达成上述目标,美国哲学学会下设的大学入学前阶段哲学委员会(The Committee on Pre-College Philosophy)于1987年委托彼得·费希万(Peter A. Facione)教授牵头组织哲学、教育、社会科学和自然科学等四个领域的批判性思维专家(1)逾半数参与调研的批判性思维专家来自哲学研究领域,占比52%;其余三个领域的专家依次为教育领域专家(占比22%)、社会科学领域专家(占比20%)和自然科学领域专家(占比6%)(Facione,1990:34)。这也从侧面反映出批判性思维运动发展到了哲学领域专家主导、教育领域专家较广泛参与的阶段。,就批判性思维及其教学与测评展开了系统的调查研究。该研究于1988年2月启动,1989年11月结束,历时近两年,整个研究过程始终采用特尔斐研究法。
《特尔斐报告》是1990年发布的。报告由批判性思维运动与批判性思维测评、研究方法与研究目的、批判性思维的认知技能维度、批判性思维的特质维度、批判性思维教学与测评的相关建议、特尔斐研究专家团队成员等六个章节,以及批判性思维商用测评工具、侧重批判性思维测评的参考文献、《特尔斐报告》研究过程中的往来信件等三则附录构成。
《特尔斐报告》专门列出了七个相关表格,其中包括四个专家共识意见表,分别是表1“关于批判性思维和理想批判性思维者的共识声明”、表3“批判性思维认知技能及其子技能的共识清单”、表4“核心批判性思维技能及其子技能的共识描述”和表6“批判性思维技能教学与评测的共识声明”。报告也呈现了表2“项目的研究过程”和表7“参与调查研究的专家组成员”。报告还列出了表5“批判性思维的情感特质”,涵盖“对待生命和生活的总体方式”和“对待特定事件、疑问和难题的方式”两个方面(Facione,1990:25)。需要特别指出的是,报告描述表5并未使用“共识”这一表述。也就是说,表5并非专家共识,这一点得到了《特尔斐报告》牵头人费希万教授的确认(2)费希万教授在2020年8月19日的确认邮件中指出:“With regard to Table 5, you would be correct in thinking that the experts did not reach consensus.”。上述专家共识意见表中,表1“关于批判性思维和理想批判性思维者的共识声明”是我国外语教育领域关注的焦点。
表1 关于批判性思维和理想批判性思维者的共识声明(Consensus Statement Regarding Critical Thinking and The Ideal Critical Thinker)(Facione,1990:3)(3) 表2—表7原文请参见Critical Thinking:A Statement of Expert Consensus for Purposes of Educational Assessment and Instruction. Research Findings and Recommendations(Facione, 1990:7-35)。
从表1可见,《特尔斐报告》中批判性思维的界定是明确的,且为专家共识。依据专家共识意见,“批判性思维是有目的的、自我调整性的判断”(Facione,1990:3)。《特尔斐报告》指出:“这一判断可促成对其所依据的论据、概念、方法、标准或背景等因素加以解释、分析、评价、推论与阐释。”(Facione,1990:3)专家共识意见也肯定了批判性思维至关重要的作用,认为“批判性思维是必不可少的探究工具。就其自身而论,批判性思维是教育中的解放力量,为人们的个人生活和社会生活提供强力支撑。批判性思维虽非优秀思维的代称,但它确是一种人类普遍存在、自我矫正性的现象”(Facione,1990:3)。专家共识意见还认为,批判性思维包括解释、分析、评价、推论、阐释和自我调整等六项核心认知技能以及相应的若干子技能。《特尔斐报告》对上述核心技能及其子技能做了较为详细的描述,且明确指出这是专家共识意见,这也可以从表3“批判性思维认知技能及其子技能的共识清单”(Facione,1990:12)和表4“核心批判性思维技能及其子技能的共识描述”(Facione,1990:13)的表述中直观地看出来。可见,《特尔斐报告》中批判性思维界定的专家共识未提及认知技能和情感特质的“双维结构”。
《特尔斐报告》中的表1之后,有这样一句表述:“如表1所示,该调查的一个重要结果是批判性思维专家组明确从认知技能和情感特质两个维度来界定批判性思维。”(Facione,1990:3)《特尔斐报告》第三、四章还分别以“批判性思维的认知技能维度”(Facione,1990:8)和“批判性思维的特质维度”(Facione,1990:20)为标题进行阐述。据初步统计,整个报告中“批判性思维的(认知)技能维度”的表述出现约20次,“批判性思维的特质维度”的表述出现约15次。这或许是外语学界认为《特尔斐报告》中批判性思维界定中认知技能和情感特质的“双维结构”是专家共识的主要原因。
事实上,《特尔斐报告》(Facione,1990:25)指出,“多数(61%)专家将上述情感特质视作批判性思维界定的组成部分”,而其余专家则坚持情感特质并不在批判性思维界定的范畴之内。《特尔斐报告》也指出,“超过83%的专家组成员就优秀的批判性思维者可能具备上述情感特质达成了共识”(4)依据亚里什·达加尼(Jaris S.Dajani)、迈克尔·辛考夫(Michael Z. Sincoff)和韦恩·塔利(Wayne K. Talley)(1979:85)的观点,共识是指达到完全一致,未达到完全一致却超过了半数则为多数。从这个意义上讲,情感特质属于批判性思维者也非共识。此外,《特尔斐报告》明确指出,即使在同意批判性思维具有两个维度的专家中,约三分之一的专家认为应该采用“特质”而非“情感特质”来表述这一概念(Facione,1990:21)。(Facione,1990:25)。换句话说,情感特质属于批判性思维者只是多数专家的意见,批判性思维界定中的情感特质维度也不是专家共识,这一点也得到了费希万教授的确认(5)费希万教授在2020年8月19日的确认邮件中指出:“The majority regarded the dispositions as vitally important personal attributes. But the majority did not think that these dispositional elements should be part of the definition of ‘critical thinking’.”。
情感特质属于批判性思维者,而非批判性思维。《特尔斐报告》中的表1在批判性思维专家共识之后,详细列出了理想批判性思维者(the ideal critical thinker)理应具备的诸多特质,认为“培养优秀的批判性思维者就意味着朝着培养上述特质的理想目标而努力”(Facione,1990:3)。而要实现培养优秀批判性思维者的目标,则需“将培养批判性思维技能和培养上述特质结合起来,这些特质能够持续地萌生真知灼见,也是理性和民主社会之基”(Facione,1990:3)。这既明确了情感特质为批判性思维者所有,又强调了情感特质的重要价值。为此,报告以表格(表5)的形式呈现出优秀批判性思维者所应具备的情感特质。同时,《特尔斐报告》也指出,尽管描述批判性思维中的自我审视和自我修正离不开特质成分,“但是大多数专家更希望将个体特征、思维习惯、态度或情感特质用来描述优秀的批判性思维者的特征”(Facione,1990:20)。这也为情感特质属于批判性思维者的结论提供了证据支撑。
此外,报告表述的相悖之处也易误导读者。例如,报告指出,“专家组就优秀的批判性思维者具备的情感特质清单达成了共识。共识清单请见表5”(Facione,1990:20)。与之相应的表5题名则赫然变成了“批判性思维的情感特质”(Facione,1990:25),而非批判性思维者的情感特质。
由此可见,《特尔斐报告》在解读批判性思维界定时存在歧义(6)这一点得到了费希万教授的认同。费希万教授在2020年8月27日的确认邮件中指出:“You are correct to see the ambiguity in the Delphi Report at a purely theoretical level.”,甚至存在相悖之处,这尤其表现在报告理想批判性思维者的情感特质的表述中,给人们正确理解报告中批判性思维的内涵制造了困难,使得不少研究者对批判性思维界定专家共识的理解出现了偏差,误以为认知技能和情感特质两个维度均为专家共识意见。
有观点认为,《特尔斐报告》研制的参与专家人数多、研究过程持续时间长、讨论轮次多,研究结论是专家组的集体智慧,因此,《特尔斐报告》中批判性思维定义中的认知技能界定“更具科学性和权威性”(文秋芳,2008:30)、“肯定更具普遍性”(文秋芳 等,2009:41),《特尔斐报告》中批判性思维的定义“颇具权威性”(孙有中,2011:52)。事实上,要相对客观地评价《特尔斐报告》中的批判性思维定义以及《特尔斐报告》的定位,需要我们更为深入地认识特尔斐研究法。
如前所述,《特尔斐报告》是通过特尔斐研究法完成的。特尔斐研究法是指“通过专家组成员深入地回答系列调查问题与可控性意见反馈交互进行的方式,旨在就调查问题获得最可靠的专家意见共识的研究方法”(Dalkeyet al.,1963:458)。该方法是通过个人访谈或问卷调查的方式、并就调查问题多次单独征询专家组成员的意见而完成的。特尔斐研究法的实施流程大致如下:(1)确定研究目标和研究问题,制定问题征询单;(2)选定相关专家并向专家组成员发出问题征询单;(3)收集、分析、评估专家意见,依据总结出的专家意见精心设计下一轮次的可控性反馈并发给专家组成员。如此迭代,达到预期目标后,调查终止。特尔斐研究法的实施过程主要具有匿名性、可控性和统计性三个基本特点(Dalkey,1969)。其中,匿名性体现在调查通过问卷或其他正式交流渠道进行,避免专家组成员直接相互见面。可控性是指将前一轮次的调查结果进行总结之后,再反馈给专家组成员进行下一轮次的调查。这里反馈给专家组成员的总结意见也是匿名的。统计性则体现为研究者在调查的最后一轮汇总专家组成员的意见,经过数据统计后,最终报告专家意见的相关数据,确保专家组所有成员的意见得以呈现。特尔斐研究法实施过程中体现出的上述特点,有助于“最大限度地降低专家组主导成员、与研究的无关交流和来自专家组趋向一致意见的压力等因素带来的偏误影响”(Dalkey,1969:408)。
特尔斐研究法旨在通过结构化的小组交流解决复杂的问题(Linstone et al.,1975)。《特尔斐报告》涉及的批判性思维问题即为复杂的问题,这体现在参与研究的专家数量、研究时长、函询次数和讨论轮数等方面。参与《特尔斐报告》撰写的首批专家组成员是由大学入学前阶段哲学委员会推荐给项目牵头人费希万教授的。首批专家组成员又推荐了第二批相关专家,最终共46位被业界广泛认可的批判性思维教学专家、批判性思维测评专家和批判性思维理论研究专家组成了专家组。《特尔斐报告》展示了专家组采用特尔斐研究法历时近两年,借助16次函询,历经六轮数回合而达成的书面“共识”意见。
特尔斐研究法自1948年用于提高赛马结果预测的准确率(Pill,1971)以来,至今已有逾70年的历史。特尔斐研究法采用集思广益的方式,“旨在解决现有知识暂无法明确解决的问题”(Dalkey,1969:408)。该方法主要靠的是专家组成员的已有经验和直觉判断。特尔斐研究法采用匿名的方式让专家组成员间的交流成为可控性互动,意在避免相左观点通过专家圆桌讨论等传统方式直接交锋带来的弊端,有助于专家进行独立思考,也有助于专家提出深思熟虑的意见(Dalkeyet al.,1963)。同时,特尔斐研究法是一种理论依据显而易见、流程系统易于理解、快捷、方便、成本低的研究方法,可用于几乎任何领域来征求专家意见,确定专家共识(Sackman,1976)。不过,特尔斐研究法的使用是一个极为复杂且要求很高的过程。首先,在使用特尔斐研究法时要特别注意调查问卷的设计、专家组成员的选择,以及确保专家答复方式的有效性、防止出现专家光环效应等技术问题(Sackman,1976)。以调查问卷的设计为例。要设计调查问卷,首先要完整回顾相关文献、检验构念效度,确保所选问题的系统性,并对调查问题进行试测和项目分析。其次,在各轮次给专家组的反馈信息应避免研究者的个人偏好(Dalkeyet et al., 1963)。反馈信息主要包括两类:一是备好的专家组某一成员事先要求准备的资料,二是专家组成员在研究过程中所建议的潜在相关因素。对于后者,反馈信息往往很难做到真正隐藏其他专家的真实观点,而仅展示不带任何倾向性的考虑因素。实际上,特尔斐研究法是一把“双刃剑”,因为该方法“在收集专家组集体意见的同时,也冲淡了在特定问题研究领域真正的专家的意见”(Pill,1971:62)。特尔斐研究法的匿名性也是如此。哈罗德·萨克曼(Harold Sackman)(1976:445)明确指出:“就专家组、研究者和研究结果的使用者而言,研究过程采用专家匿名的方式可能导致专家组成员个体失责。专家择选程序中的匿名方式和相关的个体失责可能导致精英主义,也可能导致蓄意操纵研究结果从而满足既定利益。”由此可见,匿名性的潜在风险亦不容小觑。同时,对于专家组作答各种问题和个别专家或少数专家仅作答那些他们深入研究的问题,哪种方式的效果更佳,依然没有答案(Pill,1971)。
如何检测特尔斐研究结果的有效性也是一个关键问题。亚里什·达加尼、迈克尔·辛考夫和韦恩·塔利(1979)较深入地探讨了如何依据稳定性和一致性标准终止特尔斐研究,提出了采用卡方检验的方式检测各轮次之间专家集体稳定性的方法。威尔基·查芬(Wilkie W.Chaffin)和韦恩·塔利(Wayne K.Talley)(1980)在此基础上进行了推进性研究,他们区分了专家集体稳定性和个体稳定性,聚焦于个体稳定性的检测。上述研究成果为特尔斐研究有效性的验证提供了可行性方案。
从《特尔斐报告》所呈现的内容来看,《特尔斐报告》在遵循上述特尔斐研究法使用注意事项和保障研究结果有效性两个方面仍存在进一步完善的空间。同时,《特尔斐报告》“研究过程持续时间长”受限于当时“蜗牛式的”(Facione,1990:63)书面信函往来的通信条件。费希万教授指出,部分专家组成员尚未使用电子邮件,研究仅能通过信件往来的方式进行(7)从《特尔斐报告》的附录三(Facione,1990:63)来看,确定地讲,费希万教授本人当时也不会使用电子邮件,第二轮讨论采用书面信函和电话两种方式进行。。若在当前条件下进行该研究,或许仅需几个月就能完成当时两年才能完成的工作(8)费希万教授在2020年8月19日的确认邮件中指出:“Back in the late 1980’s, we had to use paper mail since some on the panel of experts did not have access to email. I and my graduate research assistant required two years to accomplish something that today might take only a few months. ”。从《特尔斐报告》研制的过程可以看出,研究的前两轮旨在组建专家组,第三、四轮和第五轮的第一回合聚焦认知技能,第五轮第二回合讨论(情感)特质,第三回合侧重有关认知技能的教学和测评的建议,第六轮邀请专家组成员就报告初稿给出反馈(Facione,1990:7)。因此,该报告“讨论轮次多”的说服力也值得商榷。
此外,学界对于《特尔斐报告》的关注度差别较大。我国外语教育领域关注的焦点在于《特尔斐报告》中的批判性思维界定、认知技能及其子技能和情感特质,却未见《特尔斐报告》相关的专项研究,亦未见对报告所用特尔斐研究法的研究成果。国外教育领域除了《特尔斐报告》牵头人费希万教授始终关注优秀批判性思维者的认知技能和情感特质的测评之外,报告研制专家组46位成员中,仅有保罗(2011)、戴维·希契科克(David Hitchcock, 2017)等简要提及报告中的批判性思维界定,未见其余成员就报告研究或特尔斐研究法的相关著述。因此,上述现状也从侧面为《特尔斐报告》定位的重新认识提供了佐证。
在重新认识特尔斐研究法的基础上,相对客观地看待《特尔斐报告》,准确理解《特尔斐报告》中的专家共识,尤其是批判性思维界定的专家共识,有助于更加深刻地认识《普通高等学校本科专业类教学质量国家标准》中的相关指标,认真落实《普通高等学校本科外国语言文学类专业教学指南》中的相关培养任务,进而助益外语学习者运用批判性思维“理解、掌握和吸收文化现象背后的思想和价值内涵”(姜锋 等,2020:29),恰当处理全球视野和国家意识二者间的关系(陈新仁,2020),更好地“推动中国文化、学术、思想和主张的对外表达”(宁琦,2020:14)。
通过考察《特尔斐报告》文本、报告的研制背景、专家组成员的相关论著以及与报告牵头人的电子邮件核实,我们能够明确的是,批判性思维界定中的认知技能和情感特质的“双维结构”不是《特尔斐报告》中的专家共识,这一点得到了费希万教授本人的确认。认知技能和情感特质虽非批判性思维界定的两个维度,二者却可以统一到通过教育教学培养优秀的批判性思维者的轨道上来。换句话说,只有将认知技能和情感特质的培养结合起来,才有可能培养出优秀的批判性思维者。这既是《特尔斐报告》中的专家共识,也代表了费希万教授当下的观点(9)费希万教授在2020年8月19日的确认邮件中指出:“There is today a strong consensus that to be a strong and successful critical thinker a person must build the skills and cultivate the habits of mind (dispositions). ”。
特尔斐项目组采用特尔斐研究法对批判性思维及其教学与测评进行了研究,发布了《特尔斐报告》。从某种程度上讲,在批判性思维研究中采用特尔斐研究法是一种创新性活动。同时,特尔斐研究法的使用过程相当复杂、要求很高,其研究结果还需进行有效性验证。而《特尔斐报告》未提供遵循该方法使用要求的详细说明,亦未提供验证研究结果有效性的相关证据,这或许会在一定程度上影响《特尔斐报告》的科学性和权威性。此外,特尔斐研究法在报告专家组集体意见时,也存在冲淡真正的专家意见之可能。《特尔斐报告》是费希万教授牵头组织46位专家历时近两年,历经六轮数回合讨论后折中的产物,侧重大学生的批判性思维教学与测评(10)费希万教授在2020年8月29日的确认邮件中指出:“1001ba the goal of the Delphi Research project was to seek expert consensus for purpose of educational instruction and assessment at the college level1001bathe purpose was practical.”,报告中共识的理论原创性则难免受到影响。较为全面地了解特尔斐研究法有助于相对客观地评价《特尔斐报告》的定位。