张婧婧 于 玻
在“科学主义”的影响下,教育研究奉行还原论,忽视了教育的复杂性。还原论所指导的教育研究是我们熟知的量化研究。20 世纪80 年代之前,国际上普遍认为,实证主义范式下的量化研究是教育研究的金标准(Tashakkori & Teddlie,1998)。80 年代激烈的范式之争中,实证主义下的量化研究者与解释主义下的质性研究者坚持认为各自所推崇的研究范式优于对方,并形成了壁垒分明、互不相容的论点(Incompatibility Thesis)(Johnson &Christensen,2019)。在此次范式之争后,解释主义范式下的质性研究开始在教育研究领域崭露头角,并逐渐获得广泛的认可。
解释主义认为实证主义忽视了教育的复杂性,将教育问题简化为了“数字游戏”。然而,即使认识到了简化论难以还原教育中的复杂性,解释主义的支持者在情境观的指导下也未能真正揭示教育的复杂性规律。这是因为多数解释主义支持者将教育活动视为复杂的人类活动,其复杂性主要体现在人的主观参与、历史活动与实践情境中。他们并未真正地将教育视为一个开放、自组织且演化的复杂系统来进行研究。与复杂的(Complicated)人类活动不同,教育的复杂性(Complexity)通常指系统论指导下教育的复杂性规律。只有从系统论的视角去认识与理解教育的复杂性,并真正引入复杂性研究的理论和方法,才能真正解决教育的复杂性问题(程广文,2008)。
在过去二十年间,越来越多的协会、学科与学者都意识到教育复杂性问题的重要性。2010 年美国教育研究协会年会将主题定为“了解变化世界中的复杂生态”,呼吁在教育研究中引入生态学和复杂性科学的视角(Rochon,2010)。Jacobson、 Kapur 和Reimann(2016)总结了目前认知和情境两大理论派别的争论,提出“学习的复杂系统概念化框架”(Complex Systems Conceptual Framework of Learning,CSCFL),认为教育是一个开放的复杂系统,既包括复杂的集体行为(如自组织性、初值敏感性、非线性和涌现性等),也包括个体在系统中的行为(如并行性、条件触发、适应与演化等)。Hilpert 和Marchand(2018)基于系统在宏观层面的复杂行为和系统个体在微观层面的动态交互及其涌现机制,建立了复杂系统科学视角下的教育心理学本体论。我国教育学科亟待从系统科学所倡导的复杂性研究入手,建立具有中国特色的教育研究范式。
Thomas Kuhn(1962)在《科学革命的结构》(The Structure of Scientific Revolutions)一书中提出,范式是研究者在认识和解决问题中达成的共识,包括信念、主张,组织原则等。每位研究者都在特定的范式下认识研究对象,并寻求回答研究问题的方法,从而推动研究领域的发展。学者通常遵循相同的规则与标准从事学术研究,但也不完全受规则牵制,在开放与灵活的规则范围内,范式起到指导研究设计的作用(陈向明,2008)。至今,关于教育研究范式的分类尚未达成共识,常见的分类方法包括“二分法”(量化研究与质性研究)、“三分法”(思辨研究、量化研究和质性研究)、“四分法”(本质主义范式、体系主义范式、实用主义范式和批判主义范式)等(王洪才&田芬,2021)。此外,学界还存在着不同观点下的范式变迁说、范式创新说、方法范式说、中国特色范式说,等等(汪基德& 王开,2021)。张羽、刘惠琴和石中英(2021)认为当前教育研究范式主要可归为三类:实证主义范式、解释主义范式和批判理论范式。他们认为这些传统的研究范式面临着实践性本土性不足的危机,并提出了“指向教育实践改进的系统范式”。
不同学者提出的研究范式分类折射出的是学者基于所在二级学科对教育研究的认识与理解,既包含共性也存在差异。我们可以从Guba 和Lincoln(1994)提出的“本体论、认识论和方法论”三个层面来剖析各类研究范式。本体论关注事物的本质与形式,即人与物究竟以怎样的方式存在于这个世界上?认识论强调我们与我们所要认识的世界/知识之间的关系的本质,即我们应怎样认识世界?方法论则侧重探讨我们用何种方法和手段去认识世界。这三个层面的问题互相影响,塑造出不同的研究范式分类。本文从本体论、认识论和方法论三个层面辨析不同教育研究背后折射出的各类研究范式,并提出在向科学研究第四范式的变革中,教育数据密集型研究如何将教育的“复杂性”纳入新经验主义范式的创新中。
在本体论层面,实证主义持有现实主义的态度,认为研究的对象是真实存在的,并遵循一定的自然法则和规律。在认识论层面,实证主义认为研究者和研究对象之间是主客二元关系,研究者应该持有价值中立的立场去认识研究对象,从而发现控制研究对象行为变化的规律(何莲珍&李航,2011)。实证主义研究是一个演绎推理的过程,通常先提出研究假设,采用实验的方法干预和控制变量来发现规律,收集的数据多为量化数据,通过统计方法来验证研究假设,使研究结果具有预测的正确性和控制的有效性。实证主义范式以命题可观察性、客观的检证原则、操作性定义等为显著特征,其“证据”本质上是可客观观察验证的事物(简成熙,2017)。因此,实证主义研究提出的研究问题常以什么(What)、多少(How much)、是否存在关系(Relationship between)和因果关系(Causual-effect)等形式出现。在方法论层面,实证主义范畴下的研究类型包括实验研究、单一被试研究(Single-Subject Research)、相关研究(大规模问卷调研)、因果比较研究(Causal-Comparative Research)、调查研究(Fraenkel et al.,2019)以及元分析等(Lodico et al.,2010)。
相关关系研究是实证主义范式研究的一种典型形式。在这类研究中,研究者通过探究不同变量之间的关系来确定它们之间是否存在一定的相关性。如Hospel 和Galand(2016) 有关学习投入的研究,他们认为学生的参与度是真实存在的,并受到一定条件和规律的影响,因此提出的研究问题属于“是否存在关系”类别:教师的课堂行为对于学生的学习投入是否存在影响?教师课堂行为的各个组成部分具体存在怎样的影响?在研究方法层面,研究者根据自我决定理论的框架设计了问卷,问卷采用经过信效度检验的李克特5点量表,包括人口统计学特征、学习投入(行为投入、情感投入和认知投入)、教师自主支持等方面的内容。接下来采用大规模问卷调查的方法,对来自51 个班级的744 名九年级学生收集了量化数据,然后研究者采用多层回归分析对问卷结果进行统计分析。研究发现,在班级层面,教师提供的课程结构与学生的行为投入和认知投入中的自我调节呈正相关关系。同时,教师的自主支持及其结构与学生的积极情绪也呈正相关关系。这项研究是一项典型的相关关系分析研究,在已有理论的指导下提出影响因素的变量,并采用大量的定量数据进行统计分析,旨在客观地认识世界中影响学习投入的真实规律。
除相关关系研究外,实验研究因为能够验证因果关系,一直以来是实证主义范式下的重要方法论。比如,Meyer 等人(2019)进行了一项2×2 实验研究,以探究沉浸式虚拟现实(VR)技术和预训练对学习效果的影响。研究中,他们将118名大学生被试随机分配到两种方法条件(有/没有预训练)以及两种媒体条件(虚拟现实环境/传统视频形式)下。被试首先接受了关于先验知识和人口统计学特征的前测,预训练组的参与者被要求观看相关图片。所有参与者完成了大约10 分钟的虚拟现实或视频学习,然后进行了关于记忆、迁移、自我效能和沉浸感的后测。在干预一周后,所有参与者进行了与后测相同的线上延迟后测。研究结果表明,方法条件和媒体条件之间存在交互作用。在虚拟现实环境条件下,预训练对知识迁移和自我效能都具有积极影响,而在视频条件下没有明显影响。这项研究是典型的实验研究,通过控制变量,验证了自变量与因变量之间存在因果关系。然而,实际上,在真实的教育场景中很难实施随机对照试验(randomized controlled trial,RCT),这导致真实验研究设计并不常见,多以准实验(quasi-experiment)研究为主。
可以看出,在实证主义范式下进行的量化研究是在已有知识(理论模型)基础上产生新知识的一种途径。然而,在互联网高速发展的今天,这类研究很难产生具有革命性变革的新知识(Anderson,2013)。在这类研究中,通常需要对变量进行干预和控制,导致研究结果具有较低的外部效度,在不同教育情境中的应用性受到质疑。更值得注意的是,在技术快速迭代的时代,对于一些新的教育技术应用,采用过时的理论或者无法指导新技术应用场景的理论来验证相关关系或因果关系,可能会扼杀一些具有创新性和变革性的教育实践。
要解决量化研究外部效度不高的问题,可以在全球范围内不同情境下开展长周期、大样本的相关研究,并随后进行元分析研究,来弥补由于样本限制而导致研究结果难以推广的不足。比如,Bernard 等人(2004)通过对1985年至2002年间的232项研究进行元分析,比较了远程教育和传统课堂教学的效果。李玉等人(2018)对近十年间60篇文献进行元分析,运用标准化编码、描述性统计、主效应分析、调节效应分析和发表偏倚分析等方法,总结了思维导图对学生学业成就的影响。李彤彤等(2018)通过对37项翻转课堂实验和准实验进行系统定量分析,考察了翻转课堂对学生学习效果的影响。李宝敏等(2022)对2000 年至2021 年间国内外109 篇实验研究进行量化分析,系统检验了混合教学的有效性。这类元分析研究在很大程度上弥补了样本限制的不足,通过对多项研究进行综合分析和总结,更全面、客观地验证教育技术的效果和影响,提高研究的可信度和推广性。
在20 世纪80 年代初激烈的范式之争后,解释主义范式下的质性研究开始在教育领域引起关注,逐渐得到了广泛认可。与实证主义相悖,解释主义持有相对主义的态度,在本体论上认为社会“现实”并不是一成不变的,而是人类智力的产物。在认识论层面,解释主义认为知识是在社会和情境中,在研究者与研究对象的互动中建构的,我们需要在特定的社会文化背景下去认识个体独特的世界观。解释主义范式主张从知情人的视角去认识事物的规律,通常在研究中尝试回答“为什么”(Why)和“怎么样”(How)的问题,而不是像实证主义范式下回答“什么”“什么时候”“多少”等问题。在方法论层面,解释主义侧重对不同类型的个人或机构身份之间的关系建构进行诠释,旨在重新建构知识。因此,其采用的方法通常是非实验性、非控制性、探索性的质性的研究方法,如叙事、访谈、观察、民族志、个案、现象分析等,通过这些方法,研究者可以收集丰富的质性数据,以理解和解释研究问题与现象。20 世纪90 年代,随着技术的飞速更替,解释主义范式下的质性研究开始蓬勃发展,成为教育领域最常用的研究范式之一(Guba &Lincoln,1994)。
解释主义范式强调“人”的感受。在探究分组教学模式是否优于个体教学模式时,解释主义范式不会采用实验设计来验证因果关系,而是认为学生的亲身体验和真实观点对于教学至关重要。因此,Money 和Coughlan(2016)的研究对15 名计算机专业大四学生进行了深入的一对一半结构化访谈,以发现不同教学模式的优劣势。解释主义范式还强调“真实情境”。例如,为探究平板电脑对儿童创造力的影响,Marsh 等(2018)没有采用调查或实验研究,而是进行了一个三阶段的混合研究:第一阶段采用随机分层抽样法对英国2,000 名5岁以下儿童的父母进行调查;第二阶段,对6个家庭的父母进行民族志研究,研究人员对每个家庭进行了5次访问,包括非正式的儿童对话、家长的半结构化访谈、视频观察等;第三阶段邀请12 名儿童使用平板电脑,并录制了他们使用应用程序的视频,通过对视频进行分析来观察儿童如何使用平板电脑。这种深入的民族志研究是不可能在实证主义范式下进行的,而解释主义范式与这类研究所重视的“情境观”是一致的。
在解释主义范式下,还存在一种典型的研究方法,即扎根理论(Grounded Theory)。扎根理论指导了一种知识重构和再生产的过程。例如,面对当今世界不确定性因素的日益增多,围绕如何在紧急时期进行有效的教育治理的问题,逯行等(2020)通过基于扎根理论的多案例分析,对22 个国家和地区的23 个代表性案例进行了研究,总结出相应的运行机制和具体措施。在新冠疫情蔓延的时期,大规模的在线教育备受关注。为了探讨社会公众对在线学习的观点,侯春笑和田爱丽(2021)通过对2020 年1 月27 日至5 月31 日期间微博和知乎上1,005条帖子的扎根分析,总结出公众关注的多个热点问题。扎根理论被认为是解释主义范式下一种相对科学的分析方法,它提供了一整套从归纳原始资料到建构理论的方法和步骤(Strauss,1987),通过反复比较、思考和分析,将数据和资料转化为概念,从而构建理论。
与实证主义范式下的元分析不同,解释主义范式下的元分析更加强调研究者依据领域知识和经验对文本内容进行深入解析。Daenekindt 和Huisman(2020)对1991—2018 年间的16,928篇高等教育英文论文的摘要进行了相关主题模型的构建(correlated topic model),最终选择构建了31 个主题。通过关键词和文献原文对各主题进行解读,分析了主题随时间演变和共现的情况。我国学者开展的研究中也有质性元分析的案例(例如,刘妍等,2021;赵文涛等,2015),这些研究往往采取“确定研究问题—筛选相关文献—确定分析框架或思路—深入分析”的路径。
批判理论的本质是调查与揭露权力关系。在本体论层面,批判理论认同现实的真实存在,但与实证主义不同,批判理论认为现实是在社会不平等因素(如经济、政治、文化、种族、性别等)的影响下形成的。在认识论层面,批判理论致力于揭示那些被隐藏或扭曲的声音和行为,以帮助我们认识并改变社会现实。在方法论层面,批判理论主要使用批判分析和历史评述等方法。例如,批判理论研究的研究问题可能包括:MOOCs 是否真的免费?学习分析是否暴露了学生的脆弱性?学习分析是否剥夺了学生的隐私权?网络技术是否扩大了数字鸿沟?等等。教育政策社会学派常常运用民族志、话语分析等方法来回答核心问题:政策背后隐藏着怎样的(不平等的)社会权力结构?(余晖等,2021,p.56)。
Moe 和Rolin (2015) 认为现有的TED、Curiosity.com、Upworthy 以及MOOCs 等并非真正的开放教育资源(Open Education Resource,OER)。基于批判理论框架,该研究分析了传统OER 和这些网络资源在社会文化、经济和政治层面的区别。该研究回顾了有关“寓教于乐”(edutainment)内容的历史文献,认为这种形式将知识作为商品和社会政治的表达,而非开放的、面向公共利益的教育资源。Zhang等(2019)收集了中国49所高校官方发布的548 篇关于MOOCs 的语篇,提取出2,514个包含关键词“MOOCs/慕课”的句子,并总结出12 个主题,如变革(将MOOCs 视作变革催化剂)、教学(MOOCs起到提升传统教学的杠杆作用)、全球化(MOOCs 作为全球现象),等等。通过批判话语分析,研究发现权力关系和意识形态等因素塑造了设计和实施MOOCs 的战略规划。相较于通过MOOCs 扩大学习机会,我国更加重视通过MOOCs 提高高校的国际声誉。此外,田慧(2019)从批判理论的视角评析了编程教育低龄化的现象,认为其背后的深层逻辑是“技术理性”意识形态的影响。
批判理论范式认为教育系统不再是一个封闭的系统,而是受到多重结构和关系的深刻影响,这与张羽等人(2021)提出的系统范式中的“开放性”特点相对应,即教育研究应考虑到影响教育实践的社会文化情境。然而,在我国教育技术领域,很少有批判理论支持下的研究。在我国技术融合的大背景下,恰恰是这类研究的成果能够推动教育公平和全民教育的进步。
在20 世纪80 年代,一些实证主义范式下的认知科学家开始从教学实验转向设计实验,意味着研究从“控制”取向转变为“设计”取向。与实证主义范式下设计实验中的干预旨在验证因果关系不同,基于设计的研究中的设计本身即研究内容,旨在解决教育问题并提出新的理论以指导实践(Edelson,2002; Shavelson et al.,2003)。
美国认知心理学家、加利福尼亚大学伯克利分校Ann L.Brown教授基于她早期从事的实验研究和对元认知问题的兴趣,开始尝试真实情境下的设计研究。她在促进学习者共同体(Fostering a Community of Learners) 的研究中,确定了基于设计的研究(Design-based research,DBR)的基本框架(Brown,1992)。与此同时,美国认知心理学家、美国西北大学教育和社会政策荣誉退休教授Allan Collins 在1990 年题为“迈向一门教育设计科学”的汇报中详细阐述了如何开展基于设计的研究。这两位学习科学家推动了基于设计的研究的发展。可以看出,实用主义范式下基于设计的研究是在认识到实证主义范式下的认知科学远远不足以支持教育实践变革的情况下产生的。此类研究的主要特征是在真实情境下进行干预,研究者与实践者之间是合作关系,并遵循一定的理论发展和设计原则。这与张羽等人(2021)提出的研究目的为“实践改进”的观点是一致的。
实用主义认为不存在绝对的主观或客观,因此不隶属于任何一类哲学体系(Creswell,2009;Kankam,2019)。尽管实用主义范式下的微观发生法看似质性研究,但其背后的设计逻辑与解释主义下的质性研究完全不同(Goldkuhl,2012)。总体来说,实用主义范式下的研究与其他三种范式有所不同,其目的并不是发现真理、揭示现实或在争论中构建知识,而是帮助人类解决问题(Powell,2001)。在本体论层面,实用主义认为现实是各种思想在实践中的产物。在认识论层面,实用主义认为只要能产生实用的解决方案,任何想法和行动都是有用的。在方法论层面,实用主义认为单一的量化或质性研究方法具有局限性,因此提倡混合研究方法。然而,混合研究方法并非简单地将这些单一的方法打包使用,而是强调方法的开放性和研究人员的多元化,以解决真实情境中的复杂问题(Kelly et al.,2018)。因此,实用主义倾向于开展基于设计的研究和行动研究。
基于设计的研究既致力于研究真实情境中的活动,即期望直接影响实践,也包含理论上的启发创新,通过多次迭代提出新理论。与实验研究中通过信效度(尤其是外部效度)来证明干预的推广性不同,基于设计的研究中的推广性通常指的是新理论或原则在指导不同情境下的设计研究方面的适用性,而不是实证主义范式下所认为的可以脱离具体情境的具体行动或干预。
基于设计的研究是学习科学领域最典型的研究类型,其独特之处在于“干预设计”。柯小华和李红波(2008)认为,学习与生产力是设计(包括人、环境、技术、信念等)的产物。基于设计的研究类似于工程研究和设计研究,聚焦于特定的真实环境,在解决教育问题时设计人工制品。同时,它也与发展研究类似,研究是一个迭代的过程,关注过程、干预、合作、多层次,并以实用为导向。
举例来讲,Vanderhoven 等(2016)进行了一项基于设计的研究,旨在探究如何正确引导青少年使用社交网络。研究的第一阶段是与教育利益相关者组成焦点小组,通过三个探索性研究和现有文献建立了一个框架,说明了教学材料的设计原则。第二阶段根据第一阶段的框架明确了教学目标,并详细编写了教学材料。第三阶段在比利时中学课堂上使用开发的教学材料,在干预前后一周对学生的态度和行为进行测量。根据结果对教材进行修订,并对不同学生再次实施,这种开发—评估—改进的迭代过程共进行了五次。在实践层面,最终形成了有效的解决方案;在理论层面,形成了可以指导实践的教材设计原则。
此外,基于设计的研究的一个重要要素是研究者与实践者合作,在真实的教育环境中解决复杂的问题。这种方法整合了已知的设计原则,并在新技术的支持下优化这些原则。研究过程力求严谨,可以进行一定程度的反思,以探索、验证和改进创新的学习环境,并提出新的设计原则(Brown,1992; Collins,1992)。比如,Ustun 和Tracey(2020)采用混合研究方法,以探究混合式学习教学设计的实施。他们深度访谈了教师和教学设计专家,观察了真实的学习环境,并对学生进行了问卷调查。通过对开发的混合式学习课程进行三个轮次的迭代分析、设计和评估,成功提高了教师和学生的主动性。行动研究也可以在实用主义范式下进行。例如,黄琰等(2014)为提高翻转课堂的教学效果,让教师深度参与研究过程。他们首先开展了一轮行动研究来进行实践探索,并在反思和调整后进行了第二轮行动研究来验证实践效果,最终,这种教学模式提高了学生的积极性和学业成绩。
近三十年来,我们所处的时代发生了重大变化,数据科学的兴起直接推动了科学研究范式的变革。教育研究中的“数据”已经从传统的抽样调查数据和文本数据转变为时空、维度与规模上的“大数据”(朱波&王坦,2019)。数据革命的爆发使得人们开始重新思考在这样的时代知识是如何产生的(Mayer-Schönberger&cukier,2014)。在对“知识是什么”“知识是怎么产生的”“如何获得知识”的反思中,大数据使得各个研究领域开始审视一种新的研究范式出现的可能性。Gray 和Szalay(2007)认为范式的转变建立在产生新型数据与创新分析方法的基础上,因此他们提出科学探究迈入第四研究范式——数据密集型研究。
在此背景下,教育领域中的学习分析和教育数据挖掘研究在这轮变革中逐渐兴起,成为未来教育研究的重要取向(陈明选&俞文韬,2016),基于大数据和智能技术的“计算教育学”被视为教育学科发展的新方向(郑永和等,2020; 刘三女牙等,2020)。当然,与自然科学领域中范式具有排他性和进行更迭式的演化不同,在社会科学领域,研究范式的共存是常见的。因此,有关教育领域中数据密集型研究是否开启了新的研究范式,学术界仍存在争议。一些学者认为数据密集型研究本质上属于实证主义范式(赵佳丽等,2020),当前的教育数据密集型研究以量化方法为主(郭炯&郑晓俊,2017)。本研究认为,数据密集型研究看似采集与分析了大量的“数字化”数据,但从其对这些数据在本体论与认识论上所持有的观点来看,并不是将实证主义范式下量化研究中同类数据变“大”这么简单。将教育数据密集型研究视为实证主义范式下的量化研究其实反映出张羽等(2021)提到的国内教育研究对自然科学领域中实证主义的过度推崇和盲目信任。
传统实证主义范式下的实验研究往往通过演绎逻辑从理论中提出研究假设,与此不同的是,数据密集型研究往往事先并没有特定的研究假设,而是可以视为先在解释主义或是批判理论的指导下,从数据分析中探索规律,在实用主义所倡导的迭代设计中生成理论、提炼研究假设,然后才采用实证主义范式的演绎逻辑进行研究(Kelling et al.,2009)。它其实倡导将归纳逻辑纳入研究设计中,但这也并不意味着将解释与归纳作为研究的终点(Kitchin,2014)。在认识论层面,数据密集型研究在探索数据与建构理论的过程中发现潜在的研究问题与假设,进而开展研究。这里所谈及的理论与实证主义范式下的理论其意义不同,数据密集型研究中的理论往往是在数据挖掘过程中生成的,并用于指导研究假设的提出,是一种知识发现,而非通过数据挖掘去验证理论。这样的数据分析也并不像产业界的极端经验主义那样对数据盲目崇拜,数据分析不是研究的终点,重视数据并不意味着理论的终结。
尽管教育数据密集型研究看似与数据打交道,形似实证主义范式下的量化研究,但实际上它将数据中蕴含的规律视为教育中的“人”无法直接获取的经验,以丰富解释主义所强调的“情境性”、实用主义所倡导的“真实性”以及批判理论所坚持的“开放性”。此外,不同于传统经验主义强调的来自感官的经验才是一切知识的来源,数据密集型研究将经验主体从人延展至智能体与环境,智能体所能捕捉到的“经验”(数据)嵌入人可感知到的“经验”(叶蕊&张睦函,2023),这些“经验”甚至还包括来自大规模人本计算和模拟仿真的数据。
传统经验主义范式中,对经验进行解读被认为是教育思辨研究。数据密集型研究与传统经验主义依赖的归纳逻辑亦不相同,数据密集型研究在理论指导下判断潜在研究兴趣点与值得研究的内容的方式被称为溯因推理(Abductive Reasoning)(Kitchin,2014)。溯因推理由美国哲学家和逻辑学家Charles Sanders Peirce 提出,其将之视为归纳与演绎外的第三种推理方式,也是唯一可以产生新知识的推理方式。溯因理论方法(Abductive Theory of Method)包括现象检测和理论构建(理论生成、理论发展、理论评估)(Haig,2005)。
可以看出,数据密集型研究在本体论、认识论与方法论层面,对“数据”与“经验”是什么、理论有何意义、采用何种推理逻辑与研究路径等问题的回答,与实证主义和传统的经验主义都截然不同,产生了新的、有价值的知识和见解。Kuhn(1962)提出的范式理论认为,范式转变是因为现有范式无力回答与解读已改变的现实,因此诉诸新的思想、认识与方法的建立。从这一范式理论视角来看,教育领域的数据密集型研究代表了一种新的研究范式,不妨称其为“新经验主义”。在本体论层面,它认为数据即分布式的“经验”;在认识论层面,它认为这些数据经验受简单规则约束,需要对数据间关系进行建模从而发现人类尚未认识的基本规律;在方法论层面,它以复杂系统建模为主,旨在深入认识教育复杂系统中不同层次的元素和主体,以及它们之间的交互关系和演化机制。对于“新经验主义”这一提法,虽然容易被误解为传统思辨研究的接纳者,但实际上它体现了教育研究范式创新的学科自豪感:既不盲目地崇尚科学主义,也不简单地直接照搬自然科学领域中的研究范式。而且数据密集型研究带来的新经验主义范式,无论是复杂系统建模、人本计算还是模拟仿真,都需要真正意义上的跨学科合作。
对于一些敢于创新的解释主义和批判理论主张者来说,新经验主义范式下的数据密集型研究促进了质性研究的发展。在这一范式下设计的教育研究可以获取丰富的、电子化的、相关联的、不同类型的结构化与非结构化数据,这些数据大部分是一些全新的数据(比如,社交媒体中产生的数据),或者是以往很难获取的数据(比如,数以百计的历史文档与照片的电子化资料)(Cohen et al.,2008),同时还带来了新的数据存储、管理和分析工具。教育研究不再局限于几门案例课程、几个在线社区的论坛或是几段教室里的视频,探究成千上万这样的新媒体数据成为可能(Manovich,2011)。尽管学习分析研究看上去是对“数据”进行分析,如上所述,新经验主义范式下的学习分析并不同于传统的实证主义范式下的量化研究,它其实是在解释主义范式下采用实证的方法去探究现象,即用新的量化数据分析手段辅以已有的质性研究方法,结合传统的解释分析与理论推演,从而能够设计出一些创新性的教育研究,来回答以往由于数据量小和计算能力欠缺而不可能解决的教育复杂性问题。
当然这样的研究设计也引起了一些传统解释主义范式主张者的担忧。比如,生成式人工智能的兴起使得解释主义范式与批判理论的主张者担心,研究者太过于依赖自然语言处理技术,把文本数据交给机器去学习,而忽视了文本与话语分析过程中对意义的建构,而文本中传递的信息需要在一定的文化、政治背景下去解释。在这个问题上,解释主义范式的主张者其实是将数据密集型研究归为了实证主义范式,认为大数据研究采用的是机械的、分割的、狭隘的思想去简化不同特征的人以及随之而来的复杂性,把数据层面的多维度建模技术作为研究的核心(Wyly,2014)。这其实是因为解释主义范式主张者还没有真正理解“大”数据与“小”数据在本质上的差异。更重要的是,大数据研究中采用机器学习进行模式识别并不是这类研究要回答的研究问题,相反,被识别出的模式其实是为了帮助提出传统解释主义范式下并不能回答但“具有意义”的研究问题,从而推动研究者收集更加“丰富”的数据,为解释教育问题和现象的复杂性做出努力。
对于实证主义范式和实用主义范式的主张者来说,这样的研究使得我们有机会去建立有关人类社会的更加复杂的、大规模的与精致的理论模型。大数据技术使得教育研究从数据贫乏(Data-scarce) 走向数据丰富(Data-rich),从对现象的静态快照发展到动态捕捉,从对研究对象进行笼统的组别抽样转变为在高分辨率下进行提取,从建立简单的模型发展到开展长周期的模拟演示成为可能(Kitchin,2014)。在这样的范式之下,教育领域势必会产生一系列更宽、更深、更大规模以及长期跟踪的研究,这些跟踪研究在本质上会是长期的纵向研究,与当下的静态研究形成鲜明对比(Batty et al.,2012)。此外,数据类型的繁多、数据的高精度、数据质量的混杂,加上不断增强的计算能力与数据分析能力,使得新经验主义范式下开展的研究能够规避实证主义范式研究长久以来受到的简化论(Reductionism)与普遍性(Universalism)的质疑。与之相反,教育大数据研究设计能够把境脉与不可控因素(Contingency)考虑进来,在复杂系统论的视角下,对数据展开精细的、敏感的、细微的分析,从而优化和扩展我们对于社会与物理世界的认识乃至形成新的理论(Kitchin,2013)。与此同时,考虑到数据的广度与细度,这类研究能够在不同的教育情境中检验理论的准确性。
学习的复杂系统概念框架认为,学习发生的情境本身也是一个复杂系统(Jacobson et al.,2016)。然而,在数据密集型研究兴起之前,教育领域的传统研究范式并不能指导我们认识这个复杂系统中不同层次的元素和主体,包括神经、认知、个人、人际、文化等。更重要的是,即使我们意识到这个系统在各个层次上存在着交互与反馈,从而使整个系统产生了在个体或局部层次上不具备的集体复杂特征,我们也无法采集到所需的过程性数据,并且也没有合适的方法来揭示集体复杂特征是如何产生的。复杂系统中的个体或主体通过交互进行学习和适应,这意味着我们应该关注个体或主体之间的交互行为,因为这些行为会导致系统层面上复杂规律的产生。然而,遗憾的是,因为我们没有进行范式创新,所以无力指导如何采集有关这些交互的过程性数据,以及如何存储和分析这些数据。有关教育复杂性的研究止步于理论探讨和概念建构的层面。
推动教育复杂性研究的关键在于范式的变革与创新。具体而言,复杂系统建模的思想是对由大量节点和连边组成的大规模网络进行分析,旨在理解微观层面的交互影响宏观性质的机制所在。这种相互作用网络的复杂性可以体现在网络规模、节点的异质性、层级关系的网络拓扑结构、网络动力学行为和演化以及时间空间复杂性等方面。随着互联网时代教育新形态的发展,其规模性、开放性、灵活性和动态性不断增强,如何运用复杂系统思维进行建模并探究其动态演化机制成为新的发展趋势和研究重点。复杂系统的概念,如自组织和涌现性,已经开始在教育研究中崭露头角。教育学家和研究者逐渐认识到教育领域中并不存在简单的因果关系,无法完全解释或预测社会认知过程的结果,但可以尝试通过简单个体之间交互所产生的复杂结构来解释认知推理与问题解决等教育问题。
目前,教育领域中关于复杂性或复杂网络的研究可以大致分为三类:第一类研究中,网络分析起到了“放大镜”或“望远镜”的作用,利用技术的便利性和数据的规模化,简化了原本费时费力的教育研究,并采用更优的可视化方法呈现研究结果。然而,在这类研究中并不需要创新研究范式,可以延续实证主义、解释主义、批判理论或实用主义范式来指导研究设计,网络分析被视为研究方法中使用的一种技术和工具。第二类研究中,复杂网络分析起到了“显微镜”的作用,即对于某些在教育中真实存在的复杂规律,肉眼观察不到,也就是采用传统的方法即便不计成本也无法回答此类研究问题,只有通过基于数据的复杂系统建模才能进行探究。这种“显微镜”类型的教育研究是当前急需的。然而,现有教育数据存在不少问题,如不准确、不完整、选择不当、指标偏颇等(Selwyn,2019)。因此,采集什么数据、如何采集数据以及如何分析数据变得尤为重要。第三类研究中,复杂系统建模起到了“牛顿支点”的作用,需要从足够大的规模上来探究教育规律。这个规模并不是指传统意义上宏观、中观和微观层面的尺度,而是使用复杂系统建模构建一个符合真实教育情境的新的抽象的空间。在这个新空间中,存在着简单法则,并且这些法则深刻地影响着从个体到系统各个层级的教育现象。换句话说,无论是传统意义上的宏观、中观还是微观研究,都需要遵守这些简单法则,其犹如“无形的手”。在不同的层面上,教育复杂性现象中的适应、进化和涌现看似会产生无数可能,但所有生物与社会现象都受到简单法则的约束。然而,当前新经验主义范式下的数据密集型研究兴起之际,这类研究尚未受到足够重视,并且由于其对简单法则的探索,容易让在本体论、认识论和方法论上尚未接受新经验主义的研究者认为,这类研究遵循的是简化论的思想,难以还原教育中的复杂性,也未考虑到教育中的情境性。其实,这类研究才能真正彰显新经验主义范式下数据密集型研究的价值,并应成为未来教育研究中真正受到关注的方向。为了尽早实现第三类研究的愿景,教育研究需要真正接纳人本计算与模拟仿真这类跨学科合作,从而在真实的教育实践中产生“大”而“自然”的研究数据,并实现对教育系统在长周期内随时间的演化进行模拟。
在新经验主义范式下的数据密集型研究中,数据被视为类似于人的经验,直接影响着复杂系统建模表征真实教育现象和活动的方式。新经验主义范式下的数据采集并不能采用与实证主义范式相同的数据采集方式,因为在数据密集型研究中,所需的“大”数据可能会给参与者带来沉重负担,或存在教育伦理风险。教育中的数据离不开人的参与,传统的问卷调查、访谈等自我报告数据是重要的研究数据来源。然而,这类研究数据的采集工作与真实教育实践中生成数据的工作是割裂的,因此这类研究数据的效度受到多重因素的影响,包括提问者的问题清晰度、语言和措辞、提问时间等,以及被试的记忆、语言文化背景、理解能力、性格、社会期望偏差和晕轮误差等(Gonyea,2005)。在这些现实条件的限制下,数据密集型研究如果仍然采用“非自然的”数据采集方法,往往难以收集到大规模真实可信的数据。
因此,公众参与到数据收集和分析工作中的“公众科学”(Citizen Science)和“人本计算”(Human Computation)可能成为解决真实教育数据采集问题的突破口。2008 年,牛津大学、约翰斯·霍普金斯大学等机构发起了“星系动物园”(Galaxy Zoo)活动,让公众对星系和疑似星系的照片进行鉴别和分类,目前已有超过25 万人参与,并提交了上千万份分类结果(Mankowski,2011; 胡昭阳& 汤书昆,2015)。类似地,康奈尔大学的ebird项目将需要分类的鸟类图片分配给公众,用户也可以上传鸟类观察记录,该项目已吸引了数十万用户,并衍生出超过百篇学术论文(金瑛等,2019)。2009 年,在为纪念达尔文200 周年诞辰开展的“进化实验室”活动中,研究者邀请公众对所在地附近蜗牛的数量、特征和环境等信息进行采集,科学家随后进行整合和分析,欧洲已有15 个国家的公众参与到该项目中(牛毅冲等,2017)。人本计算的另一种有效形式是游戏,用户在休闲娱乐的同时完成标注等任务。Luis von Ahn(2006)提出的“有目的的游戏”(Game with a purpose,GWAP)是其中一种形式。例如Verbosity 游戏(von afhn et al.,2006),随机匹配两个玩家玩类似于“你说我猜”的游戏,其中描述者会被给予一个单词并对其进行描述,猜测者猜对即可得分,描述者所做的描述将被记录下来作为标签进入常识库。目前,某些教育系统具有一定的封闭性,无法获取教与学过程中的数据,而“人本计算”使得大量普通公众通过互联网技术参与科研数据采集和分析,完成计算机难以处理但对人类而言相对容易的微任务,在收集大规模跨区域数据方面具有极大优势,是新经验主义范式下研究数据采集可借鉴的方向(张婧婧&封晨,2017)。
Gray 和Szalay(2007)提出的第三代科学研究范式,即计算机模拟仿真,在过去的教育研究中并未被广泛采纳。随着第四代科学研究范式的出现,计算机模拟仿真在教育研究中似乎迎来了新的机遇。在教育研究中,我们不能盲目地追随研究范式的更替,而是可以考虑在新经验主义范式下,采用计算机模拟仿真研究方法来解决教育长周期数据和分析方法匮乏的痛点。
教育是一项百年树人的事业。对于某些研究问题而言,在“真实世界”往往无法收集到长周期、多时空的海量数据以进行跟踪和开展动态演化研究。基于真实数据的计算机模拟仿真可能为这类教育研究提供突破口。例如,多主体建模(Agent-based modeling,ABM)被广泛应用于模拟仿真个体或团体的行为交互。这是一种在国际上较为常见而在国内教育研究中相对少见的方法(吕晶,2020)。ABM方法具有灵活的模拟规则和代理数量设置功能,可以捕捉到“涌现”现象。它在高校合作(如创新扩散)、学术活动(如教师招聘、学术合作、同行评议等)、高校招生(择校)和学生表现等方面都有应用价值(Gu&Blackmore,2015)。教育系统具有复杂性和演化性,ABM 方法使得我们能够发现不同尺度上的规律,并进行长期的模拟和预测,具有极高的推广价值。
举例来说,张婧婧等(2019)以学堂在线平台的所有课程及其推荐关系作为网络建模的原始数据,探究了大规模开放在线课程的跨学科性。这种研究方法与实证主义的理性观不同,秉承的是把数据作为经验的认识论,认为理论与知识应当在数据挖掘中通过归纳演绎产生,而不是存在着绝对正确的理论与知识(比如,跨学科的定义)来指导实践。在该研究中,对课程的跨学科性分析采用了一系列网络科学中的指标,来衡量课程及其推荐关系所形成的网络的局部性和全局性结构特征,并通过传染病模型对学科课程网络中引入新课程导致学科多样性发生变化的过程进行了模拟。之所以采用模拟仿真的方法,是因为现实中难以采集到大规模学习者在一个长周期中学习多门课程的数据,并且可能存在伦理问题。再如,群体协作中成员行为之间的影响和依赖一直以来都是研究的难点。Halpin(2021)提出使用K分网络(K-partite network)描述小组协作行为的方法。在这种方法中,每个成员作为K分网络的一个组件,每个节点表示一个行为,连边表示行为之间的先后关系。研究者通过马尔科夫算法对行为序列进行建模,最终发现成员之间的相互依存性比小组成员的能力或互动总数更能预测小组绩效。这一方法为揭示成员间相互依赖关系提供了新的视角。
互联网时代,复杂系统观应该成为教育系统的思想基础(陈丽等,2023)。随之而来的大数据和相关分析技术正在作为“破坏性创新”冲击着原有研究范式(Kitchin,2014)。根据Boyd和Crawford(2012)的观点,数据密集型研究实际上正在重新定义我们对社会和世界的认知以及认识世界的方法。我们认识到,大数据倡导的是一种新经验主义观,它在本体论层面认为数据即经验,在认识论层面认为这些数据经验受简单规则约束,需要对数据间关系进行建模去发现基本规律。换句话说,我们可以通过对数据与经验进行建模从而生成理论来认识这个世界。在商业界,极端的新经验主义观盛行,认为新经验主义时代的到来标志着理论的终结,并将大数据视为知识的一种经验表征(Anderson,2008)。然而,在学术界,新经验主义范式下的数据密集型研究将数据作为“原始的”“粗糙的”但“有价值的”“可挖掘的”经验,需要通过严谨的研究设计去发现其价值。这一类研究坚持采用科学与严谨的方法,以更加包容溯因、归纳和演绎的混合方式推动我们对于现象的认识,而不是直接将数据或者这类经验作为知识与理论的表征。
更重要的是,教育研究者,无论是实证主义范式主张者、解释主义范式倡导者还是批判理论家与实用主义范式下的学习科学家,都需要在本体论、认识论和方法论上真正认可范式创新给我们带来的机遇与挑战。教育领域的范式共存使得我们的教育研究多元化,但我们需要避免在研究设计中混淆本体论、认识论与方法论的立场,这并不是范式共存,而是没有真正理解不同教育研究者所秉承的范式和哲学观。
值得指出的是,我们倡导的实证研究(Empirical study)并不是实证主义范式下量化研究的简称。实证研究的提法主要是与思辨研究形成对比,强调研究结果的得出是基于经验或证据而非纯粹的哲学思考,属于传统经验主义的范式。实证研究既可以在实证主义范式下,也可以在解释主义、批判理论、实用主义范式或是新经验主义范式下展开。因此,我们需要以更加开放与宽容的心态去接纳教育领域中范式共存与共荣的现实,尝试去理解解释主义中关注的个体经验、实证主义中的操作性定义以及批判理论下人类社会的权力关系(扬德里克等,2020),在融通西方理论与中国智慧的基础上,认识到所有研究范式的意义与局限,寻求教育研究范式的发展与创新,推动中国教育学以独特的风格屹立于世界学科之林(李均,2018)。