马 晓,唐 炎
(1.上海体育学院 体育科学研究院,上海 200438;2.上海体育学院 体育教育训练学院,上海 200438)
近年,随着跨学科能力培养与“校园一体化”系列教学改革措施的不断深入(Kohl et al.,2013),打破体育锻炼与学业教育二元结构已成为促进学生身心协调发展的基本诉求。由此,一种体育与智育相结合的新型教学形式——体智融合教学应运而生(Goh et al.,2018;McMullen et al.,2016),且在推广应用过程中显著提升身体活动水平,有研究还取得了显著的学业效益(Barrettwilliams et al.,2017;Bublitz et al.,2017;Drummy et al.,2016;Goh et al.,2018;Maykel et al.,2018;Norris et al.,2018;Seljebotn et al.,2019;Watson et al.,2019)。这种学业效益不仅体现在学业成就测验成绩、标准能力测验评价结果,以及学业随堂测试成绩的提高,同时还表现为课堂注意等学习行为方面的显著进步与优化。针对学业效益来源的分析衍生出了大量随机对照实验研究和截面数据分析,在理论取向上可大致分为认知功能提升假说和课堂行为优化假说。目前,针对课堂行为优化取向的相关研究业已取得了较为一致的结果(Maykel et al.,2018),但从机制层面对其运动、心理、教育原理进行的探讨尚未获得一致性研究证据的支持(Verhagen,2020)。本研究认为,体智融合研究存在的这种差异化甚至完全相悖的研究结果与各项研究在干预剂量规划与落实、学业效益分离与评价方面存在的方法学问题密切相关,以致难以阐明学业效益的来源机制。基于此,拟对体智融合教学学业效益研究的发展脉络进行回顾,以两种解释取向为起点,归纳研究中存在的干预与评价问题,探讨后续研究的思路与方向。
20世纪末,随着美国青少年肥胖发生率的持续攀升,中小学体育课普及不足、体育教师专业资质匮乏等学校体育教学存在的问题日益凸显。为了尽快解决中小学学生体质健康问题,美国提出了以《K-12国家体育教育标准》替代以走、跑、跳、投为主的基本运动技能教学,在充分挖掘体育育人价值的同时,鼓励标准化中小学体育课程的开发与应用(Pangrazi,2003)。在此背景下,1989年,美国圣地亚哥州立大学主导开展了SPARK体育教育项目(The Sports,Play,and Active Recreation for Kids Programs)(Sallis et al.,1993),以圣地亚哥市郊7所小学的全体四年级学生(n1990=955,Mage=9.25±0.50)为样本进行了为期2年的三臂队列对照实验,以探讨体育课对学生身心健康的促进作用。该项目设置的实验条件为专业体育教师、受训班主任以及对照组。其中,专业体育教师和受训班主任属于体育教学条件,教授运动技能、MVPA和自我管理相关内容。在干预期内,每周实施3次干预,每次30 min,包括15 min体质健康活动和15 min技能活动,内容涉及有氧体育舞蹈、有氧游戏、跑、走、跳绳等10个健康素质项目,以及篮球、足球共9个学习单元(McKenzie et al.,2009;Mostafavi et al.,2013)。自我管理部分则以实施每周30 min室内教学形式为主,教授内容分别为自我监控、目标设定、刺激调控、自我强化、自我指示训练、问题解决,旨在帮助小学生建立课外自主锻炼的好习惯。虽然SPARK项目的干预内容与学业教学内容无直接的关联性,但至研究结束时,入组学生的健康素质和阅读、语言、数学等学业表现均显著提升(Centers for Disease Control and Prevention,2010;McKenzie et al.,1997)。该项目使得学校体育教育的学业促进价值备受瞩目,而且经过专业化培训的班主任均可掌握简单的体育教育技术(Sallis et al.,1997),为后续体智融合教学的方案设计与教师培训积累了经验(Dowda et al.,2005;Sallis et al.,1999)。
自SPARK项目之后,相关研究进展缓慢,直至2000年4月,美国国际生活科学研究与健康促进中心(International Life Sciences Institute Center for Center for Health Promotion,ILSI CHP)提出制度顺应性校内运动机会的理念后,体智融合教学方才正式提上中小学教育改革日程。制度顺应性是指在不妨碍正常教学进度的前提下,将运动分别嵌入数学、科学、社会学习、语言艺术等学科的教学当中(Peregrin,2001),帮助学生实现每天至少60 min的中高强度身体活动(moderate-to-vigorous intensity physical activity,MVPA),以达到促进学生身心协调发展的目的(Katz et al.,2010)。该理念经专业团队设计,最终以TAKE 10!®教学干预项目的形式在美国亚特兰大地区27所小学进行了为期10周的试点应用(Kohl et al.,2001),后续结果表明,该项目运动强度规划合理,不仅能够提升学生中高强度的身体活动积累,减少课堂久坐时间,还可有效缓解小学生课堂注意分散进程,提升学业表现水平(Kibbe et al.,2011;Stewart et al.,2004)。
自2000年以后,以共享、整合为基调的校园一体化方案在丰富学生校内生活,优化学习机会,提升儿童青少年学业表现及身心健康方面取得了瞩目成就(Hawortha et al.,2015),极大地推动了后续运动、饮食营养等校园健康干预计划的拟定与实施。2001年,澳大利亚对7~15岁四年级、八年级学生进行的学校体质健康调研(The Australian Schools Health and Fitness Survey)数据进一步支持了体育与学业之间的正相关关系(Vetter et al.,2019),为体育与智育之间的相关性提供了大数据支持。作为最早开展体育运动学业促进价值相关研究的国家,美国和澳大利亚近20年来开展了大量教学干预项目,不断提升教案专业化水平、标准化水平、趣味性与科学性,相继形成了多种适宜不同年级自由选用的成套教学干预方案,并通过随机对照实验检验应用效果、澄清效益来源。除了TAKE 10!®项目,近年美国、澳大利亚、英国、荷兰相继报告了A+PAAC(Academic Achievement and Physical Activity Across the Curriculum intervention)(Donnelly et al.,2017)、Energizers(Riley et al.,2015)、I-CAN!(Bartholomew et al.,2011)、EASY Mind(Riley et al.,2016)、ACTI-BREAK(Watson et al.,2018,2019)以及 Active Classrooms(Martin et al.,2015a,2015b,2017)、TWM-E(Mavilidi et al.,2020)、“Fit&Vaardig op School”[Fit and Academically Proficient at School(F&V)](Mullender-Wijnsma,2016)等大型研究项目的结果。
目前,体智融合教学的干预周期短则4周,长则3年。已公布的EASY MIND(6周)、TWM-E(4周)和Virtual Traveller(6周)等项目均取得了显著的数学、英语学业干预效果和课堂注意行为改善(Mavilidi et al.,2019,2020;Owen et al.,2018;Riley et al.,2015,2016;Stapp et al.,2018)。基于教学方案应用场景与知识结合紧密程度的差异,体智融合教学逐渐分化为嵌入课堂教学的课堂融合模式和作为课堂间隔的课间融合模式。课堂融合模式是在常规课堂教学中嵌入5~10 min与所授知识相关的身体活动或通过体育游戏完成的课堂练习,其教学应用涉及数学、阅读、拼写、科学、艺术等(Erwin et al.,2013;Mavilidi et al.,2018;Riley et al.,2015,2016;Vazou et al.,2017;Vetter et al.,2019),典型的教学模块包括3×3随机字母矩阵跳跃拼写任务(Mavilidi et al.,2018)、往返跑计数与加和任务(Donnelly et al.,2013)、字谜接龙(Grieco et al.,2016)等。随着虚拟现实技术(virtual reality,VR)、动作游戏(active videogame,AVG)(Chen et al.,2017)、地理信息技术等科技手段在教学中的应用,与地理知识相关的户外运动知识和元素得以通过更具象的形式融入课堂(Norris et al.,2016,2018),从而进一步拓展了体智融合教学的应用范围,提升了课程的趣味性和沉浸感。课间融合模式则以运动为主,其与教学内容的关联匹配程度相对较低,单次干预时间大多选择10~30 min,依课间融合安排的运动内容、运动强度规划差异可进一步细分为结构化课间和非结构化课间。经典干预方案以Energizers(Bailey et al.,2015;Mahar et al.,2006)、ACTI-BREAK(Watson et al.,2018,2019)、Brain Breaks(Glapa et al.,2018;Popeska et al.,2018)和TWC步行计划(The Walking Classroom Program)(Stoepker et al.,2018)等大型体智融合研究项目最具代表性。
目前,针对体智融合教学的随机对照研究、大样本回归分析(Correa-Burrows et al.,2017)、模型分析(Aibar et al.,2020;Wang et al.,2019),以及系统分析和元分析结果(Beck et al.,2016;Donnelly et al.,2016;Vazou et al.,2016)均肯定了体智融合教学的健康效益(Alhassan et al.,2016;Popeska et al.,2018;Martin et al.,2015),亦支持其对学生课堂表现、学业成绩的提升作用(Vetter et al.,2019),尤其是学业效益既可见于课堂融合模式(Donnelly et al.,2017;Seljebotn et al.,2019),亦可见于课间融合模式(Howie et al.,2015;Mavilidi et al.,2019)。然而,体智融合教学在知识贯通、课堂重构方面的创新对教师综合素质、教案设计水平、教学环境配置提出了更高的要求,在一定程度上影响了教学方式的普及。同时,部分长程项目,如A+PAAC项目,在延长运动时间、提升运动强度、增加教学科目和认知与运动评价指标后,干预效果未能获得统计结果的支持(Donnelly et al.,2009,2017);部分小样本研究在扩大样本后亦出现学业表现提升维度的差异(Mavilidi et al.,2018),提示,当前体智融合教学研究中运动干预方案设计与干预效果之间的关联尚未达到剂量化水平。
对体智融合教学学业效益的探讨实质上是运动刺激-学业表现研究的延展,其对学业效益来源的解释可分为以心理学取向为主的运动认知功能提升假说和以教育学取向为主的运动学习行为优化假说。前者立足于个体的认知发展,后者则重在知识的教学与建构,二者从不同角度分别阐述了体智融合教学的学业效益来源。
运动认知功能提升假说以运动益智论和认知与学业呈正相关的证据为基础,以运动相关脑塑造效益为佐证,构建了以认知为中介变量的“运动-认知-学业”效益路径(Chaddock-Heyman et al.,2018;Lima et al.,2019;Oberer et al.,2018)。Donnelly等(2011)在对既往有关运动促进学生身心发展以及运动与学业成就关联性研究回溯的基础上,提出了以运动、心肺功能、肥胖、认知水平为影响因素的学业表现解释模型,其中,运动、心肺功能、肥胖被视为认知功能的独立影响因素,而认知功能的变化对个体学业表现具有重要影响。换言之,运动在提升健康水平的同时可改善个体的认知功能(Koutsandréou et al.,2016;Subramanian et al.,2015;Van Der Niet et al.,2015),进而促进其学业表现(Beck et al.,2016;Kern et al.,2018)。多项干预项目的研究结果皆支持运动与学生学业成绩、能力及认知功能密切相关的论述(Mullender-Wijnsma et al.,2015;Haapala et al.,2014;Hillman et al.,2014;Van der Niet et al.,2016;Vazou et al.,2014)。而认知神经科学研究则从运动与脑发育水平关系的角度为该假说提供了神经生物学解释。在运动过程中,运动引发的认知投入对认知功能具有练习作用(Schmidt et al.,2016,2015),运动本身对儿童大脑相关功能区具有激活与塑造作用(Donnelly et al.,2016;Hillman et al.,2008,2012;Subramanian et al.,2015),而且运动对神经内分泌系统的刺激可使其体内多种兴奋性神经递质的分泌增加(Hillman et al.,2009),因此与同龄儿童相比,长期进行规律运动的儿童,其脑结构和神经通路发育更好。研究显示,青少年脑发育程度越接近成人则其认知水平越高,越有可能获得较高的学业成就(Azad et al.,2015;Chaddock-Heyman et al.,2018;Chang et al.,2012;Feter et al.,2019;McMorris et al.,2015;Vaynman et al.,2015),提示,长期进行规律运动可以提升个体的学业表现。虽然这一效益假说具有相对完整的机制解释,但单独的运动干预研究结果并未获得链式效益检验的有效证据,而且小样本研究亦未能在大样本随机对照研究中获得一致性结论(Vazou et al.,2016),如高认知投入的运动课间无益于学生刷新任务和抑制任务,甚至可能损害转换任务表现(Egger et al.,2018)。Schmidt等(2016)所提供的运动-认知效益受个体在运动过程中被激发的情绪调节的证据,进一步佐证了运动-认知效益假说尚不足以全面解释体智融合教学学业效益(De Greeff et al.,2016a)的发生路径。
运动学习行为优化假说以学业表现是学习效果的体现为基础,立足体智融合教学方式的特征,从教学组织与知识传授方式对学生课堂投入影响的角度对体智融合教学学业效益的来源进行分析,并构建了以课堂注意行为作为中介的“运动-课堂专注-学业”效益假说(Riley et al.,2015;Stapp et al.,2018)。学业表现不仅与个体智力、认知水平有关,还受到个体学业投入的影响,如学生的课堂学习状况,特别是课堂注意。Evans等(1997)提出注意重置理论(Theories of Attentional Reset),认为游戏化课间休息不仅对儿童转换注意、重新聚焦于后续学业任务具有积极的促进作用,同时对丰富个体体验和经验、提升教学效果亦大有裨益。针对课间休息和课堂注意与学生学业的复杂相关性,体智融合教学通过检验干预前后学生课上任务专注时间,以及课上专注与非专注行为发生频率的变化(Mavilidi et al.,2020;Stapp et al.,2018),探讨体智融合教学对学生课堂表现的影响,并通过学业能力测试或知识学习效果评价形成“运动—课堂专注—学业”的效益发生路径(Riley et al.,2015;Stapp et al.,2018)。评价结果显示,体智融合教学所取得的学业效益与运动对个体注意品质的优化相关,即学生课堂专注时间延长、课堂分心行为减少。相对于学业表现是个体认知水平外化的“认知-学业”理论,课堂行为优化假说更注重个体在学习过程中的付出,即学业表现是个体课堂学习结果的反映。运动学习行为优化假说的理论基础在于教学对学习表现的影响,但体智融合课间的学业促进效益并未显著优于有氧运动课间(Fedewa et al.,2018)的结果,使该假说有关教学方式可影响学习结果的论断备受质疑。虽然体智融合教学延缓学生课堂注意涣散进程的效益(Goh et al.,2016,2018)得到了不同强度运动干预研究结果的支持(Grieco et al.,2016),且对小学男生的作用尤为突出(Watson et al.,2018,2019),但这种效益只是停留在降低学生课上分心行为发生频率和促进课堂学习策略的选用,并未对学生课上回答问题、参与互动等课堂投入行为产生显著的影响,特别是对学生的学业态度并无积极影响(Owen et al.,2018)。故而,当前运动—课堂投入—学业的效益路径仍停留在单纯描述个体行为,而对专注行为改善背后深层的教育、学习、心理机制的解释相对不足,因此尚不能完全揭示课堂运动干预与学业改善的量化关系。
综上,当前效益解释假说及其研究证据尚无法解构课堂注意行为与个体心理之间存在的潜在联系,亦鲜见行为塑造与心理能力之间基础研究证据。同时,基于运动、健康水平、认知功能、学业表现的相关关系,当前的两项效益解释假说在生理基础的解释上有待进一步完善。
体智融合教学项目自应用以来,虽然在教案设计、教师培训、实施流程上积累了丰富的经验(Dinkel et al.,2017),但作为一项教育现场实验研究,早期研究大多采用准实验设计(Van der Niet et al.,2016;Verhagen,2020),部分研究存在无前测或对照组设置不完全等不足(Graham et al.,2014;Mullender-Wijnsma et al.,2015),不利于厘定实验效果和总结经验。虽然近年随机对照干预方案应用于体智融合教学已日臻成熟,但干预剂量依据不明、干预周期过短、干预过程执行监管不力等问题仍是导致实验结果偏倚的重要风险来源(Watson et al.,2017)。
当前干预剂量的设计依据主要来自实验室运动认知干预的研究经验和学校环境的执行限制,通常单次干预时间为5~15 min,部分研究可达20 min或以上;单周干预频率在3~5次。已有研究表明,单次5 min的运动干预由于时长过短(Howie et al.,2014),经随机对照实验证实无法显著提升小学生的学业表现(Watson et al.,2018,2019);而单次10 min的有氧运动课间融合教学方案对小学生阅读能力的提升效益则得到多水平增长模型分析结果的支持(Fedewa et al.,2018)。由此推断,单次干预时长的有效取值以10~20 min为宜。除了实验证据外,有研究者认为,干预剂量的设计还可结合运动健康指南和校内已有运动机会进行整体设计。这一建议的依据为,若每周MVPA累积时长达到健康部门推荐的50~70 min,则受试者学业表现更佳(Aibar et al.,2020)。Donnelly等(2013)在规划运动干预剂量时,首先根据健康部门建议的运动量核算学生在校运动总时长,然后再计算当前在校运动剂量与目标剂量差额,以此为依据确定日均干预剂量,经过为期3年的运动干预,体智融合教学干预组学生韦氏个人测验(Wechsler Individual Achievement Test-Third Edition,WIAT-Ⅲ)有关阅读理解、数学能力、拼写能力3个维度显著高于对照组(Donnelly et al.,2017)。
基于探讨问题的不同,干预研究可分为单次干预、短期干预和长期干预研究。教育对个体心理与行为影响的相关研究多采用中长期干预,以长程追踪设计或队列设计观察教学干预对个体身心发展影响的动态变化,以及干预结束后心理行为改善的保持。既往体智融合教学研究所设定的干预周期短则4周,长则3年。如A+PAAC项目开展的相关研究大多持续1年以上,并在周期内进行若干次中期测试,以考察在体智融合干预下,学生运动水平、认知水平、学业表现的动态变化;早期开展的TAKE 10!®项目采用8周观课数据探讨体智融合教学对学生注意涣散进程的延缓作用(Kohl et al.,2001);其他一些研究则针对学生周期内学业效益的阶段性变化展开(Mavilidi et al.,2020;Donnelly et al.,2017;Donnelly et al.,2009;Donnelly et al.,2013)。此类研究虽然取得了较为丰富的研究资料,但因历时长、实验控制欠佳,导致学业效益评价结果的一致性未尽如人意。而近年开展的干预实验则主要采用4~8周的短期干预方案(Mavilidi et al.,2019,2020;Owen et al.,2018;Riley et al.,2015,2016;Stapp et al.,2018)。这一变化在一定程度上降低了儿童身心发展对教学结果的影响,但过短的干预周期是否符合学生的知识学习规律和能力发展规律尚需进一步效益评价结果的推定。同时,当前以截面数据和短程干预为主的实验设计,存在周期短、中期操作检查与效益评价不足等问题,难以进行交叉滞后等复杂的纵向数据分析,故而无法解释学业发展的动态变化过程及运动剂量、认知水平、学业表现、学习行为在时间序列上的相互作用。同时,无论是长期干预还是短期干预,大多数体智融合教学研究均未能在干预结束后设置有效的随访评价,因此无法对干预效果的持续性进行客观有效地评价。
对体智融合教学干预过程实行监控的目的是为了更好地描述干预剂量的落实情况,亦是后续对因变量变化原因进行有效分析的必要保障。既往在实验室进行的短时有氧运动干预时间一般约为15 min,受试者需在干预时限内按照器械(跑台或功率自行车)设定的运动强度持续运动,直至干预阶段结束。这种对运动剂量的严格管控为效益来源的分析提供了基本保障,但有别于实验室对运动强度、有效运动时长的严格控制,学校干预剂量的落实受到学生轮流完成动作、整队、讲解等现实教学因素的干扰,而这种时间变量与强度变量上的杂糅严重影响了量效估计的准确性(Shore et al.,2020)。当前的研究大多通过加速度计、计步器、心率监测仪等运动强度穿戴设备对学生的实际运动量加以量化,并逐渐以MVPA累积时长替代干预时间完成运动剂量的规划。尽管如此,大多数研究仍难以达到预期的干预计量。挪威基于ASK(ACTIVE Smarter Kids)项目的群组随机对照实验,共对57所小学(28所干预校)1 129名5年级小学生实施为期7个月的校园运动干预,但未发现学生数学与语文学业成绩显著提升。经对ASK项目设定的身体活动累积时长与MVPA累积时长进行比较,虽然ASK项目对课堂、课间以及家庭体育作业等校园运动进行了整合,并为干预组学生提供了平均每周100 min的运动时长,但实验组与对照组日均MVPA实际累积时长仅相差4 min,在校日均MVPA实际累积时长仅差1 min,而且两组日均久坐时长也十分接近,说明该项目的运动干预未达到预期目标(Resaland et al.,2016);类似结果亦见于 ACTI-BREAK 项目(Watson et al.,2018,2019)。这两项应用研究在运动剂量控制上的失败,提示,大样本运动干预项目大多存在实验组与对照组干预剂量梯度落实的问题,也表明了对干预剂量落实水平实施监控的必要性。
对体智融合学业效益进行客观完整地评价是分析其效益来源和作用方式的起点与归宿,其中评价内容、评价工具的水平是测评质量的关键。目前,体智融合学业效益的评价包括学业成就评价与学习表现评价两方面,同时辅以认知、智力等心理评价结果分析学业效益的来源(Fedewa et al.,2015),但当前研究中存在评价内容靶向不明、评价工具标准化水平不一、测量等值性偏低等问题,使各研究之间的可比性和可重复性下降(Daly-Smith et al.,2018;Hollis et al.,2017;Watson et al.,2017),因而难以获得相对稳定且一致的结论。同时,受限于数据结构等因素,已有研究所应用的统计方法尚不足以分离学校教学因素和学生个人因素对体智融合教学干预效果的影响。
目前,体智融合教学研究的学业效益评价工具包括标准化学业表现测试和非标准化学业阶段测试(如教师根据教学内容制作的知识测验),部分研究还纳入了智力测验。与非标准化学业阶段测试相比,学业标准化测试具有良好的测量结构、题目设计和评价常模,并能对学生学业能力进行跨样本比较;而非标准化学业阶段测试虽可为学生近期的学习效果提供具有针对性的评价信息,但缺乏跨样本、跨时间的一致性。事实上,标准化测试和非标准化学业测试分别用于评价学生学业表现的不同来源,即能力增长和知识落实。虽然体智融合教学所产生的学业效益业已在这两种测评中取得了相对一致的结果(Mullender-Wijnsma et al.,2015,2016;Vetter et al.,2019),但在具体的效益发生维度和效益发生进程上仍有所分歧。如同样是针对小学生运动教学与数学能力、语言能力和智力发展关系的探讨,Reed等(2010)选用与南加州课程相匹配的 PACT(Palmetto Achievement Challenge Tests)测验作为评价工具,评价三年级小学生4个月运动化课堂(每天30 min、每周干预3天)的学业效益,研究结束时虽然学生的英语语言艺术、数学、科学学业表现均有所提升,但组间未达到统计学显著差异。而Fedewa等(2015)以美国国家学业标准测验(Measures of Academic Progress,MAP)对三至五年级小学生进行每天20 min的运动课堂干预,8个月后学生数学、阅读和语言应用表现均显著提升。以上述两项研究的语言评价为例,前者选用州立学业评价工具的英语语言艺术维度,后者则以国家学业评价工具中的语言应用为标准,二者不仅在语言评价维度上不同,而且在工具的评价靶向、题项组织、分数量尺和评价切点上均存在较大的差异(Crodray,2013;Cronin,2004),因此,二者截然不同的学业效益判定结果并非源于干预方案的不同,而可能仅是两项研究所选量具本身不等值造成的评价误差。鉴于此,当前评价工具不一致所导致的矛盾结论不可完全归因于工具的标准化水平,可能还与不同评价工具之间由于测评理论、内容、难度差异造成的量具不等值问题有关。事实上,这种测评不等值是目前各项研究难以进行跨样本比较、分析、归纳的重要原因。
认知范式与智力测验工具不等值的问题同样也是体智融合教学研究认知效益归纳不力的原因。当前体智融合教学研究主要聚焦于执行功能和注意,但二者的研究范式与测试任务较多,且各项研究之间的侧重点与倾向性差异亦较大,导致不同范式间的等值性相对较低。以体智融合教学后学生注意的探讨为例,不同研究者采用的范式和任务存在明显差异,如针对学生侧抑制的任务共有两个版本,分别为儿童修订版和颜色诱导版(Egger et al.,2018;Mavilidi et al.,2019);针对注意集中水平的任务则更为多样化,包括双目标字母划销测验(two target letter cancellation test,LCT)、双任务划销测试(trail making test A and B,TTA&TTB)、Ruff形象流畅测试(ruff figural fluency test,RFFT)等 NCT 测验(Subramanian et al.,2015)和d2-R纸笔测试(区分d和p的划销测试)(Schmidt et al.,2016);其他测试任务还有评价学生对细微变化觉察能力的5 min心理警觉任务(five-minute psychomotor vigilance task,PVT)(Wilson et al.,2016),以及测量学生抑制习惯性行为的Stroop能力倾向测验(Van der Neit et al.,2016)等注意功能测试。虽然上述测验与范式均可在一定程度上反映个体认知水平的变化,但在评价内容、评价原理以及结果解释上并不完全相同,无法调解不同研究结果之间存在的矛盾。与此同时,儿童青少年正处于身心、情智发展的快速阶段,样本性别、年龄、身心发展水平和学业基础等差异(Novak et al.,2018)均有可能影响学业效益评价的准确性与有效性。
除了评价工具本身存在的问题,当前体智融合教学学业效益的分析延续了实验室运动认知研究的统计方案,但作为教学应用研究,还需找出干预方案与原有教育教学环境因素的联系,籍此探究体智融合教学的独特学业贡献,对于厘定体智融合教学的学业促进效益、澄清效益特质及来源、挖掘影响因素具有重要意义。已有体智融合干预研究通过筛选、匹配等方式对来源于不同家庭社会经济状况、学业水平、智力发展水平的学生之间的差异进行分类比较,部分研究还以结构方程模型建立了运动、认知、学业结果的路径分析模型,或通过协变量控制部分教学因素对学习结果的影响,然而由于这些研究更多关注学生个体层面存在的差异,忽略了针对教学水平、师资质量、课时安排等造成学业质量校间差异的学校层面关键变量的分析,使其中大多数研究结果无法揭示体智融合教学与原有教育系统内部要素的联动影响及其作用路径,因此也就无从开展对体智融合教学学业效益来源、影响范围、方案完善等关键内容的探讨。如PAAC项目采用学业周期监测(Child Academic Monitoring System,CAMS)工具和标准化测试工具对荷兰54所小学二至三年级小学生的数学能力和运算速度进行测量,阶段性测验结果显示学业效益显著,但3年全程干预结束时,干预组与对照组学生的学业表现均有提升,但组间未达到统计学显著差异(Donnelly et al.,2009,2013,2017);TWM-E项目与PAAC项目相同,其小样本和大样本结果均显示所实施的运动干预对小学生语言学业表现具有促进作用,但其小样本学生的学业进步体现在拼写能力上,而大样本研究结果则表现为语法和标点运用的逻辑性进步。由于以上研究未能有效纳入教育教学层面的学业质量影响因素,故其在评价组间和跨校样本间矛盾结果的时候,只能从测量工具效力不足、评价内容脱靶、知识能力增长动态变化或取样差异等角度进行解释,而无法通过学校教学水平、课时安排、教学进度等校间差异因素作出更为深入的探讨。
当前的两项研究假说在研究证据和机制解释上均不尽完善,各自无法独立解释体智融合教学学业效益背后运动刺激-学业表现的发生机制。后续研究可从心理与行为二者间的联系入手,贯通认知提升与课堂行为改善两项假说,并加入生理指标,构建心理-行为-生理的完整效益来源解释模型以备实证研究检验。
以心理学取向为主的运动认知功能提升假说和以教育学取向为主的运动学习行为优化假说分别从心理机制和学习行为两方面对运动刺激-学业表现进行了解释,二者的分歧在于学业成就的主要来源,而非发展观与教育观上的对立,因此可以从心理与行为的表里联系入手,加以整合。基于学业成绩是个体认知水平外化构建的运动认知功能提升假说认为,认知水平的增长是体智融合教学学业效益发生的关键。然而,认知水平的发展虽然是一个连续复杂的过程,但个体在特定的年龄阶段所能达到的认知发展水平是相对稳定的,包括运动干预在内的认知干预或认知训练一般无法突破个体本身发展阶段的限制。同时,认知发展水平并非儿童学业成绩的唯一决定因素,因此,运动—认知—学业效益路径虽然符合运动益智论等理论的推导,但在一定程度上脱离了儿童青少年学习和成长的特点。相对而言,运动的学习行为优化假说构建的运动—课堂专注—学业效益路径则强调课堂行为变化与学业表现的影响,认为学业成绩源于个体的学习行为,从本质上支持认知发展水平具有阶段稳定性的观点,但未否定运动对样本内认知发展水平不均衡的改善作用,因此并未从根本上否定认知发展差异造成学业水平差异的可能。事实上,认知水平与学习行为都是影响个体学业成就的重要因素,二者密切相关,但并非完全对应。如学生运动后课堂专注行为的变化可以作为评价个体注意行为和抑制功能变化的重要外显指标(Mavilidi et al.,2020;Lassiter et al.,2019;Stapp et al.,2018),而体智融合教学提升个体任务集中性、减少分心行为(95%CI:0.20,1.00)、促进学业表现[standardized mean difference=1.03(95%CI:0.22,1.84)]的现象与个体认知功能的改善并不存在显著的相关性[standardized mean difference=0.33(95%CI:-0.11,0.77)](Watson et al.,2017),提示,认知水平、学习行为和学业表现三者之间存在复杂的关联性,有待更为综合的心理-行为假说指导随机对照实验和区域数据分析,以便对运动刺激-学业表现的效益来源加以解释。
此外,基于运动、认知、健康、学业之间复杂的相关关系,后续理论模型的构建可尝试纳入具有健康评价意义的生理指标(Aibar et al.,2020;Basch,2011;Feter et al.,2019;Donnelly et al.,2016;Sigfúsdóttir et al.,2007;Syväoja et al.,2018;Voss et al.,2016),以进一步探讨体智融合教学学业效益背后的生理学基础,增加对运动刺激-学业表现之间生理学基础的解释。虽然穿戴设备可显著提高干预剂量的精细化水平和客观化水平,但基于个体身体素质与健康水平的差异,不同个体对运动的耐受程度有所不同,所产生的生理变化亦存在相应差异。虽然个体生理指标监测比穿戴设备监控成本更高、操作难度更大,但其进一步量化了对受试群体的个体差异,有助于提升运动剂量分析的精细化水平和学业效益来源机制探讨的综合性。最大摄氧量是运动学业效益分析中常用的健康评价指标之一,具有年龄增长性和后天可训练的特点,并可在一定程度上反映中枢和外周对有氧运动的耐受水平与改善程度(Verburgh et al.,2013)。最大摄氧量水平越高,个体伊利诺伊阅读与数学学业测试表现越佳(Raine et al.,2018;Oberer et al.,2018)。随着渐进性有氧耐力跑测试逐渐替代跑台力竭实验(Grieco et al.,2016;Hillman et al.,2012;Sjöwall et al.,2017),有氧能力测试的安全性和便利性显著提高,以之为运动干预评价测试的实验和截面数据分析逐年增加(Ávila-García et al.,2020;Wang et al.,2019)。除最大摄氧量,肥胖的评价作用也得到相关研究的肯定。以腰围作为肥胖评级指标的3年期追踪研究表明,腰围与学业成绩呈负相关,且身体活动与久坐对儿童青少年学业成绩的影响受个体腰围变化的调节(Lima et al.,2019)。
目前,有关体智融合教学干预效益研究的干预剂量主要问题:1)运动剂量的设置缺乏研究证据和运动处方的支撑;2)由于关键变量的设计融入过多主观评价,且与已有行为或生理证据缺乏交叉验证,从而限制了对研究结果的解释(Pascoe et al.,2020)。因此,后续研究应从优化操作变量入手,以运动推荐量和前人研究经验提升干预剂量的合理性和有效性,以生理评价指标量化干预质量,分离个体差异对干预结果的影响,解决当前干预剂量设置与落实存在的问题。
首先,在干预剂量的设计上,应当以前人经验为基础,结合运动处方剂量规划和项目选择的依据与原则,进一步提升干预剂量的科学性和有效性。在单次剂量的规划上以10~20 min中等强度运动为宜,避免干预时长过短导致MVPA累积时长过短而无法达到生理唤醒、影响认知与行为的干预目标,同时也应避免因运动强度过大而造成学生过度兴奋或疲劳,影响认知表现及后续课堂及课外学业表现(Samuel et al.,2017;Verhagen,2020)。虽然目前尚未形成运动项目、运动剂量、学业效益的计量研究成果,但已有研究表明,10~20 min的干预剂量可在一定程度上优化随后的课堂表现,减缓课堂注意衰减。同时,干预方案的设计还需综合考虑单次时长、单周频率并设计运动方式,结合学校体育固有内容实现儿童青少年运动健康发展建议,提升运动剂量规划的整体性。剂量规划后,还可尝试通过小样本实时监测剂量落实、调整干预方案。近年开展的跨校、跨区域大样本研究多从干预样本中选择部分研究对象作为运动剂量矫正与学业、注意行为、认知效益分析的校验样本,为量化干预质量、分析学业效益与身体活动水平的关系提供便利。
其次,引入相关生理评价指标,保障干预剂量的落实。在后续干预方案的设计过程中,研究者可从确定学业、认知的靶向生理学指标入手,量化运动干预方案的生理唤醒与变化水平,为心理效益的获得提供量化分析基础。目前可供参考、选用的生理学指标除最大摄氧量、腰围指数、BMI等,还包括脑源性神经营养因子(brain-derived neurotrophic factor,BDNF)、血清儿茶酚胺(plasma catecholamines)等认知相关神经递质(Azad et al.,2015;Chang et al.,2012;Feter et al.,2019;McMorris et al.,2015;Vaynman et al.,2015),以及功能磁共振成像(fMRI)、事件相关电位(ERP)、脑电图(EEG)、功能性近红外光谱技术(fNIRS)等脑结构或脑功能相关的神经心理学检测技术(Hillman et al.,2008,2012)。此外,汗液采集等体液采集穿戴设备的技术进展(Han et al.,2018;Koh et al.,2016)亦值得关注;量化评价学生课堂注意行为亦可使用便携式Tobii等设备采集学生课堂眼动数据。
基于当前体智融合教学在测量不等值和测量框架不完整两方面的问题,后续研究应从优化测量效力、丰富评价指标、扩大样本等方面入手,构建更为完整的数据采集与分析方案。
首先,在测量等值问题上,后续研究应明确评价目标,审慎选择评价工具。研究者应立足研究目的,区分是以学业能力发展为评价对象还是以知识技能习得为评价对象,选择恰当的教学效果评价工具。其次,无论是选择学业评价工具还是认知水平测验均应基于对学业领域、具体学业能力维度、具体认知过程间的相互关联性及其与运动关系的研究证据,合理选择靶向学科、认知功能及其研究范式,精细化定量分析,降低测验盲目多选造成的差异与浪费,从而提升研究效率。如综合考虑有氧运动对学生注意、记忆、执行功能的提升效益,以运动过程对个体计划、设定并控制行为指向目标、刷新环境信息认知功能的训练与提升效益(Koutsandréou et al.,2016;Tomporowski et al.,2015)为靶向或以视觉短时记忆为靶向探讨运动对学业表现的影响(Beck et al.,2016)。
其次,尝试构建体智融合教学学业效益分析数据库。研究者可以在干预的同时采集个体背景信息、生理健康指标、认知功能指标、个体学业表现与学业兴趣、学校教育因素等信息,通过连续2~3年的施测,形成完整的追踪数据库,整合运动与学生学业表现(Kern et al.,2018)、运动与生理变化、运动与认知能力(Van der Niet et al.,2015)、生理变化与认知效益、认知能力与学业表现(Oberer et al.,2018)之间的关系,分离学生学习兴趣、自我效能感、情绪体验、家庭社会经济状况、身心发展水平与发展速度等学生因素(Mullender-Wijnsma et al.,2016;Owen et al.,2018;Shore et al.,2020;Verhagen,2020),及教师配合、教师培训质量、教师教学水平等学校层面因素(Calvert et al.,2019;Carlson et al.,2017;Dinkel et al.,2016;Routen et al.,2018;Webster et al.,2015)对体智融合教学干预效果的影响,客观描述体智融合教学对学生学业发展与身心健康促进的综合作用(De Greeff et al.,2016b;Seljebotn et al.,2019),阐述运动刺激-学业表现的效益来源,从而揭示体智融合教学学业效益的内在机制,为进一步提升后续研究的干预质量乃至教育相关性身心发展与促进效益,提供研究支撑。
在样本的选择上,除了扩大样本数量,还需尽可能拓展样本覆盖的人群,以定位体智融合教学最适宜的应用人群,挖掘其在不同人群中实施的关键影响因素,提高教学干预的精准性。在进行小样本教学实验时,应当注意区组匹配,增加组内同质性,提高干预方案设计的针对性,从而提升干预效果评价的准确性。