吕慧敏 ,董翠香 *,杨秋颖 ,刘 超
体力活动(physical activity,PA),是指骨骼肌产生的任何需要能量消耗的身体移动(Caspersen et al.,1985)。根据不同的研究设计,体力活动常被分为一次性体力活动(acute physical activity)和长期体力活动(regular/chronic physical activity)。长期体力活动对身心健康的益处已被熟知,如增强体质、降低慢性疾病发生风险(如肥胖、心血管疾病、糖尿病等)、改善精神障碍(如压力、抑郁、低自尊等)(Ahn et al.,2011;Janssen et al.,2010;Poitras et al.,2016)。研究表明,体力活动对大脑发育及认知功能也有积极影响,从而促进儿童青少年学业成绩的提高(方黎明 ,2020;Álvarez-Bueno et al.,2017b;Donnelly et al.,2016;Singh et al.,2012)。体质健康状况好的学生往往表现出更好的出勤率、认知表现、课堂行为和学业成绩(CDC,2014;Michael et al.,2015)。神经生理学领域的研究显示,儿童青少年时期是大脑发育的绝佳“窗口期”,此时大脑的神经可塑性最强,参与体力活动能够最大限度地对大脑结构和功能产生积极影响,从而获得更好的学业成绩(董进霞,2017;Ratey et al.,2013)。
但也有研究认为,长期体力活动对学业成绩没有影响或有负面影响(Chan et al.,2016;Yu et al.,2006)。可见,对于儿童青少年进行长期体力活动是否能够提高学业成绩这个议题,迄今为止并未达成共识。研究结果的差异,可能是研究设计及体力活动干预剂量差异导致的。体力活动干预剂量是指机体接受的运动量,一般包括频率、强度和持续时间,干预方式也常被研究者纳入体力活动的剂量处方中(Howie et al.,2018)。剂量-效应关系(dose-response)是指由于不同的干预剂量而产生不同的结果效应。对长期体力活动与学业成就的剂量-效应关系进行研究,可以检验不同持续时间、强度、频率与方式的体力活动干预对学业成绩影响的差异。但目前,鲜见体力活动与学业成绩剂量-效应关系的量化研究(温煦,2015;Álvarez-Bueno et al.,2017b;Donnelly et al.,2016)。
鉴于此,本研究在充分考虑被纳入文献的方法学质量基础上,运用Meta分析方法,对国内外关于长期体力活动对儿童青少年学业成绩影响的实验研究进行综合分析,探讨长期体力活动对学业成绩影响的总体效应,长期体力活动对不同科目学业成绩影响的效应差异,以及长期体力活动与学业成绩的剂量-效应关系。
纳入标准:1)研究主题为关于体力活动与学业成绩关系的实验研究;2)长期体力活动干预,至少进行了一项学业成绩评估;3)研究对象为3~18岁的健康儿童青少年;4)中、英文文献;5)文献类型为期刊文献。
剔除标准:1)未进行实验研究的文献;2)未进行体力活动干预的研究;3)体力活动干预类型为非长期性干预;4)针对非健康儿童青少年的研究;5)非中、英文发表的文献;6)数据报告不完整的文献。
分别选取中、英文数据库(中国知网、ScienceDirect、Web of Science、EBSCO、Scopus),根据纳入标准构建检索式[中文:SU=(“体力活动”+“身体活动”+“体育活动”+“身体活动”+“体育锻炼”+“运动”)AND SU=(“学业成绩”+“学业成就”+“学业表现”+“学业成绩”);英文:TS=(“physical activit*”OR exercise OR sports OR“physical education”OR running OR walking OR yoga)AND TS=(“academic”OR“academic achievement”OR“academic grades”OR“academic performance”OR“class‐room behavior”)AND TS=(children OR kids OR adoles‐cent*OR teenager*OR youngster*OR preadolescent*OR school*OR preschool OR kindergarten OR“middle school”OR“high school”)]并进行文献检索,检索时间范围为2020年以前,共获得中文文献642篇、英文文献4 376篇。将检索获得的文献信息导入EndNote,去掉1 933篇重复文献,获得中文文献634篇、英文文献2 451篇,共计3 085篇。
基于检索获得的3 085篇文献信息,由两位研究者根据纳入和剔除标准分别进行文献筛选。采用Cohen’s Kappa系数对两位研究者筛选的一致性程度进行检验,Cohen’s Kappa系数为0.828,说明文献筛选结果具有高度一致性(Tang et al.,2015)。对于存在争议的17篇文献,邀请第三位研究者加入讨论,共同确定是否纳入,最终获得中文文献5篇、英文文献26篇,共计31篇。
采用定量研究质量评估标准(改编版)对纳入的研究质量进行评估(表1)。两位研究者根据评估标准对纳入研究的质量进行独立评估,从选择偏倚、实验设计、干扰因素、盲法、测量方法和样本变化6个维度进行了综合评定,即高质量研究:强维度≥4且弱维度=0;中等质量研究:强维度<4且弱维度≤1;低质量研究:弱维度≥2。对于不一致的评估结果,邀请第三位研究者加入讨论,共同确定结果。研究质量评估结果显示,高质量研究6篇,中等质量研究7篇,低质量研究18篇。为使研究结果可信度更高,本研究仅纳入13项中高质量研究(图1)。
表1 定量研究质量评估标准(改编版)Table 1 Quality Evaluation Standard for Quantitative Studies(Revised Version)
图1 文献筛选与纳入流程Figure 1. Literature Selection and Inclusion Flow Chart
采用Excel对纳入的13项研究进行编码,提取以下特征值:作者、年份、国籍、样本特征(样本量和年龄)、学业成绩测评工具、体力活动干预剂量(干预方式、持续时间、单次时间、频率和强度)、研究结果(表2)。
表2 纳入文献特征值编码缩略Table 2 Abbreviated List of the Characteristics of Included Literature
采用Review Manager 5.3软件进行Meta分析,通过Q检验和I2确定研究间是否存在异质性:P<0.05为异质性显著,P≥0.05为异质性不显著;Ⅰ2<25%为低度异质,25%<I2<50%为中度异质,50%<I2<75%为高度异质,I2>75%不能直接合并(黄志剑等,2013)。采用效应量(ef‐fect size,ES)表示实验组与控制组间的差异程度:ES<0.2为小效应,0.2≤ES≤0.8为中等效应,ES>0.8为大效应(Cohen,1992)。本研究结果均为连续型变量,且使用不同测量工具,故采用标准化均数差(standardized mean dif‐ference,SMD)计算效应量,95%置信区间,P≤0.05为具有统计学意义。
对筛选得到的31篇文献进行研究质量评估发现,仅19%的研究被评为高质量研究。选择偏倚维度上,由于选取样本不具代表性或样本有一定代表性但同意参与实验的样本比例低于60%而被评为弱维度。实验设计维度上,89%的研究为随机对照实验,还包括准实验和对照实验。干扰因素维度上,77%的研究比较全面地排除了样本年龄、性别,以及体力活动水平和学业成绩水平基线可能对实验结果产生的影响。盲法维度上,仅19%的研究选择单盲或双盲法,以降低研究者和被试的主观因素引起实验结果的信息偏倚。测量方法维度上,选用多种学业成绩测评工具,55%的研究对测评工具的信效度进行了检验。样本变化维度上,45%的研究报告了最终完成实验的样本数量,并对样本丢失原因进行了说明。81%的研究在不同维度上表现出弱维度,提示,未来开展该领域的实验研究时,注意提高实验设计的方法学质量。
由于研究间存在中度异质性(χ2=22.29,I2=46%,P=0.03),故采用随机效应模型对纳入的13篇文献的效应量进行综合检验。从合并效应量结果来看,13项实验研究的合并效应量:SMD=0.29;95%CI:0.16,0.41;P<0.000 1。说明长期体力活动对学业成绩具有中等程度的正向影响,儿童青少年进行长期体力活动有助于提高学业成绩。
针对长期体力活动对不同科目学业成绩的影响效果是否一样这一问题,本研究探究了长期体力活动对不同科目学业成绩的影响差异。纳入的13篇文献分别对数学和语文成绩进行了评估,其中语文科目包括阅读(read‐ing)、写作(writing)、拼读(spelling)、言语表达(expressive language)和语音意识(phonological awareness)等。长期体力活动对数学、阅读和写作成绩具有显著的正向影响(表3),对数学成绩的促进效果最大(SMD=0.48,P<0.000 1),对阅读成绩的促进效果次之(SMD=0.25,P<0.000 1),对写作成绩的促进效果较小(SMD=0.16,P=0.05)。说明长期体力活动对不同科目的影响效果不同,对数学成绩的促进效果高于阅读和写作。
表3 长期体力活动干预对不同科目学业成绩的影响效果Table 3 Effect of Regular Physical Activity on Academic Performance of Different Subjects
为保证研究结果的科学性与可靠性,Meta分析过程通常会对样本数据的发表偏倚进行检测。当纳入Meta分析的研究个数≥10时,可采用漏斗图法进行发表偏倚评估。从13项研究在漏斗图中的分布情况来看(图2),研究样本效应量均匀分布在平均效应值两侧,无异常值存在,说明发表偏倚检测效果良好,提示,数据分析结果较为稳定。
图2 样本数据发表偏倚检测漏斗图Figure 2. Funnel Plot of Publication Bias Risk
1)干预方式。纳入的13篇文献包含7种干预方式,不同干预方式的合并效应量:有氧运动:SMD=0.59,95%CI:0.22,0.96,P<0.000 1;综合性学校体育活动计划:SMD=0.51,95%CI:0.38,0.65,P<0.000 1;专业体育与健康课:SMD=0.25,95%CI:0.09,0.41,P<0.000 1;与学习任务相关的体力活动:SMD=0.28,95%CI:-0.01,0.56,P=0.06;要求认知参与的体力活动:SMD=0.26,95%CI:-0.14,0.67,P=0.20;文化课中的微运动:SMD=0.16,95%CI:-0.21,0.53,P=0.39;瑜伽:SMD=-0.01,95%CI:-0.24,0.21,P=0.91。可见,有氧运动、综合性学校体育活动计划和专业体育与健康课对学业成绩有着显著的中等程度正向效应(ES>0.2,P≤0.5),且有氧运动的效应量最大。
2)干预持续时间。纳入文献中的体力活动持续时间从3周到3年不等,不同持续时间的合并效应量:≤1个月:SMD=0.32,95%CI:-0.01,0.64,P=0.06;1.5个月 :SMD=0.14,95%CI:-0.25,0.53,P=0.49;3个月:SMD=-0.05,95%CI:-0.37,0.27,P=0.76;4个月:SMD=0.13,95%CI:-0.28,0.53,P=0.54;5个月:SMD=0.47,95%CI:0.23,0.70,P<0.000 1;6个月:SMD=0.23,95%CI:-0.30,0.77,P=0.40;≥12月:SMD=0.32,95%CI:0.12,0.52,P<0.000 1。说明干预持续时间为5个月或1年以上,可以对学业成绩产生显著的中等程度正向效应,其中5个月的效应量最大。
3)单次干预时间。12篇文献报告了体力活动的单次干预时间,不同干预时间的合并效应量:5 min/次:SMD=0.10,95%CI:-0.42,0.61,P=0.71;15 min/次:SMD=0.44,95%CI:0.17,0.71,P<0.000 1;20 min/次 :SMD=0.26,95%CI:-0.14,0.67,P=0.20;30 min/次 :SMD=0.47,95%CI:0.20,0.73,P<0.000 1;45 min/次 :SMD=0.14,95%CI:-0.03,0.31,P=0.11;60 min/次 :SMD=0.14,95%CI:-0.25,0.53,P=0.49。说明单次干预时间为15 min或30 min对学业成绩具有显著的中等程度正向效应,且30 min/次的效应量最大。
4)干预频率。纳入文献包含3种干预频率,不同干预频率的合并效应量:2次/周:SMD=0.22,95%CI:0.08,0.35,P<0.001;3 次/周 :SMD=0.29,95%CI:0.07,0.50,P<0.000 1;5次/周:SMD=0.21,95%CI:-0.06,0.49,P=0.13。说明每周进行2~3次的体力活动干预对学业成绩的提高具有显著的中等程度正向效应,3次/周的效应量最大。
5)干预强度。仅有5篇文献明确报告了体力活动的干预强度,不同干预强度的合并效应量:小强度:SMD=0.00,95%CI:-0.37,0.38,P=0.99;中等强度:SMD=0.23,95%CI:-0.30,0.77,P=0.40;中大强度:SMD=0.29,95%CI:0.15,0.43,P<0.000 1。说明中大强度体力活动对学业成绩具有显著的中等程度正向效应。
研究质量评估结果显示,仅有6篇文献属于高质量研究。可见,长期体力活动与儿童青少年学业成绩研究领域的高质量文献占比较低,中低质量文献在选择偏倚、实验设计、干扰因素、盲法、测量方法和样本变化6个维度上表现出方法学缺陷。为了提高实验质量,增加研究的可靠性和可信度,未来在设计该领域的实验时应注意:1)样本最好具有较高代表性,或具有一定代表性且同意参与实验的样本比例达80%以上;2)实验设计最好为随机对照实验;3)注意排除年龄、性别及体力活动水平对学业成绩水平基线的干扰;4)采用单盲或双盲以排除主观因素造成的信息偏倚;5)对采用的评估工具进行信效度检验;6)注意报告退出实验的样本量及原因。
从总体效应来看,长期体力活动对儿童青少年学业成绩有积极影响,这与已有的系统综述和Meta分析结果一致(Álvarez-Bueno et al.,2017a,2017b;Donnelly et al.,2016;Fedewa et al.,2011)。针对不同科目学业成绩的亚组分析显示,相较阅读、写作等科目,体力活动对提高数学成绩具有更大的作用。这与Fedewa等(2011)和Álva‐rez-Bueno等(2017b)的Meta分析结果吻合,并与方黎明(2020)基于国内大规模样本数据的实证结果一致,即体力活动对提高学业成绩具有中等效应,对数学成绩的影响效应大于语文和英语。综合Meta分析结果和现有研究证据,本研究认为长期体力活动可以促进儿童青少年数学成绩的提高。然而,由于纳入研究数量较少,且绝大多数研究仅评估了数学成绩的变化,未对物理、化学、外语等学科成绩进行测量,故尚不能确定长期体力活动对数学以外学科成绩的影响,未来需要开展更多关于体力活动对不同学科成绩影响的实验研究。
关于体力活动究竟是如何提高学业成绩这一问题,神经生理学和心理学相关研究提供了启示。神经生理学研究发现,体力活动可从系统水平(脑结构、脑激活水平、脑功能网络)、细胞水平(神经发生、突触可塑性)、分子水平(脑源性神经营养因子BDNF、胰岛素样生长因子IGFI、血管内皮生长因子VEGF等)诱导脑产生积极的可塑性变化,从而提高相应的认知能力,如执行功能、注意、反应抑制、情绪调节、组织、计划等(陈爱国等,2011;鞠恩霞等,2010)促进良好学习表现的形成,进而促进学业成绩提高。心理学研究认为,体力活动不仅可以直接对学业成绩产生影响,还可以通过体能、健康、心理-社会因素等中介变量影响学业成绩,影响效果受年龄、性别、社会经济状况或文化环境及背景等调节变量的影响(图3)。可见,参与体力活动非但不会对学业成绩造成负面影响,反而能够促进儿童青少年学业成绩的提高,但其对学业成绩的影响可能会因社会经济状况或文化环境及背景差异产生不同效果。
图3 体力活动影响学业成绩的心理学理论模型(Tomporowski et al.,2011)Figure 3. Psychological Theoretical Model of Physical Activity Affecting Academic Achievement(Tomporowski et al.,2011)
从干预方式对学业成绩的效应结果来看,有氧运动、综合性学校体育活动计划和专业体育与健康课为中等效应量,前两种方式的效应量明显高于后者。有氧运动对体质健康的益处已成为不争的话题,因此常被应用于对学业成绩影响的研究中,绝大多数实验采用了有氧运动干预(Singh et al.,2019)。有氧运动对学业成绩的积极影响,可能得益于其产生的认知益处(Buck et al.,2008;Chaddock et al.,2010)。此外,综合性学校体育活动计划是以增加学生体育活动为目标的综合性学校体育卫生框架,它为学生提供了更多参与体力活动的机会,包括体育课、课间体育活动、嵌入文化课中的体育活动、课前和课后体育活动、教师参与、家庭和社区参与6部分(CDC,2019)。综合性学校体育活动计划在提高学业成绩方面的显著作用,为学校组织体育活动提供了参考,提示,学校应鼓励学生参与多种形式的体力活动,并为学生提供更多参与体力活动的机会。
在体力活动剂量分析中,干预持续时间为5个月及1年以上表现出中等效应量,持续5个月的效应量更大,而持续6个月的效应却不显著。因持续6个月的研究仅有1篇,故其结果不具说服力。干预效果并未随着持续时间的增长而提高,可能是干预时间的拉长导致学生产生倦怠感,提示,体力活动干预持续5个月时对学业成绩的提高达到最佳效果,随着持续时间的增长,学业成绩不会表现出更大的提高。单次干预时间为30 min/次的效应量最大,这与部分已有研究存在偏差(王积福等,2016),可能是受纳入对比文献数量少的影响。干预频率为2~3次/周可对学业成绩产生积极影响,3次/周的效应量最大,5次/周的效应量不具有统计学意义。提示,干预次数并非越多越好,次数过多可能导致身体和精神疲劳,机体和神经不能得到有效恢复,进而影响干预效果,3次/周的干预可能最利于学业成绩提高。干预强度为中大的效应量最大,中大强度体力活动(moderate-to-vigorous,MVPA)已被广泛证明对身心健康有益(武海潭,2014),其在促进学业成绩上也表现出积极作用(Mullender-Wijnsma et al.,2015)。可见,学校实施MVPA干预有望实现学生身体健康和学业成绩的“双赢”。
尽管Meta分析显示,持续5周、3次/周、30 min/次的中大强度有氧运动干预可能对提高儿童青少年学业成绩最有效,但因纳入文献数量不足和样本来自不同国家(地区),考虑到研究证据的不足及社会文化背景的差异可能引起的结果偏差,对于这一剂量结果的得出和推广应持保守态度,需更深入和细致的研究来进一步验证。此外,探讨长期体力活动干预的最佳剂量问题较为复杂,涵盖变量多,干预方式、持续时间、单次干预时间、干预频率、干预强度等都会对干预效果产生影响。例如,相同持续时间、频率和强度的体力活动干预,可能会因干预方式或单次干预时间的差异导致结果不一致。因此,讨论体力活动干预剂量时,常常需要对方式、时间、频率和强度等因素进行综合考虑,干预效果差异是不同剂量因素共同作用的结果。因此,长期体力活动干预对儿童青少年学业成绩影响的最佳剂量尚无定论,未来需要开展更多的实验研究,在控制其余剂量因素的基础上,进一步探讨某一特定剂量因素对学业成绩的影响效果。
1)本研究未能全面收集到前人的所有研究;2)纳入文献数量较少,样本量相对不足,高质量研究占比较低,有可能存在偏倚风险;3)纳入文献中采用了多种学业成绩测评工具,这些工具的有效性和可靠性存在差异。
长期体力活动能够提高儿童青少年的学业成绩,且相较阅读、写作等科目,对数学成绩的促进效果更好。为获得更好的学业成绩,儿童青少年参与体力活动可采取的剂量为持续5周、3次/周、30 min/次的中大强度有氧运动。学校可通过实施综合性学校体育活动计划,为学生提供足够的活动空间和机会。可采取的措施包括:早操进行小强度的瑜伽或伸展性活动,体育与健康课上保证30 min以上的中大强度运动,每天开展约20 min的中大强度的课间操,在其他文化课上嵌入约5 min的中大强度微运动等,从而促进学生体质健康和学业成绩的双向提高。未来应开展更多的高质量实验研究,在保证方法学质量的基础上,更加注重量化体力活动剂量,准确报告干预的类型、强度、时间和频率,以便不同研究间的相互比较。