梁哲,李曼丽
(1.佛山科学技术学院 人文与教育学院,广东 佛山 528000;2.清华大学 教育研究院,北京 100084)
促进青少年儿童健康成长与全面发展急需扭转社会的短视与偏见。2012年,世界经济合作与发展组织(OECD)在《教育公平与教育质量》报告中,将体质健康形象地比喻为海平面下看不见的冰山,会对海平面上能观察到的学业表现产生影响[1]。体质健康促进是否有益于学业发展?青少年儿童将本应投入学习的时间用于体质健康促进是否值得?随着跨学科理论的深化与扩展、世界各国大规模体力活动与健康促进的实践,以及高级定量研究方法与工具的应用,体质健康促进与学业发展逐渐成为青少年儿童发展领域的研究热点。
通过文献回顾和逻辑分析等方法,梳理20世纪以来的代表性研究。以“体质”(physical fitness)或“体质健康”(physical health)或“健康促进”(health promotion)与“学业表现/成绩/成就”(academic performance /scores/achievement)为检索词,在中国知网、Web of Science、Elsevier、PubMed、EBSCO等数据库检索可全文下载的同行评议文献。以校园范围内的(school-based)体质健康促进与学业的关系为主题,以普通青少年儿童(中小学生)为对象,兼顾国家(地区)、样本量、被引数等标准进行严格筛选,最终获得代表性中文文献5篇和外文文献40篇。根据跨学科理论演进、定量研究方法应用等梳理关系识别、因果推断、动态跟踪三大争论焦点,回应青少年儿童体质健康促进与学业表现的关系问题,提出开展后续研究的针对性建议。
1908年,Yerkes等[2]发现行为表现与生理唤醒存在倒U型关系,即中等程度的生理唤醒有助于达到最佳的行为表现。当唤醒过高或者过低时,行为表现都会相应地下降。倒U型理论的提出引发了学界对一个问题的兴趣:增加身体活动(PA)会影响学习吗?自此,越来越多研究立足于“PA→体质健康→学业表现”,即 PA通过促进体质健康以提升学业表现的生理机制假设,探析青少年儿童体质健康与学业表现的关系。
学业表现与肥胖(超重)显著负相关、与健康体质和体测达标显著正相关的假设得到实证研究的支持。
Kim等[3]通过多元线性回归,分析韩国6 463名五、八、十一年级学生的饮食行为、体质状况与学业表现的关系,发现一日三餐、身高与学业表现显著正相关,为规律饮食与坚持体育锻炼提供了实证支撑。Shore等[4]以宾州566名来自郊区公立学校的六、七年级学生为研究对象,采用单因素方差分析与多元逻辑回归分析,在模型控制了性别、社会经济地位(SES)、种族等人口统计学变量后,结果显示超重学生表现出更多的迟到和缺勤现象,且平均学分绩点(GPA)与阅读能力等级测试得分低于正常体重学生,尽管差异未达到显著性水平。Chomitz等[5]对1 847名马萨诸塞州市区中小学生的综合评估成绩进行多元回归分析,发现体重状况与数学成绩显著负相关,即超重学生(BMI≥第 95百分位)、临界体重(第85百分位≤BMI<第95百分位)的数学成绩低于健康体重学生,个人体测达标项目越多则通过数学与英语测评的可能性越大。
尽管针对学龄前儿童的研究在数量上不如青少年群体,亦呈现出相近又颇为微妙的研究发现。Datar等[6]分析1998—1999学年美国早期儿童纵向研究幼儿园项目(ECLS-K)数据,发现在学龄前阶段,超重幼儿在数学和阅读成绩上不如非超重幼儿,这种差异会延伸至小学一年级;女童在幼小衔接阶段从正常体重发展为超重则比男童更可能面临学业成绩下滑的问题;当模型纳入SES变量和行为变量,超重与学业成绩不再显著相关。尽管外显身体形态与学业表现的关系尚无定论,研究者[7]将学业表现不佳理解为外显身体形态的一种污名化标签,有必要充分考虑个人行为与心理特征、父母与家庭特征等因素的调节效应。
由于身体形态的外显特征交织着复杂的心理与社会效应[8],研究者开始关注青少年儿童内隐的身体机能、身体素质单一指标或多项指标,包括心肺/有氧适能(C/AF)、肌肉耐力、柔韧性等。Dwyer等[9]调查了7 961名7~15岁澳洲中小学生,发现其C/AF和肌肉力量测试成绩与考试排名显著相关,表现为排名越靠前的学生,则跑步用时更短、规定时间内完成更多仰卧起坐和跳远得分更高。在回顾前人研究的基础上,Santana等[10]指出较多横断面研究证实C/AF既单独又与其他指标共同作用于学业表现。Marques等[11]进一步提出C/AF可能是学业与认知发展的关键指标。Castelli等[12]、Bass等[13]分别对伊州中小学生实施FITNESSGRAM体质测试,发现 C/AF较好的小学生有较优的学业表现,有氧耐力跑达标的中学生更可能在标准化考试中达标。Hanses等[14]在线性多元回归分析的基础上,通过非线性多元回归模型揭示堪州低年级小学生的 C/AF与拼写和数学成绩存在显著正向关联。Janak等[15]、Dusen等[16]将德州13个学区多达25万名小学、初中、高中学生研究发现 C/AF越好的学生其成绩排名越靠前,9~11年级学生的C/AF与学业存在剂量效应,即C/AF每增加一单位,学业成绩有相应的提升。Esteban-Cornejo等[17]通过分析2 038名6~18岁西班牙青少年的体质与学业状况,发现在控制BMI标准分数、腰围和体脂率后,C/AF和运动技能既单独又共同与学生数学和语言成绩显著正相关,而以上两项能力较差的学生往往是学业后进生,且肌肉力量不单独与学业表现显著正相关。Ishihara等[18-19]采用结构方程模型,分别验证日本男生C/AF、女生身体形态以及体质健康总分对学业表现的直接效应,提供来自亚洲青少年儿童群体的实证支撑。
我国的研究始于20世纪80年代,黄滔[20]对比体育加强班与普通班学生的体质健康与期末考试成绩和初中升学情况,发现体育加强班在期末考试和升学方面皆优于普通班。2000年以后,关于体质健康与学业的研究渐增,在研究方法上主要采用小规模的方便性抽样,对数据进行均值比较和相关分析,如石倩等[21]通过随机整群抽样,在山西太原收集正常体重、超重、肥胖小学生有效数据1 552条,对比发现正常儿童学习成绩总分显著高于肥胖儿童。随着我国学生体质健康标准的严格实施、学生体质监测网络平台的持续完善等,研究者注重收集第一手的地区全样本学生管理数据,描述统计肥胖、肺活量不达标、视力不良等问题,采用最小二乘法(OLS)线性回归验证体质不佳的学生在学业上不如健康同伴,尤其是女生[22-24]。
关系识别研究倾向于遵循经典的个人行为理论[25],从个人特点或个体层面的影响因素验证研究假设和揭示解释机制,关注个人主观能动性导向的对策建议。不过,该类研究多停留在相关关系识别层面,未触及教育政策制定与评估最关切的因果关系,且未充分考量个体所处多层级环境因素的综合作用。在美国学者Bronfenbrener等[26]的生态系统理论启发下,Mcleroy等[27]提出“个人—人际关系—组织—社区—公共政策” 的公共健康干预五层级模型,Spence等[28]将其发展为PA与体质健康促进模型。研究者在思路上参考生态系统理论,设计以学校为本、整合家庭和社区等资源的青少年儿童发展干预项目,在方法上借鉴计量经济学的因果推断方法,如随机对照试验(RCT)、工具变量法(IV)、倾向分数匹配法(PSM)等,深入探析校园环境中的体质健康促进是否对学业发展产生因果影响。
RCT作为因果推断的黄金法则,本质是在真实环境中把研究对象随机分配至干预组和对照组的实验设计,能有效解决研究干预的自选择问题。一项在美国密歇根州某公立学校开展的研究显示,214名六年级学生被随机分配至体育教育组(干预组)以及实验室教育组(参照组),增加体育课时的干预组学生在标准化考试中未出现成绩下降的现象[29]。另一项在加拿大温哥华8所小学开展的为期16个月的“行动学校”项目,随机设置每周接受校内额外75 min体力活动的干预组(6所学校),与不接受任何干预的参照组相比,干预组既显著延长了PA时间,又能保持考试成绩[30]。
在 PA有益于学业表现的实证基础上,后续研究积极探索中等至高强度身体活动(MVPA)与学科教学融合的跃动学科课程。Donnelly等[31]选取堪萨斯地区24所小学二至三年级,开展为期3年的“课程中的身体活动”(PAAC)项目,在干预组(14所小学)的数学课上,学生分组围圈跑或跳,通过计算组别和人数学习乘法;在地理课上,根据教师所说的地名,学生跑或跳至教室相应方位等。结果显示,每周接受至少75 min MVPA的干预组在BMI上增长少于对照组,各科标准化考试成绩显著优于对照组,尤以数学最明显。在荷兰北部开展的“健康进取学校”项目中,研究者从12所小学招募499名二至三年级的学生,以班级为单位随机分配至干预组的学生接受为期两年、每年22周、每周3次20~30 min的“健康进取学校”课程,每节课安排10~15 min数学跃动活动和10~15 min语言跃动活动。结果显示,干预组的BMI无显著增长且数学统考和单项成绩显著优于参照组,考试成绩等同于对照组多接受4个月常规课程所取得的水平[32-33]。
鉴于实施 RCT可能出现参与者对随机分配的服从问题与“霍桑效应”、干预组对参照组的“溢出效应”、对照组的“约翰亨利效应”、实验过程的“安慰剂效应”等,基于IV、PSM的准实验设计广泛应用于青少年儿童发展研究。
作为克服观测数据内生性的经典因果推断方法,工具变量法通过两阶段最小二乘法模型(2SLS)进行估算。选取IV需满足3个基本条件:与关键变量(体质健康)显著相关、与结果变量(学业表现)不相关、与残差项不相关,即IV具有严格的外生性,既作用于个人的体质健康又免于人为干预[34]。Cawley[35]采用美国早期儿童纵向研究项目(ECLS-K)数据,将美国各州规定的一、三、五年级每周PE时长作为每天PE时长的工具变量,在第1阶段计量模型估算每天PE时长对各州规定PE时长的拟合值,将其代入第2阶段计量模型估算具有外生性的拟合值对标准化考试成绩的影响。结果显示:州规定课时每增加100 min则该州五年级PE课时相应增加40 min,州规定课时越长则五年级男生的肥胖率越低;PE课时延长不会挤占主科教学时长,且不会影响标准化考试成绩。
寻找有效IV并非易事,PSM通过构造合理的参照组解决自选择偏误问题,为准实验设计提供另一种思路。假设将“体质健康不达标”当作一种“干预”,研究者无法比较同一时间节点上同一个体接受干预(不达标)与不接受干预(达标)的差异,只可能在未接受干预的群体中选取特定对象,构建一个在影响干预概率的背景信息(性别、城乡、SES、学校类型等)分布上尽可能接近干预组的控制组。由于影响干预概率的背景变量不止一个而是一系列,因此要先计算未受干预的个体在背景变量影响下可能接受干预的概率即倾向分数,再通过倾向分数匹配与干预组可比的参照组,那么两组在学业表现上的差异为干预效应,即不达标对学业表现的影响。Lu等[36]利用台湾教育面板调查(TEPS)数据,选取学校特征、父母特征、父母与个人教育期望等作为背景变量,通过计算倾向分数匹配体质不达标组与体质达标组,对比分析两组间的学业差异,得到与欧美主流研究类似的结论,即体质达标初中生的成绩更胜一筹。有趣的是:偏胖和偏瘦对男生的成绩都有消极影响,而女生成绩仅受到偏胖的影响,再次证实了体质与学业关系的性别异质性。
有别于关系识别与因果推断研究关注单一时间节点的横断面数据,动态跟踪采集具有国家(区域)代表性的、多个时间节点的人群追踪数据,力图验证身体(健康)优势的持续累积对于扭转学业(教育)劣势的积极作用,探析健康促进影响学业表现乃至教育成就的动态变化趋势,支持健康与教育协同发展长效机制的建立。
长远来看,体质健康促进对学业发展持续产生积极的作用。Wittberg等[37]对西弗吉尼亚学区公立小学连续3个学年的五年级学生进行为期两年的标准化考试成绩追踪,在FITNESSGRAM中保持达标的学生优于待达标的学生,偶尔在达标与待达标边缘徘徊的学生优于长期待达标的学生。London等[38]通过增长模型分析加州两个学区共1 957名四至九年级学生的整体体质健康与学业表现数据,发现健康保持达标群体与不达标群体在数学和英语标准化测试成绩上存在显著差异,尤其是女生和拉美裔学生,体质健康总评比BMI测量的肥胖更适于预测学业表现,SES带来的马太效应表现为高SES学生拥有健康的体质和优良的成绩,而低SES学生则健康和成绩都较差。Lêscherban等[39]基于美国收入动态追踪调查横跨10年的3批3~14岁青少年儿童数据及儿童发展补充数据,提出了学龄期健康与学业表现随着时间推移而相互作用的实证模型,尤以女生良好的学业表现与体质健康显著正相关,揭示了保持体质健康对学业表现的积极效应。Suchert等[40]对1 011名13~15岁的德国初中生进行为期1年的跟踪研究,C/AF与学业成绩显著正相关,初始PA不足但后续达标的学生在学业上出现相应的提升,PA与学业成绩的关系受到自我效能调控。Lima等[41]对1 020名丹麦小学生进行为期3年的跟踪研究,发现安德森测试、折返跑、纵跳高度、体测总分始终与数学和语言标准化考试成绩显著正相关。Pellicer-Chenoll等[42]首次采用基于神经网络聚类和数据可视化算法的自组织特征映射(SOM),对巴塞罗那5所高中共454名学生为期4年的PA、能量消耗、体质健康、学业表现数据进行非线性分析,构建一个二维空间下的男女性别与高低学业成绩交互生成的2×2矩形SOM拓扑结构,清晰地显示高能量消耗、体质健康良好、BMI属于正常范围且学业成绩优良的样本点聚集至一个空间结构,而低能量消耗、体质健康较差、BMI偏高、学业表现不佳的样本点聚集至另一个空间结构;在4年间,绩优生样本点稳定保持在同一空间结构,少量差生样本点流动至绩优生空间结构的趋势明显。
Chen等[43]采集一所台湾高中669名七年级学生连续3年的体质与学业测评数据,通过线性回归分析、潜在增长曲线模型证实了 C/AF的改善与学业提升显著正相关,肌肉耐力、柔韧性与BMI都无显著相关。Liao等[44]通过分层线性模型分析2009—2011年台湾高中生3年体质健康变化与大学入学成绩的关系,在控制了高一初始体质健康状况、年龄与SES后,高三体质健康得分每提升1个标准差,则男生和女生的大学入学成绩分别提高0.07和0.10个标准差。其中,女生柔韧性每提升1个标准差则大学入学成绩提高0.01个标准差,该研究尝试从脑机制等生理方面以及自尊增强、焦虑消减等心理方面解释上述性别差异。Hsieh等[45]对台湾 2009—2013级 5届共 382 259名初中生C/AF数据与中学基本学力测验成绩进行分析,发现C/AF至少有一个学年达到“非常健康”的学生比从未达到的学生有更优异的测验成绩,且时间保持越久则测验排名越靠前,尤以初三健康达标的学力效应最明显,反映出 C/AF对于学业表现的累积效应以及近因效应;C/AF与数学、科学、社会科学成绩的正向关联强于语言类科目。温煦等[46]以浙江3个城市966名初一学生为对象进行为期两年的追踪研究,发现 C/AF水平低的学生相应地学业成绩较差,C/AF水平的变化对各科成绩存在中等水平的影响效应;超重和身体素质下降对学业成绩下降存在轻微的影响效应;结构方程模型验证了体质健康影响学业表现的间接路径,执行功能是体质健康促进影响学业表现的中介变量,将解释机制从生理层面、心理与社会层面拓展至认知层面(体质健康→执行功能→学业表现)。
目前,对于体质健康促进与学业发展的探究,以美国的学者作为主力军和领跑者,形成了跨学科的研究共同体,欧亚地区的研究兴趣与贡献渐增。从研究选题来看,由PA逐渐精确至客观测量的MVPA,严格区分课前或课后PA、PE与跃动学科课程,同时探析久坐行为、动作技能、C/AF与学业表现的关系。从研究对象来看,聚焦女性、学龄前儿童与低SES等特定群体,兼顾数学和阅读标准化考试等过程性评价,以及升学考试、学历和毕业率等终结性评价。从研究方法来看,已有结论多来自横断面研究,随机对照试验和追踪研究持续增多,鲜有质性研究。学界对于体质健康促进与学业表现的研究逐渐形成一个新领域,透过不同视角共同描绘着认知地图。不过,仍有若干方面值得深入探讨。
欧美国家主要采用体适能测试评价学生的体质健康状况,我国大规模的学生体质测评主要依据国家学生体质健康标准,通过每5年一次的全国学生体质与健康调研、每2年一次的全国学生体质健康监测网络进行评价。然而,通常首选外显的身体形态尤其是BMI作为体质指标,仅少量研究同时考虑C/AF、肌肉力量等内隐的身体机能与素质指标。尽管BMI易于采集、便于国际对比,仅由BMI测评肥胖乃至体质健康一直备受质疑[47]。从身体形态的测定来看,可综合胸围、腰臀比、体脂率等身体成分指标进行评价;从身体机能、素质、活动的测评来看,应用可穿戴运动监测装备和手机APP等,对个人乃至群体的运动轨迹、运动习惯、能量消耗、健康状况等各项参数和指标进行数据化,将有助于探索和丰富互联网+背景下的体质指标操作化。
大部分横断面研究仅识别体质健康促进与学业发展的相关关系,因果机制迫切需要进一步探明[48]。在关系解释上,体质健康促进与学业发展既可以理解为体质健康促进提升学业表现,又可以解读为学习优异的学生具备较强的自我管控能力与健康资源整合能力,更可能实现体质健康促进。在数理统计上,体质健康促进本身也具有一定的内生性,即体质健康与体力活动极可能受到个人先天特征、后天偏好、家庭和父母等无法观测的变量或遗漏变量的影响,导致体质健康促进可能与计量模型中的随机误差项存在相关,违背了经典假设而无法得到无偏估计。
据此,在方法上通过因果推断解决内生性问题、在时间上采用多个时间节点的动态跟踪、在设计上考虑定量与定性相结合的混合研究,探明生理、认知、社会等维度的因果机制,是研究体质健康促进与学业表现,乃至实现健康与教育长远发展的有效方法。由于教育实验研究本身存在争议,采集观测数据开展准实验设计研究,日益受到社会科学研究者的青睐。
随着全球体质健康问题的低龄化趋势凸显,近年研究的对象逐渐下移至学龄前儿童,得到与中小学生类似的研究发现,肥胖和超重群体与健康群体之间的学业差距可追溯至幼儿园阶段。由于义务教育阶段的学业负担较小,中小学生体质健康促进研究更易获得家校支持,而面临升学压力的高中生则较少参与其中。我国目前正逐步普及高中阶段教育,高中生处于青春期的末段,心智渐趋成熟,身体发育即将定型,但是体育尚未被列入高考必考科目,体育课时更容易被主科教学所挤占,学生难以在学习之余充分开展PA。缺少体育考试屏障的高中生更可能受到体质健康问题的困扰,进而影响学业表现。
从教育与社会发展来看,该研究主题日益与公平议题紧密结合,通过健康促进的差距引申出对教育不平等的思考。越来越多的学者强调体质健康促进的积极作用具有累积效应[49],即积极的促进效果会随着时间而增强。同时,与性别、种族、城乡、区域、SES等因素有关的异质性极可能导致身体(健康)与学业(教育)优劣势累积,影响个人毕生发展。在学校范围内以特定群体为对象实施精准干预,缩小体质健康差距以消弭教育不平等逐渐成为新的价值取向[50]。在我国积极推进基础教育均衡发展、促进社会公平和谐以及实施健康中国战略的背景下,充分考虑社会人口学因素具有重要的政策意义和实践意义。