基于大数据的高中学生心理预警模型探究与运用

2024-05-15 10:14邵爱国伍斯玥
中小学德育 2024年4期
关键词:学业均值预警

邵爱国 伍斯玥

摘 要 聚焦高中生的心理问题原因的探究,以7685位高中学生的在校数据为样本,通过分析33个数据变量,发现高中生的心理危机与学业成绩(生物例外)呈负相关,与体重呈正相关,与800米、1000米耗时呈正相关,与人际关系敏感均值、抑郁均值、恐怖均值、偏执均值呈正相关。据此,学校构建了“身心境合一”的课程支持、环境支持和心理干预体系,以促进学生心理健康。

关 键 词 高中生;大数据;心理预警模型

中图分类号G41

文献编码A

文章编号2095-1183(2024)04-0039-05

①本文系广东省教育科学规划2021年度课题(德育专项)“基于多层支持系统的高中生身心融合发展的教育实践研究”(批准号:2021JKDY086)成果之一。

大数据不仅是资源和技术,更是管理方法,从量化角度给学生管理带来了新的范式。深圳高级中学(集团)(以下简称“深高”)基于学生在学校中形成的数据,打破信息孤岛,形成可视化的健康云,通过对数据进行多维度、多视角、多层次的分析与挖掘,探索高中生心理问题的成因,构建了数据驱动的高中生心理预警模型,实现了对心理问题学生的前置性预判和精准资助。

一、数据类型

学校是数据的海洋,为了促进学生身心的全面健康发展,深高“健康云”平台记录和储存了学生的基础数据、身体数据、心理数据、学业数据、满意度数据、社团数据、消费数据,并以数据驾驶舱的形式呈现。(如图1)

“健康云”以深高2019-2022级的7685位高中学生为样本,对这些学生数据进行全连接后删除缺失项,最终以剩下的5000位学生数据进行分析。

对每位学生的描述包含33个变量:

成绩变量9个,即学生的语文、数学、英语、物理、化学、生物、政治、歷史、地理成绩。

消费变量3个,即学生在书店、食堂、超市的消费金额。

体测变量9个,即学生在性别、身高、体重、肺活量(单位毫升)、50米跑耗时(单位秒)、坐位体前屈(单位厘米)、立定跳远(单位厘米)、女生仰卧起坐数量(单位个)或男生引体向上数量(单位个)、800或1000米耗时(单位秒)的原始数据。

心理变量11个,即学生的躯体化、强迫症状、人际关系敏感、抑郁、焦虑、敌对、恐怖、偏执、精神病性、其他等10个变量上的平均得分,再加上是否心理预警变量(有心理预警数据的学生指在《症状自评量表SCL-90》中总均分高于3分或曾经接受过心理辅导的学生)。前10个变量来自SCL-90中的10个维度,用每个人在某个维度中所有题目的得分总和除以题目数量计算出各个维度的得分均值。

二、数据分析方法

模型及模型计算的方法。Logistic回归模型是一种分类模型,用于预测二元变量的概率,而问题“心理健康预警的发生与否”正是一个二分类问题,同样可以进行二分类的方法有很多,但在本问题上都不如Logistic回归模型适合;作为教育工作者,对自变量的“分析”较“预测”更为重要,找到对学生心理状况影响的因素,就可以对症下药,事先进行干预,Logistic回归模型可以进行变量筛选,真正找到对“心理健康预警的发生与否”影响起作用的变量;Logistic回归模型具有解释性高、适用范围广、计算简单,之后有新的自变量加入容易重新建模等优点。

因此,本文采用logistic回归模型,将“心理健康预警”的发生概率作为因变量,32个描述变量作为自变量进行建模。Logistic回归模型为一个非线性模型,将自变量与概率值利用logistic函数进行非线性映射,其中,模型的所有系数是通过极大似然估计方法获得。构建出模型之后,为了找出对“心理健康预警”产生影响最显著的变量,研究进行变量筛选。

对模型变量筛选的原理及方法。统计的科学性原则表明,不同变量之间没有可比性,因此,变量回归系数大小并不能直接作为其重要性的判断依据,同样,也不可以直接采用变量显著性作为其重要性的评价指标。一个变量的重要性只能通过其对模型的解释力度来决定,解释力度大指的是能使得模型的Deviance值大幅度上升。Deviance值是衡量因变量能被一个自变量组合解释力度的指标。综上,判断一个变量对模型是否重要,只能通过删除或添加该变量前后模型的总体解释性下降或上升的幅度来判断。逐步回归法按这一原则被提出,同样,逐步回归法也被本文用于对变量进行筛选。

逐步回归法有三种,一是向前选择法,即从空模型开始,逐个加入高解释力度的自变量进行回归,直到再加入新的自变量已经对模型影响不大后停止;二是向后剔除法,即全部自变量进行回归,一步步删除解释力度低的自变量,直到留下的所有自变量都有效。本研究采用双向选择法,即结合向前选择法和向后剔除法,避免了由于变量之间的线性而导致的误判。具体来说,每一步都同时进行添加和删除自变量的操作,重复多步后,直到再增加变量或者删除变量都不会使得模型对因变量“心理健康预警”发生概率的解释力度再发生大的变化后停止。最终,本文筛选的变量组合为英语、物理、化学、生物、地理、体重、肺活量、800或1000米耗时、超市消费、人际关系敏感均值、抑郁均值、恐怖均值、偏执均值、其他均值整体。

需要说明的是,未被选中的变量不代表对“心理健康预警”没有影响,而只能说明影响较小,或者可以由被选中的变量代为解释。

三、分析结果

分析发现,预测一名同学发生心理健康预警的概率=e^q/(1+e^q),其中,q=-4.8021-0.0076·英语-0.0137·物理-0.0137·化学+0.0268·生物-0.0357·地理+0.0253·体重-0.0004·肺活量+0.0044·跑800或1000米耗时-0.01·超市消费+0.4418·人际关系敏感均值+0.7376·抑郁均值+0.3178·恐怖均值+0.3489·偏执均值+0.5515·其他均值。(本公式用列线图,如图2)

以女生 A 为例子,她的列线图得分及最后预测概率:(如图3)

学校可以通过图2列线图进行概率估计,每个变量取值对应最上面轴“得分”,将所有“得分”求和后可以获得“总得分”,每个“总得分”对应一个发生“心理健康预警”的可能性,如图3女生A的例子,图中可以看出不同特征对“心理健康预警”可能性的正向或反向的影响,也能看出影响的幅度。以样本中的女生A和男生B的各项数据为例,预测结果如下。(见图4)

根据数据分析,我们可以得出以下结论:

1.心理危机是多重因素交织形成的,每类因子对心理危机的影响大小有别。

2.心理危机概率与学业成绩呈负相关(生物成绩例外,根据过去心理辅导经验,心理健康不佳的学生,更倾向于关注自己生理的感受和症状,生物成绩相对其它科目成绩会更突出)。

已有研究表明,学习压力、学习挫败感与学生的心理健康状况高度相关,孙炳海等人曾提出中小学生“风险累积—正向支持”心理危机识别模型,该模型强调环境中的学业焦虑等风险因素的累积对心理危机有促发作用,学业自我效能感等保护因子对心理健康有正向支持、保护作用。[1]袁景颖则发现一些学习成绩不理想的学生,会产生学习情绪低落、自卑感,负担过重容易產生心理失衡,这些学业因素都可能引发学生发展性心理危机。[2]高怡在关于中小学心理健康的研究和李海垒等人在青少年学业压力和抑郁的研究中都发现学业压力会对学生的心理健康产生负性影响。[3][4]此外,朱炳达在学业压力与抑郁倾向的研究中发现,学业压力可以显著正向预测个体的抑郁倾向。[5]还有学者指出,学业压力过高会引发学生出现抑郁、失眠、焦虑、自我伤害、攻击性行为和其他问题,从而导致危险事件的发生。[6]综上所述,学业压力、学业失败感是造成心理危机的重要成因。

3.体重与心理危机概率呈正相关,800米、1000米用时与心理危机呈正相关。

已有研究证实,当青少年的身体体质指数(Body Mass Index, BMI)显示为超重/肥胖,或对身材自我评价不满意时,均会导致其生活满意度下降,是产生抑郁、焦虑症状的危险因素。[7]同时,这种影响又可能会导致青少年情绪化进食,加剧肥胖程度,进而加剧同伴的取笑和校园霸凌的发生,最终导致对心理健康的危害,形成恶性循环。[8]杨青清在研究中发现,体重对中国青少年的心理疾患存在负向的影响。[9]此外,好的运动习惯对心理健康有积极作用,良好的运动习惯可以有效改善个体抑郁和焦虑的症状。[10]李芸等人通过在对502名中学生问卷调查中也发现,长期体育锻炼习惯有助于保持良好的心理健康状态, [11]有运动习惯的学生在不同程度心理问题上,均值得分更低,心理健康状况更好,[12]说明好运动习惯有利于心理健康

4.与心理健康预警发生概率呈正相关的变量有生物、体重、800或1000米耗时、人际关系敏感均值、抑郁均值、恐怖均值、偏执均值、其他均值,其他变量呈负相关。肌肉爆发力与心理危机概率无关。

四、验证方法

对于上述的建模及变量筛选的操作都需要进行有效性检验,以回答三个问题:

1.所给的32个变量是否对心理健康预警情况发生有影响?

2.筛选后剩余的14个变量是否对心理健康预警情况发生有影响?

3.所给的32个变量与筛选后剩余的14个变量是否对心理健康预警情况的发生影响力度一样?

因为整个模型是非线性的,而且利用了极大似然法来估计参数,因此,需要用卡方检验法来进行模型检验。本文一共进行了3次卡方检验来回答上述三个问题。

1.空模型和全模型:32个自变量与因变量构成的全模型与0个因变量构成的空模型进行卡方检验比较,p值小于0.01,即说明这32个自变量与心理健康预警无关的概率小于0.01,即32个变量对心理健康预警情况发生没有影响的可能性小于1%。

2.空模型和变量筛选后的模型:14个筛选后的自变量与因变量构成的模型与0个因变量构成的空模型进行卡方检验比较,p值小于0.01,即说明这14个筛选出来的自变量与心理健康预警无关的概率小于0.01,即筛选后剩余的14个变量对心理健康预警情况发生没有影响的可能性小于1%。

3.全模型和变量筛选后的模型:32个自变量与因变量构成的全模型与14个筛选出来的自变量与因变量构成的模型进行卡方检验比较,p值大于0.99,说明这14个筛选出来的自变量对心理健康预警的影响力度与32个全部自变量对心理健康预警的影响力度相同的概率大于99%。

五、讨论

1.32个自变量构成的全模型和14个筛选后自变量构成的模型的R2值均不到0.2,说明32个变量和14个筛选后自变量这两种变量组合对一个学生是否发生心理健康预警的解释力度只有不到20%,即还有超80%的因素需要被寻找。但是,结合上面卡方检验得到的结果,模型是有效的。

2.“解释力度”是针对预测而言的。即若将模型用于预测哪位学生发生心理预警可能是不足的,若一个学生通过模型测出发生心理预警的概率较其他同学高,那么可以提醒教育工作者对该名学生应多加关注,概率较高的同学比概率较低的同学更需要被关注。

3.本模型的“分析”作用是有效的。空模型和变量筛选后的模型p值小于0.01,即筛选出来的14个自变量对“心理预警的发生”有影响的概率超99%,可以证明模型在已有自变量中挖掘到了对学生心理状况有影响的因素。作为教育工作者,对自变量的“分析”较“预测”更为重要,找到对学生心理状况影响的因素,就可以对症下药,事先进行干预。

4.本研究的自变量数据覆盖面广,包括学生的体育、成绩、消费、心理自评四个维度,已经是学生在校期间校方可以掌握的绝大部分数据,但是这些数据的解释力度却只有不到20%,恰恰表明,校方的能力范围外的因素对学生的心理状况影响远远超过校方的能力范围内,比如亲子关系、家庭状况、社会环境等。这也警示,加强家校沟通、营造良好的社会环境对学生心理健康的重要性,需要校家社多方联动,为青少年学生的健康成长保驾护航。这还提醒教育工作者,需要更全面、有針对性地了解学生,甄别剩下的80%因素是接下来努力的目标。

综合来看,无论是32个自变量构成的全模型,还是14个筛选后自变量构成的模型,都是有效但欠拟合的模型。模型只能用于探寻学生发生“心理健康预警”的影响因素,若想进行预测,还需要增加更多更有效的变量。

六、校本应用

通过分析和挖掘学校已有各项数据,学校努力探究学生各项身心数据相互之间的关系和影响机制,初步建立了学生心理预警模型,该模型为学校提供了真实、科学的学生个体和群体身心画像,一定程度上克服了单纯经验的局限,为学校课程开发和教育引导提供了数据支撑。依据心理预警值,把学生分为身心需要得到发展的学生、身心需要塑造的学生和身心需要提升的学生,针对不同类型学生,分别提供健康通识课程、身心融合团辅导课程、身心融合个体化课程;依据数据揭示的环境对学生心理的影响,建设了心理健康教育中心、体育健康发展中心、悠然园劳动基地,创造养人、宜人、育人的环境;根据数据揭示运动与心理的影响关系,学校开发了身心融合的心理课程、身心融合劳动课程、身心融合体育课程。

防之于未萌,治之于未乱。最好的心理治疗莫过于防患于未然,于苗头时潜伏时处置。基于大数据的高中学生心理预警模型,依数据开发身心融合系列课程,有助于学校抓住化解心理问题先机,防止“小病拖大”的情况发生。

参考文献:

[1]孙炳海,武莹,孙长康.中小学生"风险累积——正向支持"心理危机识别模型的构建与应用[J].江苏教育,2023,(43):7-10.

[2]袁景颖.中小学生心理危机的内涵、影响因素与干预策略[J].辽宁教育,2023,(20):26-28.

[3]高怡.湖北省中小学生心理健康的现实状况、影响因素及教育对策[D].华中师范大学,2023:26-29.

[4]李海垒,张文新.青少年的学业压力与抑郁:同伴支持的缓冲作用[J].中国特殊教育,2014,(10):87-91.

[5]朱炳达.高中生情绪弹性、学业压力和抑郁倾向的关系及干预研究[D].宁波大学,2020:30.

[6]窦芬,王明辉,王书豪.研究生压力知觉对学业拖延的影响:有调节的中介模型[J].心理研究,2019,12(03):272-277.

[7]Wang S,Sun Q,Zhai L,et al.The prevalence of depression and anxiety symptoms among overweight/obese and nonoverweight/non-obese children/adolescents in China:a systematic review and meta-analysis[J].International journal of environmental research and public health,2019,16(3):340.

[8]Rao W W,Zong Q Q,Zhang J W,et al.Obesity increases the risk of depression in children and adolescents:Results from a systematic review and meta-analysis[J].Journal of affective disorders,2020,267:78-85.

[9]杨青清.体重对中国青少年心理健康的影响及机制研究[D].湖南大学,2022:45.

[10]付克翠,陈菊平,韦焕.北海道地区中国留学生体育运动习惯与身心健康状况调研[J].运动,2012,(13):154-156+153.

[11]李芸,沈丽琴,李蓉琼,等.体育运动习惯对中学生心理健康的影响[J].中华现代护理杂志,2007(18):1694-1696.

[12]向能.成都市高三学生心理健康状况与运动习惯的差异性研究[D].成都体育学院,2024:33-34.

责任编辑 徐向阳

猜你喜欢
学业均值预警
艰苦的学业
音乐提升学生学业表现
树起学业担当之心
法国发布高温预警 严阵以待备战“史上最热周”
园林有害生物预警与可持续控制
均值不等式失效时的解决方法
均值与方差在生活中的应用
机载预警雷达对IFF 的干扰分析
关于均值有界变差函数的重要不等式
对偶均值积分的Marcus-Lopes不等式