朱 焰,林 爽
近年来,大学生心理问题发生的数量与日俱升。汪立夏分别在2001、2006、2011年对江西省5所重点高校学生进行调查,结果显示分别有23.80%、22.86%、19.46%的学生存在不同程度的心理障碍[1]。李娜于2014年对某女子学院3225名2012 级学生的心理普查中,发现有15.8%的学生可能存在心理困扰[2]。为进一步了解高校大学生的心理健康现状,本研究使用症状自评量表(SCL—90)和大学生人格问卷(UPI),对广西某高校5 617 名2018 级新生的心理健康状况进行了问卷调查。SCL—90 施测结果显示共有705 名学生心理异常,UPI 施测结果显示共有712 名学生心理异常。同时,由于大学生心理健康教育与咨询中心无法时时监测到每一名学生的心理动态,学生本身对于自身的心理状况又缺乏准确的认识,因而大学生心理健康的现状不容乐观。为更及时、更准确、更有效地对大学生的心理状况进行监测和管理,构建大学生心理预警系统成为了家庭、学校和社会关注的重点。
心理预警能有效预防和减少心理危机事件的发生,主要是通过确定预警对象,并对预警指标进行动态监测,对其进行评估、分析和研究,根据分析结果,及时发现和识别影响心理危机的因素,及时采取防范措施,以降低心理危机事件的发生率[3]28。大学生心理预警是大学生心理健康工作的重要环节,通过宿舍、班级、学院、学校四级心理健康工作网络觉察大学生的异常心理和异常行为,筛查心理异常的个体和群体,分辨并发现重点关注对象和危机对象,及时发出预警信息,并由高校心理中心对预警信息进行评估,进一步确定重点关注对象和危机干预对象,以对可能发生的危机事件作出早期预测,实现有效预防心理危机事件的发生[4]。大学生心理预警系统是通过对心理健康相关变量的量化指标进行监测,并对其进行综合的分析评估,及时发现和确定心理危机因素的影响,从而预测预警对象的心理健康变化趋势,并采取有效的危机干预手段,从而降低心理危机事件发生的系统。该系统包括大学生心理健康状况的筛查、心理健康状况的评估、心理健康变化趋势的预测几个部分。
但心理预警也存在人为评判的不确定性、信息收集反馈的滞后性、信息内容的欺瞒性等局限,庞大的学生心理数据也向高校心理健康工作提出了挑战。此外,许多心理危机信号数据并非传统的结构化数据(即可以用二维表结构来逻辑表达实现的数据,比如量表数据),而是半结构化数据(即以电子邮件、文字处理文件及大量保存和发布在网络上的信息组成的数据,如在QQ 空间、微信朋友圈等发布的危机信号信息)和非结构化数据(即没有固定结构的数据,主要包括文本数据、图像、语音、网络、空间轨迹、时间序列)[5]。因此,大数据有别于传统数据的五大特征,即样本等于总体、采用相关分析处理数据、承认数据的混杂性、数据的实时更新和大数据的预测功能。
已有的研究探索了通过大数据的方法处理大学生心理数据的可能性。例如,亓文娟使用了大数据处理方法关联规则来处理心理数据,实现对大量心理测评数据的处理[6];梁娟使用相对提升度的方法,计算学生心理测评的数据中各个属性值之间的关系,并使用剪枝方法,提高生成规则的有效性[7]。但是,已有的研究主要是从数据处理方法的角度对学生的心理数据进行研究,而当前高校所收集到的学生心理数据主要是新生入学心理测验的数据,其对于高校了解学生入学后的心理健康状况变化情况提供的信息是有限的。此外,对心理数据进行处理后,如何让大量的辅导员、班主任等非心理专业人士读懂心理数据的处理结果,也是先前研究很少涉及的问题。
首先,高校全体大学生的心理健康数据需要通过大数据技术来处理。2008年9月4日,在《自然》杂志推出了1 本名为大数据的专刊中,大数据的概念被首次提出,其中大数据是指无法用常规工具去收集、分析、统计、测量、管理的数据集合。通过对比大数据与高校全体大学生的心理健康状况数据,两者的特征是相似的。因而,为更好地捕捉、统计、测量、处理高校全体大学生的心理健康数据,高校需采用大数据技术建立大学生心理预警系统[8-9]。
其次,关于大数据视域下大学生心理预警系统的建设过程,它是在大数据技术的基础上,综合沃尔特·休哈特(W.A Shewhart)质量控制图建立的异常值分析技术以及相关分析、回归分析等统计学方法,对大学生心理健康相关数据进行采集、预处理、分析、理解和评估的过程。其具体步骤包括:提出问题、数据理解、数据采集、数据预处理、数据分析、分析结果的解析、效果评估等[10]。(1)提出问题:这里是指需要解决的问题是用大数据分析技术来实现大学生心理预警。(2)数据理解:明确基于大数据的心理预警系统中的观察数据与心理健康水平的关系,明确观察数据内容,主要是通过建立心理健康普查系统、心理状况动态评估系统和心理变化实时监测系统三个子系统及其指标体系,从而反映学生心理健康的初始水平、当前水平和发展趋势。(3)数据采集:需要采集与大学生心理健康有关的各类数据。(4)数据预处理:主要是对原始数据进行一些简单的清洗和预处理工作以过滤一些无效数据。(5)数据分析:包括可视化分析和预测性分析。通常来说,数据可视化最基础、最常见的应用是柱状图、散点图、饼状图、直方图等原始的统计图表,但为了更好地反映个体的心理健康状况,本系统主要是通过心理健康普查系统提供的心理健康水平的初始值和心理状态动态评估系统提供的当前值,结合异常值分析技术,对个体的心理健康状况进行可视化分析,通过心理变化实时监测系统中的心理健康相关变量特征值的监测,对个体的心理健康状况进行预测性分析。(6)分析结果的解析:基于分析的结果监测大学生心理健康水平,及时发现有心理困惑、心理障碍的学生并提供必要的帮助。(7)效果评估:分别检验观察数据与心理健康的相关关系,若观察数据不能正确预估心理健康水平或观察数据与心理健康关联度较低则直接删除或纠正。
由于大学生心理预警具有工作内容复杂、工作对象繁多、工作时间持久等特点,同时,人为评判的不准确性、庞大的学生心理数据也向高校的心理预警工作提出了挑战。为解决此类问题,在当前高校的大学生心理预警工作体系、梁杰的大学生身心控制和预防指标体系[3]31以及日常心理工作经验的基础上,本研究提出基于大数据技术建立大学生心理预警系统。该系统分为三个部分,分别是心理健康普查系统、心理状况动态评估系统和心理变化实时监测系统。
当前,多数高校主要采用的新生入学心理测验工具是大学生人格问卷(UPI)和症状自评量表(SCL—90)。因此在新生入学心理测验的测量结果的基础上,心理健康普查系统通过结合日常心理咨询记录筛查出可能具有心理问题的个体和有心理危机倾向的高危个体,并联合心理健康教育与咨询中心和各二级学院,共同做好对此类学生的危机预防与转介工作。通过心理健康普查,可在一定程度上更深入地了解学生的心理状况,并为下一步工作提供初始参考数据。因此,心理健康普查系统的指标值主要包括症状自评量表(SCL—90)和大学生人格问卷(UPI)得分。症状自评量表采用10 个因子分别反映个体近期10 个方面的心理症状情况,是当前使用最为广泛的精神障碍和心理疾病门诊检查量表,并被多数高校采用为新生入学心理普查的测验工具,但由于其结果仅能反映最近一段时间内个体的心理状况,而让全体学生在每隔一段时间就施测一次,对学生本人和学校学生管理工作均提出了巨大的挑战,因而,以症状自评量表和大学生人格问卷为主要指标值的心理健康普查系统起到了提供初始参考值的作用。
心理状况动态评估系统主要是基于心理状况动态报告表,通过学校、学院、班级、宿舍心理健康教育四级工作网络体系进行心理状况的常规报告和紧急报告,心理健康教育与咨询中心进而可以结合大学生动态报告结果、心理测验结果和心理咨询记录等对大学生的心理状况进行初步评估,并及时向对应的学院辅导员提供反馈和建议,进一步根据初步评估的结果构建大学学生心理危机预警对象库,将有心理危机倾向或处于心理危机中的大学生信息录入其中,对他们实行动态管理。心理状况动态评估系统的指标值主要是负性生活事件特征值和应激反应特征值。根据塞里(Seyle,1930)的应激学说、心理应激理论等,心理应激作用过程由心理危机事件(即应激源)通过应激相关的中介变量(包括认知评价、人格、应对方式、社会支持等)影响个体的应激反应,包括认知反应、情绪反应、生理反应和行为反应,进而影响个体的心理健康,因此,在无法直接了解个体心理健康状况时,可以通过直接了解个体正在经历或已经历的负性生活事件、个体的应激反应,从而间接反映个体的心理健康状况。在本研究中,心理状况评估系统是通过心理状况动态报告表定期了解学生的经历的负性生活事件状况和应激反应状况,从而掌握个体的当前心理健康水平。
心理变化实时监测系统是对心理健康普查系统和心理状况动态评估系统的有效补充,由于两者都无法实现对学生心理变化的实时监测,也无法估计学生心理变化的趋势,而建立心理变化的实时监测,目的是实现对学生心理状况的实时监测,并根据对心理健康相关变量的量化指标的实时监测实现对学生心理变化趋势的预测,从而预警学生的心理危机。心理变化实时监测系统的指标值主要是基于心理状况动态评估系统中的负性生活事件特征值建立的,从43 种负性生活事件中提取与心理健康相关的变量,从而转化为对应的特征值指标,根据特征值指标与心理健康的高相关性,通过监测特征值指标预测个体的心理健康发展趋势。
为检验基于大数据的心理预警系统各子系统对大学生心理健康的有效预测作用,本研究采用元分析的方法,分别检验各子系统的指标体系对心理健康的预测作用及其预测程度。
心理健康普查系统的指标值主要由症状自评量表(SCL—90)得分和大学生人格问卷(UPI)得分组成。因此,为检验心理健康普查系统的指标值对于大学生心理健康的预测作用,本文采用元分析的方法整合国内外已有研究,分析大学生人格对于心理健康影响的主效应。由于本系统主要使用的测量工具为大学生人格问卷和症状自评量表,因此在文献检索中,只考虑使用了这两个量表进行研究的文献,通过检索2000—2019年发表在中国知网期刊全文数据库、万方数据资源系统、中国优秀硕博士论文数据库、维普中文科技期刊数据库中的论文收集元分析所需的原始数据。筛选条件如下:(1)所检索的文献主要探讨人格与心理健康的关系;(2)研究对象主要是大学生;(3)人格与心理健康之间有明确的相关系数r 或可被转换为r 的F 值、t 值、χ2等;(4)样本量明确。最后,纳入符合要求的文献12 篇,共12 个效应量(effect size),总样本量19 419 人。本文采用Comprehensive Meta Analysis 2.0 进行数据编码与分析,使用随机效应模型分析结果,元分析结果如表1所示。
表1 人格对心理健康影响的元分析
柯恩(Cohen)指出r 为0.1、0.25 和0.4 分别表示效应值较小、中等和较大[11],该元分析结果显示大学生人格和心理健康呈正相关,且效应值较大,因此,该结果可证明UPI 可有效预测大学生的心理健康,可作为心理健康普查系统的有效指标。
心理状况动态评估系统的指标值主要由青少年生活事件量表(ASLEC)得分、心理压力反应问卷得分和症状自评量表(SCL—90)得分组成,其中心理压力反应在青少年生活事件和心理健康之间起部分中介作用,青少年生活事件可直接预测心理健康,可以通过心理压力间接预测心理健康。为了检验心理状况动态评估系统的指标值对于大学生心理健康的预测作用,本文采用元分析的方法整合国内外已有研究,分析青少年生活事件和心理压力对于心理健康影响的主效应。心理状况动态评估系统中使用的心理状况动态报告表,结合了青少年生活事件量表和心理压力量表来构建,并采用编码的方式得到每月学生的生活事件得分和心理压力得分,从而预测学生的心理健康水平。因此,只检索那些使用青少年生活事件量表(ASLEC)、心理压力反应问卷得分和症状自评量表(SCL—90)作为研究工具的文献,通过检索2000—2019年发表在中国知网期刊全文数据库、万方数据资源系统、中国优秀硕博士论文数据库、维普中文科技期刊数据库中的论文收集元分析所需的原始数据。筛选条件如下:(1)文献主要探讨的是青少年生活事件与心理健康、心理压力反应与心理健康或是青少年生活事件与心理压力反应的关系;(2)研究对象主要为高校大学生;(3)三个变量两两之间有明确的相关系数r 或可被转换为r的F 值、t 值、χ2等;(4)样本量明确。本文采用Comprehensive Meta Analysis 2.0 进行数据编码与分析,使用随机效应模型分析结果。其中,青少年生活事件与心理健康的元分析结果如表2所示。
表2 青少年生活事件对心理健康影响的元分析
该元分析结果显示青少年生活事件和心理健康呈正相关,且效应值较大,因此,该结果可证明ASLEC 可有效预测大学生的心理健康,可作为心理状况动态评估系统的有效指标。
心理压力反应与心理健康的元分析如表3所示。
表3 心理压力反应对心理健康影响的元分析
该元分析结果显示,心理压力反应和心理健康呈正相关,且效应值较大。因此,该结果可证明心理压力反应可有效预测大学生的心理健康,可作为心理状况动态评估系统的有效指标。
心理变化实时监测系统指标体系与心理状况动态评估系统的不同之处在于,心理状态动态评估系统重点关注影响大学生心理健康的生活事件是否发生和相应的应激反应的水平,而心理变化实时监测系统则是关注影响大学生心理健康的生活事件的量化指标对大学生心理健康的预测作用。为确定具体的生活事件类型对大学生心理健康的预测作用,因此,本文在青少年生活事件与心理健康的元分析的基础上,对具体的青少年生活事件类型(根据青少年生活事件量表,青少年生活事件类型包括人际关系、学习压力、受惩罚、丧失、健康适应及其他)对于心理健康影响的主效应进行了进一步检验,从而确定具体生活事件的量化指标能有效预测大学生心理健康。
本文采用随机效应模型检验主效应,元分析结果如表4所示。其中。r1—r6表示:SCL—90 总分与人际关系因子、学习压力因子、受惩罚因子、丧失因子、健康适应因子、其他因子的相关系数。
表4 具体生活事件对心理健康影响的元分析
该元分析结果显示,人际关系因子、学习压力因子、受惩罚因子、丧失因子、健康适应因子和其他因子与心理健康呈正相关,其中,人际关系、学习压力、健康适应和其他类型对心理健康影响的主效应较大,而受惩罚和丧失对心理健康影响的主效应为中等,人际关系、学习压力、受惩罚、丧失、健康适应和其他类型均可作为心理健康的有效预测指标。
大数据的4V 特征(数据量大、速度快、类型多、价值高)有效地解决了大学生心理预警相关数据的数量多、冗杂性、时效强等问题,本系统在大数据预测性分析和可视化分析技术的基础上,还采用了基于沃尔特·休哈特质量控制图建立的异常值分析技术。其中,预测性分析是指从大数据中挖掘出有价值的知识和规则,通过科学建模的手段呈现出结果,然后可以将新的数据带入模型,从而预测未来的情况,可视化分析是指直观地呈现大数据特点,同时能够非常容易地被用户所接受,通过直观地展示数据,让数据自己说话,让用户看到结果。异常值分析主要包括两种异常值,一是偏离其个体数据分布的异常值。另一种是偏离其所在群体“最典型分布”的异常值[12]。
基于沃尔特·休哈特质量控制图建立心理危机控制图,首先检测得到初始值K0,然后对应激变量的量化指标实时监测,若是出现偏离其个体数据分布的异常值则需要对个体重点关注,若是其值超过临界值则需要及时介入;二是偏离其所在群体“最典型分布”的异常值。“最典型分布”:将同一类别的所有数据叠加在一起,得到一个某一时间段内某类数据的“标准分布”,然后计算待检测的目标的数据分布到这个标准分布的距离[13]。具体来说,基于大数据的大学生心理预警系统中的三个子系统,由心理健康普查系统提供初始值,由心理状况动态评估系统提供当前值,由心理变化实时监测系统提供预测值,共同实现了对大学生心理健康变化的实时状况反映和发展趋势预测。
首先,根据负性生活事件、应激反应和心理健康的中介模型,可以得出负性生活事件与应激反应和心理健康之间的关系为:
其中,K 表示心理健康总分,X 表示当前个体经历负性生活事件的总分,Z 表示当前个体的应激反应总分,β 为常数项,ξ 为误差项。因此,学生在入学时的症状自评量表的施测结果为大数据大学生心理预警系统提供了学生本人的心理健康水平的初始值,即
其中,X 和Z 的值由心理状况动态评估系统提供。
首先,通过学年内每月收集的心理状况动态报告表,可计算出学生在校期间的心理状况,得出个体经历负性生活事件的总分和个体的应激反应总分,因而可结合个体的心理健康总分初始值(公式1)计算出个体当前的心理健康总分(公式2)。
其次,结合异常值分析和可视化分析,分析个体心理健康的变化情况和异常情况。
青少年生活事件量表(ASLEC)主要把青少年经历的生活事件类型分为人际关系类型、学习压力类型、受惩罚类型、丧失类型、健康适应类型和其他类型。根据元分析的结果,人际关系类型事件、学习压力类型事件、受惩罚类型事件、丧失类型事件、健康适应类型事件和其他类型事件与心理健康的效应值分别为0.457、0.441、0.342、0.267、0.411、0.412。相对于可观察到的应激反应而言,生活事件发生得更早,对其进行实时的监测可以实现对大学生心理变化预测。因此,当个体的心理状况报告表通过宿舍、班级、学院、学校心理健康教育四级工作网络反映出学生正在经历或已经历相关类型的生活事件时,则说明个体的SCL-90 总分可能较高,即心理健康状况正在处于或可能处于较低的水平。
心理健康普查系统是通过症状自评量表(SCL—90)和大学生人格问卷(UPI)对入学新生进行全体施测,并分析学生的测量得分,对心理普查得分异常的学生进行进一步的了解,结合得分异常学生的谈话和心理咨询的结果,提供每一名学生的心理健康水平的初始信息,为心理状况评估系统提供初始值,并将心理普查中心理异常的学生列为重点关注对象,建立心理预警重点对象数据库,心理中心和学院对此类学生予以重点关注。
以某高校的同学A 为例,该生大一入学时心理普查测得其UPI 得分为32 分,且第25 题(题目为:想轻生)做了肯定回答,并明确向心理中心提出了咨询的要求;SCL—90 总分为189 分,其中人际关系敏感、抑郁、焦虑因子得分均大于3 分。在得到该生的心理普查结果信息和受到该生的咨询要求后,心理中心的心理老师给其做了3 次心理咨询,在咨询过程中,了解到该生主要是由于入学后宿舍人际关系不适应导致的抑郁倾向,并推荐其前往专业的心理机构进行诊断,诊断表明该生未患有抑郁症。心理中心根据心理普查结果、心理咨询结果和专业心理机构的诊断结果,在建议学生继续进行心理咨询的同时,将该生的评估结果反馈给学院,并将该生列为重点关注对象,由心理中心和学院对该生予以重点关注。
心理状况动态评估系统主要是依靠心理状况动态报告表,由各班心理委员每月报告本班学生经历的负性生活事件和应激反应情况,并根据心理健康普查系统提供的初始值,计算学生的当月的心理健康水平。
以某高校的同学B 为例,入学当月测得其SCL—90 的总分为120 分,根据大样本施测结果,a值为0.45,b 值为0.55,入学时的负性生活事件总分为30 分,应激反应总分为20 分,其后每月通过心理状况动态报告表反映其心理状况变化,则该生入学至入学第十一个月的心理健康得分变化情况如表5所示。
表5 同学B 入学后一年的心理健康得分变化情况
将其转化为心理预警控制图,如图1所示。其中,K 指学生的心理健康水平,K’指常模数据(全体均值),K0即学生心理健康得分的初始值(入学时心理普查结果),Kmax是指临界值上限,Kmin是指临界值下限。
如图1可以看出,该生在入学后的第六个月,其心理健康得分超出了临界值,因此,需要高校心理中心和学院重点关注该学生,通过心理状况动态报告表中提供的负性生活事件和心理应激反应数据,日常心理咨询记录,周围老师同学提供的相关信息,了解学生心理健康得分过高的原因,从而针对性的给予学生心理辅导,防止其心理健康水平进一步恶化。
由于SCL—90 总分大于160 分提示阳性症状,故临界值上限为160,由于SCL—90 是1—5 级计分,故临界值下限为90,查得常模分数为130。该评估系统还为学生的心理健康水平划分了三个等级,第一等级为正常等级,即个体的心理健康得分大于90 分且低于160 分;第二等级为异常变化等级,即当个体的心理健康得分大于90 分且低于160 分的同时,当月的心理健康得分相较于其他月份出现了异常变化;第三等级为临界等级,即个体的心理健康得分大于160 分。
图1 基于沃尔特·休哈特质量控制图建立的心理预警控制
此外,三个等级对应着不同的应对措施,首先,第一等级即正常等级不需要心理中心和学院做出反应;其次,第二等级即异常变化等级需要学院对该学生予以重点关注;再次,第三等级即临界等级需要心理中心和学院对该学生进行心理干预。
心理变化实时监测系统主要是通过其他渠道,了解个体经历的具体负性生活事件,从而实现对个体心理健康的实时监测。例如通过建立与学校保卫处的联系,当学生发生打架斗殴事件时,根据受惩罚类型事件与心理健康的高度相关,预测该个体心理可能朝着不健康的方向发展,结合心理普查系统和心理状况动态评估系统数据,对该个体的心理健康水平进行评价,并将评估结果反馈至心理中心和学院[14-15]。此外,该系统还建立与教务处的联系,实时了解学生的学习成绩的变化情况,根据学习压力类型事件与心理健康的高度相关,预测学生的心理健康变化;建立与后勤处的联系,了解学生的一卡通消费情况,根据其他类型事件与心理健康的高度相关,预测学生的心理健康变化等。
大数据视域下大学生心理预警系统建设是在大数据技术的基础上,综合了基于沃尔特·休哈特质量控制图建立的异常值分析技术和相关分析、回归分析等统计学方法,对大学生心理健康相关数据进行采集、预处理、分析、理解和评估的过程。
通过元分析的检验,大数据视域下大学生心理预警系统中的三个子系统均能有效地对大学生心理健康水平进行预测,且预测作用较强。
大数据视域下大学生心理预警系统中的三个子系统分别提供了学生心理状况的初始值、当前值和预测值,有利于解决当前高校不能及时发现学生心理问题的现实困难,也为下一步对心理健康相关数据进行进一步挖掘提供了支持。
由于当前高校的技术手段发展程度所限,半结构化数据(如QQ 空间、微信朋友圈等发布的危机信息)和非结构化数据(包括图像、音频/视频等)信息的收集和处理在本系统中并没有被全部采用,而半结构化数据和非结构化数据的信息量更大、更能反映学生实时状况,人为参与评价的程度更低。因此,大数据视域下心理预警系统的未来发展将致力于将半结构化数据和非结构化数据的收集和处理囊括其中,实现对学生心理健康状况的全方面掌握,以促进学生全面的、健康的身心发展。
此外,心理状况动态报告表在收集学生的动态信息时,需要学校、学院、班级、宿舍各级的信息员足够了解收集的信息内容,并提高对不同类型信息的敏感度。虽然心理状况动态报告表通过观测客观存在的生活事件以及应激反应来反映学生的心理健康状况,但是观测信息的准确性和全面性决定了大数据视域下大学生心理预警系统的预测精度。因此,在实际应用中,应加强对各级信息员的学习培训,以提高他们的责任感、专业性、敏感性。