郝婉琳
(西安航空职业技术学院,陕西西安 710089)
大学时期是人生观、价值观成型的关键阶段,也是心理成熟的重要阶段。近年来,由于大学生心理健康问题导致各类社会事件频发,从而引起了社会舆论的广泛关注[1-4]。目前,我国高校中设有专门的心理健康工作室,由专职人员进行心理健康辅导工作。但由于心理健康在高校的教育中通常为辅助、支撑的角色,师资与投入相对受限,因此心理健康辅导人员没有足够的时间和精力及时向学生提供心理咨询;此外,由于心理健康问题其特殊的属性,学生缺乏自我救助意识,导致心理健康问题无法被及时发现[5-12]。
为了解决上述问题,该文结合近年来兴起的大数据技术,通过引入心理学健康评价指标体系,搭建心理健康数据采集平台。借助大数据处理算法实现了智能化的心理健康评估,大幅度简化了心理健康工作的流程,提高了工作效率。文中通过灰度关联算法对SCL-90 心理健康评价体系中的指标权重进行分析,并结合学生的数据采集结果对学生的心理状态进行评估;文中还引入了Apriori 关联规则算法,利用该算法在评分过程中进行关联分析,从而挖掘产生心理健康问题的一般规律。
在心理健康预警时,需要根据大学生相关的心理健康指标进行数据采集。为了合理构建指标评价体系,首先需要分析所有指标对于评价结果的影响力强弱关系。为了实现该目的,引入了灰度关联分析算法(Grey Relational Analysis,GRA)[13-16]。
其分析的基本思路:首先确定参考数据序列,然后引入若干比较序列,并分析参考序列、比较序列之间的相似度用以衡量二者之间的关联度。灰度关联算法流程如图1 所示。
图1 灰度关联算法流程
1)确定评价矩阵
评价指标矩阵由按照指标体系收集的高校所有学生的具体数值组成,令所有待评价的学生集合为:
设心理健康疾病评判的所有指标个数为m,则第j个待评价学生的所有指标下的数据为:
此时,可以用Yij表示第j个学生的第i个指标的采集数值。根据以上分析可得到最终的评价指标体系:
2)归一化评价矩阵
在对各个学生进行评价时,由于不同指标的度量单位不一致,无法进行直接评价,此时,需要引入归一化算法消除量纲的影响,方法如下:
经过归一化,式(3)中的矩阵S可转化为式(5):
3)确定各评价指标权重
在进行权重确定时,引入了信息熵。在信息学中,信息熵可以衡量一个系统的信息量与不确定性。信息熵越小,表示其越不稳定。对于第i个指标的信息熵,其计算方法如下:
其中,k为玻尔兹曼常数,计算得到e的范围为(0,1)。当ei=1 时,表示该指标下的采集值完全无序,没有参考价值。此时,将该指标的权重置为0,因此需要先引入信息熵的差异系数为:
最终的权重计算公式如下:
4)灰色关联度分析
在进行学生心理状态评价时,需要根据指标体系进行分解。该文根据两级指标体系,将评价系统分为两层,首先对分系统进行关联度分析,然后进行综合分析。对于第u个灰色分系统,第j个学生的第i个指标可表示为:
随后,根据熵值法计算各个指标的权重,得到权重矩阵:
其中,wu,m的检验标准为wu,m≥0。此时,可得到该分系统u中每个学生的评价值和期望最佳评价值的关联系数:
式(11)中,当αu,j0(i)=1 时,表示第j个学生与最佳期望的关系最紧密,即该学生的心理问题最为突出。为了将所有学生的心理健康状态进行排序,引入关联度的概念如下:
基于式(13)可得到整个评价系统的关联度矩阵为:
为了挖掘影响大学生心理健康的各项因素间更深层次的关系,引入了数据挖掘算法用于分析影响因素间的相关信息。在Apriori 算法中,相关的符号定义如表1 所示。
表1 相关符号定义
该算法的具体步骤如下:
1)扫描数据库T,统计该数据库中各个元素出现的次数,得到1-itemset 和L1;
2)利用步骤1)得到的L1,通过剪枝处理后继续迭代,直到无法计算出新的频繁项,得到k-itemset和Lk;
3)引入连接操作,则对于l1、l2两个序列有:
该文结合当前的心理健康评估标准,设计了评价指标体系,并基于SQL 数据库和J2EE 技术设计了数据采集系统。文中在进行数据采集时,基于SCL-90 心理健康测试表进行指标体系设计。症状自评量表SCL-90 是目前最常用的心理健康测试表,其包含90 道自评题目,部分测试题目如图2 所示。
图2 部分测试题目
所有的测试题目均包含5 个评级,各个评级的说明如表2 所示。
表2 评级指标说明
基于SCL-90 对该调查表内的问题进行分类,划分为9 个评判大学生心理状态的指标。具体指标及其在SCL-90 中对应的题目序号如表3 所示。
表3 SCL-90指标体系
此外,该文还采集了大学生的基本信息,具体包括性别(XB)、院系(YX)、户口(HK)、是否独生子女(DS)、是否为单亲家庭(DQ)。
结合表3,搭建了二级评价指标体系。其中第一级体系为具体的题目序号,第二级指标为具体的9项特征。随后面向某高校,基于图2 给出的系统进行心理测评数据的信息采集。
经过数据采集,共获得有效数据5 726 份。进行数据仿真实验时,使用的仿真环境和Apriori 相关参数设置如表4 所示。
表4 算法仿真环境
通过灰度关联规则,对表3 中一级指标的权重进行计算,得到各个指标的权重分布情况如图3所示。
图3 各指标的权重分布情况
由图3可看出,在所有指标中躯体化程度(QTH)对于结果的影响最大,其权重为0.194,焦虑程度(JL)、人际关系(RJGX)、精神病属性(JSBX)、偏执度(PZ)、敌对感(DD)等因素的权重均在0.10 以上。其余几个指标的权重较小,对于心理健康的判别影响均较弱。
结合灰度关联算法和Apriori 算法,可以实现对全部采集人员的心理健康状态评估。经过评估,该批次人员内共有121 人存在心理健康问题,占比2.11%,其中27 人存在较为严重的心理健康问题。结合前期该校心理专职教师建立的心理健康台账,进行算法的性能分析,结果如表5 所示。
表5 算法性能分析
从表5 的计算结果可看出,算法的F1 值达到了0.92。准确率、召回率均在91%以上,可以满足自动化、智能化的心理健康预警分析需求。
除了得到算法的计算指标外,通过灰度关联分析,还得到了较多与心理学理论一致的数据分析结论。比如心理健康问题通常会通过躯体化特征体现,躯体化特征是心理健康问题的外在表现,恐怖、偏执等症状也可在一定程度上反映心理健康状态。通过对严重心理健康问题的学生进行分析发现,这些学生中有63.3%来自单亲家庭,有21.2%来自较为贫困的农村地区。可看出,心理健康问题与大学生的成长环境有着较为紧密的关联。通过这些分析,可帮助高校的心理健康辅导老师提前确定重点对象,并实施相关的心理辅导帮助学生更优地摆脱心理问题的困扰。
该文面向大学生的心理健康评估,基于新兴的计算机、大数据技术设计了数据采集与分析平台。通过灰度关联算法计算不同心理健康评价指标的评分权重,并借助Apriori 算法挖掘出导致心理健康的一般性规律。仿真结果表明,测评结果与该校的心理健康台账一致,文中的研究成果为高校心理健康工作信息化、智能化发展提供了参考。