基于数据降维和SVM的大学生心理健康状态评价

2021-06-04 03:09李馥利金敏王雨佳
微型电脑应用 2021年5期
关键词:准确率心理健康状态

李馥利, 金敏, 王雨佳

(1.商洛学院 化学工程与现代材料学院, 陕西 商洛 726000;2.商洛学院 健康管理学院, 陕西 商洛 726000;3.中航工业西安航空计算技术研究所, 陕西 西安 710062)

0 引言

随着社会竞争的日益加剧,大学生面临就业、生活、学习、情感等方面的多重压力,导致大学生心理健康问题频发,直接影响校园生活和学习环境的稳定,因此对大学生心理健康进行状态评价具有重要的现实意义和理论价值[1]。目前,大学生心理健康状态评价的方法主要是基于传统的机器学习算法所提出的,比如决策树(Decision tree,DT)、前馈神经网络 (back propagation network,BPNN)等[2-3],这些算法存在计算量大并且准确率不高的缺点。

据中国常规模式评价指南和症状自评量表SCL-90所采集的大学生心理健康状态数据属于高维数据集,因此进行大学生心理健康评价时存在计算量巨大和数据特征之间存在冗余关联性的缺点。随着流行学习算法的广泛研究,该方法作为数据特征提取和降维已被广泛地应用于图像检索、文本分类、人脸识别以及植物叶片识别等领域[4-8]。为提高大学生心理健康状态评价的准确率,提出一种基于局部线性嵌入算法(locally linear embedding,LLE)和支持向量机(support vector machine,SVM)的大学生心理健康评价方法。与SVM、BPNN和DT相比较,LLE-SVM能够有效提高大学生心理健康状态评价准确率。

1 大学生心理健康状态评价

1.1 特征属性

根据中国常规模式评价指南和症状自评量表SCL-90[9-10],选择精神病性、偏执、敌对、恐怖、焦虑、抑郁、强迫症状、人际关系敏感和躯体化等9个维度的指标作为大学生心理健康状态评价的特征属性,将大学生心理健康状态分为健康、轻度不健康和不健康等3种状态。

1.2 评价模型

大学生心理健康状态评价本质上属于非线性分类问题。由于大学生心理健康状态评价的每个个体的心理状态数据特征属于多维度的特征数据,这些特征数据涉及很多非线性因素,具有多层次、多变量、非线性和强耦合等特征,因此很难用传统的数学模型或者方法进行定量描述。为提高大学生心理健康状态评价的准确率,非常有必要建立更加科学合理的大学生心理健康状态评价模型。本研究将精神病性、偏执、敌对、恐怖、焦虑、抑郁、强迫症状、人际关系敏感和躯体化等9个维度的数据作为LLE-SVM模型的输入向量,大学生心理健康状态分为健康、轻度不健康和不健康作为LLE-SVM模型的输出向量,建立基于LLE-SVM的大学生心理健康状态评价模型,评价模型如图1所示。

图1 心理健康状态评价模型

2 大学生心理健康状态评价流程

本研究将精神病性、偏执、敌对、恐怖、焦虑、抑郁、强迫症状、人际关系敏感和躯体化等9个维度的数据作为LLE-SVM模型的输入向量,大学生心理健康状态分为健康、轻度不健康和不健康作为LLE-SVM模型的输出向量,建立基于LLE-SVM的大学生心理健康状态评价模型。基于LLE和SVM的大学生心理健康状态评价算法流程可详细描述如下:

Step1:采集大学生心理健康特征数据:发放症状自评量表SCL-90,采集大学生心理健康特征数据,特征数据包括精神病性、偏执、敌对、恐怖、焦虑、抑郁、强迫症状、人际关系敏感和躯体化等9个维度的数据;

Step2:为了减少计算量,运用LLE算法对大学生心理健康特征数据进行降维处理;

Step3:将降维处理后的大学生心理健康特征数据划分为训练样本和测试样本,运用训练样本数据建立LLE-SVM的大学生心理健康状态评价模型,其中降维处理后的大学生心理健康特征数据作为SVM的输入,大学生心理健康状态作为SVM的输出;

Step4:运用测试样本数据验证LLE-SVM的大学生心理健康状态评价模型的效果。

3 试验与结果分析

3.1 数据来源

为了验证LLE-SVM的大学生心理健康状态评价的有效性,选择陕西某学校2019年入校大学生的大学生心理健康症状自评测量表SCL-90数据为研究对象,每个大学生的心理健康特征数据为精神病性、偏执、敌对、恐怖、焦虑、抑郁、强迫症状、人际关系敏感和躯体化等9个维度指标组成的一维列向量。大学生心理健康状态分为不健康、轻度不健康和健康等3种状态,3种样本数据分布,如表1所示。

表1 训练与测试样本数据分布

3.2 评价指标

将准确率AR作为大学生心理健康状态评价效果的评价指标,其定义如下:若大学生心理健康被正确识别的样本数量为A,样本总数量为B,则大学生心理健康状态评价结果的准确率AR可定义为:

3.3 结果分析

由于LLE算法涉及两个参数:嵌入维数d和近邻参数K。这两个参数的大小直接影响大学生心理健康状态评价的效果。因为大学生心理健康特征数据为9个维度指标组成的一维列向量,因此d的取值范围设定为[2,8],K的取值范围为[3,8]。SVM的参数设定为:惩罚参数C=10,径向基核函数参数γ=0.5,不同K与d取值时的大学生心理健康状态评价的准确率,如表2所示。

表2 不同K和d取值的准确率(%)

由表2可知,当K=6与d=5时,大学生心理健康状态评价的准确率最高,准确率为96.5%。

为了验证LLE-SVM的大学生心理健康状态评价的有效性,将LLE-SVM与SVM、前馈神经网络(back propagation neural network,BPNN)和决策树(decision tree,DT)进行对比,为避免算法随机性带来的不稳定性,每个算法独立运行10次,取10次运行结果的平均值作为最终的大学生心理健康评价的准确率,具体如表3和图2—图5所示。

表3 大学生心理健康状态评价结果

图2 LLE-SVM评价结果

图3 SVM评价结果

图4 DT评价结果

图5 BPNN评价结果

图2—图5中,“○”为大学生心理健康状态的实际类别,“*”为大学生心理健康状态评价结果;1、2、3分别为大学生心理健康为不健康、轻度不健康和健康。当“*”和“○”重合时,表示大学生心理健康评价结果正确;当“*”和“○”不重合时,表示大学生心理健康评价结果错误。由表3不同算法的大学生心理健康状态评价结果可知,与SVM、BPNN和DT相比较,LLE-SVM的大学生心理健康状态评价的准确率为96.5%,较SVM、BPNN和DT分别提高了4.2%、8.0%和6.8%,从而说明LLE-SVM进行大学生心理健康状态评价具有更高的准确率,从而为大学生心理健康评价提供新的方法。

4 总结

本文提出一种基于LLE和SVM的大学生心理健康状态评价方法,与SVM、BPNN和DT相比较,LLE-SVM可以有效提高大学生心理健康状态评价的准确率。然而LLE算法的参数选择会影响数据降维效果,文中通过试验对比选出LLE最佳参数,存在工作量大、参数无法自适应性的缺点,后续将运用群智能搜索算法自适应选择LLE最佳参数,实现LLE算法的参数自适应选择。

猜你喜欢
准确率心理健康状态
心理健康
心理健康
心理健康
心理健康
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
2015—2017 年宁夏各天气预报参考产品质量检验分析
状态联想
高速公路车牌识别标识站准确率验证法
生命的另一种状态