聚类与判别分析在大学生SCL-90测试结果中的运用

2017-10-25 06:41滕燕
中国社会医学杂志 2017年5期
关键词:亚健康均值聚类

滕燕

·社会因素与健康·

聚类与判别分析在大学生SCL-90测试结果中的运用

滕燕

目的分析探索SCL-90结果解释中判别效果较好的聚类指标。方法对某高校3 638名新生SCL-90测试结果进行K-均值聚类及逐步判别分析。结果采用K-均值聚类的方法分类,将测试结果分成3组,各组之间差异具有统计学意义。其次,通过逐步判别分析,在11个聚类指标中,选出8个有统计学意义的指标构建判别模型,用此模型对3 638个新生样本作回顾性评价,误判率为2.9%。结论逐步判别分析发现,通过SCL-90中的强迫症状、人际敏感、抑郁、敌对、恐怖、偏执、精神病性7个因子分及总均分进行聚类分析的判别效果较好。

大学生; SCL-90; 聚类分析; 判别分析

大学阶段是青年学生心理发展的关键时期,在这一时期所面临的环境改变及适应,使得大学生在原生家庭及其社会化过程中形成的一系列问题突显。为了解大学生心理健康状况和特点,有针对性地实施干预及教育,各高校通常在入校新生中开展集体心理普查,建立学生心理档案。心理健康状况是一个动态的过程,高校大学生的心理普测工作,不仅仅是为了衡量该群体的平均心理健康水平与全国大学生群体的差异,更是为了区分出重点关注人群和亚健康人群,并针对亚健康人群开展相应的宣传教育工作,使亚健康人群逐步发展成为健康人群。因此,筛查不是为了比较,而如何运用该量表的测试结果进行干预、教育及跟踪才更有意义。目前,国内广泛采用症状自评量表(SCL-90)筛查大学生心理卫生问题,本文通过判别分析探索SCL-90结果解释中判别效果较好的聚类指标,为开展大学生心理普查提供具有实效性的指标体系。

1 对象与方法

1.1 研究对象

以某高校刚入校的一年级本科学生为研究对象,进行心理健康普查。共有4 138人接受测试,回收有效问卷3 638份,其中女生2 099人,男生1 629人;有效回收率87.9%。

1.2 测量工具

运用Derogatis等在20世纪70年代编制症状自评量表(SCL-90),该量表用于评定一个人是否具有某种心理症状,临床上常用其作为精神科咨询门诊的筛查量表。但在实际使用中,该量表也有一定的限制。首先,SCL-90量表没有分界值,对大学生SCL-90测试结果的评定,大多采用单一的评价标准,仅可以筛选出考虑阳性症状者,存在假阳性率较高的问题。其次,面对SCL-90测试结果假阳性率较高的问题,部分高校通常还会同时运用其他量表权衡评价。而这样的评价大多依据施测者的经验开展,如将单一的评价标准由2分提至3分,或其中几个因子分都高于2分或3分以上者考虑筛查为阳性,但各高校都没有一个统一的标准。再次,大多数研究把SCL-90用来比较被试群体在常模中的相对位置,使SCL-90的测量性质发生了变化,变成了常模的参照测验和诊断工具[1]。

1.3 评定标准

依据SCL-90传统结果的解释方法,以总分超过160分,或阳性项目数超过43项,或任意因子分超过2分,评定筛选为阳性[2]。

1.4 研究方法

采用集体施测的方法,对大学生进行SCL-90量表测试;运用K-均值聚类的方法分类,通过判别分析SCL-90结果,解释其中判别效果较好的聚类指标;采用统计软件SPSS 17.0的K-均值聚类分析及逐步判别分析的方法对数据进行处理。

2 结果

2.1 单一指标筛查结果

本次测试结果显示,有1 528人SCL-90任意因子分大于2分,有617人总分超过160分,有1 161人阳性项目数超过43项。见表1。

表1 SCL-90量表各单一标准评价的阳性症状人数比例 n(%)

2.2 K-均值聚类结果

以3 638名大学生的SCL-90测试得分为基础,包括10个因子分及总均分(general symptomatic index,GSI)进行K-均值的聚类,将被试者分成三类。当面对大量零散数据的时候,聚类不需要事先根据每个样本对象的特征去确定隶属,而是自动依据各个样本对象的特征相似度值的大小去划分簇类[3],因而各组之间没有明确的划界值。第一类学生各因子均值大于2分或接近2分,介于1.89~2.56分之间,称为阳性症状组,共326人,占总人数的9.0%;第二类学生各因子均值在1.48~2.01分之间,称为亚健康组,共1 287人,占总人数的35.4%;第三类学生各因子均值在1.17~1.50分之间,称为健康组,共2 025人,占总人数的55.6%;通过方差分析,三组分类之间差异具有统计学意义(P<0.01),但三组之间的各因子均值分数有交叉,交叉数据主要表现在强迫症状这一因子分上,而强迫症状较其他因子分普遍较高,因而还需要通过逐步判别分析判别聚类的效果。见表2。

2.3 判别分析

2.3.1逐步判别分析结果利用聚类分析结果,将大学生SCL-90的10个因子得分及GSI共11个变量,按照阳性症状组、亚健康组、健康组分成三类,组成3 638个训练样本,应用逐步判别分析方法,进行变量的筛选、判别函数模型的构建,并对模型作回顾性评价。最终结果进入模型的变量有:强迫症状(X1)、人际敏感(X2)、忧郁(X3)、敌对(X4)、恐怖(X5)、偏执(X6)、精神病性(X7)、总均分(X8),得到3个判别函数:

Y1=-3.76X1-0.64X2-4.31X3+3.92X4+4.16X5+2.21X6-0.97X7+108.68X8-121.51(阳性症状组)

Y2=-1.67X1-2.29X2-4.51X3+2.11X4+2.07X5+1.53X6+0.14X7+65.40X8-39.84(亚健康组)

Y3=-1.80X1-1.08X2-5.60X3+2.33X4+2.11X5+2.41X6-1.05X7+85.04X8-69.10(健康组)

指标阳性症状组[n=326(9%)]亚健康组[n=1287(35%)]健康组[n=2025(56%)]F值P值躯体化189±041148±027117±017159449<001强迫症状256±041201±029150±027248444<001人际敏感249±042185±029133±023325601<001抑郁221±041160±025120±017312309<001焦虑230±038173±025128±020324385<001敌对202±048152±032117±019160017<001恐怖214±051163±030119±022160831<001偏执209±045164±030123±021189905<001精神病性212±040162±025126±019224139<001其他213±046163±031124±022174895<001总均分221±025167±013126±013750253<001

注:P值为双侧检测

2.3.2回顾性判别效果评价将3 638名训练样本做回代判别函数的检验,阳性症状组共有326人,用判别函数回代分类,与实际相符的285人,错分到亚健康组41人,阳性症状组分类的准确率为87.4%;健康组共有2 025人,用判别函数回代分类,与实际相符的2 019人,错分到亚健康组6人,健康组分类的准确率为99.7%;亚健康组共有1 287人,用判别函数回代分类,与实际相符的1 228人,错分到健康组57人,阳性症状组2人,亚健康组分类的准确率为95.4%。误判率为2.9%(106/3 638)。见表3。

表3 SCL-90聚类分析的判别回代统计表

注:样本划分正确率为97.1%

3 讨论

3.1 单一筛查标准的阳性症状检出率较高

采用“任意因子分超过2分”的标准,筛查为阳性症状者占被试人数的42.0%,由于要排除的人群范围过大,在一定程度上也降低了心理健康教育工作的实效性。其次,SCL-90量表的每一个因子反映被试某一方面症状的痛苦情况,且通常是评定一周以来的心理健康状况。对于刚入校的大学生而言,面临新环境的适应,采用单一因子的评价标准,更易造成对被试群体的误判,这也是阳性症状人数过高引起争议的主要原因之一。

3.2 运用K-均值聚类缩小了目标人群的筛查范围

国内版SCL-90量表包括90个项目,主要有三个总体指标:第一,总症状指数分(GSI);第二,阳性症状指标(positive symptom distress index,PSDI);第三,阳性症状(derogatis,1983)。其中,GSI是当前症状水平最好的单一指标[4]。尽管GSI是当前症状水平的最好指标,但它仍是单一的评价指标。其次,单茂洪[5]认为,SCL-90对有心理症状的人有良好的区分能力,能较好地区分他们的心理健康水平。但它对没有或有较少心理症状者的心理健康水平缺少区分能力。因此,对SCL-90的结果分析不能仅用单一的评价指标,并且除单个的因子分外,还应引入GSI,即总均分这一指标进行评价。

比较表1及表2,运用聚类分析的方法,所得的数据分布合理,且三组之间的差异具有统计学意义。运用聚类分析可以方便地对数据进行分析,从而达到理想的目的;同时也可作为特征和分类等算法的预处理步骤[6];识别观测量中相类似的分组[7]。因此,通过聚类分析可以提高SCL-90量表对亚健康人群的区分能力,缩小筛查范围,并有针对性地开展宣传教育工作。

3.3 躯体化、其他及焦虑3个因子分在进行K-均值聚类时应予以排除

判别分析是根据观测到的某些指标对所研究的对象进行分类的一种分析方法,其中“逐步判别分析”可以在众多指标中挑选一些有显著作用的指标来建立一个判别函数,使方程内的指标都有显著的判别作用。而判别效果一般用误判率来衡量,并要求判别函数的误判率小于10%或20%才有应用价值[8]。本文应用逐步判别分析,对10个因子分及总均分进行变量筛选,结果进入模型的变量有:强迫症状、人际敏感、忧郁、敌对、恐怖、偏执、精神病性、总均分。进一步对3 638个样本作回顾性的判别效果评价,误判率为2.9%,说明判别分析可信。其次,运用SCL-90中的强迫症状、人际敏感、忧郁、敌对、恐怖、偏执、精神病性、总均分,通过判别函数的计算即可区分出某个体是否属于阳性症状组或亚健康,或是健康组。在逐步判别分析阶段,躯体化、其他及焦虑3个因素因判别效果不显著被排除,仅用强迫症状、人际敏感、忧郁、敌对、恐怖、偏执、精神病性、总均分8个因素进行聚类,在一定程度上提升了聚类的效果,减少了不同组别之间的数据交叉[9-10]。然而,判别函数是根据样本信息得到的,故可能夸大了判别效果[11]。因此,在今后的研究及运用中,还应通过考核样本作前瞻性判别效果的评价,以说明本研究构建的判别模型的判别效果。

[1] 高旭,毛志雄,周忠革.临床症状自评量表在心理健康评定中的误区[J].中国心理卫生杂志,2006,20(10):684-686.

[2] 雨帆.心理测试[M].北京:文汇出版社,2008.

[3] 孙卓.K-均值聚类算法及其应用[J].农业网络信息,2013(7),41-44.

[4] 谢华,戴海崎.SCL-90量表评价[J].神经疾病与精神卫生,2006,6(2):156-157.

[5] 边俊士,井西学,庄娜.症状自评量表(SCL-90)在心理健康研究中应用的争议[J].中国健康心理学杂志,2008,16(2):231-233.

[6] 单茂洪.正确使用SCL-90、16 PF量表测查心理健康水平[J].中国心理卫生杂志,1998,12(2):81-82.

[7] 彭学君.聚类分析在数据挖掘中的应用探究[J].科教文汇,2007(9Z):216-216.

[8] 孙振球.医学统计学[M].北京:人民卫生出版社,2002.

[9] 贺颖,曾晶,袁权龙.大一新生SCL-90自评症状量表评定结果分析[J].教育文化论坛,2015(6):65-71.

[10] 赵晓燕.某后勤部队162名战士SCL-90自评结果分析[J].医药前沿,2014(8):137.

[11] 赵晓军.基于SCL-90量表的大学生心理健康状况调查研究[J].佳木斯职业学院学报,2016(4):225.

TheApplicationofClusterAnalysisandDiscriminantAnalysisintheResultsofCollegeStudentsSCL-90Test

TENG Yan.

YunnanUniversityMentalHealthCounselingCenter,Kunming,650091,China

ObjectivesThrough cluster analysis of freshmen's cores from SCL-90,seeking some effective target variables in the data from cluster analysis.MethodsTo evaluate the psychology health of 3 638 freshmen by Cluster analysis and stepwise discriminant analysis.Results3 638 freshmen were divided into 3 groups by cluster analysis.In addition,a function on predicting was established by stepwise discriminant analysis,which included 8 target variables out of 11,which were from the scores of SCL-90.3 638 freshmen were evaluated retrospectively by the function with the error rate of 2.9%.ConclusionsTo evaluate the scores of SCL-90,compulsion,interpersonal sensitivity,depression,hostility,terror,paranoid,psychoticism factor and GSI of SCL-90 has larger discriminant significance to cluster analysis of SCL-90.

College students; SCL-90; Cluster analysis; Discriminant analysis

R395.6

A

10.3969/j.issn.1673-5625.2017.05.013

2016-11-03)(本文编辑 乔岩)

云南大学心理健康咨询服务中心,云南 昆明,650091

猜你喜欢
亚健康均值聚类
基于K-means聚类的车-地无线通信场强研究
均值—方差分析及CAPM模型的运用
均值—方差分析及CAPM模型的运用
党员“亚健康”,咋办?——咸阳探索“党性体检”
甩掉亚健康 我们在行动
跟踪导练(一)
浅谈均值不等式的应用
均值不等式的小应用
基于高斯混合聚类的阵列干涉SAR三维成像
亚健康科技工作者