武颖,申跃其,宋颂
(山西医科大学 人文社会科学学院,山西 太原 030001)
近年来, 大学生的心理健康状况引起了广泛关注, 社会经济的快速发展和竞争压力的增大等因素导致大学生心理问题明显增多[1]。 本科护生作为大学生群体的组成部分, 除了面对大学生普遍的压力外,还额外承受着未来护理职业带来的特殊压力:高风险、高责任、社会认同感低和作息不规律等[2-3],导致其心理健康状况更加不容乐观。 印度的1 项针对某护理学院学生的调查显示,63.9%的护生表现为轻度抑郁,一年级新生的情况更为显著[4]。 澳大利亚某护理学院的本科护生普遍对职业前景感到焦虑[5]。在中国台湾、中国香港地区,护生也有着较高的抑郁发生率[6-7]。只有深入了解护生异常心理的特点,才能为提高护生心理健康提供科学的干预策略, 进而促进其素质的全面提高,为医院培养优秀护理人员。
我国很多高校在新生入学时都要进行症状自评量表(Symptom Checklist 90,SCL-90)测试,初步了解学生可能存在的心理症状水平。 SCL-90 包含10个因子分别为躯体化、强迫症状、人际关系敏感、抑郁、焦虑、敌对、恐怖、偏执、精神病性及其他项目(睡眠、饮食等),除第10 个因子外,其余9 个因子反映了受试者的9 方面的心理症状。 由于该量表简便易懂,测查角度全面,所以常用作高校新生心理筛查的初级筛查工具。
传统的量表统计和分析方法只能获得心理数据的表层信息, 对数据的利用率和研究深度都有待加强。 数据挖掘是指对海量的数据信息进行有目的性的提取、分拣、归类,从而挖掘出隐含的有用信息,为各行各业的生存和发展提供决策支持。迄今为止,多种数据挖掘技术已经应用于学生心理问题的研究中。 有研究者讨论并分析了决策树算法在解决高职学生心理问题应用中的可行性[8-9];还有的研究者构建了贝叶斯网络预测模型, 分析预测学生属性与心理测试数据之间的潜在联系, 结果显示模型有较好的预测能力[10];另外,有的研究讨论了聚类分析技术在预防心理危机中的作用[11]。 利用数据挖掘算法对护生群体的心理测试数据进行综合分析, 不仅可以更全面、更深入了解他们的心理状态,还可以为心理健康工作提供更科学、更有效的决策支持。
本研究的数据来自某医科大学2021 级护理本科生心理普查问卷——90 项症状量表(SCL-90),共发出问卷698 份,收回问卷690 份,回收率为98.9%。按照全国常模结果,总分超过160 分,或阳性项目数超过43 项,或任一因子分>2 分,考虑筛选阳性[12]。根据测评标准筛选出结果异常的问卷230 份, 因子异常发生率从高到低排列为:强迫、人际关系敏感、抑郁、焦虑、精神病性、偏执、恐怖、敌对和躯体化。73份问卷为单一因子异常, 其余157 份问卷为多因子异常,占比68.3%。
2.1 对SCL-90 结果重新分级 该量表每个条目均采用5 级评分制,评分越高则自觉症状越严重。因子分等于组成某一因子的各项总分与项目数的商。当个体在某一因子的得分>2 时,则个体存在该方面的异常心理症状。 为了便于分析, 根据各因子的得分,本研究将每个因子分为3 个等级,即因子分<2为正常;因子分≥2~≤3 为轻;因子分>3 为重。 3 个等级“正常、轻和重”用“1,2 和3”表示。 这样,9 个因子离散化后可以得到27 种具体的心理症状因子,9种为正常,18 种为异常。 然后,230 份异常的问卷中异常的心理症状数据以矩阵形式保存起来, 作为关联分析和聚类分析的研究对象,矩阵中的“1”和“0”表示某心理症状的存在与否,“1”表示存在,“0”表示不存在,见表1。 全部问卷的因子等级数据另加一个决策变量以事务表形式保存为TXT 文件,作为决策树分析的数据集,见表2。
表1 异常心理症状因子的部分矩阵
表2 决策树分析的部分数据集
2.2 关联分析 关联分析是揭示数据内在结构特征的重要手段。关联分析的目的就是基于已有数据,找到事物间的简单关联关系或序列关联关系。 关联规则挖掘是数据挖掘中一个最活跃、最重要的技术,它发现一组对象同时发生或一个对象与另一个对象之间隐藏的相互关系规则, 完成已知事物对未知事物的推测[13]。 挖掘过程主要包含2 个阶段:第1 阶段必须先从数据集中找出所有的高频项集, 第2 阶段再由这些高频项集中产生一定的关联规则。 Apriori算法是关联规则的经典算法, 也是所有关联挖掘算法的核心。 该算法涉及到3 个重要参数:支持度、置信度和提升度。 支持度测量了关联规则应用的普适性,支持度越高,说明该规则采用的越普遍;置信度反映了关联规则的准确性,置信度越高,说明在规则前项存在的条件下,后项出现的机会越大;提升度体现了关联规则的实用性,只有提升度大于1 的规则才有实用价值。 本研究采用Apriori 算法对评测异常护生的18 种异常心理症状进行关联分析,通过R语言的“arules”程序包来实现。 将表1 作为事务表导入程序,设置最小支持度为0.2,最小置信度为0.8。
2.3 系统聚类分析 聚类分析是实现对数据全方位自动分组的一类数据挖掘方法。若将全部数据看成一个大类,这个大类很可能是由若干个包含一定数量的小类组成的。聚类分析的目的就是找到这些隐藏于数据中的客观存在的小类,并通过刻画小类体现数据的内在结构。 系统聚类也称层次聚类,从距离和联通性角度设计算法。空间中距离较近的多个观测点为一个类, 得到的聚类结果一般为确定性的且具有层次关系。 系统聚类过程是将各观测点逐步合并成小类,小类合并成中类乃至大类。联通性测度适用于小类之间距离的测度,离差平方和法是一种常用的联通性测度方法。 本研究的系统聚类分析通过R 语言的“hclust”程序包实现,分析对象为异常心理症状矩阵(表1),测度方法设置为“ward”,即离差平方和法。
2.4 决策树分析 决策树算法是数据预测建模中非常经典的算法,包括分类和回归预测方法,具有很好的预测效果,其结果模型也具有很好的解释功能。决策树是由根节点、 中间节点和叶节点组成的树形数据结构。一个节点可以确定一个实例所属的类别,而节点的作用则是通过比较属性值决定测试用例该如何选择下一个节点。 目前来说常用的决策树算法有ID3、C4.5 和分类回归树(CART)等。 其中,CART算法采用与传统统计学完全不同的方式构建预测准则,生成的模型是结构简洁的二叉树,易于理解、使用和解释,预测结果常比统计方法构建的预测准则更加准确[14]。 影响CART 模型的异质性测度指标主要为Gini 系数和信息增益。决策树剪枝则是通过制定一些控制参数在决策树生长时进行预修剪和后修剪。
本研究采用CART 算法来构建数据预测模型。从预处理后得到的护生心理等级数据集(表2)中随机抽取2/3, 即460 条记录作为训练集进行预测模型的构建。 另外1/3,即230 条记录作为测试集进行预测模型的测试。决策树预测模型通过R 语言的“rpart”程序包实现, 将数据集中各心理症状因子设置为输入变量,输出变量为决策结果(0 为正常,1 为异常),异质性指标采用Gini 系数,未设置特定参数进行剪枝。
决策树评估方法选用了混淆矩阵法。 首先通过R 语言 “predict” 函数完成测试集对预测模型的测试,然后通过“table”函数将测试结果以混淆矩阵形式输出进行评估。
3.1 关联分析结果 经过运算,得到3 条提升度>1的关联规则(图1)。 图中,圆圈越大代表支持度越大,颜色越深代表提升度越大。 其中,支持度最大的关联规则是{人际关系敏感2,焦虑2}=>{强迫2},支持度为0.213;提升度最大的是{人际关系敏感2,精神病性2} =>{偏执2},提升度为2.33。
图1 异常心理症状的关联规则
3.2 系统聚类结果 聚类过程把18 种异常心理症状按照距离从近到远不断从小类聚集成更大的类,类内的相似性逐渐降低(图2)。 以距离20 为界线将异常心理症状分为2 类。第1 类:包含全部9 种等级为重的异常心理症状。第2 类:包含全部9 种等级为轻的异常心理症状。
图2 异常心理症状的聚类树形图
3.3 决策树结果 最终决策树从上到下生长,包括了1 个根节点,1 个中间节点,3 个叶节点(图3)。 每个圆角矩形代表一个节点,节点中包括3 行数字,第1 行的数字代表了输出的预测结果 (0 表示正常,1表示异常),第2 行的数字从左到右分别代表了预测为0 和1 的概率, 第3 行数字代表了该节点占总人数的百分比。决策树只包含了2 个因子,强迫和人际关系敏感。3 个叶节点对应3 条推理规则:强迫等级为2 或3,35%的护生预测为心理状态异常; 强迫等级为1 且人际关系敏感等级为2 或3,2%的护生预测为心理状态异常; 强迫等级为1 且人际关系敏感等级为1,63%的护生预测为心理状态正常。
图3 异常心理症状的决策树
表3 为用于模型评估的混淆矩阵, 矩阵的行代表实际值,列代表预测值。 可以看到,测试集230 条记录中,210 条是正确分类的,20 条是错误分类的,预测准确率91.3%。
表3 决策树测试集的混淆矩阵
4.1 本科护生异常心理症状间关系分析 护生学习压力、生活规律的改变和未来的职业困惑更易于引发心理问题,从而产生异常心理症状。 很多研究者采用SCL-90 对护生的心理健康状况进行测量。结果显示,护生与其他专业学生相比,心理症状水平较低,抑郁、恐怖和强迫等症状检出率较高[15];还有研究显示:护生同时患有多个异常的心理症状, 前4 位分别为强迫、抑郁、焦虑和敌对[16]。 某地区在校护生SCL-90 问卷结果中,强迫、抑郁、焦虑、恐怖和精神病性各因子分均显著高于国内常模[17]。 因此,影响护生的心理健康的异常心理症状复杂多样,很难用单一因素解释。
本研究评测结果显示,在筛选阳性的护生中,半数以上存在多因子异常, 多个异常心理症状间存在共现关系。 只有着力于挖掘异常心理症状之间内在的联系,才能更好地把握护生心理异常的特点,发现异常心理症状产生的规律。
在护生异常心理症状的关联分析中,支持度最大的关联规则提示:出现了人际关系敏感轻症和焦虑轻症很可能同时并发强迫轻症;提升度最大的关联规则提示出现了人际关系敏感轻症和精神病性轻症则再出现偏执轻症是最具有实际意义的。 因此,人际关系敏感、焦虑和强迫;人际关系敏感、精神病性和偏执这2 组因子的轻症之间的关联关系需要重点关注。
从系统聚类的结果看, 症状的重和轻之间分界明显。所有重症分成一类,提示存在某一症状等级为重的护生,合并其他症状等级很可能也是重,应尽早开展全面的心理干预;所有轻症分成一类,提示存在轻症的护生, 若有其他合并症状, 等级很可能也是轻,心理异常不会很严重。另外,我们可以观察到,强迫重症与人际关系敏感重症优先聚类, 而强迫轻症和人际关系敏感轻症同样优先聚类, 说明强迫症状和人际关系敏感症状之间存在更为密切的关系。
4.2 本科护生心理症状预测模型分析 本研究采用了决策树算法建立了护生心理症状的预测模型。经过混淆矩阵评估,该模型预测准确率为91.3%,可信程度较高。 模型中只包含了强迫和人际关系敏感2 个因子,而且从决策顺序来看,强迫比人际关系敏感更为重要。3 条推理规则提示,强迫和人际关系敏感这2 个因子中,只要有一个因子异常,无论等级是轻还是重,均会导致心理健康测试判定为异常;只有强迫和人际关系敏感都正常, 才能判定心理健康测试正常。 这个结果突出了强迫和人际关系敏感这2个因子的重要性。也就是说,强迫和人际关系敏感这2 个因子对护生的心理症状影响最大, 应当被优先关注,在之后的心理干预中也应向这两方面侧重。
护生强迫症状的形成可能与其课程多, 学业压力大, 而且由于专业的特殊性造成的学习和工作制度更为严格有关。同时,社会对护生的固有认识也是严谨,细致,不能出错,这无形之中增强了护生的责任压力, 使得护生们更加容易反复关注一些细枝末节的问题。这些因素可能导致其出现强迫症状,使得心理症状问题日益加重[18]。
心理学专家认为,大学生的心理行为问题大多与人际关系失调有关,改善大学生的人际关系有助于提高心理健康水平[19]。 护生的人际关系敏感症状可能源于其性格,或者与护理专业的社会地位较低有关[20],进入大学后,护生感到无所适从,或专业不理想而陷入迷茫,导致心理失调及与人交往方面的困扰。 实习期间,护生还要学会处理自己与带教老师间的关系、同学间的关系以及复杂的医患关系,都会引起人际关系压力[21]。 这些因素可能导致护生患有人际关系敏感症状,进而影响了自身的心理症状水平。
4.3 本科护生心理健康工作对策分析 综合3 种算法的结果, 本研究发现护生几种异常心理症状的轻症之间存在密切的关系。同时,如果护生存在多种异常心理症状,则其等级往往相同。这就要求护理院校应该广泛、及时的开展心理健康教育工作。 如:设置符合护理专业特点的课程,明确学习任务,提高护生的学习兴趣和职业自信;开设相关心理学课程,举办心理健康活动并定期进行心理辅导, 全面提升护生的心理素质;建立护生的心理健康档案,对其心理健康状况进行动态管理,发现异常及时干预,防止心理症状由轻转重。
另外, 强迫和人际关系敏感是导致护生心理异常的核心因子,强迫更为重要。这2 个因子很大程度上决定了某个学生心理健康的与否, 而且他们之间存在密切的关系。 因此,在心理健康工作中,应该优先考虑这2 个因子。 如可有针对性的开展心理素质课程,将课堂授课与户外心理素质拓展结合起来,通过丰富多彩的活动和团队成员之间的交流与合作来改善护生犹豫不决,思维混乱等强迫症状[22]。 以积极心理学为基础开展团体辅导的心理干预课程, 可以帮助护生认识到积极主动与人交往的重要性, 并在活动中引导成员探讨人际交往的小技巧,不仅能改善人际关系,还有助于减轻负性情绪,促进身心健康。
本研究应用数据挖掘技术, 挖掘了本科护生的心理测试数据,分析了各异常心理症状之间的关系,找出了影响心理健康测试结果的核心因子。研究结果对护生的心理健康工作有重要的参考价值,并为制定针对性的心理干预措施提供了重要的理论依据。
本研究数据来源单一, 只选择了1 所大学护生的心理测试数据, 结论的外推性受到一定局限。 同时,未进行纵向对比,仅选取同一年护生的数据进行了横断面研究。下一步研究将扩大数据来源,在不同地区和不同等级院校的护生中抽取数据。另外,考虑开展纵向调查, 对护生心理健康水平随年级的变化趋势加以分析。