刘志喜,石倩萍,杨洪霞,张建军,张庆英
(1.汕头大学医学院公共卫生与预防医学教研室,广东 汕头 515041;2.汕头大学医学院第一附属医院肝胆二区,广东 汕头 515041)
睡眠障碍是指睡眠的量或质的异常,或在睡眠时发生某些临床症状[1]。普通人睡眠障碍的发生率约为27%[2]。睡眠质量差与紧张、易怒、抑郁、困惑和生活满意度低相关。国内研究发现护理人群睡眠质量问题较为突出,其睡眠障碍发生率为25.5%~70.8%[2-4]。睡眠障碍不仅影响护理人员的身心健康,工作效率,甚至可能威胁患者安全。因此,对护理人员群体开展睡眠质量的有效测评与研究具有重要意义。匹兹堡睡眠质量指数(Pittsburgh sleep quality index,PSQI)广泛应用于各类人群的睡眠质量调查[5-6]。中文版PSQI的信度和效度已经得到初步验证[7]。虽然国内采用PSQI量表调查护理人员睡眠状况的研究较多,但在该人群中使用此量表的信度和效度证据却十分缺乏。本研究采用电子化的中文版PSQI调查汕头市某三甲医院的护理人员的睡眠质量,分析该量表在护理人群中应用的信度和效度,为进一步以电子式PSQI的方式开展护理人员睡眠质量的调查提供依据。
2019 年8 月采用方便抽样的方法抽取汕头市某三甲医院720 名护理人员。纳入标准:(1)持有护士执业证书1 年以上且在有效期内;(2)自愿参与本研究;(3)在岗护理人员。考虑到工作量与正式职工的差异,排除实习、进修、轮转护理人员。1 个月后随机抽取20 名调查对象进行重测,以评价量表的重测信度。
本研究采用电子化问卷开展调查。调查内容包括性别、年龄、职称等个人基本信息和中文版PSQI 量表。该量表包含19 个自评条目和5 个他评条目,其中参与计分的18个自评条目构成了入睡时间、睡眠时长、睡眠效率、睡眠障碍、主观睡眠质量、催眠药物及日间功能7 个维度,评定期限为最近1个月。每个维度计0~3分,累计各维度得分即为 PSQI 总分(0~21 分),PSQI 总分越高表示睡眠质量越差。
利用SPSS 22.0 和AMOS 22.0 进行统计分析。信度评价方法:使用Cronbach’s α系数、各维度得分与PSQI总分的相关系数来评价量表的内部一致性,依据奇偶分半法将量表条目分半并经Spearman-Brown 公式进行校正计算出分半信度系数;以Pearson相关系数作为量表的重测信度,并以配对t检验检验前后2 次测量结果的得分差异。效度评价方法:使用验证性因子分析评价结构效度,并比较不同结构模型的拟合效果;以主观睡眠质量作为分组效标,绘制PSQI总分的受试者工作特征曲线(receiver operating characteristics,ROC),计算曲线下面积并比较不同分界点的灵敏度与特异度,以约登指数为该量表区分睡眠质量好坏能力的评价指标。
本研究初次抽取720 名调查对象,全部为女性,年龄范围为20~39 岁;平均年龄为(27.5±4.3)岁;其中护士、护师、主管护师分别为243、333、144 人。PSQI 总分平均为(6.68±3.06)分。后随机抽取20名调查对象进行重测,其年龄范围为25~34 岁,平均年龄为(29.1±3.5)岁,其中护士、护师、主管护师分别为8、10、2人。
2.2.1 内部一致性量表的18个计分条目中有16个条目单独计分(去除上床睡觉时间和起床时间2个条目),16 个条目的总体 Cronbach’s α系数为0.87,表明PSQI 量表整体的内部一致性程度较好。“睡眠障碍”“入睡时间”“日间功能”3 个维度的 Cronbach’s α系数在 0.60~0.84 之间,表明PSQI 量表各维度内的一致性程度也较好。调整各维度后Cronbach’s α系数在0.61~0.71 之间;各维度得分与PSQI 总分的相关系数在0.42~0.72 之间,平均相关系数为0.59,皆大于0.40,见表1。采用奇偶分半的方法将16 个条目分为两部分分别计分;经Spearson-Brown 公式校正后量表分半信度系数为0.87,表明量表的分半信度较好。
表1 PSQI量表内部一致性信度评价
2.2.2 重测信度两次测量的PSQI总分的Pearson相关系数为0.53,各维度的相关系数在0.16~0.85之间;其中“入睡时间”相关性最高,“睡眠效率”相关性较低。配对t检验结果发现,PSQI总分前后差异有统计学意义(P<0.05),但其7 个维度得分前后差异没有统计学意义(P>0.05),见表2。总体来看,量表的跨时间稳定性和一致性尚可接受。
2.3.1 结构效度基于量表理论构想国内外已有研究[6],本研究建立了单因子、二因子和三因子共6 个结构方程模型。二因子模型中“睡眠时间”“睡眠效率”2 个维度由“睡眠时效”公因子决定,其余维度由“睡眠质量”公因子决定;三因子模型见图1。6个结构方程模型的通径系数检验有统计学意义(P<0.001)。通过拟合优度指数(goodness of fit index,GFI)、调整拟合优度指数(adjusted goodness of fit index,AGFI)、均方根残差(root of the mean square residual,RMR)、近似误差均方根(root-mean-square error of approximation,RMSEA)等指标发现:相较于单因子结构方程模型,二因子和三因子结构方程模型的拟合效果较好。调整后的三因子模型的GFI 和RESEA 改变不明显,但χ2/df下降至7.96,且赤池信息准则(Akaike information criterion,AIC)也有所降低,表明经调整后,三因子模型拟合效果和精简度得到进一步改善,见表3。由上可以看出,测量数据与理论构想的结构具有一致性。
表2 PSQI量表总分及各维度重测信度评价
图1 PSQI量表三因子模型
表3 PSQI不同结果模型的验证性因子分析
2.3.2 组合信度和区分效度根据调整后三因子模型,计算模型的中各因子的组合信度和区分效度[8-9]。睡眠质量、睡眠时效和睡眠异常的组合信度分别为0.68、0.57 和0.64,仅睡眠时效稍低于0.60,说明各因子能够反映大部分原维度信息。三因子的平均方差抽取量依次为0.42、0.40 和0.51。睡眠质量和睡眠时效、睡眠时效和睡眠异常、睡眠异常和睡眠质量间的相关系数分别为0.11、0.09、0.02,远低于平均方差抽取量的算术平方根,说明三因子模型的各维度区分度较好。
2.3.3 ROC曲线评估以调查对象主观睡眠质量的好、差作为分组变量,PSQI 总分及各成分得分的组间差异具有统计学意义,绘制的PSQI总分的ROC 曲 线 下 面 积 为 0.90 (95%CI:0.88~0.92,P<0.001),分界点为6.5 时,约登指数最高,灵敏度与特异度分别为0.87和0.77。见图2和表4。
本研究720 名护理人员的PSQI 总分高于刘贤臣等[7]报道的一般人群睡眠质量的研究结果,与刘蕴等[3-4]研究结果一致。PSQI量表的信度分析结果表明其内部一致性较好,同时重测信度分析表明其跨时间稳定性和一致性尚可接受。PSQI 量表的结构效度分析发现,三因子和二因子模型均比单因子模型的拟合效果较好,且调整后三因子模型的区分效度和聚合效度也较好。表明此次PSQI测量结果及三因子和二因子的理论构想是合理的,与Khosravifar等[11-13]研究结果一致。
本研究护理人群PSQI 量表总体Cronbach’s α系数为0.87,信度系数较高,与Buysse 等[6,8]的研究相似,提示在不同人群中PSQI可能皆具有较高的信度。研究发现在对“入睡时间”进行调整后,Cronbach’s α系数上升到0.71,与Khosravifar等[11]研究结果相似,可能是睡眠时间不易量化及调查对象的粗略回答降低了信度,提示调整此题的问询方式可能会增加量表的信度。本研究PSQI量表的重测信度为0.53,与刘贤臣等[7]研究结果相比较低,但有研究表明医学类量表信度>0.50,已具有较好的重测信度[8-9]。重测信度不高也可能与重测样本量较少有关,具体原因还有待进一步研究。研究发现重测前后PSQI的总分之间存在差异,但PSQI量表7 个维度前后两次测量差异并没有统计学差异,表明调查对象的睡眠行为和睡眠质量会随着时间发生潜在的改变。“睡眠效率”维度两次测量数据的相关系数不高。“睡眠效率”是由3个参数计算出来的,这3 个时间参数随时间发生改变,易使相关系数不高;Tsai等[8]也有相似的发现。
以主观睡眠质量的好、差作为分组变量,PSQI量表的曲线下面积为0.90分界点为6.5时,约登指数达到最大,灵敏度与特异度分别为0.87、0.77,表明在护理人群中有较高的应用价值。刘贤臣等[7]关于一般人群的研究发现,以7为界值时约登指数达到最大;郑棒等[12]关于高校医生的研究发现,以6.5为界值时灵敏和特异度较高。由此可以表明,PSQI 在不同人群应用时,为取得较好的筛选效果,需要对判断界值进行调整。本研究的调查对象仅限于汕头市某三甲医院,有一定的局限性;同时ROC 曲线分析结果未结合多导睡眠图,尚需要在今后的研究中完善和验证。
综上所述,PSQI 量表在护理人群中评估睡眠质量时具有良好的信度和效度,但在实际应用中,应根据护理人群的特点对个别条目进行调整以获得更好的使用效果。