基于项目反应理论的儿童睡眠问卷项目分析

2018-09-03 10:01邰隽许志飞李晓丹杜江南王桂香马军胡佩瑾阎小妍张杰张亚梅刘原虎赵靖郑莉陈俊冯国双倪鑫
中国全科医学 2018年23期
关键词:区分度信息量条目

邰隽,许志飞,李晓丹,杜江南,王桂香,马军,胡佩瑾,阎小妍,张杰,张亚梅,刘原虎,赵靖,郑莉,陈俊,冯国双,倪鑫*

儿童阻塞性睡眠呼吸暂停综合征(obstructive sleep apnea syndrome,OSAS)是最常见的睡眠呼吸障碍疾病,该病可以导致多种并发症的发生[1],国外和香港地区报道的患病率约为5.7%和4.8%[2-3]。目前诊断OSAS的金标准是多导睡眠监测(polysomnography,PSG),然而PSG的检测成本较高,难以在国内外广泛应用。儿童睡眠问卷(Pediatric Sleep Questionnaire,PSQ)是美国儿科学会在2012年儿童OSAS指南中推荐的筛查问卷[2],但该问卷目前在国内尚未推广,仅有基于小规模人群的评价[4],缺乏大规模流行病学调查人群的验证。本研究采用项目反应理论(item response theory,IRT)对该问卷在诊断OSAS中的效果进行评价,以提供基于大规模人群的证据。

1 对象与方法

1.1 研究对象 2015年5—7月采用多阶段分层整群随机抽样方法,按北京市的四大功能区(首都功能核心区、城市功能拓展区、城市发展新区和生态涵养发展区)分层,随机抽取西城区、朝阳区、昌平区、顺义区、房山区、怀柔区和门头沟区共7个区,然后从7个区中整群随机抽取10所幼儿园、7所小学和8所初中。抽中的学校中,除小学六年级和初中三年级外,其余班级均进行调查,共计11 420例儿童。

1.2 调查方法 采用横断面调查方法,由首都医科大学附属北京儿童医院、北京大学儿童青少年研究所以及抽中7个区县的儿童青少年保健所共同合作调查。调查内容均在调查人员的指导下,由儿童家长或监护人填写。PSQ是CHERVIN等[5]开发的针对儿童睡眠障碍调查的问卷,该问卷包含与儿童睡眠呼吸障碍相关的4个维度,即呼吸、睡眠、行为、其他,共22个题项(见表1)。选项均为“是”“否”二分类选项,得分越高提示相关症状越严重。本研究被调查儿童及监护人均知情同意,且本研究获得首都医科大学附属北京儿童医院伦理委员会批准。

1.3 质量控制 调查前由儿童睡眠学临床专家和流行病学专家对调查员进行规范化培训,调查以班级家长会的形式进行,邀请被调查儿童的家长参加,要求其为照顾被调查儿童生活起居的监护人,并对其生活习惯特别是睡眠状况有深入了解。由专业耳鼻咽喉科医师对调查问卷所涉及内容进行逐一讲解,现场调查时研究人员将每次问答时间控制在5~10 min。

1.4 统计学方法 采用SAS JMP Clinical 6.0统计学软件进行正态分布以M(P25,P75)表示;计数资料的统计描述采用相对数表示。统计分析采用IRT建立研究对象对条目的反应与潜在变量(本研究为睡眠障碍)之间的非线性关系,采用二参数Logistic函数建立二者的项目特征函数(item characteristicfunction),并绘制项目特征曲线,二参数Logistic模型表达为:中,θ表示受试者的能力(本研究为是否存在睡眠障碍),Pi(θ)表示能力为θ的受试者在项目上正确回答的概率(即如果存在睡眠障碍,在条目中体现为睡眠障碍的概率),ai表示项目i的区分度参数(即能够区分是否睡眠障碍),bi表示项目i的难度参数,e表示自然对数之底,e=2.718 28,D为常数,D=1.7;同时还计算了PSQ的项目信息函数和测验信息函数,用来反映该问卷在估计受试者能力所提供的信息量大小,基于每个条目的项目信息量项目i的被试反应函数,P'i(θ)表示项目反应函数对θ的一阶导函数,测验信息量函数定义为每个项目信息函数的累积和,即:I(θ)=。以p<0.05为差异有统计学意义。

表1 PSQ中英文版内容Table 1 PSQ in Chinese and English version

2 结果

2.1 基本情况 共发放问卷11 420份,回收10 743份,回收率为94.07%,经数据清洗后得到有效问卷9 198例,有效回收率为85.62%。其中男4 736例(51.49%),女4 462例(48.51%);年龄3~14岁,平均年龄(8.8±3.3)岁;PSQ总分的中位数为3(2,5)分;呼吸、睡眠、行为、其他4个维度的得分中位数分别为0(0,1)分、0(0,0)分、2(1,3)分、0(0,1)分。

2.2 各条目的项目反应函数和项目特征曲线 从难度参数来看,多数项目的难度参数均≥1.000,只有C1(在跟孩子讲话时他/她好像心不在焉或没有在听)、C3(易被外部的刺激因素分散注意力)、C5(常表现得忙个不停或高谈阔论)、C6(平时总爱打断别人或者抢话说)这4个项目的难度参数<1.000(分别为0.843、-0.346、0.436、0.722),提示这4个项目过于容易,多数人容易“通过”,即使无睡眠障碍的人也倾向于做出阳性回答。这4个条目中回答“是”的比例分别为30.34%、57.74%、39.89%、33.38%,远高于其他条目回答“是”的比例。从区分度参数来看,D1(睡觉偶尔尿床)和D5(是否超重)的区分度最低(分别为0.441和0.124),提示这两个项目难以有效区分睡眠障碍与否(见表2)。

项目特征曲线显示,多数峰值集中在1~3之间,提示这些条目对于倾向于有睡眠障碍的儿童贡献的信息量最多。而D1和D5这两个条目的项目信息量始终非常低,即无论被测对象是否具有睡眠障碍的倾向,这两个条目贡献的信息量均较低(见图1)。

2.3 测验信息函数 由于D1和D5提示效果不佳,本研究尝试将这个条目删除,并计算删除前22个条目和删除后的20个条目的测验信息函数,剔除这2个条目后,测验信息量几乎没有任何变化,提示这两个条目可能对睡眠障碍的区分效果不大(见图2)。

3 讨论

目前国内对儿童OSAS的筛查尚无较好的工具,美国2012年儿童OSAS指南[2]强调CHERVIN 等[5]开发的PSQ在筛查儿童OSAS方面优于其他儿童睡眠问卷。该问卷在美国儿童的研究结果显示,该问卷的22个条目中,存在7项以上症状的儿童患OSAS的可能性增加,其灵敏度和特异度分别为85%和81%[5]。在此之后,关于葡萄牙版本和西班牙版本PSQ问卷的评估和应用研究相继发表,其良好的信度、效度和临床筛查能力在不同国家和种族的儿童中得到多次证明[6-8]。而目前我国尚未完全引入PSQ问卷,仅李晓丹等[4]和WANG等[9]分别对389例和173例儿童对该问卷进行了评价,结果认为该问卷具有较好的信度和效度。

表2 各条目的区分度和难度参数估计结果Table 2 The estimation of difficulty and discrimination for each item

图2 22个条目和20个条目的测验信息函数比较Figure 2 The comparison of test information function between 22 items and 20 items

本研究在大规模人群的基础上,采用IRT对该问卷进行了验证,通过对9 198例儿童的分析,认为PSQ问卷中多数条目具有较好的信度,而且综合来看其评价效果较好。测验信息函数呈“瘦高型”曲线,提示问卷具有较高的区分度;而且最高峰值>1,说明对于可能存在睡眠障碍的受试者,该问卷可以贡献最高的信息量。

图1 各条目的项目特征曲线和项目信息函数Figure 1 Characteristic curves and information function for each item

但本研究也发现问卷中个别条目可能需要调整。正常情况下,区分度参数取值范围为(0,3)之间,而难度参数在(-3,3)之间较为合理[10-11]。综合这两个参数可以发现,“睡觉偶尔尿床”和“是否超重”这两个条目的区分度参数过低,同时难度过高,项目信息量也未发现随横坐标增加而变化的趋势,而且删除这两个条目后,测验信息量几乎没有任何变化。这些结果均提示,实际中可以考虑简化问卷,删除这两个条目。同时,美国提出的以存在7项以上症状作为PSQ阳性的建议[12],也需要同时修改。

IRT是20世纪50年代由REISE等[13]提出并发展起来的一种测量理论,目前主要在心理学、教育学等领域应用较多[14-16]。传统的测量理论存在一定的局限:首先,其测量误差受多方面因素的影响,不同被测对象甚至同一对象的不同时间测量有时差别较大;而IRT则更为稳定,因为其不是计算具体的信度值,而是通过项目特征曲线来反映被测对象的能力(如是否具有睡眠障碍)与某一项目回答的关系。A1条目随着横坐标的增加,纵坐标的值迅速升高,说明被测对象越倾向于存在睡眠障碍,其选择“是”的概率越高;而D5条目这种趋势则不明显。其次,传统测量理论主要是针对量表的总体特征,如Cronbach's α系数评价的是整个量表的信度;而IRT则关注构成量表的每一条目。项目特征曲线给出了每一条目的项目信息量,其含义类似于传统测量理论中的信度。最后,IRT对不同能力受试者的灵敏度更高。从测验信息函数来看,信息函数最高峰值对应的横坐标约为2.5。提示,对于倾向于睡眠障碍的受试者,此时该问卷提供的信息函数最高;如果受试者倾向于不存在睡眠障碍,此时该问卷贡献的信息函数越来越低。

目前IRT中比较常用的项目特征曲线函数有Rasch模型、Logistic模型等,而且根据不同的需求,可采用单参数、二参数或三参数模型。本研究采用的是基于区分度和难度两个参数的二参数Logistic模型,而不是基于区分度参数、难度参数、猜测参数的三参数模型。这主要是因为睡眠障碍是一种真实存在的症状,正常情况下不会受随机作答的影响,因此不考虑猜测参数,仅估计区分度参数和难度参数。

总之,本研究通过大规模人群的调查,认为PSQ在评价儿童睡眠障碍中可以提供较好的初筛效果,个别条目可删除,国内应用时可以考虑对其进行简化,重新设定适合国内儿童的临界值。

作者贡献:邰隽进行文章的构思与设计,结果的分析与解释,撰写论文;邰隽、许志飞、马军、胡佩瑾进行研究的实施与可行性分析;李晓丹、杜江南、王桂香进行数据收集;李晓丹、杜江南、郑莉进行数据整理;阎小妍、冯国双进行统计学处理;陈俊、冯国双进行论文的修订;邰隽、张杰、张亚梅、刘原虎、赵靖负责文章的质量控制及审校;倪鑫对文章整体负责,监督管理。

本文无利益冲突。

猜你喜欢
区分度信息量条目
重磅!广东省发文,全面放开放宽落户限制、加大住房供应……信息量巨大!
《词诠》互见条目述略
图形推理测量指标相关性考察*
Can we treat neurodegenerative diseases by preventing an age-related decline in microRNA expression?
浅观一道题的“区分度”
走出初中思想品德课的困扰探讨
利用垂直平分线的定义巧解题
让多媒体技术在语文课堂飞扬
对县级二轮修志采用结构体式的思考
无机化学推断题与框图题解法