吴沛霞王辰楠席淑新李华伟
1 复旦大学附属眼耳鼻喉科医院眩晕与平衡障碍中心,护理部(上海 200031)
2 复旦大学护理学院(上海 200035)
3 复旦大学附属眼耳鼻喉科医院医务部(上海 200031)
4 复旦大学附属眼耳鼻喉科医院耳鼻喉科,耳鼻喉研究院(上海 200031)
前庭疾病是引发头晕与眩晕的主要原因[1-3],患者常有行走不稳、漂浮感、注意力无法集中等症状,导致日常活动与社会参与功能受限,易跌倒[4]。近年来,由前庭疾病引发的活动与参与障碍逐渐受到临床医生、患者和研究人员的关注。临床上虽已有数份与之相关的自评量表,但普遍未基于合适的理论框架,或信效度验证不充分[5],并且多聚焦于生活质量[6],而非功能障碍层面。2011年美国匹兹堡大学康复中心Whitney,Susan L.团队以《功能、残疾和健康国际分类》作为理论框架,开发了前庭活动与参与量表(Vestibular Activities and Participation,VAP)[7,8]。目前该量表已在4个国家应用,跨文化适应性良好,可用于评价不同文化背景下的眩晕头晕患者功能受限程度和活动参与情况[9]。Rasch模型是最常使用的项目反应理论模型之一,是一种潜在特质模型,基于实测数据运用数学模式将受试者的能力和条目特质整合在同一尺度进行分析比较,可直观评估受试者的潜在能力,亦能较精确地评估条目间的相关性,从而深入检验量表的心理学测量学特质[10]。本研究旨在汉化VAP量表,通过Rasch模型分析中文版的测量学品质,为我国前庭功能障碍患者活动与参与情况提供可用可信的评价工具。
本研究为上海市耳源性眩晕多中心临床研究的部分内容,由复旦大学附属眼耳鼻喉科医院伦理委员会审核(编号:2017-046),在中国临床研究中心注册(注册号:ChiCTR1800017328)。
量表引进经原作者授权。翻译以Brislin量表跨文化模型[11]为指导框架。首先两位精通英语的译者(一位为康复治疗师,另一位为无医学背景的英语教师)各自对量表进行翻译,对两份译稿中不一致处进行讨论整合,形成VAP量表中文初版。随后,另两名译者分别进行回译。翻译组(四名译者、一名耳鼻喉科专家及作者)对5个译本进行归纳修改,并与原作者沟通后确定初稿。10名前庭功能障碍患者受邀进行量表预评估,量表填写过程顺利,患者均表示条目内容清楚,切合实际。
量表译制中主要分歧与修改:原条目11和12“使用交通工具(乘坐私人交通工具或公共交通)”、“操作交通工具:开车或骑自行车”,表达累赘,故删除语句“使用交通工具、操作交通工具”,保留解释性语句;其次“私人交通工具”中文表达不自然,改为“私家车”;条目6“体育活动(从事竞技类、正式或非正式的体育比赛,包括个人和团体项目)”,正式/非正式的表述不符合中国文化习惯,改为“有组织的体育比赛”。量表中英文对照详见表1。
表1 前庭活动与参与量表中英文对照Table 1 English and Chinese version of Vestibular Activities and Participation measure
1.2.1 研究对象
选取2016年11月至2019年2月在某耳鼻喉专科医院确诊为良性阵发性位置性眩晕(Benign Paroxysmal Positional Vertigo,BPPV),经复位治疗后仍主诉有头晕、头昏、不稳感的患者。纳入标准:①年龄18-80岁;②认知正常,签署知情同意书。排除标准:①合并心脑血管疾患:脑梗死、脑出血、多发性硬化症、心肌梗死、心力衰竭、心律失常(II度以上房室传导阻滞、病窦综合征)、体位性低血压;②正在服用或近3月内曾服用可能影响活动的药物。
1.2.2 方法
患者通过问卷星在线填写中文版VAP量表;一般资料从电子病史中提取。同意参加重测信度研究的患者在间隔4小时后进行重测,为减少间隔时间过短导致的记忆混杂,量表题项随机重排。选取同期在院接受前庭康复的患者,于康复前和康复4周后填写量表,分析量表反应度。
1.2.3 统计分析
采用Winstep 3.72.3软件对量表条目适配度及信效度进行Rasch模型分析,检验以下参数:条目拟合度、维度分解、选项排序、局部独立性、个人-条目图。重测信度:计算组内相关系数(ICC)。反应度检验:采用配对t检验,计算效应量(Effect size,ES)和标准化反应均数(Standardized response mean,SRM)。
共422例患者纳入分析,平均年龄50.12±13.49岁,男性145例(34.4%),大学及以上文化程度166人(39.3%),已婚400人(94.8%),316人(75.1%)家庭经济负担较轻,274人(64.9%)全职工作,症状持续时间1-300(中位数11天)。同期接受前庭康复患者44例,4例资料不全,40例纳入分析,平均年龄46.68±15.14岁,男性16例(40.0%),合并一侧前庭功能低下(双温试验提示一侧半规管功能减弱)12例,合并耳石器功能异常(单侧或双侧眼源性或颈源性肌源诱发电位引不出)17例,合并偏头痛9例。
2.2.1 条目拟合度
对整份量表进行分析,发现仅条目5(举起或肩扛物体)的加权拟合度略超过适宜标准,为1.57,其余各条目拟合指数均处于0.5-1.5之内,与模型拟合佳。各条目的点值相关系数为0.57-0.77,与总量表具有显著正相关性,并且预期相关(Pt-Measure exp)与实际测得的相关系数(Pt-Measure corr)数值差别较小,说明数据可以适配Rasch模型分析。见表2。
表2 条目拟合度检验Table 2 Item Fit Indices
2.2.2 维度诊断
维度诊断示,Rasch模型解释了51.6%的变异,18.9%未被解释的变异被第1对照解释。计算第1对照的特征根值为4.7,提示量表具有多维性。对其条目载荷分布进行分析,发现4个条目的因子载荷为正值,另8个条目为负值。据此将量表分解为两个维度,分别进行残差分析后得出首对比残差特征根均<2.0,提示两个分量表具有良好的单维性,满足Rasch分析条件,后续分析均基于两个分量表进行。
2.2.3 单调递增性
采用Likert 5点计分,选项为:无困难(0分)、轻微困难(1分)、中度困难(2分)、重度困难(3分)、无法执行(4分)。检验两个维度的选项排序合理性,结果如图1、图2所示,横坐标为条目难度和个体能力之间的关系,纵坐标为反应概率;5条曲线代表5个选项。分析可见,曲线峰值顺序一致且相互分离,曲线0斜率较大,项目特征曲线基本符合理想形状,表明各选项之间相互独立,有较好的区分度,量表计分方法设置合理。
图1 活动维度条目的选项适合性检验Fig.1 Category probability curves of items in activity domain
图2 参与维度条目的选项适合性检验Fig.2 Category probability curves of items in participation domain
2.2.4 信度与分离指数
Rasch分析最显著特征之一是将个体和量表条目放在同一个尺度上进行比较。无论个体还是条目,分离指数越大,鉴别度越高,分离指数<2则鉴别度差。活动维度的受试者、条目信度为0.86、0.88;受试者、条目分离指数为2.50、2.67,见表 3。参与维度的受试者、条目信度为0.82、0.93;受试者、条目分离指数为2.15、3.69,见表4。
表3 量表信度与分离指数检验(活动维度)Table 3 Reliability and separation index test(activity domain)
表4 量表信度与分离指数检验(参与维度)Table 4 Reliability and separation index test(participation domain)
2.2.5 条目与个体匹配度
对条目难度与受试者能力的匹配程度进行评估,发现两个维度的分布相似,即:条目难度分布较集中,个体能力分布相对较广,个体能力均值略低于条目难度。
活动维度中,条目难度均值为Logit 0.00±0.19,个体能力均值为Logit-0.43±1.99。“由坐到站立和攀爬(上下楼梯、电梯等)”是最容易的条目,而“集中注意力”、“躺下或翻身”、“长距离行走”为较难的条目。参与维度中,条目难度均值为Logit 0.00±0.30,个体能力均值为Logit-0.17±2.30。“在家以外的室内走动”是最容易的条目,“乘坐私家车或公共交通”、“开车或骑自行车”为最难的条目,见图3。
图3 个体-条目图(左:活动维度;右:参与维度)Fig.3 Person-item map/Wright map(left:activity domain;right:participation domain)
422名参试者中,51人进行了重测信度测试。分析示,活动、参与维度ICC值为0.935、0.932,总量表ICC值为0.983,重测信度极佳。
40名患者康复前后量表总分差值为5.49分(P<0.01),效应量和标准化反应均数分别为0.87、0.85。
VAP量表开发至今已逾9年,多方研究证实其良好的效用。2014年,量表作者Whitney研究团队在德国、美国、约旦、沙特阿拉伯四个国家对VAP量表进行跨文化测试应用[9]。随后,在一项对脑外伤病人的研究中,VAP量表结果显示患者年龄和活动与参与情况的关系,年龄愈大,活动与参与限制愈严重[12]。此外,VAP量表还被用来评估前庭障碍患者康复前后生活质量的变化[13,14]。德国眩晕与平衡前瞻性队列(DizzyReg study)最新发表的研究中,VAP量表用来测量持续性姿势-知觉性头晕患者临床特征[15]。由此可见,VAP量表在国外已逐渐进入临床视野,为疾病治疗与康复提供了重要参考。
测量是一种有目的的行为,量表中每个条目都需为测量的潜在变量服务[10]。Rasch分析通过分析实证资料来检测条目是否发挥了测量功能。进行分析前,需检验量表是否符合Rasch模型的分析条件。两个拟合指标加权拟合度和未加权拟合度值为1时,表示数据与模型完全拟合,0.5-1.5为可接受范围。本研究中分析结果示量表整体拟合程度较好,仅条目“举起或肩扛物体”拟合度略差。考虑到现实中此动作运用较少,存在胡乱或随机作答的可能,未来研究中可对此题进行优化。
在国外量表本土化的过程中,条目和维度有可能与源量表存在差异[16,17],因此分析量表结构是汉化时的重要步骤。Rasch分析中若量表为单维度,那么数据残差中的第一个因子(第一对照)特征值应<2.0,且其解释的变异需<5%[18]。本量表单维性并不成立,重新分解后确认存在两个维度,根据内容分别命名为“活动维度”和“参与维度”。活动维度主要描述体位变化诱发眩晕与头晕的动作,与外周性前庭疾病引发的眩晕特点表现一致。其中,条目“集中注意力”并不属于体位变动的范畴,其原因可能是前庭神经与大脑皮层杏仁核、海马等区域存在广泛的联系,从而影响情绪及认知控制等功能[19]。此外,条目“体育活动”在我国主要反应的是个体参与社会活动的功能,故由原量表的活动维度移至参与维度中,符合我国的文化习惯和价值观念。
Rasch分析中受试者和条目的信度可以反应量表的稳定性,分离指数则反应量表区分不同潜在特征人群的能力。本量表两维度的分离指数均≥2.0且信度均≥0.8,说明具有良好的测量精密性。
通过分析个体与条目的难度分布,显示本量表适用于平均难度的人群。没有足够的条目针对比较困难或能力较强的个体,这可能与量表总条目数相对较少有关。活动维度中“集中注意力”、“躺下或翻身”、“长距离行走”为较难的条目,与原量表的分析结果基本一致[9],临床实践中亦观察到眩晕患者在上述项目中存在较大困难。参与维度中“乘坐私家车或公共交通”、“开车或骑自行车”为最难的条目,虽然这两项活动本身不会诱发或加强头晕/眩晕的症状,但部分患者在经历过眩晕急性发作时天旋地转的体验后,会留有恐慌或惊惧的心理,缺乏安全感,害怕独自出门或活动。该量表内容较真实地反应了前庭疾病引发的活动与参与特点,与临床现象吻合,可用于前庭功能障碍患者活动与参与的评估,指引前庭康复方案设计。
由于眩晕症状急性、不稳定性、可变性的特点,本研究中重测信度间隔时间为4小时,与同类研究做法相同[7,9],检验得出ICC值>0.8,说明量表具有跨时间稳定性。
Kirsher等指出量表需要证实反应度后才适宜用作临床疗效评价工具[20]。本量表汉化的目的之一是评估前庭康复前后患者功能的改善,故进行了反应度检验。研究中同时采用配对t检验、效应量(ES)和标准化反应均数(SRM),力求全面地评价量表的反应灵敏程度。本组参试者前庭康复前后ES和SRM均>0.8,表明效应量大[21],量表具有极佳的反应度,能敏感捕捉到前庭康复前后的变化,可以作为康复效果评估时的快速参考。
前庭疾病造成的活动与参与功能障碍困扰着大量患者,临床上急需一份能有效评估患者活动与参与功能的量表。本研究遵循了量表翻译及本土化流程,采用Rasch模型对量表信效度进行了分析,提示中文版VAP量表信效度良好,难度适宜,具有较好的测量精密性和反应度。本研究参试者局限在BPPV患者,样本代表性不足,后续仍需扩大样本群体的研究,以进一步验证量表在不同前庭疾病人群中的适用性。