马亚男 徐敏杰 王海芳 杨瑜爱 李 颖 任巧生 陈 健 张家成 包炜玮 高 颖,2 常静玲
(1 北京中医大学东直门医院,北京,100700; 2 北京中医药大学中医脑病研究院,北京,100700)
患者报告结局测量临床计量标准(Clinimetric Criteria for Patient-reported Outcome Measures,CLIPROM),要求测量量表的信度、效度、敏感性等指标,尤其强调临床计量学的敏感性,即量表能否反映临床特征的变化,包括症状的类型,严重程度、持续时间,疾病的进展速度和分期,多维度损伤,患者的心理健康和幸福感等[1-2],而非强调对多元观测变量的降维处理。目前验证患者报告结局量表(Patientreported Outcomes Measures,PROMs)常用的选择健康测量工具的共识标准检查表(Consensusbased Standards for Selection of Health Stat us Measurement Instruments,COSMIN)是寻找、组合多个同质性条目,以检测量表整体同质性,因此难以适应多维度临床评估[3-4]。
卒中后失语(Post Stroke Aphasia,PSA)患者占急性卒中的1/3[5],易造成认知、情感、生命质量等多方面的负面影响[6-8]。PSA表现为听、说、读、写、计算等多维度语言功能障碍[9],同时伴随非语言认知障碍,如执行、控制等多维度功能障碍[10-11]。因此,PSA康复需要多维度评估,但现有的失语症检查量表,多存在检查时间长、评分困难、操作复杂、结构单一、敏感性较差等缺点,难以满足临床需求[12]。本团队前期参考国际PROMs研制方法,结合中医整体观,研制出《卒中后失语患者报告结局量表》第1版[13]。经预调研后对量表进行了简化,形成《卒中后失语患者报告结局量表》终版,共包括4个维度,28条条目,其中语言认知功能维度15条、中医病证维度5条、心理维度5条、社会维度3条[14]。鉴于PSA的多维认知损伤临床特性,本研究拟采用CLIPROM对该量表的各维度性能进行最后一轮临床验证。
1.1 一般资料 选取2022年3月至2022年10月就诊于北京中医药大学东直门医院和中国康复研究中心的门诊及住院PSA患者作为研究对象。研究采用问卷调查的方式,基于一般法则,验证量表的样本量为条目数的5~10倍[15]。量表共28个条目,采用条目数的5倍,确定样本量为140份。
1.2 纳入标准 1)符合《中医脑出血诊治指南(2019)》中脑出血诊断、《中国急性缺血性脑卒中诊疗指南2018》中缺血性脑卒中西医诊断;2)母语为汉语;3)有明确的失语综合征,具备一定的理解能力,能配合完成量表的相关内容;4)充分知情后自愿参加本研究并能积极配合信息采集者。
1.3 排除标准 1)并发精神疾病的患者;2)有失语综合征,但不具备理解能力或智力障碍等其他不能理解或完成问卷的患者;3)拒绝参加本项目的患者。
1.4 指标与方法
1.4.1 计分方法及缺失数据处理 《卒中后失语患者报告结局量表》终版采用Likert五级评分法,28条正向条目依次记为1~5分。计分规则:各维度得分为该维度所有条目得分的总和[16]。为减少数据偏倚,故对缺失数据进行处理。缺失值总体缺失率小于2%,经检验缺失数据服从正态分布,可采用均值填补缺失数据[17]。
1.4.2 信度分析 选择Cronbach α信度系数[18],Cronbach α信度系数0.9以上认为量表信度极好,0.8~0.9之间则认为信度较好,0.7~0.8之间认为信度达标,0.7以下则认为量表需要修订[19]。
1.4.3 效度分析 本研究采用的效度分析包括以下3个方面,即内容效度、结构效度、标准效度等[20]。1)内容效度:运用Pearson相关系数评估量表各条目得分与所属维度总分及其他维度总分之间的相关性。若P<0.05的同时,各条目得分与所属维度总分相关性大于与其他维度总分的相关性,则此量表具有较好的内容效度[21]。2)结构效度及敏感性:鉴于本研究的样本量,故采用CLIPROM中的非参数项目反应理论Mokken Scale Model测量量表结构效度及敏感性[22]。若满足Mokken Scale Model中单调同质模型的3个基本假设,即单维性、局部独立性和单调递增性,则表明该量表具有较好的结构效度及敏感性[23-24]。将患者得分带入Mokken Scale Model模型,首先对测试的患者得分进行排序,再依据同质性系数查看量表数据结构与期望量表结构的误差,同质性系数分为H,Hi和Hij[25]。H是整个量表同质性系数(H值<0.3为量表不合格,此时不能进行后续的检验,需对量表进行调整。H值为0.3≤H<0.4时,量表的准确程度较弱;0.4≤H<0.5,量表准确程度中等;0.5≤H≤1,准确程度强)。Hi是项目i的同质性系数,Hij是由项目i和项目j组成的成对试题的同质性系数,共同反映结构效度的单维性和局部独立性。其中Hi>0.3,Hij>0表示单维性和局部独立假设成立。单调递增性通过重大违规(#tsig)和Crit值测定,当#tsig>0,且Crit值<80时单调递增性假设成立。若量表能满足单维性、局部独立性和单调递增性则说明患者得分越高越能说明患者整体状态越好[26-27]。3)标准效度:将《卒中后失语患者报告结局量表》各维度及总分与汉语标准失语检查法表(Chinese Rehabilitation Research Center Aphasia Examination,CRRCAE)总分进行Pearson相关系数分析[28],若P<0.01,表示《卒中后失语患者报告结局量表》各维度及总分与CRRCAE量表总分有显著相关性,即被检测的《卒中后失语患者报告结局量表》有较好的标准效度。
2.1 可行性评价 发放142份量表,其中2名患者重复评价,共获得有效问卷140份。样本接受率为100%,量表完成时间范围为2.22~24.23 min,平均完成时间(6.13±3.68)min,其中Q5~6、Q10、Q13~14、Q19~25题目中存在缺失值,采用均值填补缺失数据。140份问卷各维度得分情况详见表1。
表1 各维度分值分)
2.2 人口学资料 参与本次调研的140名患者,平均年龄(55.79±14.96)岁(31~79岁),男女比为101∶39,脑力劳动与体力劳动比为19∶9,符合失语症的患病特点。见表2。
表2 患者基本信息情况
2.3 信度分析 对量表的28条条目进行Cronbach α分析,结果显示该量表的Cronbach α为0.932,各维度Cronbach α均大于0.7。中医病证维度及社会维度信度达标,语言认知维度、心理维度及量表总体信度极好。见表3。
表3 各维度标准化Cronbach α及量表整体Cronbach α
2.4 效度分析
2.4.1 内容效度 各条目得分与各维度得分的相关性分析显示,除Q1外,语言认知维度的其他条目得分与所属维度得分的相关系数均大于其他维度得分的相关系数;中医病证维度,心理维度及社会维度所有条目与所属维度得分的相关系数均大于其他维度。见表4。
表4 各条目与各维度得分的相关性
2.4.2 结构效度 结果显示4个维度H>0.349,表明可以使用Mokken Scale Model分析。其中语言认知维度准确度中等,中医病证维度准确度较弱,心理维度和社会维度准确程度高。除语言认知维度的Q4外,其他条目的Hi>0.3且Hij>0。见图1,表5。
图1 各维度Hij值热力图
表5 同质性系数及单调性评估
2.4.3 标准效度 CRRCAE量表与《卒中后失语患者报告结局量表》终版的语言维度(r=0.630,P<0.01)、社会维度(r=0.533,P<0.01)及总分(r=0.562,P<0.01)之间均存在显著的正相关,与中医病证维度及心理维度相关关系无显著性差异(P>0.05)。见表6。
表6 《卒中后失语患者报告结局量表》终版各维度分数与CRRCAE量表总分相关情况
2.4.4 敏感性分析 #tsig、Crit值均为0,证明在各个条目没有重大违规项目,符合Mokken Scale Model的单调递增性,结合Hi值和Hij值,说明该量表符合Mokken Scale Model预先设定的3个假设。见表5。
本研究率先引进CLIPROM评价患者报告结局量表,以试图弥补COSMIN检查表的局限性。《卒中后失语患者报告结局量表》具有较好的可行性、信度及敏感性。效度分析符合CLIPROM,但仍存在个别条目数理统计与临床实际的偏差性,这可能与PSA疾病本身具有多维损伤的特性有关。
3.1 效度分析结果 内容效度显示除Q1外,量表各维度条目与本维度的相关性大于与其他维度的相关性,表明该量表具有较好的内容效度。Q1是围绕患者流利程度进行评价,患者语言流利程度是导致患者心理、社会、日常生活能力障碍的主要因素,所以显示出较差的内容效度。但语言的流利程度是反映PSA语言功能的重要测量指标[30],具有重要的临床意义,故保留Q1。
结构效度分析显示除Q4外,各条目的Hij>0,Hi>0.3,表明除语言认知维度外,中医病证维度、心理维度及社会维度都是单维性的,且各条目满足局部独立性,语言认知维度可以考虑删除Q4[31]。因Mokken Scale Model分析中存在个别条目数理统计与临床实际的偏差性,此偏差与语言本身具有多维损害的特殊性有关[32]。此外,数据分析经验告诉我们,所有建模尝试的关键问题不是模型是否适合数据,而是模型和数据之间的差异是否足够小,以使模型属性适合当前的应用程序。因此,数据结构只能无限近似于单维性、局部独立性和单调递增性,模型预测和数据结构之间总是存在一定的差异[33],故暂不考虑删除Q4。
3.2 CLIPROM在PROMs验证中的应用 PROMs在临床实践中可用于评估症状的严重程度,生命质量及心理健康,并促进患者与医师的沟通[34-35]。目前评估PROMs所采用的COSMIN检查表是基于心理测量模型建立的,其方法学框架为成分同质性假设[36],这会导致过分注重PROMs条目之间的同质性,不能贴合临床实际需求。
CLIPROM注重不同条目临床信息或维度,强调量表所能反映出来的临床效用,尤其是对不同条目反应不同的临床特征,以反映疾病的多维性,这一特点更贴合PROMs在临床实践中的应用。针对具有多维度损伤的PSA患者所制定的PROMs,因其需要反映出多维度信息,故采用CLIPROM标准更适合。该方法已用于PROMs的研制验证中,如霍普金斯症状检查表[37]。
3.3 《卒中后失语患者报告结局量表》的优势 兼顾内容全面和实施便捷的评估模式是目前PSA评价面临的巨大挑战[38-39]。本研究回收的有效问卷,涵盖不同年龄、教育背景、工作性质的PSA患者,故具有一定普适性。《卒中后失语患者报告结局量表》终版平均完成时间相较于第1版的平均完成时间明显缩短[14],平均完成时间为6 min,信度效度及敏感性较好,提示《卒中后失语患者报告结局量表》实施便捷,具有更好的可行性、有效性。
《卒中后失语患者报告结局量表》是基于中医整体观制定的,强调整体和局部症状相结合,形与神相结合,还采取了中医症状学评价,故该量表不仅能评估PSA患者的语言功能,还能评估其认知、中医证候、日常生活能力及心理等整体情况,与目前需要语言量表、认知量表、日常生活能力量表等相互配合、用时较长的PSA评估方式比较,符合PSA患者临床评价需求,填补目前中西医联合评价的空白。
综上所述,CLIPROM适合多维功能损伤患者报告结局量表的验证。《卒中后失语患者报告结局量表》具有较好的信度、效度、敏感性,临床可操作性强,可用于全面评估PSA患者。
利益冲突声明:无。