最小临床重要差值在支气管扩张症疗效测评工具中的应用与思考

2022-08-18 11:38关佳瑞任嘉铭谢洋张彭

中国全科医学 2022年30期

关佳瑞，任嘉铭，谢洋，张彭

支气管扩张症（bronchiectasis，BE）是各种原因引起的支气管树的病理性、永久性扩张，导致反复发生化脓性感染的气道慢性炎症，主要表现为反复咳嗽、咳痰、咯血等症状，严重影响患者生存质量［1］。一项系统评价研究表明BE的经济负担显著，不仅住院费用占据较大比例，门诊费用和负担也不容小觑［2］。为改善BE患者症状，防止疾病恶化，降低住院率，其症状管理必不可少，而患者报告结局（patient reported outcome，PRO）在其中发挥着重要作用。随着BE临床研究的开展，相关疗效测评工具相继出现，但缺乏疗效指标变化对临床意义的有效解释，而最小临床重要差值（minimal clinically important difference，MCID）［3］能够解释量表分值变化的临床意义，因此逐渐成为研究热点。本文详细介绍了MCID的概念、计算方法以及在BE-PRO测评工具中的研究现状和取值范围，以期为BE相关临床疗效评价提供量化标准及参考依据，为今后BE测评工具的MCID研究提供方向及依据。

本文文献检索策略：计算机检索中国知网（CNKI）、维普网（VIP）、万方数据知识服务平台（WANFANG DATA）、中国生物医学文献数据库（CBM）及PubMed、Web of Science等数据库。中文检索词：支气管扩张症、支气管扩张、生存质量、生活质量、生命质量、患者报告结局、最小临床重要差值、测评工具、量表；英文检索词：bronchiectasis、quality of life、patientreported outcome、minimal clinically important difference、minimal important difference、MCID、MID、measurement instrument、scale。检索时间为2001-01-01至2020-12-31。纳入标准：涉及支气管扩张症生存质量测评工具关于MCID的制订、应用、综述、Meta分析及有关报道，与主题密切相关的文献，文献发表时间可适当放宽。排除标准：与研究问题无关、重复发表、无法获得全文的文献、文献质量差的文献。

1 MCID概念及计算方法

1.1 MCID概念 JAESCHKE等［4］指出MCID是指以患者为中心，不考虑经济成本及不良反应的前提下，患者认为对自身有益的评分最小变化值。SCHÜNEMANN等［5］认为MCID其实是最小重要值（minimal important difference，MID），即不管受益与否，患者或知情代理人认为有意义的最小变化值，可为治疗方法的改变提供参考，MCID与MID均被广泛使用，通常情况下被认为是同一概念。后来，NORMAN等［6］指出MCID应该定义为最小可测差值（minimally detectable difference，MDD）或最小可测变化值（minimal detectable change，MDC），即测得的变化并非均有意义，也可能是测量误差引起。在临床研究中，具有统计学意义的量表评分变化是否具有临床价值是需要明确的问题，而MCID就是用来判断量表评分变化是否具有临床意义的最小阈值。

1.2 MCID计算方法 MCID最常用的计算方法包括锚定法、分布法、专家意见法和文献分析法。（1）锚定法又称效标法，是将测评工具的分值变化与外部一个可解释的锚相比较，从而证明该测评工具的评分变化是有意义的。锚定法要求锚与测评对象的分值变化之间存在相关性。有研究建议将0.30～0.35作为相关阈值，当锚与测评对象的相关系数在此范围内时可以使用锚定法计算MCID（随锚的改变而改变）［7-8］。（2）分布法从统计学角度来估算MCID，应用到的统计学指标包括：效应值（effect size，ES）、标准差（standard deviation，SD）、标准误（standard error of measurement，SEM）等，通过ES的变化解释MCID［9］。分布法的评估有多种形式，但均基于组内变化或组间比较［10］，观察到的绝对差异通常通过除以SD进行标准化，从而产生标准化ES。分布法计算出的MCID大小与样本量相关，有明确的计算公式，并将误差纳入计算，但因其基于样本数据进行估算的特点，故其适用场景存在限制［11］。（3）专家意见法简言之就是完全根据专家的意见来确定MCID，不能较好地反映患者的观点，所以只能作为辅助方法［12］。（4）文献分析法将系统评价作为确定MCID的一种方法，即利用已有的文献证据确定MCID［9］。一方面，文献分析法依赖于已有文献，能有效利用所有数据；另一方面，文献分析法所需样本量较大，结果仅来源于已有文献，因此文献分析法在计算MCID时常作为辅助方法。

不同量表的MCID取值不同，即使同一量表，不同的计算方法得到的MCID值也可能不同，目前对于MCID的计算尚无统一标准。

2 MCID在BE-PRO测评工具中的研究现状

PRO是指直接来自患者对自身的躯体状况、功能状态及治疗满意度的报告，未经过其他人（医务工作者、临床照顾者）的解释［13］。目前，用于BE的PRO测评工具主要分为3种类型：普适性量表、疾病特异性量表和症状特异性量表（表1）。

表1 支气管扩张症的测评工具及最小临床重要差值Table 1 Interpretation of minimal clinically important difference used in outcome assessment tools for bronchiectasis treatment

2.1 普适性量表

2.1.1 健康调查简表（the MOS 36-item Short-form Health Survey，SF-36） SF-36是在医疗结局研究基础上，由美国波士顿健康研究所研制的简明健康调查量表［14］。该量表应用广泛，被普遍用作生存质量量表使用，具有代表性和可操作性，该量表包含生理功能、生理职能、躯体疼痛、总体健康、生命活力、社交功能、情感职能、心理健康8个维度，评分越高，生存质量越差。SWIGRIS等［15］使用分布法估算MCID，采用SEM和0.5 ES得出SF-36量表的MCID为3分；使用锚定法以用力肺活量（FVC）、一氧化碳弥散量（DLCO）为锚估算出MCID为2～4分。

2.1.2 医院焦虑和抑郁量表（Hospital Anxiety and Depression Scale，HADS） HADS由 ZIGMOND 与SNAITH于1983年制订，主要应用于综合医院患者中焦虑和抑郁情绪的筛查［16］。HADS共由14个条目组成，其中7个条目评定抑郁，7个条目评定焦虑，可简单区分为焦虑量表（HADS-A）和抑郁量表（HADS-D）两个亚量表。SMID等［17］以慢性阻塞性肺疾病（COPD）患者为对象，基于锚定法和分布法最终确定的HADS-A的 MCID 为 1.3～1.8，HADS-D 的 MCID 为 1.5～1.7。WYNNE等［18］评估HADS量表对BE患者肺康复（pulmonary rehabilitation，PR）的反应性，首次提出了应用HADS-A和HADS-D于BE患者MCID的估算，该研究基于锚定法和分布法估算HADS子量表HADS-A和HADS-D的平均MCID为2。

2.2 疾病特异性量表

2.2.1 圣乔治呼吸问卷（St.George's Respiratory Questionnaire，SGRQ） SGRQ常用于COPD的特异性健康状况测量，也可用于BE、哮喘、间质性肺病、肺癌等，包括症状（频率和严重程度）、活动（能导致气促或受到限制的活动）、日常生活影响（气道疾病引起的社会能力损害和心理障碍）3个维度，共50个条目［19］。蔡映云等［20］对SGRQ问卷中不符合我国国情的项目做了调整，研制出成人COPD生存质量量表，此量表包括日常生活能力、社会活动状况、抑郁心理症状、焦虑心理症状4个维度，共35个条目，得分越高表示生存质量越低。

SGRQ应用广泛，祖菲亚·努尔买买提等［21］在评价PR运动对BE急性加重患者稳定期的影响时，就采用了SGRQ来评价患者的生存质量。李扬懿等［22］通过观察PR前后肺功能和SGRQ评分，探讨PR对BE患者肺功能和生活质量的影响。李静芬等［23］应用SGRQ对COPD患者的生活质量进行调查，结果表明SGRQ不仅对COPD患者的生活质量评价良好，而且能较好地反映患者的治疗效果。冯京帅等［24］在研究二甲消癥汤对气虚血瘀型特发性肺纤维化（IPF）患者的治疗效果时也采用了SGRQ。张美荣等［25］采用生存质量评估简表和SGRQ来评价煤工尘肺患者的生存质量。

SGRQ的MCID计算方法多样，包括锚定法、分布法、专家意见法等。就SGRQ而言，JONES［26］的研究中以COPD患者为对象，上述方法除分布法外，MCID的计算结果均为4，这是因为基于分布法计算的MCID在不同的研究中是不同的，计算结果也不可能一致。而在SWIGRIS等［27］的研究中以IPF患者为调查对象计算出SGRQ的MCID结果为7。REHMAN等［28］以COPD为研究对象，对马来西亚版SGRQ-CM进行验证，证明SGRQ-CM有良好的心理测量学特性，且基于锚定法计算时MCID为5.07；基于分布法计算时MCID为6.05（5.30，6.80）。侯年［29］应用SGRQ评分的一项研究结果表明，3种剂量的茚达特罗均优于安慰剂且3种剂量间无差异，只有剂量为300 μg的茚达特罗降低SGRQ评分超过了4分，大于MCID。由此可知SGRQ的相关研究中MCID的研究虽较多，但对于不同的疾病计算获得的MCID也不相同，目前尚无统一标准。

2.2.2 慢性呼吸系统疾病问卷（Chronic Respiratory Disease Questionnaire，CRQ） CRQ是应用于COPD患者最著名和描述最完整的疾病特异性量表［30］，在BE患者中也有所应用，涉及呼吸困难、疲劳、心理功能、对疾病的控制4个维度，评分采用7分制，得分越低，表明生存质量越差。国外已有相关文献验证了CRQ对于慢性呼吸系统疾病患者生存质量测评的有效性，证明了该问卷具有良好的信度、效度，且对治疗效果敏感。VODANOVICH等［31］进行了一项研究，在非囊性纤维化BE老年患者中，CRQ的可靠性和有效性得到验证，但其反应性有限。JAESCHKE等［4］采用锚定法，通过与“全球得分变化评级”相比较，得出只有呼吸困难维度减少3分的患者呼吸困难症状能得到缓解，维度内评分改变3分意味着每个条目平均变化0.6分，因此确定CRQ每个条目的MCID近似为0.5。WYRWICH等［32］在研究中将COPD和心脏病两个患者群体结合起来计算MCID，以分布法（SEM）和专家意见法计算其中3个共同维度呼吸困难、疲劳、心理功能的MCID分别是3、2、4，并基于条目数量，验证了CRQ每个条目的平均变化值是0.5这一假设。

2.2.3 西雅图阻塞性肺疾病问卷（Seattle Obstructive Lung Disease Questionnaire，SOLDQ） SOLDQ是TU等［33］于1997年开发的用于COPD患者自我生存质量评估的问卷，包括身体功能、情绪功能、应对技巧、治疗满意度4个维度，共29个条目。该量表各维度得分均为0～100分，满分400分，各条目采用Likert 5分或7分进行等距赋值，计分方式采用加权平均法，分数越低，提示生活质量越差［34］。许利萍等［35］采用SOLDQ量表评估优质护理对老年COPD患者的价值；BULCUN等［36］验证了SOLDQ评估BE患者生存质量的可靠性和有效性。目前国内外尚无SOLDQ关于MCID的研究。

2.2.4 BE生活质量问卷（Quality of Life-Bronchiectasis，QOL-B） QOL-B是第一个用于BE生活质量评价的特异性量表，包括生理功能、角色功能、活力、情绪功能、社会功能、治疗负担、健康感觉、呼吸症状8个维度，共37个条目，满分100分，分数越高，生活质量越好，该量表只需计算各维度得分，无需计算总分［37］。MAGGE等［38］使用 QOL-B对 19例 BE患者进行长达2年的纵向研究，期间每位患者都经过3次QOL-B调查，结果表明BE患者在专门的护理中心接受治疗后生活质量可得到改善。QUITTNER等［39］结合锚定法、0.5 SD、SEM计算出各维度最终的MCID分别为 10、8、10、7、9、9、8、8；OLVEIRA 等［40］对西班牙版QOL-B V3.0进行心理学测定，且以0.5 SD、SEM测得呼吸症状维度的MCID为6.8；QUELLHORST等［41］对德文版QOL-B V3.1进行心理测量验证，在德国收集1 000例病例，并将904例患者的资料纳入研究，该量表没有观察导地板或天花板效应，内部一致性良好（Cronbach's α≥0.73），（14±7） d重测信度高（ICC≥0.84），基于分布法通过SEM计算MCID估算值为8.5～14.1，呼吸症状维度的MCID为8.5；周慧姣等［42］也对中文版QOL-B进行了信度、效度检测，结果显示该量表在对BE患者生活质量的评价中表现出良好的可靠性和有效性，且与SGRQ具有明确相关性。QOL-B量表目前已被翻译成40多种语言，在多个国家广泛使用，相比SGRQ具有更好的灵敏度。

2.2.5 BE健康问卷（Bronchiectasis Health Questionnaire，BHQ） BHQ是专门针对BE患者开发的一个简短、有效的问卷，初始版本包含65个条目，后删减为10个，该问卷采用Likert 7分进行等距赋值［43］。BHQ 是一种简短、易于使用、针对特定疾病的健康状况测量，且与SGRQ之间存在显著的收敛效度。GISSEL等［44］将该问卷翻译成丹麦版本，并进行验证，这是该问卷的第一个北欧版本，这项研究纳入111例BE患者，研究结果表明丹麦版BHQ具有良好的心理测量学属性，且与SGRQ之间有较好的收敛效度（ρ=-0.826，P=0.0001）。BHQ目前已被翻译成其他11种语言并得到验证，相比其他生存质量调查问卷具有简洁的优势，但同时也存在确定MCID时需大量样本的缺点，目前尚无BHQ关于MCID的研究。

2.2.6 COPD评估测试（COPD Assessment Test，CAT）CAT最初是为COPD患者开发的问卷，包括咳嗽、咳痰、胸闷、睡眠、精力、情绪、运动耐力和日常运动影响8个维度，分数范围为0～40分，分数越高表明该疾病对患者影响越大［45］。已有研究表明CAT也可作为评价BE患者生存质量的临床疗效指标［46］，且与临床稳定期COPD患者的SGRQ评分密切相关［47］。CAT被广泛用于评估COPD患者症状对生存质量的影响，GIL等［48］进行了一项横断面研究，根据CAT评分来分析COPD患者的临床特征，结果表明CAT评分高（≥20分）的患者更有可能存在下列情况：当前未戒烟、呼吸困难症状更重、既往加重史次数多、肺功能更差和较低的体质指数（BMI）。SMID等［17］以COPD患者为对象，基于锚定法（SGRQ）和分布法最终确定其MCID为2～3。FINCH等［49］结合分布法和锚定法计算出CAT的MCID为4。TSILIGIANNI等［50］比较了CAT和COPD临床呼吸问卷（Clinical COPD Questionnaire，CCQ）的有效性并使用SEM方法计算CAT的MCID为3.76。

2.2.7 CCQ CCQ是由MOLEN等研发的专门检测COPD患者临床控制的自填式问卷，包括症状、功能和精神状态3个维度，10个条目［51］。TSILIGIANNI等［50］使用SEM方法计算CCQ的MCID为0.41。ALMA等［52］从PR和常规临床实践中回顾性分析CAT、CCQ和SGRQ的基线和随访数据，从环境、性别、年龄、全球阻塞性肺疾病倡议分类、合并症和基线健康状况来计算和验证MCID，旨在探讨患者和疾病相关因素对来自不同环境的COPD患者的MCID估计值的影响。

2.3 症状特异性量表

2.3.1 莱斯特咳嗽问卷（Leicester Cough Questionnaire，LCQ） LCQ是BIRRING等［53］研制的用于自我症状管理的慢性咳嗽问卷，包括生理、心理和社会3个维度，共19个条目，该量表评分范围为3～21分，数值越低表明咳嗽对生存质量的影响越大。有研究表明，LCQ在BE患者中作为疗效评估工具具有实用性，能够灵敏地区分疾病严重程度的变化［54］。此外，LCQ还可用于肺部手术后咳嗽症状的评估，林嵘嘉等［55］采用中文版LCQ来研究肺癌患者电视胸腔镜手术后咳嗽的影响因素，结果显示肺癌患者术后出现咳嗽症状的主要危险因素是术前有咳嗽症状及麻醉时间长。HAUKELANDPARKER等［56］将英文版LCQ翻译成挪威版NLCQ并测试了内容和结构效度、内部一致性、重测信度和测量误差，结果显示NLCQ表现出令人满意的信度和总体效度。BROKKAAR等［57］以335例门诊咳嗽患者为研究对象测得的荷兰版LCQ问卷的MCID为3。PORNSURIYASAK等［58］基于锚定法计算泰语版LCQ-T关于整体、生理、心理和社会维度的MCID分别为1.1、0.4、0.4和0.4；基于分布法以SEM为统计指标计算的MCID分别为0.8、0.3、0.3和0.3，以1/2 SD为指标计算的MCID分别为2.0、0.6、0.8和0.8，以1/3 SD为指标计算的MCID分别为1.4、0.4、0.5和0.5。BIRRING等［59］在一项研究中定义了LCQ的MCID为1.5～2.0，即当LCQ总分增加1.5～2.0分时认为其有临床意义。

2.3.2 呼吸困难评分（Modified Medical Research Council Dyspnea Scale，mMRC） mMRC根据患者的呼吸困难程度来评估患者状况，总分为0～4分，分值越高，提示患者呼吸困难程度越严重［60］。mMRC仅需患者做出一次选择即可快速得出评分，操作简便，较适用于症状严重、配合度较差的患者，该量表对于BE患者同样适用，且已经应用于日常BE患者的生存质量测评［61-63］。目前尚无mMRC关于MCID的研究，在文献系统中检索到的更多的是将mMRC作为锚来确定其他生存质量量表的MCID的相关研究。

2.3.3 咳嗽生活质量问卷（Cough Quality of Life Questionnaire，CQLQ） CQLQ是一个咳嗽特异性问卷，包括身体不适、社会心理问题、职业技能、情感健康、极端身体不适、人身安全恐惧6个维度，共28个条目［64］。采用Likert 4分评分法，分数范围为28～112分，分数越高表示咳嗽对生活质量的影响越大。咳嗽是哮喘和COPD的常见特征，也是BE的主要症状，POLLEY等［65］通过2种特异性量表LCQ和CQLQ来分析咳嗽对呼吸道的影响，该项研究对慢性咳嗽、COPD、哮喘和BE患者进行问卷调查，结果显示LCQ和CQLQ总分之间没有显著差异，四组患者之间的心理社会问题和功能损害存在差异。LECHTZIN等［66］验证了CQLQ的信度、效度及反应度后指出该问卷可作为IPF有效可靠的工具来评估咳嗽症状，并以SEM为统计指标计算其MCID为5.0～5.7，但受样本量大小的影响，后续还需进一步验证。

2.3.4 咳嗽和咳痰评估问卷（Cough and Sputum Assessment Questionnaire，CASA-Q） CASA-Q 是由CRAWFORD等［67］开发并验证的一个用来评估咳嗽和痰液对患者生存质量影响的测评工具，能客观评估咳嗽和痰液对COPD或BE患者生存质量的影响。经过不断修改，当前版本包括20个条目，涉及以下4个维度：咳嗽症状、咳嗽影响、咳痰症状和痰液影响。CASA-Q是第1个包含痰液评估的量表，其有效性已在多个国家的COPD患者中得到验证。TAGAYA等［68］采用CASA-Q对COPD患者吸入噻托溴铵治疗前后的痰液相关症状进行了评估。李雪等［69］在研究升阳益胃汤加减对BE患者肺脾气虚，痰热蕴肺证的临床疗效时，选择的测量指标包括CASA-Q、mMRC、SGRQ、急性加重次数及第1秒用力呼气末容积（FEV1）%。与LCQ和CQLQ相比，CASA-Q不仅可以评估咳嗽对患者的影响，还可以量化症状的严重程度。BE患者咳嗽、咳痰症状明显，与CASA-Q内容契合，但目前尚缺乏其临床实践的相关研究。

2.3.5 下呼吸道感染视觉模拟量表（Lower Respiratory Tract Infections-Visual Analogue Scale，LRTI-VAS）LRTI-VAS是根据直观的水平直线图来形象地表现患者症状，包括呼吸困难、疲劳、咳嗽、疼痛程度和痰色，每项1～10分，总分为所有症状分数相加，分数越高表明症状越严重［70］。LRTI-VAS设计简单，易于管理，用时较少，满足了在试验和临床中简单而迅速获得PRO的需求，且同样适用于教育程度低或文盲患者，是较好的BE生存质量测评工具。卢刚等［71］在研究不同维持剂量阿奇霉素对稳定期BE患者肺功能和生命质量的影响时，观测指标就包括LRTI-VAS。ALTENBURG等［70］在非囊性BE患者中对LRTI-VAS进行了验证，研究结果显示其具有良好的有效性、可靠性和对变化的反应性，并且与SGRQ、SF-36和LCQ总分相关性很高。

3 思考与展望

随着生存质量问卷的不断发展，可用于BE患者的相关量表也逐渐增多。虽然BE的疗效测评工具种类众多，但专门针对BE患者研制的特异性量表数量仍较缺乏，且本土化量表相对较少。其中一部分量表刚开始时是基于COPD、IPF或其他慢性呼吸系统疾病患者研制，故针对BE患者的特异性量表的研制有待加强。上述介绍的PRO在BE的研究中均有应用，不同的是有的量表研究充分，不仅在多种呼吸系统疾病中有应用，且关于MCID的研究也有很多，如SF-36、HADS、SGRQ、CRQ、CAT、QOL-B、LCQ和CQLQ，而一些量表的MCID研究尚缺乏，如SOLDQ、BHQ、mMRC、CASA-Q、LRTI-VAS。

MCID是量表灵敏度的一个体现，临床研究在进行样本量估算时会受到MCID的影响，并且关系到量表最小可测变化值分值的临床解释。同时MCID也是为了区分统计学意义和临床相关性，特别是在大型研究中，小的影响可能在统计上具有显著性，但这些影响可能很小，并没有临床意义。当前确定MCID还没有“金标准”，常用的MCID计算方法各有其优缺点，如（1）锚定法计算MCID时，不同的“锚”计算出的数值不同，且该方法未考虑测量误差；（2）分布法虽考虑了测量误差，但因其受样本数据影响，仅揭示了最小可测变化值，无法确定其临床意义；（3）专家共识法主观性强，文献分析法依赖于已有文献，这两种方法基本上不单独使用，只能起辅助作用。故当前制定MCID的规范与标准尤为重要，同时应构建MCID质量评价体系，对已有的研究结果进行质量评价，确定合适取值，从而为临床研究提供指导。

MCID的估算是当前BE疗效测评工具研究的一大热点、难点，是连接统计学与临床结果意义判读的桥梁，但当前关于BE疗效测评工具的MCID研究尚不充分，且针对BE患者的特异性量表仍较少，未来亟须加强对BE疗效测评工具的研制及MCID的研究，以期为临床研究提供量化依据。

作者贡献：关佳瑞进行文章的构思与设计，撰写论文并对文章负责；关佳瑞、张彭负责文章的资料收集与整理；任嘉铭负责文章的修订；谢洋负责文章的质量控制及审校，对文章整体负责、监督管理。

本文无利益冲突。