基于COSMIN指南对癌症患者支持性照护需求量表的系统评价

2022-02-11 10:35严雪刘倩倩苏予洁豆欣蔓魏思琪

中国全科医学 2022年4期

严雪，刘倩倩，苏予洁，豆欣蔓，魏思琪*

支持性照护需求的概念由FITCH［1］正式提出。支持性照护需求是指除治疗性干预措施外，癌症患者可能需要的各种帮助，可分为生理需求、日常生活需求、情感需求、心理需求、精神需求、信息需求及社会需求7类［2］。上述需求反映了癌症患者在治疗与康复过程中对自身内部环境和外部生活条件的要求，其测量主要采用自我报告的方法［3-4］。癌症患者在治疗与康复过程中常面临诸多压力，并承受着巨大的身心痛苦。研究发现，当支持性照护需求未被满足时，癌症患者对疾病的应对能力将会下降，其精神、心理负担亦会明显加重，进而会对其生活质量和疾病预后产生不利影响［5］。定期评估癌症患者的支持性照护需求情况并为其提供合适的帮助、支持，不仅有助于使其积极配合治疗，还有利于促进其身心康复，提高其生存质量［6］。目前，我国可用于评估癌症患者支持性照护需求的量表较多，但尚不确定这些量表在应用于临床时是否具有良好的测量性能，也少有研究者对此类量表的测量特性进行系统的评价。健康测量工具遴选标准（COSMIN）指南由多个国家的心理测量学专家共同起草、修订，可用于评价患者自我报告结局工具（PROMs）的性能及研究的质量，旨在为研究者和医务工作者选择合适的PROMs提供依据［7］，现已成为澳大利亚乔安娜布里格斯研究所（JBI）PROMs测量属性系统评价制作的推荐工具［8］。本研究采用COSMIN指南，在对中文版癌症患者支持性照护需求量表的测量特性及研究的方法学质量进行评价的基础上，综合评定中文版癌症患者支持性照护需求评估量表各测量特性的证据等级，并形成对于量表的最终推荐意见，旨在筛选出高质量的癌症患者支持性照护需求评估量表，并为其在临床的深度应用与推广提供循证依据。

1 资料与方法

1.1 纳入与排除标准纳入标准：（1）研究对象为癌症患者；（2）研究内容涉及支持性照护需求量表测量学性能评价；（3）研究中至少对量表的1项测量学特性进行了评价；（4）能获取全文的中、英文研究。排除标准：（1）运用量表来采集调查对象资料的调查性研究；（2）为量表的预试验或应用现状研究；（3）所评价的量表仅能用于测量某一特定支持性照护需求的水平（如信息需求水平、灵性需求水平）；（4）所评价的量表仅适用于特定类型癌症患者支持性照护需求水平的测量；（5）评价非中文版量表测量学性能的研究；（6）二次研究（综述、系统评价）；（7）重复发表的研究。

1.2 文献检索策略 2021年4月检索中国知网、万方数据知识服务平台、维普中文科技期刊全文数据库、中国生物医学文献数据库、PubMed、EmBase、Web of Science、CINAHL Complete数据库，获取有关中文版癌症患者支持性照护需求量表测量学性能评价的研究，检索时限均为建库至2021年3月30日。采用主题词与自由词相结合的方式进行文献检索。中文检索词包括：需求评估、未满足需求、支持性照护需求、癌症、肿瘤、问卷、量表、信度、效度。英文检索词包括：need assessment、unmet need、support care need、neoplasms、tumor、cancer、carcinoma、oncology、questionnaire、scale、tool、instrument、reliability、validation。为保证文献检索的全面性，手动检索纳入文献的参考文献。

1.3 文献筛选和资料提取由两名研究者独立筛选文献、提取资料并交叉核对。如遇分歧，则通过与第三方协商解决。文献筛选时首先通过阅读文题和摘要，在排除明显不相关的文献后，进一步阅读全文以确定是否纳入。资料提取内容主要包括：第一作者、发表年份、量表名称、研究对象及其来源、地区、样本量、研究对象年龄、量表维度数与条目数、量表维度、各条目采用的评分方法、量表完成时间、重测时间、量表测量学性能（内容效度、结构效度、内部一致性、假设检验、效标效度、稳定性、跨文化效度、测量误差、反应性）［7］。

1.4 评价步骤由两名研究者采用COSMIN系统综述指南（2018版）［7］对中文版支持性照护需求评估量表的测量特性及研究的方法学质量进行独立评价，并交叉核对结果。如遇分歧，则通过与第三方协商解决。首先，根据COSMIN偏倚风险清单［9］，对纳入研究的方法学质量进行评价；然后根据COSMIN质量标准［10］对研究所报告的量表测量特性进行评价，并定性合成每个量表各测量特性的评价结果；最后，运用COSMIN改良GRADE［11］综合评定中文版癌症患者支持性照护需求评估量表各测量特性的证据等级，并形成对于量表的最终推荐意见。

1.5 研究工具

1.5.1 COSMIN偏倚风险清单［9］COSMIN偏倚风险清单主要用于评价量表研究的方法学质量，由10个模块组成，分别为PROMs的开发（并非一种测量学特性，而是评价内容效度的关键步骤）、内容效度、结构效度、内部一致性、假设检验、效标效度、稳定性、跨文化效度、测量误差、反应性。COSMIN偏倚风险清单采用4点评分法〔“很好（V）”“良好（A）”“模糊（D）”“不良（I）”〕对每项研究的偏倚风险进行评价。某一模块的整体偏倚风险评分由模块内所有条目的最低评分决定，即最低计分原则。

1.5.2 COSMIN 质量标准［10］COSMIN质量标准由TERWEE等［10］开发，主要用于评价量表的9种测量特性（内容效度、结构效度、内部一致性、假设检验、效标效度、稳定性、跨文化效度、测量误差、反应性），并将评价等级设置为3个级别，即“充分（+）”“不充分（-）”“不确定（？）”。若量表的某一测量特性在各项研究中均为“充分（+）”或“不充分（-）”或“不确定（？）”，则对于该量表而言，此测量特性的总体评级亦为“充分（+）”或“不充分（-）”或“不确定（？）”；若量表的某一测量特性在各项研究中得到的评价不一致，且造成评价不一致的原因无法解释，则对于该量表而言，此测量特性的总体评级为“不一致（±）”。

1.5.3 COSMIN改良GRADE［11］COSMIN先将量表的每个测量特性看作“高质量”，然后根据偏倚风险、不一致性、间接性、不精确性4个因素给予降级，将证据质量分为“高”“中”“低”“极低”4个级别。依据证据客观评价结果形成推荐意见，并对推荐意见进行强度标注。若量表内容效度“充分”（任何等级的证据），且量表内部一致性证据等级不低于“低”，量表可推荐使用（推荐强度：A级）；若有“高质量”证据证明量表内容效度“不充分”，则量表不建议使用（推荐强度：C级）；推荐强度非A级或C级的量表，具有应用的潜力，但仍需要开展更多研究，以进一步评估其测量特性（推荐强度：B级）。

1.6 统计学方法采用描述分析法对中文版癌症患者支持性照护需求量表的测量学性能及研究的方法学质量结果进行汇总、分析。

2 结果

2.1 文献检索结果初检获得研究2 018项（中文研究849项，英文研究1 169项），经去重后剩余研究1 607项，通过阅读题目和摘要剔除研究1 377项，进一步阅读全文剔除研究215项，最终纳入15项［12-26］研究。文献筛选流程见图1。

图1 文献筛选流程Figure 1 Flow chart of literature retrieval

2.2 纳入的中文版癌症患者支持性照护需求量表测量学性能评价研究的基本特征共纳入15项研究，涉及8个中文版癌症患者支持性照护需求评估量表，分别为癌症患者支持性照护需求简明问卷中文版（SCNSSF34）、中文版支持性照护需求筛查工具（SCNS-ST9-C）、癌症患者综合需求评估量表（CNAT）、癌症需求简明问卷（CNQ-SF）、中文版癌症患者未满足需求量表（CaSUN-C）、癌症患者未满足需求简明量表（SF-SUNS）、晚期癌症患者需求评估问卷（ACNQ-41）、晚期癌症患者需求评估表简表（ACNQ-29）。其中，SCNSSF34是被评价次数最多的量表［12-17］，其测量特性得到了最为全面的评价。而SCNS-ST9-C是SCNS-SF34的简化版，共包含9个条目，可用于癌症患者支持性照护需求的快速筛查。11项［13-14，17，19-26］研究的研究对象为患有不同类型癌症的人群，仅4项［12，15-16，18］研究的研究对象为患某种特定类型癌症的人群。各量表均具有多维结构，每个条目多采用Likert 4级或Likert 5级评分法。纳入的中文版癌症患者支持性照护需求量表测量学性能评价研究的基本特征具体见表1。

表1 纳入的中文版癌症患者支持性照护需求量表测量学性能评价研究的基本特征Table 1 The basic characteristics of the included Chinese version of the cancer patient supportive care needs scale measurement performance evaluation research

2.3 中文版癌症患者支持性照护需求量表的测量学性能及研究的方法学质量评价纳入的15项研究均未对量表的效标效度、测量误差、反应性进行评价。（1）内容效度方面，5项［18，21，23-25］研究通过专家咨询法评价量表的内容效度；4项［14，18，23，25］研究除了运用专家咨询法外，还通过询问研究对象，了解研究对象对量表条目“相关性”“理解性”“全面性”的看法。但上述研究均存在仅使用调查法评价量表内容效度，未进行定性分析，研究过程/统计方法描述不够具体、详细等局限性，故研究的方法学质量均为“模糊”，所评价量表的内容效度均为“不确定”。（2）结构效度方面，除1项［16］研究外，其余14项［12-15，17-26］研究均对量表的结构效度进行了评价。6项［13，15，17，22-24］研究采用验证性因子分析（CFA）评价量表的结构效度，样本量满足要求且无方法学缺陷，故研究的方法学质量为“很好”。其中4项［13，17，23-24］研究报告量表的比较拟合指数（CFI）>0.95，故量表的结构效度为“充分”，另2项［15，22］研究所评价量表的结构效度为“不充分”。（3）内部一致性上，全部研究均对量表的内部一致性进行了测量。1项［16］研究未对量表的结构效度进行检验以判断量表是否满足单维性的要求，方法学质量为“模糊”；1项［26］研究未报告各分量表的Cronbach's α系数，方法学质量为“不良”；其余13项［12-15，17-25］研究均报告了结构效度的检验结果（各分量表具有单维性）及量表各维度的内部一致性系数，方法学质量为“很好”。在4项［13，15，20，25］研究中，量表各维度的 Cronbach's α 系数<0.700，故量表的内部一致性为“不充分”。（4）假设检验上，6项［12-14，17，22，24］研究因未明确阐述统计分析方法或用于比较的量表在研究人群中的测量特性，方法学质量为“良好”，3项［15-16，18］研究方法学质量为“很好”。4项［16-17，22，24］研究在进行量表间比较时，未对量表间的相关性做出假设，故量表的假设检验为“不充分”，其余5项［12-15，18］研究所评价量表的假设检验为“充分”。（5）稳定性上，8项［16-17，19-22，24-25］研究通过重测信度来评价量表的稳定性，但由于未能明确说明被试者特征、测量情境及待测构念在测量间隔期内是否发生变化或两次施测时间间隔的确定依据，方法学质量为“模糊”。在2项［16，25］研究中，组内相关系数（ICC）<0.7，故量表的稳定性为“不充分”，其余6项［17，19-22，24］研究所评价量表的稳定性为“充分”。（6）跨文化效度上，仅1项［13］研究采用多组验证性因子分析检验了SCNSSF34在不同性别和年龄人群中的测量变性，但未具体说明除性别、年龄外其他特征变量的分布情况是否相同，故研究的方法学质量为“模糊”，所评价量表的跨文化效度为“充分”。中文版癌症患者支持性照护需求量表的测量学性能及研究的方法学质量评价结果见表2。

表2 中文版癌症患者支持性照护需求量表的测量学性能及研究的方法学质量评价Table 2 The measurement performance of the supportive care needs for cancer patients and the methodological quality evaluation of the research

2.4 中文版癌症患者支持性照护需求量表测量特性合成结果及推荐意见就量表的测量特性质量而言，除ACNQ-29的内容效度为“未提及”外，其余7个量表的内容效度均为“不确定”；除CaSUN-C、SF-SUNS的结构效度为“充分”外，其余6个量表的结构效度均为“不确定”；SCNS-SF34、CNQ-SF、CaSUN-C、SF-SUNS的内部一致性为“充分”，ACNQ-41的内部一致性为“不充分”，其余3个量表的内部一致性为“不确定”；CNAT、CNQ-SF、ACNQ-29的假设检验为“未提及”、CaSUN-C、SF-SUNS、ACNQ-41的假设检验为“不确定”，SCNSSF34、SCNS-ST9-C的假设检验为“充分”；除ACNQ-41的稳定性为“不充分”，SCNS-ST9-C、ACNQ-29的稳定性为“未提及”外，其余5个量表的稳定性均为“充分”；仅SCNS-SF34的跨文化效度为“充分”，其余7个量表的跨文化效度均为“未提及”。受偏倚风险这一降级因素影响，量表各测量特性的总体证据质量多为中/低。8个量表的推荐等级均为B级。中文版癌症患者支持性照护需求量表测量特性合成结果及推荐意见见表3。

表3 中文版癌症患者支持性照护需求量表测量特性合成结果及推荐意见Table 3 Synthesis of the measurement characteristics of the Chinese version of the supportive care needs scale for cancer patients and the formation of recommendations

3 讨论

本研究共纳入15项研究，涉及8个中文版癌症患者支持性照护需求量表。通过对纳入研究进行全面、系统地评价，发现癌症患者支持性照护需求主要集中于生理、心理、信息支持、社会支持等方面。通过满足癌症患者的支持性照护需求，有助于减轻疾病对其身心健康造成的危害，并改善其生活质量。了解并评估癌症患者的支持性照护需求情况，是为其提供针对性优质医疗护理服务的前提。本研究发现，尽管目前可用于评估癌症患者支持性照护需求的量表较多，但其测量特性的检验方法存在一定的问题，不同量表在测量特性质量上存在明显差异，量表质量参差不齐。现对本研究发现问题进行总结，以期为今后癌症患者支持性照护需求量表的研发和/或验证提供参考。

从量表效度来看，内容效度是最重要的测量特性［8］。除 ACNQ（ACNQ-41、ACNQ-29）为我国学者编制的量表外［25-26］，其余6个量表均从国外引进，并经修订。通过对原始量表开发过程进行评价，发现本研究中纳入的量表多是根据文献回顾、专家咨询、目标人群访谈结果汇总编制而成。但在评价量表内容效度时，纳入研究多仅通过专家咨询法评价量表的内容效度，较少关注研究对象对量表条目“相关性”“理解性”“全面性”的意见。今后，可通过采用个人深度访谈法或焦点小组访谈法，了解研究对象对量表内容持有的理解、看法和态度，进而使研究对象参与到量表检验、评价过程中，从而提高量表内容与待测构念之间的吻合程度［7］。构建效度由结构效度、假设检验、跨文化效度三部分组成。纳入研究主要采用因子分析法对量表的结构效度进行评价。但部分研究存在仅进行了探索性因子分析（EFA），并未进行CFA这一缺陷。是否运用了先验理论或知识，是EFA和CFA的根本区别［27］。同时，CFA结果也可从侧面反映量表的编制架构是否有理论依据。COSMIN认为，CFA优于EFA［9］。鉴于此，对于缺乏坚实理论基础的量表，在对其结构效度进行评价时，建议先采用EFA以明确其内部结构，在此基础上，再应用CFA更细致地测量项目与因子之间的关系。在进行结构效度的假设检验时，为避免结论偏见，研究者应给出有关量表间相关性的假设。本研究纳入的量表多从国外引进，但仅有1项研究对量表（SCNS-SF34）的跨文化效度进行了评价，以检验量表在不同语言群体间的测量不变性。未来，在构建/从国外引进癌症患者支持性照护需求量表时，应注意探讨量表的条目在跨文化中是否存在项目功能差异［8］。在选择不同群体样本进行测试时，一方面应保证样本选取具有足够的代表性，另一方面应尽可能使除分组变量外的其他特征变量的分布情况基本相同，从而增强组间的可比性。

从量表信度来看，内部一致性是指每个单维度量表或亚量表条目之间相互关联的程度。研究者在明确量表具有单维性后，除了需要对总量表的内部一致性系数进行计算外，还应计算并报告各分量表的Cronbach's α系数，以检验量表及各维度是否均具有良好的信度。稳定性是指对同一受试者采用同样的方法重复测量时所得结果的一致性程度，包括重测信度、评定者间信度和评定者内信度3个子测量特性。本文纳入的研究均采用重测信度来反映量表的稳定性。鉴于患者的需求是动态、开放的，且易随着环境的变化而变化，量表的评价者需明确阐述重复测量间隔时间的选择根据，并给出测量间隔期受试者待测构念保持稳定的理由，如提供证据证明患者的生活环境、疾病状况无明显变化。目前，测量间隔期的确定主要靠主观经验判断，这一定程度上可能会导致重测信度评价结果的偏倚。

纳入的15项研究均未对量表的效标效度、测量误差、反应性进行评价。由于在癌症领域，尚无关于测量患者支持性照护需求的“金标准”，故目前暂时无法对相关量表进行效标效度评价。但COSMIN指南指出，原版量表可作为新开发的简短版量表的“金标准”［7］。因此，在对简短版量表进行信效度检验时，研究者可考虑将其与原量表进行比较，以验证简短版量表是否具有较好的效标效度。

通过对量表测量特性结果进行合成并形成最终的推荐意见，本研究发现SCNS-SF34既是被评价次数最多的量表，也是测量特性得到最为全面评价的量表，其内容效度、内部一致性等测量特性均有不同等级的证据支持。相较于其他量表，对CNAT、ACNQ的测量特性进行评价的研究较少，且CNAT、ACNQ的条目数较多。均有中等质量证据支持CNQ-SF、CaSUN-C和SF-SUNS的内容效度，且其内部一致性证据等级不低于“低”。鉴于8个量表内容效度均为“不确定”，临床应用可行性将作为量表推荐的依据［10］。SCNS-SF34由4个维度组成，条目数量适宜，完成时间约为10 min，具有较好的临床可行性，且有中等质量证据支持其内容效度，高质量证据支持其内部一致性，因此，SCNS-SF34可暂时被推荐使用，但该量表的其他测量特性仍有待进一步验证。今后，在研制或验证癌症患者支持性照护需求量表时，应尽量规避现有量表测量性能评价研究中存在的问题；可在确保量表内容效度合理的前提下，依据COSMIN指南具体要求，对量表各测量特性的检验设计和统计方法进行核查，以期开发出有高质量证据支持的量表用于临床研究。

本文也存在一定局限性：首先，本文仅纳入了中英文研究；其次，部分量表的测量特性评价研究较少，可能会对这些量表的测量特性及其证据质量等级产生不利影响，故应谨慎解释本研究的结果。

作者贡献：严雪负责文章的构思与设计、论文撰写与修订；严雪、刘倩倩、苏予洁负责文章的可行性分析、文献/资料收集及整理；豆欣蔓、魏思琪负责文章的质量控制及审校；严雪、魏思琪对文章整体负责，监督管理。

本文无利益冲突。