辛笛诺,杨素云
(1 山西医科大学护理学院,山西太原,030001;2 山西医科大学第一医院核医学科,山西太原,030001)
甲状腺癌是一种起源于甲状腺上皮细胞的恶性肿瘤,是头颈部及内分泌系统最常见的恶性肿瘤[1]。2020年最新数据报告[2],全球范围内甲状腺癌新发病例约58.6 万,占癌症总发病人数的3%,居第9 位。我国癌症中心最新发布的肿瘤登记年报显示[3],中国甲状腺癌发病率居恶性肿瘤第7 位。甲状腺癌生存期长、死亡率低,10年生存率可达98%,死亡专率仅为0.5/10 万[4]。目前,国际上公认治疗甲状腺癌最理想的方案是“外科手术治疗+放射性131I 治疗+促甲状腺激素抑制治疗”[5],这种经典治疗方案大大降低了甲状腺癌的复发率和死亡风险。尽管甲状腺癌患者预后明显优于其他恶性肿瘤患者,但疾病本身、手术创伤刺激及术后并发症、放射性131I 治疗引起的不良反应、甲状腺激素替代治疗引起的激素水平异常等,使患者常常伴随着不同程度的身体症状和心理困扰,严重影响其生理、心理、社会功能[6]。随着医学模式的转变和精准医疗的快速发展,癌症患者的结局评价已在治愈率、生存率等传统客观指标的基础上,延伸了对患者主观体验和自我报告结局的探讨。患者自我报告结局(patient-reported outcomes,PROs)是从患者角度获取的与疾病诊疗相关的症状、心理感受、功能状态以及患者满意度和依从性等主观资料[7]。目前,PROs 作为临床结局评价的重要内容,与生化影像等客观检查结果相结合,得到越来越多医疗卫生从业人员的认可和重视。本文对国内外甲状腺癌PROs 评估工具的制定背景、特性、应用现况、优势与不足等进行综述,旨在为医护人员合理选用评估工具,并为我国甲状腺癌患者相关测评工具的开发和研究提供参考和借鉴。
PROs 是一个广泛化的术语,指患者对自身疾病、诊疗照护、卫生政策服务等多个方面和维度产生的最主观的、直接的感受和反馈,其不受医护人员或照护者的干扰[8]。2006年,美国食品药品安全管理局(Food and Drug Administration,FDA)将PROs 界定为:“没有经过医护人员或其他任何人的解释,直接来自患者的有关自身健康状态的任何方面的信息”[9],强调信息的来源必须是患者本人。PROs 信息的收集方式有口述病史、问卷调查、质性访谈、临床讨论等[10]。临床上,PROs 一般以自评问卷或量表的形式进行评估,它能够标准化患者提供的资料[11]。根据性质可将PROs 评估工具分为普适性工具和特异性工具。普适性PROs 评估工具可用于多种疾病,推广应用广泛,但是对于一些特定疾病的特异性结局指标,其条目的敏感性和代表性比较差,无法满足特定疾病患者的测评需求;特异性PROs 评估工具则是针对特定疾病进行测评,可以准确识别特定疾病的特异性问题,对于患者的测评结果更加敏感、高效[12-13]。
2.1.1 安德森症状评估量表(M.D Anderson symptom inventory,MDASI) MDASI 是由美国德克萨斯州大学安德森癌症中心CLEELAND 等[14]在2000年研制,用于评估不同类型和治疗方式的癌症患者过去24h 的症状,量表由两部分组成,第一部分评估癌症患者常见的13 项核心症状的严重程度,包括疲劳、睡眠障碍、疼痛、嗜睡、食欲不振、恶心、呕吐、呼吸短促、麻木感、健忘、口干、悲伤、苦恼;第二部分评估以上症状对一般活动、情绪、工作、人际关系、行走和生活乐趣6个方面的困扰程度,采用0~10 分(无症状或无影响-极严重的症状或影响)的数字计分方式,评分越高代表患者的症状越严重或者症状对生活的困扰程度越严重,量表Cronbach’s α系数为0.82~0.85。已被翻译成伊朗、法国、希腊、韩国等多种语言版本并进行了本土化应用。WANG 等[15]于2004年对该量表进行了汉化,测得中文版安德森症状评估量表(Chinese version of the M. D. anderson symptominventory,MDASI-C)的Cronbach’s α 系数为0.82~0.94,表明MDASI-C 是一种有效、可靠和简洁的工具,可用于测量中国癌症患者的症状严重程度和对功能的干扰程度。于晓敏等[16]采用MDASI-C 调查甲状腺癌患者术后症状的发生情况,结果显示,甲状腺癌患者术后症状发生率高的前三位为疼痛、睡眠不安和咳嗽,严重程度较高的前三位症状为睡眠不安、咽痛和咳嗽。然而,由于MDASI 没有涵盖甲状腺癌患者疾病治疗中的核心症状,对甲状腺癌患者症状评估的针对性不强,应用不广泛。
2.1.2 埃德蒙顿症状评估量表(Edmonton symptom assessment system,ESAS) ESAS 是由加拿大学者BRUERA 等[17]于1991年编制,用于评估姑息治疗的晚期癌症患者过去24h 症状发生情况,采集了9个常见症状的发生率和严重程度,包括6个机体症状(疼痛、疲倦、恶心、嗜睡、食欲和呼吸困难)和3 种心理症状(抑郁、焦虑和幸福感),条目采用视觉模拟评分法,范围为0(没有症状)到10(症状最严重),评分越高代表症状越严重,量表的Cronbach’s α 系数为0.79。已被翻译成韩语、日语、西班牙语、巴西语等多种语言版本,并广泛应用于多个国家。2016年,冰岛学者GRETARSDOTTIR 等[18]对量表中的部分症状添加了简要解释,形成修订版ESAS-r,保留了9 大核心症状,并添加定义疲倦(缺乏活力)、嗜睡(感到困倦)、抑郁(感到悲伤)、焦虑(感觉紧张)、幸福感(你的整体感觉如何),“食欲” 更改为“缺乏食欲”。SAWKA 等[19]在使用ESAS-r 对甲状腺癌症状严重程度进行分类时,疲倦、幸福感缺失和焦虑在中度和重度症状中最常见。2015年,DONG 等[20]选择了210例消化内科患者对其进行汉化及信度、效度检验,形成中文版埃德蒙顿症状评估量表(Chinese version of the edmonton symptom assessment system,C-ESAS),增加了对“皮肤瘙痒”症状的评估,测得Cronbach’α 系数为0.72,各项目之间的相关系数为0.72~0.92,并且C-ESAS 的评分与之相对应的MDASI-C 量表评分的Pearson 相关系数为0.70~0.96,完成时间为2~7min,表明具有良好的信度、效度及可行性,是测量中国癌症患者多维症状的良好工具。杨昱[21]使用C-ESAS 评估跨学科护理模式对甲状腺癌术后患者身体状况的影响,结果提示患者的症状如疲劳、焦虑、抑郁、疼痛、嗜睡、气短均有所缓解。ESAS 简洁易懂,没有填表负担,患者容易理解和配合,应用比较广泛。但其评估症状较单一,无法全面评估患者的整体症状,并且主要针对处于姑息治疗的癌症晚期患者,而甲状腺癌患者预后普遍良好,多接受治愈性治疗,因此对于甲状腺癌患者的适用性和有效性有待进一步验证。
2.1.3 记忆症状评估量表(memorial symptom assessment scale,MSAS) MSAS 是由纪念斯隆-凯特琳癌症中心在1994年制定[22],主要用于评估恶性肿瘤患者过去1w 内32个症状的发生情况、严重程度和困扰程度,量表包含24个躯体症状和8个心理症状。其中躯体症状的项目评定从症状是否发生(“是”或“否”)、频繁程度(Likert 4 级评分,从“无”到“一直持续”)、严重程度(Likert 4 级评分,从“轻度”到“非常严重”)、困扰程度(Likert 4 级评分,从“无困扰”到“非常困扰”)评估患者症状的发生状况和特点,心理症状只评估症状的严重程度和困扰程度。评定得分越高表示症状给患者身心带来的影响越严重,量表Cronbach’s α 系数为0.58~0.88,重测信度为0.40~0.84,在临床上可用于对癌症患者的症状评估。目前,有瑞典、巴西、土耳其等10 余种语言版本。2009年,香港学者CHENG 等[23]对MSAS 进行翻译汉化及信效度考评,中文版MSAS(MSAS-Ch)的Cronbach’s α系数为0.79~0.87,内容效度为0.94,分量表和总分的组内相关检验结果在0.68~0.79 之间,验证性因子分析显示与原量表具有较高的拟合性能,量表结构、内容及内部一致性均较好,在恶性肿瘤临床护理领域广泛应用。杨婵娟等[24]使用MSAS-Ch 评估希望疗法对放射性131I 治疗的甲状腺癌患者的症状困扰,结果表明希望疗法有效改善了放射性131I治疗甲状腺癌患者的生理、心理症状困扰。该量表评估症状较全面,但题量多、计分方式复杂,容易给患者造成填表负担,且尚未在接受根治治疗的癌症患者样本中得到验证,因此针对甲状腺癌患者的适用性还需进一步考究。
2.1.4 患者报告结局测量信息系统(patient-reported outcomes measurement information system,PROMIS)基于以往研究工具的多样性容易造成研究结果的较大差异,2004年美国国立卫生研究院(National Institutes of Health,NIH)牵头创建了PROMIS,是用于普通人群和多种慢性疾病患者人群自我报告的症状和生活质量的标准化测评工具系统[25]。PROMIS 采用WHO 的健康框架为概念框架,使用定性和量性结合的方法,基于经典测量理论(classical test theory,CTT)和项目反应理论(item response theory,IRT)进行严谨的开发和测量学检验,涵盖生理、心理、社会领域,包括7个方面的健康状况:抑郁、焦虑、疼痛干扰、睡眠障碍、疲劳、身体功能、社会功能。根据每个PROMIS 领域的条目数目,PROMIS 简表可分为PROMIS-29、PROMIS-43、PROMIS-57 三种类型。其中PROMIS-29 最常用,7个领域各为4个条目,各领域的分值为4~20 分,仅疼痛干扰条目采用0~10分的数字评分法,其余领域均采用Likert 5 级评分法进行计分,所得分值均需转换为平均值为50、标准差为10 的T 分布下的标准分。其中抑郁、焦虑、疲劳、疼痛干扰和睡眠障碍领域的得分越高表明健康状况越差,身体功能和社会功能领域的得分越高表明健康状况越好[26]。PROMIS 每个领域都有动态化的计算机自适应测试(computerized adaptive testing,CAT)形式,CAT 对每名测试者只匹配与其能力水平相当的项目,在节省测试时间的同时又提高了测试的精准度[27]。GOSWAMI 等[28]使用PROMIS-29 将甲状腺癌患者的生活质量与美国一般人群及其他类型癌症人群相比,结果显示与国内标准数据相比,甲状腺癌患者在所有领域报告的生活质量明显降低;与其他几种癌症的幸存者相比,甲状腺癌患者在焦虑、抑郁、疲劳、睡眠障碍和社会功能方面的生活质量更差,但他们的生理功能更强,疼痛更少。CHOW 等[29]使用PROMIS-29 研究发现,甲状腺癌术后有低钙血症、发音困难或吞咽困难症状及放射性131I 治疗后有口干症状的患者在多个领域的健康状况更差。PROMIS 具有稳定性、可靠性、便捷性,目前已有多个国家对PROMIS 进行了翻译和文化调适,并在不同疾病患者中证实了良好的信度、效度,但在国内使用还比较少见,且暂未有研究验证该系统在甲状腺癌患者中的测量学特性。建议医护人员将PROMIS与疾病特异性量表结合起来使用,共同监测特定疾病患者症状特征和功能状态的变化。
2.2.1 安德森症状评估量表-甲状腺癌模块(M.D Anderson symptom inventory-thyroid cancer module,MDASI-THY) 由于不同类型的癌症存在其特有的症状,因此2009年GNING 等[30]通过焦点小组对甲状腺癌患者、临床医生和研究人员进行访谈,在MDASI 的基础上又增加了6个甲状腺癌患者常见的特异性症状条目,形成MDASI-THY,包括13个核心症状条目,6个症状干扰条目,6个甲状腺癌常见的症状条目(声音嘶哑、感觉发热、感觉寒冷、心跳加速、吞咽困难和腹泻),计分方法同MDASI。测得甲状腺癌特异性症状分量表、核心症状分量表和症状干扰分量表的Cronbach’s α 系数为分别为0.76、0.85 和0.92,各分量表之间存在显著的相关性,Pearson 相关系数为0.70~0.90。ALHASHEMI等[31]使用MDASI-THY 研究发现,影响甲状腺癌患者生活质量的最严重症状包括疲劳、困倦和睡眠障碍,这些症状负面影响了患者情绪、工作和生活乐趣。该量表可以捕获并量化甲状腺癌患者的症状及症状干扰的程度。然而,MDASI-THY 的初步验证仅选取了60 例内分泌科门诊就诊的甲状腺癌患者,样本量少且代表性差,故该量表未得到较大的推广和应用,也未引入国内进行汉化研究。此外,MDASI-THY 特异性条目较少,没有涵盖手术治疗、131I 放射性治疗等不同阶段甲状腺癌患者经历的症状,因此还需要进行大样本、多中心、多阶段的验证来进一步评估其心理测量学特性和敏感性。
2.2.2 希望之城甲状腺癌生活质量量表(quality-oflife thyroid scale,QOL-THY) 由于甲状腺癌幸存者需定期进行全身放射性碘扫描检查及血清甲状腺球蛋白测定来监测疾病的复发和转移,而这些方法需停服4~6w 甲状腺激素以刺激内源性促甲状腺激素水平升高,患者处于甲状腺功能减退状态,会对心理社会功能造成影响。为了评估放射性碘扫描前停用甲状腺激素的甲状腺癌患者的生活质量,DOW 等[32]于1997年开发了QOL-THY,该量表模仿了希望之城国家医疗中心研究人员开发的生活质量版本,研究人员花费1年的时间对6 名甲状腺癌患者进行了深入的定性访谈,确定了患者本人描述的影响生活质量的共同领域,包括与甲状腺激素戒断有关的症状、生育问题、治疗痛苦、对癌症复发的恐惧以及积极的个人变化等,最终确定41 项疾病特异性评定项目,分为生理(8 项)、心理(18 项)、社会(8 项)和精神健康(7 项)四个领域。该量表采用0~10 分的计分方式,“0 分”代表可能的最差结果,“10 分”代表可能的最好结果,分数越高,代表可能的生活质量越好。分量表的Cronbach’s α 系数范围为0.74~0.94,并且与癌症治疗功能评估表(functional assessment of cancer therapy-general,FACT-G)之间的相关系数为0.78,表明该量表具有较好的信效度和可接受性。RUBIC 等[33]使用QOL-THY 研究发现,影响甲状腺激素戒断后分化型甲状腺癌患者生活质量的主要因素有疲劳、冷热不耐受、睡眠改变、体重增加以及初诊断引起的心理困扰。该量表对激素戒断期的甲状腺癌患者生活质量评估维度较全面,特异性高,但目前尚未见中文版跨文化调适的相关研究。我国研究者可考虑将该量表进行科学合理的汉化及验证,为放射性碘扫描前或131I 治疗前停用甲状腺激素的甲状腺癌患者的生活质量测评提供依据。
2.2.3 甲状腺癌特异性生命质量量表(thyroid cancer-specific quality of life,THYCA-QoL) 由于当时缺乏有效的、特异的工具来评估甲状腺癌幸存者的健康相关生活质量,荷兰蒂尔堡大学HUSSON 等[34]于2013年根据欧洲癌症研究与治疗组织(European organization for research and treatment of cancer,EORTC)量表编制指南,通过系统文献回顾、焦点小组会议,参考6 名医护人员和18 例甲状腺癌患者的问题清单,研制出THYCA-QoL,用以测定甲状腺癌幸存者特异性健康相关生活质量问题。该量表共包括24个条目,分为7个症状领域(神经肌肉、声音、注意力、交感神经、咽喉/口腔、心理和感觉问题)和6个单一条目(疤痕、感到寒冷、手/脚刺痛、体重增加、头痛和性兴趣)。除性兴趣条目的时间框架为过去4w 外,其他条目均为过去1w。所有条目计为1~4 分(从“完全没有”到“非常多”),分数越高表明患者的生活质量越低。各领域的Cronbach’α 系数在0.45~0.82 之间,探索性因子分析提取7个因子,解释46%的变异,所有条目的因子载荷均在0.35 以上,表明量表具有较好的信度、效度,在欧美国家得到广泛的应用。HUSSON 等[35]使用THYCA-QoL 研究表明,甲状腺癌长期幸存者与一般人群相比生存质量降低,交感神经问题(感觉寒冷/潮热),神经肌肉问题(腿部抽筋和关节/肌肉疼痛)和突然疲劳发作是甲状腺癌最常见的症状。2019年,刘洁等[36]对THYCA-QoL 进行汉化及信效度评价,测得中文版THYCA-QoL 除神经肌肉领域(Cronbach’s α 系数为0.67)和感觉领域(Cronbach’s α 系数为0.53)外,其他领域的Cronbach’s α 系数均>0.70,量表所有领域的重测相关系数均>0.80,探索性因子分析提取6个主成分,累积方差贡献率为59.79%,量表所有条目与本领域的相关系数均大于与其他领域的相关系数,表明其内部一致性、时间稳定性、条目和领域的区分效度均较高,可作为甲状腺癌患者生命质量的测评工具。该量表与中文版欧洲癌症研究与治疗组织生命质量核心量表C30(European organization for research and treatment of cancer quality of life questionnaire-c30,EORTC QLQ-C30)结合起来使用,既可以评估癌症患者的共性问题,又可以评估甲状腺癌疾病本身及治疗给患者带来的特异性生活质量问题,并且条目结构合理、数量适宜,内容全面清晰,患者接受度高,在临床研究中可操作性较强。目前,国内已初步应用于甲状腺癌患者生命质量的测评,有广阔的应用前景。然而,由于中西方文化背景和价值观存在差异,关于性生活的条目在中国人群中可能会使测得数据出现一些偏差,对于进一步推广还需继续跨文化调适和探究。
2.2.4 甲状腺疾病患者报告结局问卷(thyroid-specific patient reported outcome,ThyPRO) 由于甲状腺疾病的特点通常是几种病症的重叠(例如甲状腺肿大和甲状腺功能亢进共存),并且一种疾病治疗之后可能会转变为另一种疾病(例如甲状腺癌患者手术或131I 放射性治疗后变成甲状腺功能减退、激素替代治疗会造成药源性甲状腺功能亢进或减退)。基于此,2009年丹麦学者WATT 等[37-38]通过文献回顾与对医生、患者进行认知性访谈后,形成了适用于各种甲状腺疾病患者的综合性测评问卷,该问卷共85个条目,由13个亚量表组成,4个特异性症状量表(甲状腺肿症状、甲状腺功能亢进症状、甲状腺功能减退症状、甲状腺眼病症状),5个非特异性心理状态和疲劳量表(疲劳、认知问题、焦虑、抑郁、情绪易感性),4个甲状腺疾病影响量表(社交生活、日常生活、性生活和外观)。每个条目都评估最近4w的情况,采用Likert 5 级评分法,从0 分(完全没有)到4 分(非常多),计算出每个量表内的项目得分,并将其线性转换为标准分0~100 分,得分越高表明所患甲状腺疾病对生活质量的影响越大。该问卷除一个亚量表(甲状腺功能减退症状)的Cronbach’s α 系数为0.83,其余所有亚量表的Cronbach’s α 系数都在0.90 以上,量表的重测信度为0.77~0.89,在丹麦人群中具有可接受的信度、效度,并且已经被翻译成希腊、波兰、西班牙等10 余种语言版本,并进行本土化应用。然而,由于ThyPRO 条目数众多,平均需要14min 才能完成,患者填表负担较重,依从性较低。2015年WATT 等[39]发展了该量表的简明版(ThyPRO39),删除了性生活亚量表,其余条目精简到39个,与原量表的组内相关系数为0.89~0.98,重测信度为0.75~0.89,患者填写用时短(平均约4min)、应答率高,便于临床应用。2017年,我国学者薛霞等[40]将ThyPRO39翻译、跨文化调适及信效度检验,测得中文版ThyPRO39 的Cronbach’s α 系数为0.92,分半信度为0.71,重测信度为0.72~0.86,各条目水平的内容效度为0.83~1.00,量表水平的内容效度为0.95,探索性因子分析提取了10个主成分,累积方差贡献率为64.44%,并且各维度得分与健康调查简表(short-form health survey-36,SF-36)躯体维度和精神维度得分呈负向中度相关,表明该量表与公认量表测定结果的相关性较好。中文版ThyPRO39 在我国甲状腺疾病患者中初步检验有良好的信度、效度,可作为纵向观察我国甲状腺疾病患者生活质量的测评工具。GIUSTI 等[41]使用ThyPRO纵向评价分化型甲状腺癌患者5年的生活质量,结果表明随着时间的推移,患者生活质量有所改善,疲劳是影响患者生活质量的主要因素。中文版ThyPRO39 的验证人群样本量较少且代表性较局限,建议未来我国研究者可将其应用于不同治疗阶段的甲状腺癌患者进行大样本、多中心、纵向长期的验证研究。
2.2.5 甲状腺癌生活质量计算机化适应性测试(thyroid computerizedadaptivetests,ThyCAT) 为了寻求方便、快捷的工具评估甲状腺癌患者的健康状况,ASCHEBROOK-KILFOY 等[42]于2017年开发了ThyCAT,是一种用于评估甲状腺癌幸存者生活质量的临床实用计算机化适应性测试,该测试包括58 项条目,分为生理(29 项)、心理(13 项)、社会(14 项)、精神(2项)四个领域。所有条目是由研究者通过双因素项目反应理论模型从最初的75 项完整的、验证过的北美甲状腺癌生存研究(North American thyroid cancer survivorship study,NATCSS) 问卷中根据0.35 主因素载荷标准被选入ThyCAT 题库中的,ThyCAT与NATCSS 相关系数为0.96,拟合程度较高。该测试是在一个智能手机应用程序上,通过不到10个问题,医生可以在不到2min 的时间内识别出甲状腺癌治疗后存在生活质量问题的患者,既不浪费答题时间,又提高了测量的精确度,在最短的时间内获得高度准确的结果。然而,该测试并未具体报告信度、效度,并且由于开发时间短,且部分老年人没有智能手机,推广应用方面受到一定限制。未来研究者可利用电子信息化技术及移动互联网,进一步研究其在甲状腺癌患者中应用价值。
在生物-心理-社会医学模式不断发展下,“以患者为中心”“倾听患者的声音”等理念已成为肿瘤研究的热点,采用PROs 的方式衡量健康状况的理念受到广泛关注,各学者也在相关工具开发方面进行了积极探索。甲状腺癌幸存者人数日渐增长,虽然其生存期长,预后良好,但是疾病本身和治疗的各个阶段都会给患者带来身心上的问题,而这些问题常常被医护人员忽略,影响患者的生活质量,根据临床情况选择适用的PROs 评估工具是解决这一问题的前提。目前,国内缺乏自主研发的甲状腺癌相关评估工具,研究使用的工具大多为国外引进的普适性量表,对甲状腺癌疾病和治疗引起的特异性健康状况未能准确地评估,即使是国外引入的甲状腺癌疾病特异性量表,也仅停留在汉化及信度、效度检验阶段,缺乏后续大样本的随访追踪,未能得到广泛的应用。当前,PROs 评估工具在研制和应用上都趋向于针对特定疾病、特定治疗方式、特定层面、特定文化和人群的研究。因此,研究人员需不断丰富甲状腺癌PROs 评估工具的理论与实践,继续完善现有工具,同时开发和验证符合中国文化背景与疾病特点的工具,为甲状腺癌患者症状及功能的监测与评估提供科学、灵敏、准确的依据,使医护人员可以及时、有效地获取患者的健康相关问题,以便更好地制定及调整诊疗照护措施,从而改善患者的疾病结局,提升生活质量。