乔雪,李静蔚,屈佳乐,陈翰翰,陈宏志
1.山东中医药大学,山东 济南 250355; 2.山东中医药大学附属医院,山东 济南 250014
桥本甲状腺炎(Hashimoto′s thyroiditis,HT)是一种以甲状腺弥漫性淋巴细胞浸润和滤泡破坏为特征,常以甲状腺无痛性肿大,成纤维细胞增殖、钙化和血管增殖为表现的器官特异性自身免疫性疾病[1]。近年来,HT的发病率呈上升趋势[2]。我国有4 000余万甲状腺功能减退症患者,其中约80%由HT引起[3]。《中国甲状腺疾病诊治指南——甲状腺炎》[4]推荐根据甲状腺功能、症状、体征及超声情况对不同时期的HT患者采取甲状腺激素、手术及中药等不同方式的治疗。随机对照试验(randomized controlled trial,RCT)被称为医学领域临床试验疗效评价的金标准[5],而每一项RCT必然对应某些结局指标。随着HT临床试验数量增多,结局指标数量正在进一步扩大。结局指标的不合理选择可能造成科研浪费,影响数据的可信度与再利用价值[6],进一步造成临床试验结果整合、干预措施疗效评价等工作的实施困难。系统梳理HT临床试验结局指标,对明晰其结局指标应用现状及规范判定标准具有重要意义。本研究通过分析HT临床RCT结局指标应用情况,为HT临床研究结局指标的合理选择提供参考。
1.1 纳入标准(1)研究对象:西医[4]及中医[7-8]诊断明确的HT成年患者,对患者性别、种族、国籍、病程、疾病分期及其中医证型不作限定;(2)研究类型:RCT;(3)研究语种:限定为中文、英文。
1.2 排除标准(1)研究对象诊断不明确者;(2)合并其他疾病者;(3)语种非中、英文者;(4)研究类型为非随机对照试验(non-randomized controlled trial,non-RCT)、动物实验或其他基础研究;(5)综述、评论、书籍、会议摘要、系统评价、无法获取全文、重复文献、学位论文,非中文核心、科技核心期刊或科学引文索引(science citation index,SCI)发表的文章,未完成、数据不完整或有误的研究,重复发表或数据相同者纳入结局指标较完整的1篇。
1.3 检索策略以主题词结合自由词的方式,对中国知网(CNKI)、万方(WANFANG DATA)、维普(VIP)、读秀、中国生物医学文献服务系统(SinoMed)、PubMed、Embase、Cochrane Library、Web of Science、Ovid、Scopus、ProQuest 12个数据库,以及中国临床试验注册中心(ChiCTR)、ClinicalTrials 2个临床试验注册中心进行检索。检索时间限定为各数据库/临床试验注册中心建立至2022年3月。英文检索词:“Hashimoto Disease”“Hashimoto Struma”“Hashimoto Thyroiditides”“Hashimoto′s Syndrome”“Hashimoto′s Struma”“RCT”等;中文检索词“桥本甲状腺炎”“桥本氏甲状腺炎”“桥本病”“桥本氏病”“慢性淋巴细胞性甲状腺炎”“随机对照试验”及“随机”。中、英文检索词根据数据库的特点进行适当调整。如CNKI检索式:主题=桥本甲状腺炎OR主题=桥本氏甲状腺炎OR主题=桥本病OR主题=桥本氏病OR主题=慢性淋巴细胞性甲状腺炎AND主题=随机对照试验OR主题=随机OR主题=中英文扩展(RCT)OR(题名=桥本甲状腺炎OR题名=桥本氏甲状腺炎OR题名=桥本病OR题名=桥本氏病OR题名=慢性淋巴细胞性甲状腺炎OR题名=随机对照试验OR题名=随机OR题名=中英文扩展(RCT)(模糊匹配)。
1.4 数据提取参照选择标准,由2位研究者独立筛选、提取数据,并交叉核对。采用NoteExpress v3.6.0.9155文献管理软件进行原始研究管理,建立HT临床RCT数据库。剔重、浏览文献相关内容后,最终纳入具有代表性的原始研究进行分析。若遇见分歧,通过协商解决,存在差异时由第三方决定。2名研究者采用Excel 2021软件建立标准化表格并进行资料提取。提取信息包括:(1)基本信息:标题、作者、发表年份、收录期刊等;(2)结局指标:指标具体名称;(3)干预措施:具体名称及疗程;(4)方法学:随机方法、盲法;(5)其他:样本量、疾病分期、中医证型、诊断标准、中医证候疗效判定标准、偏倚风险评估等。
1.5 偏倚风险评价依据改良Jadad评分量表[9],由2名研究者实施研究偏倚风险的评价。具体包括随机序列产生、分配隐藏、盲法、撤出与退出等4个维度,总分4~7分为高质量研究,1~3分为低质量研究。
1.6 统计学方法描述性分析治疗HT临床RCT的基本特征、偏倚风险评估,以及结局指标报道情况,采用GraphPad Prism 9软件进行图形绘制。
2.1 文献筛选流程及结果检索12个中、英文数据库及2个临床试验注册中心自建立至2022年3月有关研究,初次检索共获得原始研究3 632篇,将其导入NoteExpress v3.6.0.9155文献管理软件,严格按照纳入与排除标准筛选,经过剔重、阅读题目、摘要及全文,最终纳入158篇文献,其中中文141篇,英文17篇。
2.2 基本特征
2.2.1 文献发表年份158篇文献发表年份1998—2022年,近5年发表文献约占文献纳入总量的43.04%,说明HT临床研究逐渐受到重视。文献发表年份情况见图1。
图1 文献发表年份情况
2.2.2 诊断标准应用情况纳入的158篇文献中,133篇报道了HT的西医诊断标准,排名前3位的有:68篇采用《中国甲状腺疾病诊治指南》[4],13篇采用森田陆标准[10],6篇采用《内科学》[11]。61篇报道了中医诊断标准,排名前3位的有:43篇采用《中药新药临床研究指导原则》[8],11篇采用《中医病证诊断疗效标准》[12],5篇采用《中医内科学》[13]。24篇文献中、西医诊断标准均未报道。
2.2.3 样本量158篇文献研究共纳入15 220例患者。样本量29~356例,平均样本量96例。
2.2.4 干预措施158篇文献中,运用中西医结合治疗者94篇,单纯西医治疗者44篇,单纯中医治疗者20篇。中、西医类干预措施频次排名前15者见表1、表2。
表1 中医类干预措施应用情况 (次)
表2 西医类干预措施应用情况 (次)
2.2.5 疗程158篇文献中,疗程范围2周~18个月,其中疗程≤1个月者7篇,1~3个月者103篇,3~6个月者41篇,>6个月者6篇,疗程不明确者1篇。
2.2.6 疾病分期92篇文献报道了HT疾病分期[14],其中甲状腺功能正常期39篇,甲状腺功能亢进期12篇,亚临床甲状腺功能减退期15篇,甲状腺功能减退期61篇。
2.2.7 中医证型48篇文献报道了中医证型,全部证型共22种,具体证型及频次见表3。
表3 HT中医证型 (次)
2.3 偏倚风险评估依据改良Jadad量表[9]对纳入的158篇文献进行偏倚风险评估,其中高质量研究95篇,低质量研究63篇。各研究不同项目得分频次情况及不同年份的分布情况见表4、图2。
表4 改良Jadad量表得分频次 (次)
图2 方法学质量评价情况
2.4 结局指标
2.4.1 指标域158篇文献累计报道结局指标 1 379 次,单个研究平均报道结局指标9项。经去重、标准化及归类后,最终得到有效结局指标165种。由于各结局指标差异较大,故将其进一步划分为6个指标域[15]:(1)中医症状/证候;(2)症状/体征;(3)安全性事件;(4)远期预后;(5)理化检测;(6)生活质量。见图3。
注:TCMSSS评分:中医证候评分量表;HAMA量表:汉密尔顿焦虑量表;HAMD量表:汉密尔顿抑郁量表;HADS评分:医院焦虑抑郁量表;SAS量表:焦虑自评量表;SDS量表:抑郁自评量表;Se:血硒;TGAb:抗甲状腺球蛋白抗体;TPOAb:抗甲状腺过氧化物酶抗体;FT3:血清游离三碘甲腺原氨酸;FT4:血清游离甲状腺素;TSH:促甲状腺激素;TMAb:甲状腺微粒体抗体;TRAb:促甲状腺素受体抗体;Th17:辅助性T细胞17;25(OH)D3、25(OH)D、25(OH)D2:维生素D;BMI:体质量指数;sTSH:超敏促甲状腺素;TNF-α:肿瘤坏死因子-α;IL-1、IL-6、IL-8、IL-10、IL-17、IL-23、IL-4、IL-17A、IL-2、IL-2R、IL-1β:白细胞介素;IFN-γ:γ干扰素;TT4:血清总甲状腺素;TT3:总三碘甲状腺原氨酸;hsCRP:超敏C-反应蛋白;SePP1:硒蛋白P1;GE:总能量;CHO:碳水化合物;Pr:蛋白质;Fat:脂肪;FSH:促卵泡激素;LH:促黄体生成激素;E2:雌二醇;P:孕酮;T:睾酮;PRL:泌乳素;WBC:白细胞;VE:维生素E;VC:维生素C;MUI:尿碘中位数;TC:血清总胆固醇;TG:三酰甘油;LDL-C:低密度脂蛋白;HDL-C:高密度脂蛋白;SOD:超氧化物歧化酶;MDA:丙二醛;HbA1c:糖化血红蛋白;CRP:C反应蛋白;Ca:血钙;Treg:调节性T细胞;ALT:谷丙转氨酶;AST:谷草转氨酶;ROI图像及值:甲状腺超声感兴趣区域图像及值;TH1、TH2:辅助性T细胞;GPx3、GPx1:人谷胱甘肽过氧化物酶;PTH:甲状旁腺激素;HOMA-IR:胰岛素抵抗的稳态模型评估;CXCL 10:干扰素伽玛诱导的10千道尔顿蛋白;FSG:空腹血糖;PBG:餐后2小时血糖;MCP-1:单核细胞趋化蛋白-1;Scr:血肌酐;IgG4:免疫球蛋白G4;APN:脂联素;C3、C4:补体;galactin-3:半乳糖凝集素 3;TGF-β:转化生长因子-β;F:皮质醇;INS:胰岛素;VEGF:血管内皮生长因子;NK细胞:自然杀伤细胞;ACTH:促肾上腺皮质激素;PTR:凝血酶原时间比值;APTT:活化部分凝血活酶时间;Fbg:血浆纤维蛋白原;VWF:血管性血友病因子;PAI-1:纤溶酶原激活物抑制物-1;Nesfatin-1:人新饱食分子蛋白1;AIP:血浆致动脉硬化指数;aTregs:激活的调节性T细胞;rTreg:静息调节性T细胞;sTreg:分泌调节性T细胞;Helios:Helios基因;PD-1:程序性死亡受体1。
2.4.2 结局指标频次158篇文献中,理化检测频次最高1 054次,其次为安全性事件142次,症状/体征128次,中医症状/证候48次,远期预后6次,生活质量1次。详见表5。
表5 HT结局指标分类情况 (次)
2.4.3 结局指标使用情况将全部165种结局指标汇总排名,使用频次≥15次的结局指标依次为:TGAb>TPOAb>TSH>FT4>FT3>临床疗效>不良反应>中医证候积分>甲状腺大小>肝功能>肾功能>TT3>相关性分析>TT4>血常规>TMAb=TNF-α。见表6。
表6 HT结局指标使用情况
2.4.4 中医证候疗效指标报道情况纳入的158篇文献中,48篇报道了中医证候疗效结局指标,其中25篇以《中药新药临床研究指导原则》[8]为参考标准,4篇以文献为参考标准,1篇以《中医数学诊断学》[16]为参考标准,13篇未标明参考标准出处,5篇参考标准未报道。
2.4.5 安全性事件报道情况安全性事件包括安全性指标和不良事件发生率。安全性指标报道47次,其中英文文献报道2次,中文文献报道45次;不良事件发生率报道95次,其中英文文献报道4次,中文文献报道91次。
本研究对HT临床RCT进行系统检索,最终纳入158篇文献,并分析其基本特征、偏倚风险及165种结局指标报道情况。现就当前HT临床RCT结局指标的合理性与局限性做初步探讨,并对HT临床RCT结局指标的选用提出个人见解,以求为高质量的HT临床研究提供思路。
3.1 结局指标的合理性
3.1.1 理化检测指标应用频次较高纳入的研究中,理化检测结局指标使用频次最高,为76.43%。将其进一步归类后,又以血液指标应用最多,主要包含甲状腺功能、甲状腺相关自身抗体水平、免疫及代谢等。研究中应用较多的TNF-α、IFN-γ、CD4+、CD8+等均为免疫相关指标。HT临床特征之一为实质淋巴细胞浸润[17],机体免疫功能异常等因素均可能引起疾病的发生[18],各种血清炎性因子参与HT的发病,使HLI-Ⅰ型抗原表达增加,进一步加重免疫功能紊乱[19]。且HT进展为临床甲状腺功能减退时进一步出现血脂异常等代谢紊乱的表现[20]。笔者认为,临床RCT结局指标的选择应将客观指标与主观指标相结合,构建以客观指标为主,主观指标为辅的选取原则。因为客观指标能够佐证主观指标,而且能验证其准确性[21]。
3.1.2 对HT共性问题的重视临床治疗HT的主要目的是控制甲状腺功能减退[17],TSH是检测甲状腺功能障碍的最佳筛查工具[22]。《桥本氏甲状腺炎中西医结合质量控制指标体系北京专家共识(2021版)》[23]认为,甲状腺自身抗体,包括抗甲状腺球蛋白抗体(anti-thyroglobulin antibody,TGAb)与抗甲状腺过氧化物酶抗体(antithyroid peroxidase antibody,TPOAb),其明显增高是诊断HT的重要依据;而甲状腺激素水平,包括游离三碘甲状原氨酸(free triiodothyronine,FT3)、游离甲状腺素(free thyroxine,FT4)、促甲状腺激素(thyroid-stimulating hormone,TSH)、总三碘甲状腺原氨酸(triiodothyronine,TT3)与血清总甲状腺素(thyroxine,TT4)的变化是指导HT患者临床用药与调整剂量的关键。在本次纳入的165种结局指标中,TGAb、TPOAb、TSH、FT4及FT3也是使用频次最高的5项(10.37%、9.93%、9.21%、8.34%、8.19%),TT3与TT4也进入了结局指标使用频次前15名(1.60%、1.38%),表明甲状腺功能及甲状腺自身抗体水平仍是临床治疗HT的重点。
3.1.3 关注HT发病机制及预后HT的发病机制与甲状腺自身抗体水平及相关淋巴细胞(包括甲状腺组织中的B细胞与T细胞)的渗入密切相关[24-25]。研究发现,HT患者血清Th1细胞[26]、IL-17、IL-22细胞因子水平[27]升高;约56%的HT患者IL-12细胞因子升高[28]。结局指标中对于免疫指标的应用体现了临床研究对于HT发病机制的关注,且对于判断预后有一定的指导作用。
由此可见,HT临床RCT部分结局指标选择较为合理,体现了临床研究者对于HT发病机制、诊断、预后、临床合理用药评估及客观指标的重视。
3.2 结局指标的局限性纳入文献结局指标的局限性如下:(1)研究偏倚风险较大:本次纳入的文献中,高质量研究95篇,低质量研究63篇。部分文献未见样本量计算及临床试验注册的情况。(2)结局指标差异大、命名相对不规范、诊断及疗效参考标准不一致:如中医症状体征积分、中医症状评分、中医证候积分、中医症状积分、临床证候积分均为具有中医药特色的HT临床研究的中医证候疗效指标。133篇报道了HT的西医诊断标准,61篇报道了中医诊断标准,24篇中、西医诊断标准均未报道;92篇文献报道了HT疾病分期;48篇文献报道了中医证型。48篇报道了中医证候疗效结局指标,参考标准不完全一致;13篇研究未标明参考标准出处,5篇参考标准未报道。(3)卫生经济学结局指标评价不足:本研究纳入的原始研究均未进行卫生经济学结局指标的论述。
3.3 HT临床结局指标推荐通过对上述158篇文献的分析,笔者认为在实施HT临床RCT时,应首先考虑以下结局指标。
3.3.1 甲状腺激素及相关抗体检测研究表明,约95%的患者存在TPOAb指标的异常[29]。该项检测有助于疾病诊断及临床治疗效果的评估。
3.3.2 甲状腺彩色多普勒超声检查(以下简称甲状腺彩超)《慢性甲状腺炎(桥本氏甲状腺炎)诊断指南》[30]认为,HT的诊断主要依据临床表现、血清学指标及甲状腺彩超。甲状腺细针穿刺细胞学检查及常规石蜡切片非HT常规检查,只有当HT合并甲状腺结节且怀疑/诊断恶变时被考虑。因此,甲状腺彩超的必要性也在于评估HT是否合并甲状腺结节及其良恶性的判定。
3.3.3 中医特色证候指标中医学有系统的舌诊、脉诊、望闻问切及辨证论治体系。中医特色证候指标是中医类临床研究的一大特色,应予以推广。建议在初期制定研究方案阶段,尽可能详尽查阅最新、权威临床诊疗指南、专家共识、相关高质量临床RCT及综述等文献,了解疾病最近研究进展与动态,采用业界公认的中医证候疗效评价标准进行研究方案的制定。同时,建议选用具有国家标准、统一制造的舌诊、脉诊仪进行规范化评判,提高研究结果的客观性与真实性。
3.3.4 安全性评价与随访安全性评价是评估临床研究过程中受试者对干预措施可能造成的危害。安全性评价有助于评价干预措施的安全性,保护受试者的利益,且对于伦理学的发展有推动作用。建议临床RCT在条件允许的情况下均进行干预措施的安全性评价。同时,进行适时随访,进一步观察干预措施的疗效性与安全性。
3.3.5 经济学及生活质量评估研究表明,HT是造成甲状腺功能减退症(以下简称“甲减”)的主要原因[31]。临床甲减期的患者可表现为全身乏力、隐痛等不适,且对生活质量造成一定影响[32-33]。甲减发生时临床常采用LT4替代疗法,部分患者终身应用该疗法可能对家庭经济造成一定影响。卫生经济学评价是国家医保改革政策的重要环节[34],将卫生经济学结局指标纳入HT临床研究分析,对于临床医师诊疗,甚至是国家决策均有重要意义。因此,经济学评估及生活质量评估是有必要的。
3.4 本研究的局限性本研究对CNKI、WANFANG DATA、VIP、读秀、SinoMed、PubMed、Embase、Cochrane Library、Web of Science、Ovid、Scopus、ProQuest、ChiCTR及ClinicalTrials等数据库或临床试验注册中心自建库以来发表的HT临床RCT进行检索,对经过严格筛选并最终纳入的文献进行基本特征、偏倚风险以及结局指标应用情况的分析,并对其结局指标应用的合理性、局限性以及笔者推荐的HT临床RCT结局指标进行了论述,旨在为HT临床研究结局指标的合理选择提供参考。不足的是,本研究仅对HT临床RCT进行纳入,对于队列研究、病例对照研究等其他研究类型未予以纳入,可能造成结局指标纳入不全的问题。且未对中医与西医治疗HT的结局指标进行对比分析,存在一定的局限性。下一步将加入其他研究类型的补充研究,如加强对医师、患者等人群的问卷调查研究,为临床治疗HT结局指标的合理选择提供参考。
综上所述,当前临床治疗HT结局指标具有理化检测指标应用频次较高,对HT共性问题较为重视,关注HT发病机制及预后的合理性,尚且存在结局指标差异大、命名相对不规范、诊断及疗效参考标准不一致、卫生经济学结局指标评价不足等局限性。结局指标是客观反映干预措施实际价值的重要依据[35]。因此,建议研究者选择具有临床意义的、规范的HT结局指标,开展HT临床核心指标集的建立工作,提高临床研究质量。