冯天笑,李康健,于大伟,孙婉钰,符碧峰,冯敏山,王平*
神经根型颈椎病(cervical spondylotic radiculopathy,CSR)是由于颈椎间盘组织退变及其继发性病理改变累及神经根,出现相应节段的上肢放射性疼痛、麻木、无力等临床症状[1]。中国人群颈椎病的患病率高达17.3%[2],且呈年轻化趋势,严重影响患者生活质量。CSR在各型颈椎病中发病率最高,为60%~70%[3]。中医学认为CSR属于“项痹病”范畴,作为保守治疗的重要组成部分,手法治疗可通过放松颈项部肌肉,解除局部痉挛,纠正关节移位与紊乱,调节颈椎内外源性结构稳定,恢复动静态力学平衡,有效调整“筋出槽,骨错缝”的病理状态[4]。近年来,随着手法治疗CSR的临床研究和循证评价不断增加,其有效性和安全性逐步被证实[5-6]。以颈椎扳动类手法为代表的研究成果被纳入2017年美国物理治疗学会发布的《颈痛治疗国际循证临床实践指南》[7],已获得国际认可。
随机对照试验(randomized controlled trial,RCT)是临床实践指南形成推荐意见的基础证据,是临床疾病疗效评价的金标准[8],目前采用RCT评价手法治疗CSR的有效性和安全性的报道较多。选择合适的结局指标可增加研究一致性、减少选择性报告偏倚、提高研究质量和价值[9]。目前同类临床研究结局指标普遍存在不规范、不适用、不公认等问题,影响高质量临床研究证据产生及循证能力建设[10]。本研究通过分析近十年手法治疗CSR的RCT中结局指标的应用情况,分析存在的问题并提出相关建议,以期为该领域临床研究结局指标的选择和应用提供参考。
1.1 纳入标准 (1)研究类型为手法治疗CSR的RCT,且不受语种限制;(2)研究对象为CSR患者;(3)干预措施为任何中医手法类治疗,如手法、推拿、正骨、整脊、按摩等。单用手法或手法联用其他中西医干预措施治疗的研究均被纳入。对照组干预措施不进行限定。纳入研究报告中的所有结局指标。
1.2 排除标准 (1)未明确指出研究对象为CSR者;(2)合并有其他类型颈椎病或其他疾病者;(3)篇幅为单页纸的文献;(4)关键信息缺失、重复报告文献;(5)中文文献中非中文核心期刊或科技核心期刊文献。
1.3 检索策略 计算机检索中国知网、万方数据知识服务平台、维普网、中国生物医学文献服务系统、PubMed、EMBase和Cochrane Library数据库,检索手法治疗CSR的RCT,检索时限为2011年1月至2021年5月。追溯纳入文献的参考文献以补充获取相关文献。中文数据库采用题名或关键词和主题词相结合的方式进行检索,检索词包括“手法”“推拿”“正骨”“整脊”“按摩”“神经根型颈椎病”“神经根性颈椎病”“项痹”。英文数据库采用主题词和自由词相结合的方式进行检索,检索词包括Massage、Massage Therapy、Zone Therapy、Cervical Spondylotic Radiculopathy、Radiculopathies、Cervical Radiculopathies。
1.4 文献筛选与资料提取 由2名研究者严格按照纳入和排除标准独立筛选文献、提取资料并交叉核对。如有分歧,则经讨论或与第三方协商解决。文献筛选时首先阅读文献题目和摘要进行初筛,排除与研究主题明显不相关的文献及非RCT研究,对可能纳入的文献阅读全文进行复筛。资料提取的内容包括:(1)纳入研究的基本信息,包括文献题目、发表年份、第一作者等;(2)研究对象的基线资料,包括各组患者的样本量、年龄、性别、病程等;(3)干预措施具体信息,包括干预措施名称、剂量/频次、疗程等;(4)测量时点;(5)偏倚风险评价的关键要素;(6)所有结局指标。
1.5 纳入研究的偏倚风险评价 由2名研究者根据Cochrane风险偏倚评估工具[11]评价纳入研究的偏倚风险,并分别作出“低偏倚风险”“高偏倚风险”“偏倚风险不确定”的判断。
1.6 统计学方法 采用定性描述的方法分析以下内容:(1)以指标的功能属性为依据,将结局指标按照症状体征、生活质量、理化检查、中医症状/证候、安全性事件、远期预后、经济学评估7个领域进行归类,分析纳入研究的结局指标分类、报告率、各种结局指标的频次;(2)主要结局指标测量时点情况;(3)结局指标组合应用情况;(4)有效率指标的应用与参考标准;(5)纳入研究的偏倚风险评价。
2.1 文献筛选流程及结果 初步检索出相关文献6 301篇,经逐层筛选,最终纳入RCT 66篇[12-77]。文献筛选流程及结果见图1。
2.2 纳入研究的偏倚风险评价结果 围绕误差风险(ROB)工具的7个评价条目评价结果如下:(1)随机序列产生:41项RCT提及随机数字表法(39项)、中央随机系统(2项)被评价为“低偏倚风险”,4项RCT提及就诊顺序(3项)、单双号(1项)被评价为“高偏倚风险”,21项RCT仅提及随机,未明确具体方式,被评价为“偏倚风险不确定”。(2)分配隐藏:3项RCT采用随机信封进行分配隐藏,被评价为“低偏倚风险”,63项RCT未提及分配隐藏方式,被评价为“偏倚风险不确定”。(3)对患者、试验人员实施盲法:3项RCT对患者设置盲法,且盲法未破坏,被评价为“低偏倚风险”,63项RCT未提及盲法及实施方式,被评价为“偏倚风险不确定”。(4)对结局评估者实施盲法:1项RCT对结局评估者设置盲法,1项RCT采用客观性结局指标,被评价为“低偏倚风险”,64项RCT未报告对结局评估者设置盲法,评价为“偏倚风险不确定”。(5)结局数据不完整:50项RCT未报告不完整结局数据,被评价为“低偏倚风险”,16项RCT被评价为“高偏倚风险”。(6)选择性报告偏倚:66项RCT均无试验设计方案,被评价为“偏倚风险不确定”。(7)其他偏倚:66项RCT未报告其他偏倚,且无试验设计方案,被评价为“偏倚风险不确定”,见图2。
图2 纳入研究的偏倚风险图Figure 2 Risk of bias assessment for included RCTs
2.3 结局指标
2.3.1 结局指标分类 本研究纳入的66项RCT均报告了结局指标,干预措施单用手法治疗的有34项研究[15-17,19-22,27-28,35,38-42,45,48,51-53,57-60,63-64,67-71,73-74,76],手法联合针刺治疗的有 9 项[29-30,32-33,43-44,46,50,65],手法联合牵引治疗的有 7 项[25,34,36,47,49,72,75],手法联合中药外治法治疗的有4项[18,31,66-77],手法联合中成药治疗的有3项[24,37,61],手法联合功能锻炼治疗的有3项研究[13,55-56],手法联合中药注射剂[62]、微波[23]、脉冲射频术[26]治疗的各有1项研究,手法联合中成药及中药外治法治疗的有1项研究[12],手法针刺联合牵引[54]、西药[14]治疗的各有1项研究。纳入的研究共采用59种结局指标,共应用229次。单个研究结局指标最多为9个,最少为1个,平均每项RCT结局指标的数量为3项。根据报告的结局指标的功能属性将其分为7类,其中生活质量95次、症状体征64次、理化检查39次、安全性事件12次、经济学评估12次、远期预后5次、中医症状/证候2次。纳入研究的结局指标分类、具体名称、频次及报告率见表1。
表1 纳入研究的结局指标分类、频次及报告率Table 1 Categories,frequencies,and reported rate of outcome used in included RCTs
(续表1)
2.3.2 结局指标测量时点、频次及百分比 使用频次排名前5位的结局指标测量时点见表2。总有效率指标测量时点范围为治疗后7 d~随访6个月,共报告16个测量时点,以测量时点为治疗后14 d(27.08%)为主;疼痛视觉模拟评分法(VAS)评分指标测量时点范围为治疗后7 d~随访6个月,共报告13个测量时点,以测量时点为治疗后14 d(26.67%)为主;NDI评分指标测量时点范围为治疗后1 d~随访3个月,共报告12个测量时点,以测量时点为治疗后14 d(29.17%)为主;不良反应和不良事件指标测量时点范围为治疗后7 d~随访3个月,共报告8个测量时点,以测量时点为治疗后28 d(28.57%)为主;症状体征积分指标测量时点范围为治疗后14~35 d,共报告6个测量时点,以测量时点为治疗后14 d(33.33%)为主。
表2 使用频次前5位的结局指标测量时点、频次及百分比Table 2 Measurementtime points,frequency and percentage of five outcomes mostly frequently used in included RCTs
2.3.3 结局指标组合应用情况 27项RCT同时应用4个及以上的结局指标,14项RCT同时应用3个结局指标,20项RCT同时应用2个结局指标,5项RCT应用1个结局指标。在结局指标的选择中,有3项RCT同时应用VAS评分、NDI评分、SF-36评分及总有效率4个结局指标;有10项RCT同时应用VAS评分、NDI评分及总有效率3个结局指标;有26项RCT同时应用VAS评分及总有效率2个结局指标。频次≥3次的结局指标组合应用情况见表3。
表3 频次≥3次的结局指标组合应用情况Table 3 Combined application of outcomes used at least three times in included RCTs
2.3.4 总有效率指标应用现状 48项RCT报告总有效率指标,其中 22 项 RCT[12,19-20,26,30,32,39,42,45-48,55,57-59,62,64,72-73,75,77]参考《中医病证诊断疗效标准》[78]制定,8 项 RCT[13,23,31,43,49,60,67,71]参考《中药新药临床研究指导原则(试行)》[79]制定,2项 RCT[16,55]参考《第三届全国颈椎病专题座谈会纪要》[80]制定,2项RCT[18,71]参照田中靖久颈椎病20分法评分制定,1项RCT[54]参考《临床疾病诊断依据治愈好转标准》[81]制定,1项RCT[38]参考《脊椎病因治疗学》[82]制定,1项RCT[34]参考《骨科常见疾病诊疗经验丛书:颈椎病及腰腿痛》[83]制定,13 项 RCT[14,24,27-29,40,50-51,56,65,68-69,76]未明确说明参考标准。
随着骨伤事业的快速发展,提升中医骨伤科循证研究水平已成为学科建设的重要目标和方向。本研究基于国内外七大数据库对近十年手法治疗CSR的RCT结局指标应用现状进行分析。通过对纳入的66项RCT进行偏倚风险评估,发现纳入研究的方法学总体质量不高,如部分研究随机序列产生方法错误、缺少临床试验前的注册方案、无法确定利益冲突和样本量计算的过程、研究的结果存在发表偏倚、只报告对研究结果有意义的阳性结果、未报告阴性结果等。在RCT的研究设计中,结局指标的选择是衡量干预措施疗效和价值的重要参考依据,选择不同的结局指标可能会对相同的干预措施得出不同的疗效结论。本研究发现,目前手法治疗CSR的RCT结局指标的应用存在较多问题。
3.1.1 未区分主要和次要结局指标 RCT研究中,结局指标的主次安排是研究设计的重要问题。一般在疗效评价研究中,应将与研究目的关系最密切的结局指标设定为主要结局,以反映主要研究问题及研究实施的优先方向,同时作为样本量估算的重要依据[84]。通常应将RCT的主要结局指标设置为1个,应用多个主要结局指标易在结果阐释时产生问题[85]。本研究纳入的RCT均未区分主要和次要结局指标,多数为不同结局指标的罗列,普遍缺少针对某个主要结局指标的样本量计算的内容。单一主要结局指标的设定可以避免解释多重检验假设产生的问题。
3.1.2 更多关注替代指标,轻视终点结局指标 本研究结果显示,手法治疗CSR的临床疗效评价指标多以生活质量、症状体征等替代指标为主,如VAS评分、NDI评分、田中靖久颈椎病20分法评分、症状体征积分等。对于死亡、残疾、复发等终点结局指标的报告较少。合格的替代指标应为特定治疗与终点结局因果关系链上的主要中间介导因素[86]。尽管选择替代指标可以降低临床研究所需样本量、随访时间、人力物力消耗等,但是若想更好地说明干预措施的价值和临床意义仍应在RCT设计中选择应用终点结局指标。在手法治疗CSR的临床研究中,大量研究难以选择终点结局指标进行观测,这在一定程度上限制了高质量证据的获得,是难以产出高质量临床研究的主要原因之一。
3.1.3 忽视主观结局指标应用时的设盲 本研究纳入的66项RCT中仅3项RCT提及对患者设置盲法,1项RCT提到对结局评估者设置盲法。在临床研究过程中通过设置盲法可以将确定和判断结局时产生的偏倚风险最小化,尤其是对于一些主观性的评价指标如本研究中出现频次较高的VAS评分、NDI评分、田中靖久颈椎病20分法评分、颈椎病治疗成绩评分表、SF-36评分等指标,可能会对结果产生安慰剂效应或霍桑效应。由于手法治疗的特殊性,对患者和治疗人员设盲难度较大。但通过对结局评估者设置有效的盲法,可进一步提高研究质量及结果的可信性。
3.1.4 结局指标数量及组合选择异质性大 本研究纳入的66项RCT共采用59种结局指标,共计应用229次。单个研究结局指标最多为9个,最少为1个,平均每项研究结局指标的数量为3项。66项RCT中有27项RCT同时应用4个及以上的结局指标,14项RCT同时应用3个结局指标,20项RCT同时应用2个结局指标,5项RCT应用1个结局指标。在临床研究中,结局指标数量选择过少不能很好说明干预措施的疗效,过多则易产生错误引导。不同结局指标组合应用时也存在相似子条目重复测量的问题,说明尚缺乏可靠的核心指标规定的相关标准与可参考的核心指标集。
3.1.5 使用复合结局指标评价结局 本研究纳入的66项RCT中有48项RCT采用了总有效率指标评价,对疾病的转归大多分为治愈、显效、有效、无效或优、良、可、差等不同等级,最后多加以总有效率的复合结局指标进行描述,且RCT中报告的治疗效果均为阳性结果,这可能与这种复合结局的评价方式有关。总有效率的参考标准并不统一,部分研究未明确报告参考标准。复合结局指标的评价方式存在过于笼统、主观性强、削弱统计学效能等特点,因此可能会夸大干预措施的疗效及价值[87]。
3.1.6 结局指标测量时点不统一 本研究显示结局指标测量时点差异性较大,频次前5名的结局指标测量时点范围从治疗后1 d~随访6个月,共涉及17个测量时点,测量时点跨度较大。在RCT设计中临床疗效的观测时间设置十分重要,可影响整个研究质量与价值。当前对于临床研究中反映手法优势效应的访视时间尚无统一的认识,对结局指标测量时点重要性的认识不足,尚缺乏相应的参考标准以进一步提升研究设计水平与质量。
3.2.1 做好充分的顶层设计与前期研究 在开展临床研究工作前,需要对疾病的研究现状进行梳理和总结,做好充分的顶层设计与前期研究工作。在研究方案设计时,需要重点考虑结局指标相关内容。首先可通过COMET数据库查找是否已有相关核心结局指标集的建立,然后参考和借鉴国内外高质量的临床实践指南、系统综述和RCT中所选择的结局指标,结合研究目的及干预措施本身确定合适的结局指标。在临床研究开始前可进行小样本量的预试验,尽早了解研究中存在的问题与不足。高质量的骨伤科临床研究一般需要中西医临床专家、影像学专家、临床流行病学与循证医学专家、医学统计学专家等组成多学科协同的研究团队以保障临床研究的质量。
3.2.2 开展手法治疗CSR临床研究的核心结局指标集工作 笔者经过检索COMET数据库,发现目前尚未开展关于CSR核心结局指标集的研制工作。建立中医药临床试验核心结局指标集是解决目前临床研究中结局指标不规范、不统一、不一致等问题的重要途径[88]。建立属于手法治疗CSR的核心结局指标集,并结合中医药理论和中医外治法特色,为手法治疗CSR临床研究选择合适的结局指标和测量工具,将核心结局指标集和相应的测量工具推广到整个同类临床研究中,提高该领域临床研究质量与水平,促进中医骨伤科循证能力的建设。为此建议结合当前中医药临床研究现状及中医药理论特点,参照COMET核心结局指标集研制程序开展规范化研究,建立适合手法治疗CSR的核心结局指标集。
综上所述,本研究通过分析近十年中医手法治疗CSR的RCT结局指标的应用现状,提出在结局指标选择中存在的问题与建议,为研制手法治疗CSR的核心结局指标集提供前期研究基础。
本研究尚存在一定的局限性:本研究仅对近十年手法治疗CSR的RCT结局指标进行分析,未对其他时间范围及临床研究类型的结局指标进行汇总,以及对于结果的解释和推断可能存在一定偏倚。未来研究中可增加其他临床研究类型文献进行补充分析,为构建手法治疗CSR核心结局指标集的建立提供参考依据。
作者贡献:冯天笑、王平负责文章的构思及设计,提出主要研究指标及研究目的;李康健、于大伟、孙婉钰、符碧峰、冯敏山负责文献筛选与数据统计,绘制表格;冯天笑、李康健负责论文起草、初步撰写;王平负责文章的质量控制及审校,并对文章整体负责。
本文无利益冲突。