冯天笑,李康健,于大伟,何海龙,张君涛,冯敏山,王平*
颈型颈椎病是临床常见病、多发病,临床主要表现为颈项强直、疼痛和功能受限,给患者的工作和生活带来较大影响[1]。近年来,由于低头伏案工作与体力劳动人群的所占比例上升,颈椎病已逐渐代替腰腿痛成为肌肉骨骼系统的主要疾患,且呈年轻化趋势[2-3]。颈型颈椎病是颈椎病的早期阶段,也是治疗的最佳时期。中医手法治疗具有悠久的历史和丰富的临床实践积累,可通过放松颈项部肌肉、解除局部痉挛、纠正关节错位与紊乱,调节颈椎内外源性结构稳定,调整动静态力学平衡,恢复“筋骨平衡”的生理状态[4-6]。因其简单易行、疗效显著、安全性高等优势,已成为保守治疗的重要组成部分。
随机对照试验(randomized controlled trial,RCT)是验证干预措施临床疗效的金标准,是临床实践指南形成推荐意见的基础证据[7]。RCT的方法学质量和报告质量直接影响临床试验结果是否真实可靠,对系统评价结论及临床循证决策产生很大影响。随着中医骨伤科学的发展,大量手法治疗颈型颈椎病的RCT报道已经发表,但报告水平参差不齐,不利于中医手法的推广应用及循证能力建设。临床中物理治疗证据数据库(physiotherpy evidence database,PEDro)量表、Cochrane偏倚风险评估工具常用于评价RCT的方法学质量,临床试验报 告 标 准(consolidated standards of reporting trials,CONSORT)声明2010版常用于评价RCT的报告质量[8-10]。本研究采用以上3种方式及附加指标对中医手法治疗颈型颈椎病的RCT进行质量评价,以客观反映目前中医手法治疗颈型颈椎病RCT质量的现状,为今后提高中医手法临床试验质量及循证能力建设提供参考。
1.1 纳入标准
1.1.1 研究类型 RCT。
1.1.2 研究对象 明确诊断为颈型颈椎病患者。西医诊断标准主要参考《第二届颈椎病专题座谈会纪要》[11]、《第三届全国颈椎病专题座谈会纪要》[12]、《颈椎病诊治与康复指南(2010版)》[13]等制定。中医诊断标准主要参考《中医病症诊断疗效标准》1994版[14]、《中医病症诊断疗效标准》2012版[15]等制定。
1.1.3 干预措施 试验组干预措施以中医手法治疗为主,单独或联合对照组干预措施,手法治疗的频次、时间、疗程不加限制;对照组干预措施包括手法、牵引、针刺、药物和其他常规疗法。
1.1.4 结局指标 对研究报告的结局指标不加以限定。
1.2 排除标准 (1)未明确指出研究对象为颈型颈椎病者;(2)合并其他类型颈椎病或其他疾病者;(3)试验组干预措施不符;(4)综述、理论研究、实验研究、专家经验、个案报道、系统评价、回顾性研究等非RCT文献;(5)重复发表的文献;(6)无法获取全文的文献。
1.3 检索策略 计算机全面检索中国知网、万方数据知识服务平台、维普网、中国生物医学文献服务系统、PubMed、Embase和Cochrane Library数据库,搜集中医手法治疗颈型颈椎病的RCT,检索时限为建库至2021年6月。同时检索谷歌学术、百度学术等网站以补充获取相关文献。中文文献采用主题与全文相结合的方式检索,检索词包括:手法、推拿、正骨、整脊、按摩、颈型颈椎病、非特异性颈痛、机械性颈痛、颈痛、非特异性颈椎病、项痹、随机、随机对照试验。英文文献采用主题词与自由词相结合的方式检索,检索词包括:massage、manipulation、tuina、tui na、chiropractic、manual therapy、manual traction、manipulation therapy、manipulative therapy、cervical spondylosis、cervical spondylopathy、neck pain、neck disorder、mechanical neck pain、nonspecific neck pain、randomized controlled trial、randomized。
1.4 文献筛选与资料提取 由2名经过系统培训的研究者严格按照纳入与排除标准独立筛选文献、提取资料并交叉核对。如有分歧,则经讨论或第三方协商解决。文献筛选时首先将初步检索的文献题录导入NoteExpress 3.0查重后,阅读文献题目和摘要进行初筛,排除与研究主题及类型明显不相关文献后,对可能纳入的文献阅读全文进行复筛,确定最终是否纳入。通过Excel 2010建立文献信息提取表以进行资料提取。资料提取内容包括:第一作者、发表年份、作者单位、期刊、诊断标准、样本量、疗程、干预措施、PEDro量表、Cochrane偏倚风险评估工具、CONSORT声明各项条目相关信息及多中心、伦理审批、知情同意、干预措施质量控制、疗效评价标准、志谢6项附加评价指标。
1.5 文献质量评价 严格遵循PEDro量表、Cochrane偏倚风险评估量表、CONSORT声明各项条目及附加评价指标对纳入文献的方法学和报告质量进行评价。PEDro量表[16]共包括11个条目,每个条目均按“是”或“否”进行评价,评价“是”的个数计为得分,其中纳入标准是否明确不计入总分,则PEDro量表总分为10分,其中总分≥7分为高质量,5~6分为中等质量,≤4分为低质量。Cochrane偏倚风险评估工具[17]评价内容包括随机序列产生、分配隐藏、对患者或试验人员实施盲法、对结局评估者实施盲法、结局数据不完整、选择性报告研究结果、其他偏倚来源,分别做出“高偏倚风险”“低偏倚风险”“偏倚风险不确定”的判断。CONSORT声明2010版[18]分为文题和摘要、引言、方法、结果、讨论以及其他信息6大部分共25个条目,根据文献是否报告,对每个条目做出“是”或“否”的评判,并计算各个条目所占的百分比。为更好地评价中医手法研究的特色及具体实施,同时采用多中心、伦理审批、知情同意、干预措施质量控制、疗效评价标准、志谢6项附加指标对纳入研究进行评价。
为保证评价结果一致性,2名评价人员在正式评价之前接受系统培训。经培训,PEDro量表评价Kappa值(Kappa=0.87,P<0.01)、Cochrane偏倚风险评估工具 Kappa值(Kappa=0.89,P<0.01)、CONSORT声 明2010版Kappa值(Kappa=0.84,P<0.01)及附加指标Kappa值(Kappa=0.93,P<0.01)可信程度为完全可信,表明不同评价者间判断的一致性较高,可以进行正式评价,对仍存在争议的条目提交第三方裁决。
1.6 统计学方法 采用SPSS 23.0软件计算各评价工具评价结果一致性的Kappa值。对提取的数据进行描述性分析,运用Excel 2010计算各评价条目文献数量及构成比,采用百分数表示。
2.1 文献检索流程及结果 初检出相关文献3 080篇,经逐层筛选,最终纳入81篇RCTs,包括中文文献78篇,英文文献3篇。文献筛选流程及结果见图1。
图1 文献筛选流程图Figure 1 Flowchart of the enrollment of RCTs about TCM manipulation for cervical spondylosis
2.2 纳入研究的基本情况 纳入的81篇RCTs中,发表时间为2006—2021年(其中2006年3篇,2008年3篇,2009年3篇,2010年2篇,2011年3篇,2012年4篇,2013年6篇,2014年4篇,2015年3篇,2016年10篇,2017年6篇,2018年14篇,2019年8篇,2020年9篇,2021年3篇),均在国内进行。2006—2014年共发表文献28篇,年平均发表3.11篇;2015—2021年共发表文献53篇,年平均发表7.57篇。由此可见,文献发表数量总体随着时间推移呈现增加趋势,尤其在2015年后研究数量显著增加,中医手法治疗颈型颈椎病RCT的热度逐渐上升。
将81篇RCT的作者单位按照地理位置划分,涉及东部地区57篇(其中福建14篇、广东13篇、上海11篇、浙江6篇、北京3篇、江苏3篇、山东3篇、天津2篇、河北1篇、辽宁1篇)、中部地区14篇(其中河南3篇、湖南3篇、山西2篇、黑龙江2篇、吉林1篇、江西1篇、广西1篇、安徽1篇)、西部地区10篇(其中甘肃3篇、云南3篇、四川2篇、新疆1篇、贵州1篇)。
81篇RCT发表于中文核心期刊8篇,科技核心期刊20篇。
干预措施涉及手法之间比较38篇,手法与牵引比较17篇,手法联合针灸与针灸比较9篇,手法联合运动疗法与运动疗法比较5篇,手法与西药比较3篇,手法与中药酊剂比较3篇,手法与中药药透比较3篇,手法与中成药比较2篇,手法与脉冲磁疗治疗比较1篇,无安慰剂对照和空白对照。纳入研究的疗程为5 d~4周,样本量30~799例。
2.3 纳入研究的质量评价
2.3.1 PEDro量表评价结果 采用PEDro量表评价纳入文献的方法学质量,总分≥7分的高质量文献仅7篇(8.6%),表明大部分临床研究在试验设计及实施方面仍有较多不足,见表1。
表1 颈型颈椎病纳入文献的PEDro量表评价结果〔n(%)〕Table 1 Quality evaluation results of included RCTs about TCM manipulation for cervical spondylosis using the PEDro Rating Scale
2.3.2 Cochrane偏倚风险评估工具评价结果 采用Cochrane偏倚风险评估工具评价纳入文献的方法学质量,结果显示,高偏倚风险文献所占比例最少,低偏倚风险文献次之,大部分条目因为报告信息不全,评为偏倚风险不确定,见表2。
表2 颈型颈椎病纳入文献的Cochrane偏倚风险评估工具评价结果〔n(%)〕Table 2 Quality evaluation results of included RCTs about TCM manipulation for cervical spondylosis using the Cochrane Collaboration's tool for assessing risk of bias
2.3.3 CONSORT声明2010版评价结果 采用CONSORT声明2010版评价纳入文献的报告质量,结果显示,纳入文献对文题和摘要、方法、结果、讨论及其他信息部分的报告率不足,研究的整体质量偏低,见表3。
表3 颈型颈椎病纳入文献的CONSORT声明2010版评价结果〔n(%)〕Table 3 Quality evaluation results of included RCTs about TCM manipulation for cervical spondylosis using the CONSORT 2010 Statement
2.3.4 附加指标评价结果 采用多中心、伦理审批、知情同意、干预措施质量控制、疗效评价标准、志谢6项附加指标补充评价纳入文献的质量,结果见表4。
表4 颈型颈椎病纳入文献的6项附加指标评价结果〔n(%)〕Table 4 Quality evaluation results of included RCTs about TCM manipulation for cervical spondylosis using six additional indicators
随着中医手法被越来越多学者所接受,手法治疗的科学性和有效性逐渐通过现代研究的方式得以验证。其中,RCT作为医学临床研究疗效测评的金标准,试验设计的科学性及试验过程的严谨性和透明性是引导临床试验结果最终向临床决策转化的关键[19-20]。本研究根据国际公认的PEDro量表、Cochrane偏倚风险评估工具、CONSORT声明2010版并补充以附加指标,主要针对中医手法治疗颈型颈椎病RCT的质量进行评价,分析纳入RCT存在的问题,以便为今后中医手法治疗颈型颈椎病RCT的开展提供参考。综合最终评价结果,发现主要存在以下问题。
3.1 试验设计方面
3.1.1 样本量 样本量的计算是根据科学合理的假设来确定试验中所必要的最小样本含量,从而提高检验效能,真实地反映研究的总体效应[21]。合理的样本量在临床试验设计中具有不可忽视的作用,是严谨而有效的研究结果产生的前提条件。样本量过大会增加临床试验的难度,浪费医疗、人力资源,样本量过小则可能得出假阳性或假阴性结果,降低研究结果和结论的可信度[22]。本研究纳入的文献,仅5篇(6.2%)文献报告了样本量计算的具体方法,提示在今后试验设计前应根据文献报道、预试验、相关软件等计算样本量。
3.1.2 受试者 本研究纳入的文献均报告了受试者的合格标准,但绝大部分文献对于目标疾病的诊断标准陈旧且尚不统一,多采用西医诊断标准,忽视中医诊断标准。多数根据国内相关学会、高校医学教材或参考文献中制定的疾病诊断标准执行,导致研究资料在一致性和可重复性上存在一定程度的缺陷。此外,77篇(95.1%)文献明确报告了资料收集的场所和地点,69篇(85.2%)文献记录了具体招募的时间,8篇(9.9%)文献使用流程图报告受试者招募流程,23篇(28.4%)文献报告了受试者随机化后退组和剔除的人数及原因,其余文献未交代受试者招募和流动情况,增加结果偏倚风险。提示今后试验中应参考疾病的诊疗指南、行业标准、专家共识等诊断标准,尽快制订与完善国际公认的疾病诊断标准并推广,全面记录受试者从纳入到结局的信息,增加研究的真实性及可靠性。
3.1.3 随机序列产生和分配隐藏 随机化是保证RCT内部可靠性和科学性的重要因素[23]。随机化的作用是将患者间可能存在的混杂因素平衡,从而避免人为选择性偏倚[24]。本研究纳入的文献仅48篇(59.3%)文献报告了详细、正确的随机方法,其中42篇采用随机数字表法,6篇采用计算机产生的随机编码。27篇(33.3%)文献仅提及“随机”“随机分组”“随机对照”“随机分配”字样,无法对随机方法的正确性和真实性进行评价。6篇(7.4%)文献采用了错误的随机方法,包括4篇按照就诊顺序,2篇按照住院号的单双进行随机分配。仅有11篇(13.6%)文献详细描述了分配隐藏的方法,其余文献未描述分配隐藏,2篇(2.5%)文献报告了随机分配的实施者。随机化的不充分和不正确,会导致研究执行者的主观偏倚,增加选择性偏倚风险,影响研究结果的真实性。提示研究者应加强随机化知识的学习。
3.1.4 盲法实施 有效的盲法实施会使研究结果和结论更具有真实性和客观性[25]。中医手法临床试验属于开放性临床试验,由于手法操作的特殊性,对受试者和医护人员设盲难度较大,一定程度上限制了高质量临床证据的产生,然而可以通过对结局评估者设置有效的盲法,使其不清楚受试者的具体分组情况,尽量降低研究偏倚风险。根据干预措施不同,对受试者设盲亦可实现,如采用同种类型的手法进行对照以保证研究结果的客观性。纳入文献中仅有7篇(8.6%)文献报告应用单盲及具体实施方法,其中3篇(3.7%)对受试者施盲,4篇(4.9%)对结局评估者施盲,其余并未记述。可见多数研究不重视盲法的实施,使得研究结果的真实性和客观性难以得到保证。
3.1.5 统计学方法 本研究纳入文献均报告应用了统计学方法,但多数文献描述不完整或不详细,仅笼统说明不同类型的研究资料使用的统计学方法,未有研究报告任何其他分析如亚组分析和调整分析结果。不正确应用统计学方法常会带来错误的试验结果和结论,影响研究质量。统计学方法表达的不完整、不明确,缺乏其他分析的方法,也提示临床研究者要重视统计方法的描述与表达,提高研究的可信度。
3.2 试验实施方面
3.2.1 干预措施 本研究纳入文献均描述了各组的干预措施及实施方法。试验组干预措施中除手法单独应用外,还包括手法与针灸、运动疗法、中药药透、中药酊剂等联合应用。对照组干预措施包括手法、牵引、针灸、运动疗法、西药、中成药等,未有文献对于选择对照组干预措施的合理性进行描述。纳入文献所描述干预措施的具体实施方法,为颈型颈椎病的临床治疗提供了措施,但由于各研究的手法治疗次数、频次、持续时间等差异较大,且多数文献未对手法医师的资历和背景进行记述,一定程度上限制了临床试验结果的可重复性,不利于达成统一的临床操作规范。
3.2.2 干预措施质量控制 规范化、标准化的手法操作流程是试验实施过程中的重要条件,因此需要进行严格的手法操作质量控制。本研究仅有5篇(6.2%)文献报告了手法操作质量控制措施,包括1篇应用手法测试仪培训、2篇在高年资工作背景医师指导下培训、2篇按照高校医学教材培训。近年来,手法操作的量化评价研究为干预措施的质量控制提供了实施载体,提示研究者可进一步加强手法效应机制的研究,利用多种研究载体建立手法干预的质量控制标准,促进更多高质量临床证据的产生。
3.3 试验结果方面
3.3.1 基线资料 基线资料具有可比性是RCT的前提,试验组与对照组的干预措施不同,需要保证各组间基线水平比较差异无统计学意义,方可进行临床结果的对比分析[26]。本研究纳入的文献均对基线资料做出了报告,主要包括性别、年龄、病程、体质指数、职业、基础疾病等内容,36篇(44.4%)文献通过表格记述了各组的基线资料和特征,便于读者了解基线资料的可比性。
3.3.2 结果数据的完整性 临床试验过程中,受试者可能由于个人、工作、家庭等多种主客观因素的限制致使部分研究对象失访或脱落,导致出现结果数据不完整的情况,从而影响研究结果的真实性及可靠性。因此,临床研究中需要对缺失的研究数据进行意向性治疗分析(intention to treat analysis,ITT)以消除减员偏倚,避免扩大疗效[27]。纳入文献中58篇(71.6%)文献在研究过程中未报告出现脱落或失访病例。23篇(28.4%)文献在临床试验过程中存在脱落与失访病例,其中仅1篇文献进行ITT分析,其余22篇均进行符合方案集分析(per-protocol analysis,PP),降低了研究结果的真实性和可信度。
3.3.3 结局指标和疗效评价 结局指标的主次安排是RCT的重要问题,一般在疗效评价研究中,应将与研究目的关系最密切的结局指标设定为主要结局,以反映主要研究问题及研究实施的优先方向[28]。本研究纳入的文献中仅有1篇(1.2%)文献清楚地区分了主要和次要结局指标,其他研究均为不同结局指标的罗列,未有研究报告结局指标的效应大小及精确性(如95%可信区间)。在结局指标的选择中多数研究更多关注替代指标,轻视终点结局指标。纳入研究中62篇(76.5%)文献报告了疗效评价标准,其中42篇参照《中医病证诊断疗效标准》1994版[14]、9篇参照《中医病证诊断疗效标准》2012版[15]、5篇参照《中药新药临床研究指导原则:试行》2002版[29]、2篇参照《第二届颈椎病专题座谈会纪要》[11]、2篇参照《颈椎病诊治与康复指南(2010版)》[13]、1篇参照疼痛视觉模拟评分(VAS)分级,1篇参照颈痛量表(NPQ)评分下降率制定。多使用复合结局指标如“总有效率”评价结局,存在过于笼统、主观性强、削弱统计学效能等不足,因此可能会夸大干预措施的疗效及价值[30]。
3.3.4 安全性评价 本研究纳入文献中有27篇(33.3%)文献进行了安全性评价,其中25篇文献未报告出现相关的危害及意外效应,2篇文献报告出现了轻微的头晕、颈痛、颈部活动受限等不良反应,因患者不适感较轻,未做特殊处理。缺乏不良反应和不良事件报告常可导致无法对干预措施的安全性和有效性做出全面评价、夸大干预措施的临床疗效、忽视其潜在的危害[31]。提示临床研究者要重视手法操作的安全性评价,以更客观地评价手法干预措施的可接受性与有效性。
3.3.5 选择性报告 发表偏倚将严重影响研究结果和结论的科学价值,世界卫生组织(WHO)领导建立的临床试验注册机制是提高临床试验信息透明化的重要举措,也是减少发表偏倚和提高临床试验质量的有力举措[32-33]。本研究中所有文献未对试验注册及方案信息进行描述,不利于提高中医手法临床研究的透明度和质量,不能判断是否存在潜在的选择性报告偏倚风险。目前手法临床研究报道中阴性结果的文献极为少见,这也极大促使了发表偏倚的产生,影响研究的真实性。因此,研究中需要严格遵守并报告临床试验注册及执行情况以帮助研究者提高试验设计的规范化程度及报告的透明度,提高临床研究质量。
3.4 其他方面 纳入研究中仅有4篇(4.9%)文献可通过标题识别为RCT,增加了RCT被正确标引和识别的难度。77篇(95.1%)文献采用结构式摘要的格式概括了研究目的、方法、结果、结论,其余4篇文献中没有摘要。62篇(76.5%)文献在引言中描述了研究的科学背景和原理解释,71篇(87.6%)文献报告了明确的目的或假设,利于读者理解和参考。纳入文献中仅28篇(34.6%)文献探讨了研究的局限性,其余文献均在讨论部分提到其干预措施的良好效果,并未对试验的局限性进行客观分析。62篇(76.5%)文献提到了试验结果具有推广意义。
从纳入研究的作者单位及资助情况来看,颈型颈椎病的手法治疗受到了国家、医院、学校的重视,有22篇(27.2%)文献报告了基金资助来源,但多数研究仍为单中心、小样本量的疗效评价,仅有5篇(6.2%)文献报告为多中心研究,研究的整体质量和支持力度需要进一步加强。中医学兼具自然科学与人文科学双重属性,是二者的有机统一[34]。因此临床研究中的伦理审批与知情同意不可或缺,体现临床试验的合法性和受试者的权益。此外,志谢也是研究人文特性的反映[35]。本研究纳入文献中报告受试者知情同意的研究有54篇(66.7%),通过伦理委员会审批的研究仅有10篇(12.4%)。有28篇(34.6%)文献提及志谢内容,其中27篇为学位论文,1篇为英文文献。提示今后中医药临床研究工作者要对伦理审批、知情同意、志谢等体现中医药人文特性的条目进行规范性报告。
综上所述,目前手法治疗颈型颈椎病RCT的方法学和报告质量整体偏低。应着重从以下几方面进行改进:保障充足的前期准备工作,严格规范试验设计,不断优化临床试验方案,重视试验方案的登记注册、伦理审批、受试者知情同意等问题;在进行试验前要重视进行样本量的估算,试验结果中要详细描述随机分配方法、分配隐藏方案、盲法实施及试验中受试者退出或脱落的情况;选择国际、国内公认的诊断标准纳入受试者,结局指标尽量选择国际公认的评分量表与客观指标,避免使用复合结局指标和自拟疗效评价标准评价疗效;注重选择合理的干预措施,对手法操作进行严格规范的质量评价;重视统计方案的发表,试验前期需针对试验设计及数据类型选择恰当的统计学方法;注重手法操作的安全性评价;纳入文献多为单中心、小样本量研究,今后应注重开展多中心、大样本量的高质量RCT;注重对中医药临床科研工作者进行科研思维和相关技能的培养。今后需参照PEDro量表、Cochrane偏倚风险评估量表、CONSORT声明相关条目进行临床试验的设计和报告,整体上提升手法临床试验的质量。
作者贡献:冯天笑、王平提出研究思路,设计试验方案,制定检索策略;冯天笑、李康健、于大伟负责论文撰写及修订;李康健、于大伟、何海龙、张君涛、冯敏山负责文献筛选与数据统计,绘制图表;王平负责文章的质量控制及审校,并对文章整体负责。
本文无利益冲突。