吴忆宁,万颖,胡超越,孙亚男,于长禾
腰背痛是一类严重影响患者生活质量的常见病症,可导致患者运动功能障碍,甚至丧失生活自理能力[1],首要发病因素是软组织损伤引起的肌筋膜痛,其他常见原因还包括退行性病变及精神因素[2]。研究指出1990—2015年因腰背痛造成的肢体运动功能障碍增加了54%[3],是目前全球范围内造成运动功能减退的主要原因[4]。中国腰背痛发病率最高的人群为农村人口(64%),其次为教师及工人(50%)[5],可见腰背痛在疾病预防及诊治方面是不可忽视且亟待更多研究投入的问题。国内专家对于慢性腰背痛提出了治疗共识,包括明确诊断、动态评估、药物基础、合理微创、综合康复、心理治疗等六大方面[6]。腰背痛属中医“腰痛”范畴,中医治疗包括内治法及外治法,内治法多为中药口服治疗,外治法包含牵引、推拿、针灸、针刀、拔罐、刮痧、理疗、中药外敷、熏蒸等疗法[7-8],中医治疗方法对于提高疗效、改善患者远期预后具有良好作用。
结局指标的本质在于反映受试者的健康状态或状态变化[9],在临床研究中不可或缺,但目前临床试验存在结局指标选择、测量及报告缺乏一致性、实用性、规范性等问题,造成同领域的研究结果无法进行合并比较[10],因此需加强同领域研究选择报告结局指标的同质性和实用性[11-12]。本课题组前期建立了2015—2019年腰背痛临床研究〔随机对照试验(RCT)、队列、病例系列等〕的数据库,并依据专家共识开发了腰背痛核心结局指标集及其测量工具集[13],以上研究结果突出了具有腰背痛症状的不同疾病所表现出来的共性结局指标,但是并未对不同干预措施(中医、西医、中西医结合)结局指标的异同进行分析比较,结局指标缺少体现干预措施特点的个性内容。因此,本文通过检索近五年的关于腰背痛的临床研究,分析及比较中、西医及中西医结合治疗腰背痛采用不同干预措施的结局指标及测量工具的差异,为未来开展腰背痛相关的临床试验、系统评价、指南开发等研究在选择报告结局指标及测量工具时提供参考。
1.1 文献检索策略 检索Cochrane Library、PubMed、Web of Science、中国知网(CNKI)、万方数据知识服务平台(Wanfang Data)、中国生物医学文献服务系统(SinoMed)、维普网(VIP)数据库中关于腰疼的文献,研究类型为RCT,检索时间从2017—2021年。由于部分临床RCT研究可能未在中英文数据库发表,为避免漏检灰色文献,检索Complementary Medicine Field Trials Register(CRSO)、Back and Neck Review Group Trials Register(CRS)、ClinicalTrials.gov、WHO ICTRP 4个临床研究注册平台,获取相同时间段内注册的所有RCT研究。英文检索词“low back pain”“back pain”“backache”,中文检索词“腰痛”“腰腿痛”“腰背痛”“下腰痛”“尾骨痛”。
1.2 纳入及排除标准
1.2.1 纳入标准 (1)研究中包括中医干预措施(针灸、推拿、导引、中药、理疗、功法等);(2)研究中包括西医干预措施(药物、手术、微创、康复治疗、心理疗法等);(3)中西医结合治疗腰背痛的RCT。
1.2.2 排除标准 (1)未找到全文或无法提取完整数据;(2)重复文献;(3)与本研究主题不相关;(4)未对腰痛、腰背痛、下腰痛等疾病名称明确定义;(5)病例数不足(n<50);(6)文献质量过低(改良Jadad评分<1分)。
1.3 数据提取与分析 由两名研究者按照纳入、排除标准独立筛选文献,提取资料并进行交叉核对。2017—2019年数据由双人审核。对纳入文献提取相关资料,包括发表年份、参与国家、干预措施、测量工具及结局指标。
1.4 文献质量及结局指标评价 采用改良Jadad评分量表对西医、中医、中西医结合治疗腰背痛RCT研究进行质量评价,量表包括随机序列产生、随机化隐藏、盲法、退出与失访4个条目,前3个条目评价选项为恰当、不清楚、不恰当,分别计0、1、2分,第4个条目评价为有、无,分别计1分和0分,总分1~3分为低质量研究,4~7分为高质量研究[14]。本研究的结局指标评价采用已发表文献中使用的6条目结局指标评价标准[15-17],评价结局指标报告条目共6条,分别为:(1)是否明确说明主要结局指标;(2)是否定义主要结局指标;(3)是否明确说明次要结局指标;(4)是否定义次要结局指标;(5)是否阐述所选结局指标的用途或使用方法;(6)是否考虑增强结局指标的质量或结局指标的更新,符合相应条目得1分,不符合得0分,通过相加单条目得分得到结局指标报告总分,满分为6分,≥5分为结局指标报告完整。
1.5 结局指标分类标准 参考既有的临床研究核心结局指标集[13,18]制定结局指标的分类标准,将测量结局指标的工具内容划分为14个结局指标域,分别为疼痛程度、身体功能、整体生活质量、认知功能、情绪功能或幸福感、感知的健康状况、医院相关结局、经济学指标、角色功能、进一步干预、肌肉骨骼和结缔组织结局、不良事件或影响、精神病学结局及其他结局。
1.6 统计学方法 使用Excel录入提取资料,采用SPSS 25.0软件对提取资料进行描述性分析,计量资料首先采用K-S检验分析数据的正态性,非正态分布的数据采用M(P25,P75)表示;计数资料以相对数表示。
2.1 腰背痛临床研究注册及发表概况 检索临床研究注册平台及数据库,得到已发表的RCT文献共2 030篇,不同年份西医、中医和中西医结合发表数量见表1,对比既往数据库[13]未增加新结局指标或测量工具。其中,西医治疗腰背痛的RCT共1 014篇,涉及57个国家及地区,参与国家及地区以中国为多(68.5%),非亚洲国家(美国、加拿大等美洲国家及德国、比利时等欧洲国家)其次(18.6%),后依序为除中国外的亚洲国家(韩国、日本、伊朗等)(7.6%)、其他(2.9%)、除中国外的亚洲国家与其他国家的联合项目(1.6%)、未明确提及(0.6%)、中国与其他国家联合项目(0.2%)。中医/中西医结合治疗腰背痛已发表的RCT文献共1 016篇(中医624篇、中西医结合392篇),参与国家绝大部分为中国(中医91.7%、中西医结合85.5%)。中医治疗腰背痛的干预措施主要为针灸治疗(33%)、物理治疗(19%)及推拿(19%),中西医结合治疗腰背痛的干预措施主要为手术(17%)、运动疗法(14%)、针灸治疗(12%)及中医理疗(12%)。
表1 不同年份腰背痛临床RCT发表数量(篇)Table 1 Number of RCTs about low back pain treated with western medicine,traditional Chinese medicine and integrated traditional Chinese and western medicine published during 2017 to 2021
2.2 腰背痛RCT质量评价及结局指标报告情况
2.2.1 腰背痛RCT质量评价 腰背痛RCT Jadad评分总分西医2(2,4)分、中医2(2,3)分、中西医结合2(2,2)分,超过50%的研究Jadad评分总分为2分,超过10%研究Jadad评分为3分(表2),整体研究质量偏低,原因可能与研究设计不规范以及干预措施较难设盲有关。改良Jadad量表单条目评分分布情况显示,70%以上的研究为随机试验但未描述随机方法(西医73.3%、中医80.1%、中西医结合79.6%),70%以上研究未采用双盲或盲法不恰当(西医71.2%、中医88.0%、中西医结合87.8%);60%以上研究未描述退出与失访的数目和理由(西医64.4%、中医84.0%、中西医结合79.6%),见表3。
表2 纳入RCT研究改良Jadad评分总分分布〔n(%)〕Table 2 Distribution of the total modified Jadad score of included randomized controlled trials by the type of intervention
表3 纳入RCT研究改良Jadad评分单条目评分分布〔n(%)〕Table 3 Distribution of scores for specific items of the modified Jadad score reported in included randomized controlled trials by the type of intervention
2.2.2 腰背痛RCT结局指标报告情况 纳入研究中超过80%结局指标评分为1分,第5条为报告频率最高的条目(西医97.8%、中医97.6%、中西医结合93.6%),报告频率最低的条目为第6条(西医0.2%、中医0.3%、中西医结合0.8%),而西医RCT有14.6%的研究总分为5分(表4、5),结果显示不同干预措施的结局指标报告均不完整、充分。
表4 纳入RCT研究结局指标评价结果〔n(%)〕Table 4 Reporting status of outcome indices in RCTs about low back pain treated with western medicine,traditional Chinese medicine and integrated traditional Chinese and western medicine
表5 纳入RCT结局指标评价总分分布〔n(%)〕Table 5 Total score of outcome reports in RCTs about low back pain treated with western medicine,traditional Chinese medicine and integrated traditional Chinese and western medicine
2.3 腰背痛临床研究结局指标及测量工具报告情况
2.3.1 西医治疗腰背痛临床研究结局指标及测量工具报告情况 西医治疗腰背痛RCT报告的指标数量为1~8个(中位数M=2个),报告的结局指标共239个,涉及71个量表,90个结局指标评价维度(结局域),包含149个实验室及其他指标。报告频率前5位的结局域为疼痛程度(28.2%)、身体功能(28.0%)、医院相关结局(8.0%)、经济学指标(8.0%)、不良事件/影响(8.0%),评价研究结局使用频率前3位的量表为视觉模拟评分量表(Visual Analogue Scale,VAS)/口述分级量表(Verbal Rating Scale,VRS)、Oswestry功能障碍指数问卷表(The Oswestry Disability Index,ODI)、日本骨科协会评估治疗分数(Japanese Orthopaedic Association Scores,JOA),其他较常使用的量表为生活质量评定量表(Quality of Life,QoL)简明版(Short Form 12,SF-12)/(Short Form 36,SF-36)、疼痛数值评定量表(Numerical Rating Scale,NRS/NPRS)、Roland-Morris功能障碍调查表(Roland-Morris Disability Questionnaire,RMDQ/RMD)等,见图1。
图1 西医治疗腰痛RCT评价结局指标测量工具报告频次矩形树状图Figure 1 Rectangular tree map of the frequency of measurements in RCTs about low back pain treated by western medicine
2.3.2 中医治疗腰背痛临床研究结局指标及测量工具报告情况 中医治疗腰背痛RCT报告的指标数量为1~6个(中位数M=2个),报告的结局指标共171个,涉及36个量表,81个结局指标评价维度,其中包括90个中医疗效评价指标,实验室指标及其他指标共81个。报告频率前5位的结局域为疼痛程度(45%)、身体功能(27%)、其他(14%)、整体生活质量(5%)、肌肉骨骼和及结缔组织结局(2%),主要使用的量表包含VAS/VRS、ODI、简化McGill疼痛问卷(Shortof McGill Pain Questionnaire,SF-MPQ)、NRS/NPRS、RMDQ/RMD、SF-12/SF-36,其他较高频使用的结局指标测量工具有日常生活能力评分(Activities of Daily Living,ADL)、腰椎功能测试〔如指地距离(Finger-Floor Distance,FFD)〕及中医症候积分和症状体征积分,见图2。
图2 中医治疗腰痛RCT评价结局指标测量工具报告频次矩形树状图Figure 2 Rectangular tree map of the frequency of measurements in RCTs about low back pain treated by traditional Chinese medicine
2.3.3 中西医结合治疗腰背痛临床研究结局指标及测量工具报告情况 中西医结合治疗腰背痛RCT报告的指标数量为1~12个(中位数M=2个),报告的结局指标共141个,涉及36个量表,涵盖疼痛程度、身体功能、整体生活质量、认知功能、情绪功能/幸福感等维度,包括51个实验室指标、中医疗效评价指标及其他指标(图3)。其中报告频率前5位的结局域为身体功能(39%)、疼痛程度(34%)、其他(9%)、整体生活质量(5%)、肌肉骨骼和结缔组织结局(4%),高频率使用的量表为VAS/VRS、ODI、JOA、SF-12/SF-36、RMDQ及NRS/NPRS,其他使用的测量工具有住院时间、住院费用、影像学测量工具(X线、CT、MRI)、围术期指标、中医证候积分及症状体征积分等。
图3 中西医结合治疗腰痛RCT评价结局指标测量工具报告频次矩形树状图Figure 3 Rectangular tree map of the frequency of measurements used in RCTs about low back pain treated by integrated traditional Chinese and western medicine
2.4 治疗腰背痛RCT结局指标及测量工具的应用情况 西医、中医或中西医结合3种类型RCT的干预措施结局指标评价维度皆以疼痛程度与身体功能结局为主,所运用的测量工具集中在VAS/VRS量表(西医22.16%、中医32.97%、中西医结合30.94%)及ODI/中文版ODI(CODI)(西医15.88%、中医18.74%、中西医结合20.07%),见表6。3种类型RCT共有的高频结局指标及其测量工具为疼痛程度(VAS/VRS)、生理功能(ODI/CODI/RMDQ/RMD)、生活质量(SF-12/SF-36)及影像学结果(X线/CT/MRI)。
表6 纳入RCT高频结局指标测量工具应用情况〔n(%)〕Table 6 High-frequency outcome measurements used in included RCTs
3.1 腰背痛临床研究结局指标及测量工具报告数量和质量 纵观2017—2021年发表的腰背痛RCT,干预措施为西医、中医或中西医结合的研究报告结局指标评分,中位数均为2分,单一中西医结合RCT报告的指标最多12个,指标数量与研究阶段相关,研究初期在不确定何种指标临床效果较突出的情况下,常会选择较多指标评价疗效,但临床研究中评价受试者结局也会因为使用过多结局指标而增加难度、降低结局数据的可靠性[19],因此并非纳入越多结局指标越好[20],而是需要根据研究进展情况考虑是否更新指标或增强指标质量,审慎选择适合的结局指标。
不同干预措施的结局指标报告情况提示多数研究的指标报告均不完整、充分,总分偏低,依据得分条目可知得分因素主要是提及了结局指标的用途或使用方法,失分原因是多数研究并未对主要结局指标和次要结局指标进行区分和定义;说明如何评定疗效是RCT的基本项目[21],因此多数研究无缺失此条目,而区分、定义主要和次要结局指标并非临床研究的硬性条件,研究者可能因缺乏相关概念而忽略报告相应条目。
3.2 中西医腰背痛临床研究中共有的结局指标 考虑中西医结合治疗的干预措施以手术、运动治疗结合针灸治疗及中医理疗为主,同一研究涵盖西医及中医结局,常同时运用相应西医或中医指标域的测量工具,因此未将中西医结合治疗腰背痛的结局指标归为中医范畴。研究结果表示,无论是西医、中医或是中西医结合治疗腰背痛的RCT,结局指标均包括疼痛程度、身体功能、整体生活质量、认知功能、情绪功能/幸福感、感知的健康状况、角色功能、进一步干预、肌肉骨骼和结缔组织结局、不良事件/影响、精神病学结局及其他结局。腰背痛为临床常见病,多数患者常于急性期缓解后反复进行性进展[22],严重影响日常生活及工作,而腰背痛的治疗目标主要为缓解疼痛、恢复功能及预防复发[23]。本研究的结果为腰背痛核心结局指标(Core Outcome Sets,COS)及其测量工具的构建提供文献基础,而且本研究结果与国内外构建的腰背痛COS及其测量工具结果相似。国外已建立的COS及核心结局指标测量工具集,主要包含疼痛、身体功能、生活质量、社会参与、安全性及不良反应、心理健康及患者满意度[18]。现国内初步建立了慢性腰背痛中医临床研究的结局指标集,包含疼痛或不适、运动功能、日常生活活动能力、腰部功能障碍、对生活质量的影响和安全性指标等6个结局指标[13]。
3.3 腰背痛临床研究中医、西医不同的结局指标 中西医有不同的结局指标,与其治疗腰背痛的干预措施特点有关。住院时间为西医RCT对于医院相关结局独有的测量工具,由于西医治疗腰背痛的干预措施多为手术治疗(53%),西医RCT使用的指标尚包含医院相关结局、经济学指标(8%),在不良事件/影响中使用了围术期指标测量工具(8%);中医证候积分/症状体征积分为中医/中西医结合RCT独有的测量工具,由于中医治疗腰背痛的干预措施以针灸、推拿及中医理疗为主,不涉及西医手术治疗,因此缺少医院相关结局、经济学指标、围术期指标等结局指标及其测量工具。中西医在经济学指标和医院相关结局报告的差异可能与RCT注册情况、研究人员认知以及国情有关,中医RCT几乎未在临床研究注册平台注册,缺乏报告规范且中医从业人员对于循证医学概念认知不足[24],而纳入中医文献中超过90%的研究国家为中国,由于在历史、文化背景和思维方式上与其他国家相异[25],加上医疗保健、卫生经济学、人文医疗等概念仍在构建与进步中,因此中医研究在这两个结局中存在缺失。纳入的西医文献干预措施以手术为多(53%),因此关于围术期指标较多,关注了手术治疗的安全性。中医学的特点包含辨证论治,证候则是辨证论治的核心之一,临床中以改善证候相关的体征和症状为治疗要点[26],因此中医证候/症状积分作为评价中医疗效的测量工具应用在临床研究中。目前腰背痛的治疗尚缺少构建腰背痛证候积分的框架论述,作为结局指标应用不普遍,使用证候积分的研究仍存在缺乏统一、通用评价标准的问题,且尚未被国内外学术界认可[27]。
3.4 临床试验相关结局指标研究的方法学要点 规范结局指标分类标准有利于汇总不同疾病的结局指标,形成较大集合,进行横向和纵向的比较。如张英等[28]比较了肺炎相关疾病结局指标的异同,发现相同生理病理基础的不同疾病间存在共性结局指标,而特异性结局指标和疾病特点及干预措施有关,因此可考虑构建相同病种COS,减少研究浪费和使用率低的问题。本研究采用COMET推荐的结局分类标准[29],对不同干预措施报告的结局进行比较和分类,其标准对结局表达一致性较好,且适用于不同疾病,有利于临床数据分类、报告,减少临床中因选择不同结局指标框架使研究难以比较及合并的问题。
经过测量属性评价的工具才具有临床应用价值。本研究中使用其他测量工具的研究以中医为多(西医5%、中医9%、中西医结合6%),大多是临床较少应用的测量工具,容易造成研究结果间的可比性差,相同结果难以在Meta分析中合并,导致临床试验资源未能充分利用;此外,大部分测量工具为自我研制,未经过测量属性评价,导致评价干预效果存在测量误差[30]。临床研究过程中可使用患者报告结局测量工具(Patient-Reported Outcome Measures,PROMs)进行测量工具的测量属性评价,但目前PROMs存在数量多、不全面、不规范的问题,不利于研究人员选择及应用。陈千吉等[31]参考基于共识健康测量工具的选择标准(COSMIN),以ADLS为例归纳出PROMs的选择路径,未来临床研究可参考该路径,使用可信度好、质量高的PROMs评价,选择性能佳、适合中国腰背痛人群的量表。
3.5 腰背痛临床研究中医结局指标体系构建的设想通过分析文献中的结局及其测量工具发现,腰背痛临床试验中存在疼痛程度、身体功能、生活质量等共性结局,同时手术治疗腰背痛的试验注重围术期安全性指标,中医治疗腰背痛的试验注重中医证候评价等。笔者提出设想,针对患者特定健康状态的共性结局,可以采用适用于任何干预或对照措施的COS进行评价,针对这部分内容国内外已构建相应的腰背痛COS。针对干预的特点构建干预特色相关的特色结局指标集(Interventionrelated Specific Outcome Sets,In-SOS),即除外COS结局外,针对具有代表性干预措施(如手术、中药、针灸等)的特色结局的集合,而且目前已经提出了In-SOS相关的研究方法和流程[32]。研究者选择中医治疗腰背痛的结局指标及其测量工具时,在COS推荐测量结局的基础上,针对研究对象从In-SOS中选择最能体现干预疗效特色的结局指标,特别是作为主要结局指标。并通过COSMIN(The Consensus-based Standards for the Selection of Health Measurement Instruments)系统筛选合适的测量工具,保证其测量的效度、信度、反应度[33]。这样研究结果既能突出研究目标干预的疗效特点,又能满足循证医学对重要结局的要求。
本研究可能存在的偏倚:(1)本研究仅针对近5年文献开展研究,存在漏检结局指标的可能,但是近5年文献研究得到的结果与2015年之前的结局指标评价的文献得到的结果[34]相同,而且COMET手册对核心结局指标集中文献研究的年限设定在2年[35],因此本研究可以较大程度上避免由于漏检导致的结局缺失。(2)研究对既往2015—2019年腰背痛临床研究数据库进行筛选并增加了2020—2021年的数据,2017—2019数据经过双人审核,更新数据只有一人进行文献筛选和评价,可能存在主观偏倚,通过对数据反复核对提高了信度。
综上所述,2017—2021年发表的腰背痛临床RCT运用的结局指标及测量工具涵盖范畴广,不同研究间选择指标差异较大,中、西医在同一结局指标域中使用频率较高的测量工具略有不同,且各有相异的结局指标。基于上述结果,本研究提出了未来构建腰背痛COS集与干预相关的特色结局指标集的设想,不同干预措施可在COS基础上选择体现干预特色的结局指标,满足临床试验对主要结局和重要结局的要求。未来进行的中医腰背痛临床研究可扩展不同维度的结局指标,更新结局指标,提高测量工具的测量属性等。
作者贡献:吴忆宁完成了数据更新、提取、分析数据,撰写论文初稿;万颖参与构建数据库;胡超越参与课题设计与讨论;孙亚男、于长禾提出科学问题、假说,设计课题,参与论文撰写和修改;于长禾负责监督管理,对论文整体负责。
本文无利益冲突。