樊笑 周非非 黄浩歌 张刚强 周帅 陈欣 赵衍斌 刁垠泽 潘胜发 张凤山 孙宇
脊髓型颈椎病(cervical spondylotic myelopathy,CSM)作为常见的老年退行性疾病,已经成为世界范围性的健康问题,为个人和社会带来严重负担[1]。CSM的发病被认为与脊髓受压相关,但确切病理生理机制尚不清楚[2]。目前,CSM的主要治疗手段是通过手术解除脊髓压迫,但手术疗效因个体差异而不同[3-4]。术前,医生主要依据患者症状和影像学参数判定病情严重程度,但这在预测患者疗效时仍有一定局限性[5]。以往的研究表明,年龄、脊髓功能受损程度、症状持续时间等术前因素会影响患者的预后[6-8],但是这些研究多数是基于研究目的和临床经验而进行的患者分类,纳入的患者特征有限,且缺乏对混杂因素的考虑。聚类分析作为一种探索性的数据分析,是指将样本的集合分组为由相似的样本组成的多个类别,使得样本拥有高度的组内相似性和组间差异性的分析过程。在这个过程中,聚类分析能够从样本数据出发自动进行分类,而不必依靠研究者事先给出的分类标准。因此,从机器学习的角度讲,聚类分析是非监督学习的过程。基于非监督机器学习的聚类分析可以改善研究中疾病表型和患者的分类[9-10],纳入更多的临床特征,并且可能揭示既往不明显的数据关联和结构[11]。本研究假设在现有CSM患者中有超越旧的有先验分类的临床相关分组存在,应用分层聚类探索患者类型,对聚类产生的患者类型进行分析,以寻找出针对混杂系统中具有预测意义的术前相关因素,并确定哪些患者有最好的手术疗效。
一、资料
1.纳入与排除标准:(1)纳入标准:①经骨科确诊并行手术治疗的CSM患者;②年龄>18岁;③有完整的术前基线数据以及至少1次短期(≤6个月)随访数据。(2)排除标准:①既往有颈部手术史;②随访时间不符合要求。
2.病例来源:2012年1月至2020年12月在北京大学第三医院骨科接受手术治疗的CSM患者的病例资料。本研究向我院伦理委员会申请并获得批准[伦理号:(2021)医伦审第(160-02)]。
二、方法
1.基线资料:(1)人群特征:性别、年龄、吸烟史、饮酒史。(2)临床症状:麻木、颈肩疼痛、胸腹束带感、足底踩棉感、精细动作减退、步态异常、交感症状。(3)体格检查:肌萎缩、肌力减退、反射异常、病理征阳性、臂丛牵拉试验阳性、椎间孔挤压试验阳性。(4)评分信息:改良日本骨科学会脊髓功能评分(modified Japanese Orthopedic Association score,mJOA)和生活质量Short Form 36(SF-36)量表[12-13],分别用来评估患者颈脊髓功能以及术前生活质量。以上资料中,性别为二分类变量,年龄和评分数据为连续变量;吸烟史、饮酒史以及临床症状和体格检查的数据均以“有/无”定义为二分类变量。
2.随访:本研究纳入术后6个月内的短期随访数据。如果在这段时间内患者有多次随访,则选择距手术时间最远的一个随访节点。随访内容包括mJOA评分和SF-36量表;其中SF-36量表的数据包括生理功能、生理职能、身体疼痛、活力、社会功能、情感职能、精神健康、一般健康共8个维度的评分和SF-36健康变化评分。
3.患者预后评估:本研究以脊髓功能改善率(recovery ratio,RR)作为患者的预后评估。脊髓功能RR=(随访mJOA评分-基线mJOA评分)/(17-基线mJOA评分)×100%[14]。改善率>50%被定义为预后良好[15]。
本研究最终纳入476例CSM患者;男249例,女227例;年龄(52.0±11.2)岁;合并吸烟史者71例(14.9%)、饮酒史者40例(8.4%)。临床症状方面:合并麻木389例(81.7%)、颈肩疼痛106例(22.3%)、胸腹束带感28例(5.9%)、足底踩棉感185例(38.9%)、精细动作减退59例(12.4%)、步态异常40例(8.4%)、交感症状96例(20.2%);体格检查方面:合并肌萎缩49例(10.3%)、肌力减退255例(53.6%)、反射异常43例(9.0%)、病理征阳性337例(70.8%)、臂丛牵拉试验阳性183例(38.4%)、椎间孔挤压试验阳性92例(19.3%)。整个队列mJOA评分和SF-36评分的基线数据和随访数据见表1。
1.分层聚类:476名患者进行分层聚类的结果如树状图所示(图1)。参考聚类误差平方和(SSE)与聚类数k的关系(图2),SSE是所有样本的聚类误差。随着聚类数k的增大,每个类别的聚合程度会逐渐提高,SSE随之变小。当k小于真实聚类数时,k值增大会大幅增加每个类别的聚合程度,相应SSE的下降幅度很大;而当k到达真实聚类数时,再增加k所提高的聚合程度会迅速变小,故SSE随着k值的继续增大而趋于平缓。因此,SSE和k的关系图应形成手肘形状。肘部拐点对应的k值为4,即为本研究的最佳聚类数。表2展示了分层聚类产生的4组患者的评分数据。其中,随访评分是分层聚类纳入的特征值,各组间差异有统计学意义(P<0.001)。对于各组患者的术前评分数据,SF-36生理功能维度差异有统计学意义(P=0.008);mJOA评分差异有统计学意义(P=0.042),其余术前评分数据差异无统计学意义(P>0.05,表2)。
CSM患者人群特征、临床症状、体格检查在各组中的分布差异性见表3。各组患者的人群差异体现在年龄(P=0.021)。术前临床症状差异体现在颈肩疼痛(P=0.044)和步态异常(P=0.012)。术前体格检查的差异表现在各组病理征阳性患者的比例(P=0.006)。其余患者特征的差异无统计学意义(P>0.05,表3)。
表1 患者SF-36评分和mJOA评分的基线数据和随访数据分)
图1 使用沃德联接得到的聚类树状图,其中纵轴为分层聚类纳入的476个患者样本,横轴为各类别的相对距离。图中显示第1个分支有2个明确的聚类,第2个分支有3个聚类,第3个分支有4个聚类
图2 误差平方和(sum of the squared errors,SSE)与聚类数k的肘形图
表2 各组患者的评分数据
各组患者的预后情况主要由手术后mJOA评分的改善率来体现。第2组和第4组拥有较高的平均mJOA改善率。第1组和第3组的平均mJOA改善率较低。各组间差异有统计学意义(P<0.001,表4)。
1.聚类分析的优势:聚类分析是一种无监督的机器学习方法,可以在不同的数据集中发现更多的同质分组[19]。这种方法可以在更贴近现实的混杂系统中识别更冗杂的数据模式,并根据可观测的特征值对患者或者干预方式进行分类。在聚类分析中,确定患者类型和干预类别是一个纯粹的数据驱动的方法,不依赖于先验假设,因此是对监督学习的有效补充。
分层聚类作为聚类分析的方法之一,无需事先人为指定聚类数,并且可以更直观的展示大样本的聚类过程。Ames等[11]提出,使用基于人工智能的分层聚类,可以纳入和同步分析比现有患者分类方案更多的整体患者人群特征、症状因素、影像学和功能评分等。该方法已经被用来描述不同疾病中的患者分组,包括成人脊柱畸形、肺动脉高压、哮喘、精神障碍和恶性肿瘤等[20-23],以及手术干预后患者获益的影响因素[24]。
2.基于分层聚类方法得到的CSM患者类别意义:在选择纳入研究的患者基线数据时,本研究回顾了近几年有关CSM的文献,总结出常见的症状体征,并结合我院数据筛选出现频率较高的颈椎病专科特征,纳入了本研究。在评估患者预后时,mJOA评分量表是目前用来评估CSM患者结局最常用的指标[12]。除脊髓功能外,患者健康相关生活质量的改善从患者角度更直接的展示了其治疗效果。因此,本研究在选择聚类特征时也纳入了SF-36量表的结果。
从分层聚类的结果来看,手术干预可显着改善CSM患者脊髓功能。这与Rhee等[25]的系统回顾的结果一致。受术前因素影响,4组患者的预后情况存在差异。
表3 各组患者的人群特征、临床症状以及体格检查特征
表4 各组mJOA评分改善率及预后评价
人群特征方面,患者预后较好的第2组和第4组,其患者平均年龄更小;而预后较差的第1组和第3组患者对应了较大的平均年龄。早期Matsuda等[26]对17例70岁以上的CSM患者进行了研究,结果显示其康复率显著低于对照组。在一项前瞻性研究中。Furlan等[27]报道了类似的结果。而本研究则表明,这种年龄相关的预后差异在更年轻群体中也存在。Hasegawa等[28]和Holly等[29]的研究则表明,相较于年轻CSM患者,老年患者的手术结果没有明显差异,但是神经系统并发症的发生率较高。这可能是由于:(1)老年人的脊髓经历了与年龄相关的变化,包括c-运动神经元减少、前角细胞数量减少、皮质脊髓束和后索中有髓纤维数量减少。(2)老年患者更可能患有影响生活质量的无关合并症[30]。Kusin等[31]的研究表明吸烟也是影响CSM患者预后的重要因素。但是本研究的聚类分析没有发现类似的趋势。原因可能是:(1)多数患者选择在入院前戒烟。(2)病史中个人史部分采集不细致,导致基线数据不准确,以及本地空气污染对不吸烟者的影响。
临床症状和体格检查方面,对比第2组和第3组患者可以发现,术前更低的步态异常出现率和病理征阳性率也对应着更好的患者预后。Badhiwala等[5]提到的特定症状和体征,可能也是CSM患者预后的潜在预测因素,但是这些因素影响结果的生物学机制尚不清楚。
术前评分方面,Tetreault等[30]的系统回顾提到了症状持续时间、术前脊髓病的严重程度也是CSM患者预后较明确的预测因素。本研究的结果提示术前脊髓病严重程度由SF-36生理功能维度评分和mJOA评分能更好体现。在预后良好的第2组中,这两项评分显著高于其他组;而预后较差的第3组则对应了较差的术前评分。此外,通过对比第3组和第4组患者可以推测,在术前SF-36生理功能维度评分和mJOA评分均较差的情况下,年龄和颈肩疼痛发生率可能是决定患者预后的影响因素。
本研究通过对CSM患者的术后聚类分析,并结合患者的基线资料,筛选出了影响患者预后的术前人群特征和临床特征。在未来的研究中,患者信息量更加庞大,随之而来各种因素对患者手术预后的影响也会更复杂、更多元,而聚类分析有别于队列研究等传统研究方法,能在更贴近真实世界的混杂系统中识别出更有价值的术前相关因素,并基于这些因素在术前进行更准确的疗效预测。
3.研究的局限性:本研究将患者非监督地分为4类,并筛选出了一些可能的CSM患者预后影响因素,有助于为患者术前知情同意提供有用的信息,并辅助医生进行临床决策[16]。但本研究亦存在不足:(1)本研究作为一项回顾性研究,数据来自于单个中心,且具有完整数据的患者仅占25.1%,数据缺失和失访情况较严重。尽管如此,基于对颈椎疾病的类似研究的回顾,已经是一个相对较大的队列[32]。(2)本研究没有纳入术前和随访的影像学数据进行分析,且没有采集患者既往史数据(如糖尿病)、手术数据及其它术后康复治疗数据;这些都可能对患者聚类有一定影响[33]。(3)相较于对多个围手术期时间点的分析,本研究仅纳入了患者术前和术后短期随访的数据,对患者症状持续时间和康复轨迹的描述可能存在局限性[24]。(4)临床研究推荐使用盲法评估。然而,mJOA评分由外科医生评估。这个过程得到的数据很可能会影响实验结果[16]。综上,本研究相关的CSM患者术后疗效仍需多中心、大样本和长期的随访观察加以验证。尽管有上述不足,本研究的结果仍初步验证了分层聚类在研究CSM患者预后影响因素的可行性,有为日后纳入手术信息、影像学信息等更多因素的聚类研究提供参考的意义。
本研究根据术后随访信息进行聚类分析,将接受手术治疗的CSM患者分为4类,代表了4种不同患者预后模式,并从中识别出了有助于预测患者预后的术前因素,即人群特征中更低的年龄、临床症状中更小的颈肩疼痛和步态异常出现率、体格检查中更小的病理征阳性率以及评分信息中更高的SF-36生理功能维度评分和mJOA评分,都指向更良好的患者预后。本研究探索了将聚类分析的方法应用在CSM患者预后影响因素研究中的可行性,为进一步在相关研究中纳入更大样本资料,提取更多患者特征、选取更多随访节点、改进聚类算法提供了参考及研究资料。