何秋时 综述 郝宗耀 审校
泌尿系结石几乎在全年龄段发病率居高不下,且在急诊中占比很高。一方面,结石患者入院时常伴随肾绞痛、梗阻、尿路感染等合并症;另一方面,泌尿系结石如不及时干预,易进展为慢性肾脏病、尿毒症等[1-2],这对泌尿科医师的诊疗水平无疑是一种挑战,要求医师在更短的时间内制定正确的临床决策。结石评分系统应运而生,其通过患者入院资料及影像学检查结果,对患者的一般情况和结石难度进行快速评估,达到指导临床医师做出诊疗决定的目的,大大提升结石患者接受个体化诊疗的效率[3]。近年来,结石评分系统层出不穷,但临床医师普遍缺少对其统筹的认知,鲜有在临床上的使用。因此,将各类评分系统进行统一描述,寻找其共性及特性是非常有意义的,有利于结石评分系统在临床上的普及,使患者从中受益。
在结石评分系统中有一些普遍被提到的常见变量,这些变量可能会影响到手术的复杂性和结果,主要包括以下几项:
1.1 结石负荷结石负荷在既往研究[4]中是预测结石评分系统结果中最重要的因素。结石尺寸可以作为大多数泌尿科医师估计手术复杂性及手术结果的指标。
1.2 结石位置结石位置对于结石清除率的影响是显著的。各结石评分系统中,对于不同位置的结石,都对其进行了不同分级或赋值。下盏结石常常给手术增加难度,这一点是公认的[5]。
1.3 解剖畸形解剖畸形对于手术结果的影响主要体现在经皮肾镜取石术(percutaneous nephrostolithotomy,PCNL)中,尽管尚无一致意见,但目前依然被反复讨论[6]。重复肾、马蹄肾、肾盏憩室等解剖畸形对手术难度的影响应被设计为大样本的队列研究。
1.4 手术史及手术经验目前只有腔道泌尿外科协会临床研究办公室(Clinical Research Office of the Endourological Society,CROES)列线图[7]将手术史及手术经验纳入了评分考虑。患者存在手术史可能提示结石此前治疗失败,结石复杂程度高,影响手术成功率[8];术者经验也是结石手术成功与否的重要影响因素[9]。
1.5 鹿角形结石众多结石评分系统都对鹿角形结石相当重视,因其往往需要更复杂的手术操作,甚至需要多通道手术及多期手术来处理。然而,对于鹿角形结石的评判是主观的,并没有明确的定义,观察者之间存在个体差异。
1.6 通道长度通道长度主要指皮石距离,即在PCNL术中皮肤到结石的距离。较长的皮石距离主要见于肥胖患者,会增加建立手术通道的难度,改变实时透视定位的有效性,延长手术时间[10]。不仅如此,皮石距离的增加也给穿刺扩张,固定手术通道带来了挑战,甚至会降低肾镜的可操作性。目前只有S.T.O.N.E结石评分系统[11]将此指标纳入。
1.7 结石密度结石密度通常由亨氏单位来表示,即泌尿系CT中报告的CT值。更高的CT值代表结石更加致密。高密度结石更难被钬激光或气压弹道等工具击碎,增加手术难度,降低清石效率,使得结石残留和术后并发症的发生显著增加。该指标在PCNL和输尿管软镜碎石术(flexible ureterorenoscopy,F-URS)结石评分系统中均有涉及。
结石评分系统在其发明之初,主要的对象是PCNL,针对其他手术方式,尤其是F-URS评分系统兴起得更晚[12],这与近年来手术方式的发展趋势也是相符的。可以将上述结石评分系统进行归类,主要适用于PCNL的系统包括:S.T.O.N.E评分系统[11]、Guy′s评分系统[13]、CROES评分系统[7]、S-ReSC评分[14];主要适用于F-URS的评分系统包括:RUSS评分系统[15]、R.I.R.S评分系统[16],有无结石评分系统在不同术式里均适用,需要更多后续研究来证实。
3.1 S.T.O.N.E结石评分系统S.T.O.N.E结石评分系统于2013年建立[11],其主要通过5项来自于术前成像的可重复性变量来评定结石复杂程度及患者情况,分别是结石尺寸、皮石距离、梗阻水平、受累肾盏数目和亨氏单位,均是具有临床相关性和可重复性的指标。
当结石评分系统在临床具体应用时,依然会有某些方面的不足,主要表现在以下方面:相较于结石尺寸、皮石距离等客观变量,梗阻水平则是一项主观评分项目,并无区分肾积水水平的客观划分标准。对于肾脏梗阻水平的判定会因为评分者的主观因素造成偏倚[17]。另一方面,S.T.O.N.E结石评分系统将无肾积水赋予低分值,这一点值得商榷,无肾积水对于手术通道建立难度的提升已形成共识[18],PCNL常规需要建立人工肾积水通道。因此,无肾积水是否应该重新赋值以更高的得分,需要更多的临床数据支撑。最后,由于结石的异质性,亨氏单位是通过创建一个圆形甜区(region of interest,ROI)来测量的,该ROI需要尽可能的包含多数结石,最小化相邻的软组织,提取结石的平均密度。大多数结石,尤其是片状结石,结石中心到外缘的密度差异较大,在测量上常带来较大的误差[19],目前也尚无证据证明CT值的临界点为最佳。
3.2 Guy’s结石评分系统Guy’s结石评分系统[13]在临床实践中使用相对广泛。该系统依托于既往已发表的数据,结合了多位高级泌尿外科医师意见,以结石位置和肾脏解剖特点为评分标准,将肾结石分为四个等级。Ⅰ级:中下极或肾盂孤立结石,肾脏解剖正常;Ⅱ级:上极孤立结石,肾脏解剖正常;多发结石,肾脏解剖正常;肾盂孤立结石,肾脏解剖异常;III级:多发结石,肾脏解剖异常;肾盏憩室结石;部分鹿角结石;IV级:脊柱畸形;脊髓损伤;完全鹿角形结石。与上文提及的S.T.O.N.E结石评分系统不同,Guy’s结石评分系统是基于腹部立位KUB平片为资料来源的,后文将提到的CROES列线图也与之类似。有相当多的文献报道了Guy’s结石评分系统与结石清除率的相关性,但目前尚无确切证据说明其与术后并发症发生率之间的联系[20-21]。
同时,Guy’s结石评分系统也有不完善之处。该评分系统没有纳入结石尺寸、密度、成分等指标,评分相近的结石可能手术难度相差很多。再者,该系统对于脊柱畸形的患者评级过于严苛,无论其结石大小,统一定性于Ⅳ级。是否需要增加该评分系统的等级梯度需要后续研究探索。
3.3 CROES列线图CROES列线图[7]的发明时间较前两种结石评分系统较晚,其在2013年被提出。它纳入了全球96个机构的2 806例肾结石患者的围术期数据,是一种以统计学为基础的多元Logistic模型。该系统在开发时是作为Guy’s评分的改良版,故其核心目的在于预测结石清除率。参与该评分系统的指标主要包括结石负担、肾盏位置、结石计数、医院技术水平,且CROES列线图是第一个在连续尺度上对风险分级的评分系统。
CROES列线图的不足之处也值得讨论。首先该系统以结石尺寸作为反映结石负荷的唯一标准,但众所周知,结石的成分密度同样是影响结石手术难度的重要指标。再者,该系统作为一个通用于各类手术方式的结石评分系统,缺乏对于影响PCNL难度的特意指标,如皮石距离、肾积水情况等,对PCNL处理结石的预测能力有限。另外,对于CROES列线图能否预测术后并发症的发生,目前意见不一。最后,CROES列线图较其他结石评分系统更复杂,构建和使用难度均更高。
3.4 S-ReSC结石评分系统S-ReSC结石评分系统[14]有其特色,其设计者的初衷及要求即简洁。该系统最早是为PCNL设计,旨在通过一项单一指标来预测结石清除率。结石分布的复杂性被认为是影响PCNL成功率的最重要因素。整个肾脏被认为是一个9点系统,9个特定的肾盂肾盏位置各视为1个点(即肾上盏、肾上盏前部的肾小盏、肾上盏后部的肾小盏、肾盂、肾中盏前部的肾小盏、肾中盏后部的肾小盏、肾下盏、盏前部的肾小盏、肾下盏后部的肾小盏)。当结石累及各肾盏时,即记上相应的分值。1~2分为低分,3~4分为中等,>5分为高分。
在S-ReSC评分的基础上,Jung et al[22]针对F-URS术对此评分进行了改良。对于F-URS术中操作难度更大的,也更难自发排出的下盏结石,改良S-ReSC评分进行了新的赋值,即将肾下盏、盏前部的肾小盏、肾下盏后部的肾小盏各记2分。S-ReSC评分系统的优点主要体现在其操作简单,可重复性强,仅仅通过术前CT即可快速完成评分[23]。但是,由于其过度追求简洁,预设结石分布的复杂性为预测手术成功率的唯一变量,使其可靠程度降低。举例来看,临床中常有因体外超声波碎石效果不佳来寻求手术处理结石的患者,该评分系统会对此类患者赋予极高分值。行体外超声波碎石后,结石往往分散于多个肾盏,但因此认为该结石非常复杂显然是不合理的。是否可以通过适当增加变量来改善该系统可靠性值得后续深入研究。
4.1 RUSS结石评分系统RUSS作为一项评估F-URS术后清除率的结石评分系统,于2012年被建立。该系统基于一项纳入了207例患者的回顾性研究[15]。赋值指标包括:结石的尺寸大于 20 mm,结石位于肾的下极且肾盂漏斗角度(interpeduncular angle,IPA)小于45°,结石多发于不同肾盏,肾脏解剖畸形。RUSS结石评分系统是一种较为成熟的评分系统,在全球应用广泛,较其他结石评分系统更被认可。IPA作为一项新的赋值标准,在RUSS结石评分系统中被首次提出,这对后续很多评分量表都有启发作用。值得一提的是,RUSS结石评分系统对于结石清除的界定标准与其他系统有所差别,术后1个月结石残余小于1 mm可被系统认为结石清除。
RUSS结石评分系统的不足主要体现在以下方面:首先,其对于结石清除的标准有别于其他评分系统,故与其他系统合用时会产生不便。再者,它将结石尺寸作为衡量结石负荷的唯一标准,忽略了其他指标,如密度、成分等。增加上述指标能否对该量表进行改良,值得后续讨论。最后,该系统对于结石尺寸赋值的临界点为20 mm,实际在临床实践中,体积较大的结石并不被推荐以F-URS碎石,有证据显示≥20 mm的结石平均需接受2、3次的F-URS来清除[22]。如何增加该量表的适用范围还值得后续研究。
4.2 R.I.R.S结石评分系统R.I.R.S结石评分系统在直观上与S.T.O.N.E结石评分系统类似,都是通过对患者各方面指标进行评分,累计总分以反映结石的复杂程度[16]。赋值项包括:(R)肾脏结石密度,(I)下盏结石,(R)受累盏颈长度,(S)结石负荷。该系统主要适用于RIRS手术,对PCNL的预测效能尚无研究明确。该系统受到RUSS结石评分系统的影响,将IPA放入了评分细则中,并以30°为限,赋予不同的分值,有一定创新性。该系统的不足之处有以下几点:首先,与S.T.O.N.E评分类似,基于CT平扫的量表相较于腹部立位平片的量表在使用上相对复杂。再者,该量表对于PCNL是否有预测能力尚无明确结论。最后,该量表未考虑肾脏集合系统畸形的情况,毫无疑问的是,肾脏集合系统畸形会给F-URS手术提升难度。
F-URS评分系统有其自身的特点,例如其会增加下盏结石的赋值。相比于面向PCNL的评分系统,此类评分系统在考量项目上更简洁。虽然更少的评分项目某种程度上降低了量表的效能,但考虑到F-URS本身较为安全,又有证据显示此类量表可以出色地预测结石清除率[24],故并无必要增加过多的项目来追求此类量表在术后并发症上的预测能力。在量表设计时,使用简便和效能优秀两方面都应该被考虑。
尽管近年来不断有新的结石评分系统问世,但依然没有一种结石评分系统在临床上广泛应用,多数医疗机构仅将其作为科研工具,并未作为临床工具常规应用于患者。但结石评分系统的优势和意义是毋庸置疑的,至少在以下几个方面中得到了体现:① 准确识别患者,客观评价患者术前情况,合理预测患者临床进程。② 提供比较不同术式的新思路,便于优化各类术式和新旧术式的对比。③ 客观预测手术难度,利于完善分级诊疗及转诊制度。④ 增进学术交流,促进科研成果产出。如上述,推广结石评分系统的使用是有意义的。目前通用的结石评分系统基本上已经在效能和简便性上达到了可观的水准,如何在各医疗机构中普及使用将是后续主要问题。
近年来,又有学者以机器学习方法作为一种新的临床预测模型,用于预测PCNL后结石清除状态,并取得了不错的成绩。Aminsharifi et al[25]在2020年首次提出了此方法,并将其成果与Guy’s评分和CROES列线图进行对比,受试者工作曲线下方区域面积(area under curve,AUC)显著较高。后又有Zhao et al[26]用4种机器学习方法分别作为预测PCNL术后结石清除率的模型,证实每一种机器学习方法都展现出了优于S.T.O.N.E评分的能力。后续需要更多大样本的研究来验证机器学习方法的预测能力,同时探索其可否应用于F-URS,这也许会成为未来的研究热点所在。
综上所述,结石评分系统的出现为泌尿外科医师高效率做出临床决策提供了新工具。结石评分系统基于患者入院检查,可以在短时间内对患者的一般情况和结石难度进行评估。无论是PCNL或F-URS,均有适合的结石评分系统来指导诊疗进程。但同时各结石评分系统也存在一定的不足之处,需要结合多中心、大样本的临床研究对其进行验证及改良。目前结石评分系统多作为一项科研工具而非临床工具,如何普及结石评分系统在临床上的使用,如何规范结石评分系统的使用方式,将成为未来的研究热点。