张君颀 耿红全
随着对先天性肾盂积水自然病程的了解,我们认识到并非所有肾积水都会引起患肾功能受损,部分肾积水可长期保持稳定或自行缓解。因此,先天性肾盂积水患儿出生后的诊疗方案以保守观察为主,有明确手术指征的肾积水患儿才进行手术治疗。然而,该诊疗方案历经几十年仍存在诸多争议,争议热点包括:各项检查手段对梗阻和肾功能受损的诊断能力、手术干预的指征和时机以及哪类患者能从手术中获益。
目前肾积水的主要检查手段包括超声、同位素肾图、核磁共振等。对患者数据分析后得出的临界值、比值、分级和积分系统均可用于判断哪些肾积水需要手术,而哪些可以继续观察随访。目前没有在诊断的敏感度和特异度上占据绝对优势的某一种诊断指标。机器学习等较新的数据分析方法正逐渐应用于肾积水诊断领域,帮助提高超声和肾动态显像的诊断价值。与此同时,对各类生物标志物的探索工作也正在开展。
APD为肾脏中部横断面上肾门水平两个实质边缘之间的距离,是临床上常用的评价肾盂扩张程度的连续型变量。较多文献论证了APD可用于诊断梗阻和预测结局。Coplen等[1]开展的前瞻性研究以胎儿期最大APD>15 mm预测先天性肾盂输尿管连接部梗阻(ureteropelvic junction obstruction,UPJO),得出敏感度为73%、特异度为82%;Dias等[2]结合胎儿期最大APD和生后早期APD串联指标预测患儿是否需要接受手术,得出敏感度为100%、特异度为86%。还有不少文献报道了APD可用于预测肾积水术后肾功能恢复情况,术后监测APD对鉴别梗阻复发具有一定意义[3-5]。目前APD是我国大部分医院最常用于指导临床的超声指标,虽然单项指标很难达到较高的诊断准确率,但是我们仍应尽量减少不同中心和不同超声医师测量方法差异引入的误差,保持超声测量标准的统一性和可重复性,尽可能保证APD的诊断价值(尤其是在长期纵向观察APD变化的情况下)。
除肾盂分离外,超声能提供的重要信息还包括肾盏扩张和肾皮质、肾实质等情况。虽然它们独立预测肾功能的价值不高,但这些信息联合肾盂分离可能有助于我们更全面地判断肾功能状态并预测结局。肾盂皮质比(pelvis/cortex ratio,PCR)为超声冠状面最大APD与纵向面最大皮质厚度的比值,Babu和Sai提出以PCR≥12诊断UPJO,得出敏感度为92%,特异度为100%[6]。Rickard等提出肾实质肾积水面积比(parenchyma to hydronephrosis area ratio,PHAR)的概念,为超声纵向面上肾实质面积与肾集合系统面积之比,预测手术的正确度为0.81。其他类似的比值/指数包括肾积水指数(hydronephrosis index,HI)[8]、肾盏实质比等[9]。这些指数、比值虽然涵盖了更多信息,但提升诊断准确性的能力有限。
SFU(Society for Fetal Urology)和UTD(urinary tract dilation)分级是目前临床上最常用的肾积水分级方法,SFU按照肾盂扩张程度、肾盏是否扩张和肾实质是否受压将肾积水分为4级;UTD根据APD、肾盏扩张、肾实质厚度、肾实质外观、输尿管异常和膀胱异常情况将肾积水分为3级。目前临床上常以SFU分级来指导肾积水产前咨询和生后管理方案制订。UTD分级相较于SFU所增加的内容对UPJO诊断的帮助有限,不乏文献证明SFU和UTD的危险度分级结果相似,对于临床结局的预测能力也相似[10,11]。这两种分级方式简单直观,虽然与临床结局相关,但预测能力不强;且作为分类变量,在纵向观察中判断变化趋势存在困难(尤其是中重度肾积水,同一分级内不同个体的肾积水严重程度存在较大变异)。后来出现了一些改良的分级方式,Onen[12]提出了AGS (alternative grading system)分级法,按照该方法SFU Ⅰ级和Ⅱ级归入AGS 1级,SFU Ⅳ级根据肾实质受压的情况分为AGS 3级和AGS 4级;Santos等[13]提出结合APD和肾盏分离的分级方法,将通常判定为中度肾积水的APD区间细分为6~9 mm和9~15 mm。虽然这些方法可对中重度肾积水做进一步分级,但在预测临床走向和结局的准确性方面也没有显著的提升。
随着机器学习协助图像识别和数据分析技术的发展,目前这类方法也被应用于超声领域。Cerrolaza等[14]对肾积水的超声数字图像进行量化图像分析,提取了尺寸描述参数、几何形态描述参数和曲率描述参数3类共131个参数,分别用支持向量机(support vector machine,SVM)和Logistic回归模型进行分析,最终发现SVM的预测能力最好(AUC=0.94),优于Logistic回归和传统的SFU分级方法。这种方法充分利用了一次超声检查获得的所有图像信息,通过量化图像分析提高测量的准确性,通过机器学习提高预测诊断的能力,由此可见机器学习与超声图像的结合可能是今后对肾积水风险进行预测的一个选择。
肾图中利尿前图像可以帮助我们做到患肾功能评估的可视化,并根据示踪剂进入肾盏肾盂前在每侧肾实质的相对积聚情况计算得出分肾功能(differential renal function,DRF)。DRF是目前指导临床决策最可靠的指标,通常认为,单侧肾积水DRF低于35%~40%或连续两次肾图间DRF下降超过5%可作为手术指征。目前有些研究者推崇无论肾积水基线数据如何都应先行保守治疗的观点,因为他们观察到部分首次肾图DRF<40%的患者随访后DRF回升至40%以上[15]。然而,Assmus等[16]研究指出首次肾图DRF下降仍是后续肾功能进一步下降和需要手术干预的危险因素,OR分别为3.2和1.9。利尿肾图具有一定辐射(辐射强度低于静脉肾盂造影和增强CT),需要开放静脉和镇静,费用相对较高,医生在做决策时要权衡好以上因素与保守等待过程中肾功能丢失的可能。此外,临床医生对利尿肾图图像的细致判读,技术细节(尤其是对肾脏和背景示踪剂活性感兴趣区域的人工勾画)对保证DRF准确性也非常重要。
半排时间(t1/2)是通过利尿后时间-活性曲线计算得到的参数。通常t1/2<10 min被认为是非梗阻,介于10~20 min为中间状态,>20 min为梗阻。但这个评判标准来自于成年人或有相关症状的大龄儿童,不一定适用于婴儿和无症状肾积水儿童。新生儿期肾脏尿液生成和排泄状态处于动态变化的过程,肾脏集合系统的容量和顺应性也在变化,首次肾图中判定为梗阻的肾积水病例在第二次肾图中可能表现为非梗阻,反之亦有可能[17]。Arena等[18]开展的远期随访结果显示,约2/3排泄功能差且DRF>40%的UPJO病例不需手术。此外,利尿后早期和晚期的排泄状态也存在差异,两个完全不同的排泄曲线可能计算出相似的t1/2。因此,仅以t1/2指导临床决定并不可靠,尤其是对于婴儿期肾图。
30 min清除率(C30)由利尿后时间-活性曲线得出,是指使用利尿剂30 min后示踪剂的清除百分比;如果C30<80%,则在患儿维持直立位前和维持直立位15 min后各采集一次1 min静态肾图,以获得重力辅助直立引流清除率(Cup)。C30和Cup是比t1/2更有意义的单项指标。Sussman等[17]在对SFU 3级和4级肾积水进行纵向观察的过程中发现,首次肾图中以C30<73%预测肾积水进展需手术干预的敏感度为87%,特异度为66%;以Cup<43%预测的敏感度为97%,特异度为43%。在连续肾图中Cup的随时间变化差异比t1/2和C30小[19]。
虽然肾动态显像常被认为是评估UPJO的金标准,但仅凭一次肾图很难诊断出有临床意义的梗阻(即能够引起肾功能受损的梗阻)。如前所述,肾积水病情处于动态变化的过程。t1/2和C30是由排泄曲线算得的参数,但不能代表排泄状态的全貌,两个不同的排泄曲线可能会计算出相似的t1/2,但这些排泄指标同时也与患儿难以统一的水化状态相关。因此,从动态的角度分析利尿肾图,将每一次有创检查能获得的信息尽可能挖掘利用,以提高诊断效率,这也正是机器学习可以应用的方向。Blum等[20]提取利尿后排泄曲线形状的45项特征指标并对排泄曲线进行小波分析(wavelet analysis),将有意义的变量引入SVM进行判别训练,最终通过机器学习获得的诊断准确率为93%,灵敏度为91%,特异度为96%。
功能核磁共振(functional magnetic resonance urography,fMRU)检查可以了解肾积水的3个方面信息:肾脏梗阻的程度、肾功能的情况以及肾积水的病因。fMRU主要观察三个相:第一,造影剂前形态研究;第二,先后静脉注射造影剂钆双胺和利尿剂呋塞米进行功能学评估;第三,再次注射造影剂行血管造影和分泌性尿路造影。fMRU能整合解剖结构(集合系统扩张情况、肾盂的外形和旋转、是否存在迷走血管压迫等)和功能学评估(分肾功能和排泄曲线)的内容,被称为“一站式”影像检查,而且不存在电离辐射。
一些研究通过对比发现,fMRU和同位素肾图所计算得到的分肾功能结果一致性佳,Rohrschneider等[21]报道两者相关系数为0.92,Marcos等的前瞻性研究报道两者的相关系数为0.93,且fMRU的诊断结果与常规超声联合肾图的诊断结果在78%的病例中达到一致[22]。也有部分研究认为fMRU对分肾功能预测的准确性不如肾图,Claudon等[24]开展的多中心研究结果显示fMRU与同位素肾图计算DRF在中度肾积水中的一致性尚可,而在重度肾积水中fMRU的DRF相较肾图平均下降4%。fMRU对尿路形态的呈现较为清楚客观,尤其在鉴别合并输尿管病变和重复集合系统方面具有优势。而且,fMRU可以帮助在术前判断UPJO的病因,对异位血管造成外源性UPJO的诊断准确率高于CT[24]。然而,fMRU中肾功能评估的准确性也依赖于外源的后处理软件,这是限制其广泛应用的壁垒。
肾积水的诊断和随访中需要连续行超声检查,有时需要多次行同位素肾图,很多研究者将目光投向生物标志物的研究(尤其是尿液生物标志物),以期发现更加无创、快速、可靠的UPJO诊断方法。UPJO造成肾盂内压力增高,导致肾小管内压力相应增高,肾小管细胞拉伸受损后高表达趋化因子,募集炎性细胞到间质组织发挥功能。这个早期的病理生理过程中,肾小管细胞表达的趋化因子、受损脱落的小管细胞上皮相关蛋白、浸润的炎性细胞相关蛋白以及肾小管重吸收能力下降等因素的作用,可导致尿液中积聚的小分子蛋白均可能进入尿液并被检测到。
活化单核细胞的单核细胞趋化肽-1(monocyte chemotactic peptide-1,MCP-1)在UPJO患儿尿液中较对照组显著升高,行肾盂成形术后又下降稳定于正常范围;Madsen等[25]报道术前尿MCP-1诊断UPJO需手术的曲线下面积(area under curve,AUC)为0.78。肾脏损伤分子-1(kidney injury molecule-1,KIM-1)和中性粒细胞明胶酶相关载脂蛋白(neutrophil gelatinase-associated lipocalin,NGAL)在DRF<40% UPJO患儿尿液中的浓度显著高于DRF正常的肾积水患儿,而后者又显著高于健康对照组;Wasilewska等[26]报道术前尿液KIM-1和NGAL诊断UPJO需手术的AUC分别为0.8和0.814。参与正常肾脏小管发生和小管再生的中介表皮生长因子(epidermal growth factor,EGF)在UPJO手术患者的尿液中浓度显著低于对照组,诊断UPJO需手术的AUC为0.75[25]。其他文献报道在UPJO患儿组中,定量结果显著高于对照组的尿液生物标志物包括:肿瘤坏死因子-α(tumor necrosis factor-α,TNF-α)、转化生长因子-β(transforming growth factor-β,TGF-β)、β2-微球蛋白(β2-microglobulin,β2-M)、调节激活正常T-细胞表达分泌因子(regulated on activation normal T Cell expressed and secreted,RANTES)、血红素加氧酶-1(heme oxygenase-1,HO-1)、血管紧张素、骨桥蛋白、糖类抗原19-9(carbohydrate antigen 19-9,CA19-9)等[27]。目前也有研究利用蛋白质组学技术比较UPJO与对照组的尿蛋白组学数据,筛选差异表达的蛋白进行分析[28,29]。然而,蛋白发生差异表达不等同于其具有优质的诊断价值,建立起可靠、有效的生物标志物并不简单,挑战在于这些生物标志物并非在上尿路发生特异性表达,且UPJO病因多种,梗阻由轻到重可能引起肾脏不同程度的病变,因此很难单独通过一个生物标志物做出诊断。此外,膀胱尿液样本会受到对侧尿液的稀释,肾积水梗阻越重,患侧尿液排泄越少,这可能会影响膀胱尿生物标志物检测的准确性(尤其是对于表达水平降低的生物标志物而言)。而如果取肾盂尿液标本检测生物标志物,便丧失了其无创、简便的优势。对UPJO疾病发生和梗阻性肾病病理生理过程的进一步探索,整合多个有价值的生物标志物进行联合诊断提高灵敏度和特异度可能是后续的研究方向。
UPJO的诊断标准、“梗阻”的定义以及手术指征仍未达成一致,对UPJO诊断和预测结局的研究也在不断涌现,我们在阅读文献时应该对研究设计加以审视。文献报道的灵敏度、特异度和AUC并非都具有绝对的参考意义,需要仔细研读纳入和排除标准、研究变量的评估方法以及结局事件的判定标准,而非单独关注结论甚至主动选择各自偏好的结论,这样才有助于我们判断各诊断方式的真实价值。就研究变量而言,以Dias的研究为例[1],该研究中产前发现的肾积水患儿出生后当天即行超声检查,并以此作为生后基线数据;我们目前的认识是,生后2~3日内患儿处于低容量状态,这会造成肾盂分离的测量误差。就结局事件的选择而言,许多研究以临床是否行手术干预为结局,部分研究以同位素肾图的DRF或排泄情况为结局(如Cerrolaza等[14]开展的机器学习超声图像研究中,结局事件中判断梗阻参考了t1/2),因此结论的推导也存在一定的异质性。
经过十余年的研究讨论,UPJO诊断及随访方案的制定仍存在争议,目前的研究开始寄希望于人工智能,希望人工智能的引入能在这个领域带来突破。对影像学检查进行特征值提取,使用算法大量学习数据的判别和分类有助于给现实中的临床决策提供帮助。联合形态、功能、排泄和生物标志物对UPJO进行预测,开发出早期、准确、微创的诊断模式是未来的研究方向。