金鹏飞 包婕 乔晓梦 杨丽勤 胡春洪 王希明
前列腺癌(prostate cancer, PCa)是男性第二常见的恶性肿瘤,其发病率逐年升高,2020年全球新增约140万例[1]。多参数MRI(multi-parameter MRI, mpMRI)是PSA升高患者的主要检查手段。在接受靶向活检之前行mpMRI检查可在减少穿刺针数的同时提高有临床意义前列腺癌(clinically significant prostate cancer, csPCa)的检出率[2-3]。前列腺影像报告与数据系统(prostate imaging reporting and data system, PI-RADS)旨在促进mpMRI扫描、解读和报告全球标准化,其作为评估前列腺可疑病灶的规范化方法被广泛应用于临床[4]。2019年更新的PI-RADS V2.1评分系统解决了前一版(PI-RADS V2.0)在多年使用和研究中存在争议的问题[5],除了明确成像技术指标外,修订后的评分系统还对移行区中“不确定性病变”的评分进行了细微更改,并更新了扩散加权成像(diffusion weighted imaging, DWI)序列评分标准,以减少评分为“不确定”病变的数量,从而进一步提高了mpMRI的诊断效能。对于“不确定性病变”是否需要行活检和进一步治疗尚未有明确的临床规定[6]。PI-RADS V2.1评分系统的准确度更高,可以减少不必要的活检,但需要避免遗漏csPCa。本研究就PI-RADS V2.1和PI-RADS V2.0评分系统对移行区csPCa的诊断价值进行了对比分析。
回顾性收集我院2017年2月至2019年2月临床疑确诊为PCa且行3.0T mpMRI检查患者的资料,纳入标准:①MRI扫描条件满足PI-RADS推荐标准;②PSA升高或直肠指检阳性;③病理结果由MRI-经直肠超声融合引导前列腺靶向活检(MRI-transrectal ultrasonography fusion-guided prostate-targeted biopsy, MRGB)获得。排除标准:①MRI显示病灶位于外周带;②mpMRI和MRGB相隔6个月以上;③MRI检查前接受过临床干预。最终筛选出123例符合条件的患者,患者年龄47~89岁,平均(68.2±6.23)岁,PSA平均水平(10.17±5.48)ng/ml,MRI与MRGB间隔时间平均(36±19)d。
采用日本日立公司实时超声多影像融合导航系统(Real-time Virtual Sonography naVigation, RVS),机器型号为HI VISION Noblus / TopicPath。在穿刺之前,将DICOM格式的MRI图像数据导入RVS超声主机,对整个前列腺和MRI可疑病灶进行标注及分割。然后在屏幕上以尿道内口、苗勒管囊肿等解剖标记匹配mpMRI图像和实时超声图像。在超声引导下获取融合图像上的目标病灶组织。每个靶病灶至少穿刺2针,由操作者根据病灶大小、位置和靶向准确性决定是否增加穿刺针数。靶向穿刺完成后,常规行12针系统穿刺[7]。由一位有15年经验的泌尿外科病理医师在未获得MRI结果的情况下给出所有标本的病理诊断并记录每个癌灶的Gleason评分。根据2014年国际泌尿病理学会(Internation Society of Vrological Pathology, ISUP)修订的Gleason分级系统[8],csPCa定义为病灶Gleason评分≥7;Gleason评分=3+3定义为无临床意义前列腺癌(clinically insignificant PCa, ciPCa),将其与良性前列腺增生(benign prostatic hyperplasia, BPH)归为同一组分析。
采用有32通道体部相控阵线圈的SIEMENS MAGNETOM Skyra 3.0T超导型MR扫描仪,扫描序列包括 T1WI、轴面 T2WI(不压脂)、矢状面 T2WI、冠状面T2WI、DWI(b=100、800、1500 s/mm2)和动态对比增强T1WI(dynamic contrast enhanced-T1WI, DCE-T1WI)。根据PI-RADS V2.1评分系统设定具体扫描参数(表1)[5]。DCE扫描时,1次扫描15~20层,扫描时间分辨率5.8 s,扫描64个时相,扫描时间7 min,第3个动态扫描时相结束后经肘静脉注射对比剂钆喷替酸葡甲胺,注射流率3 ml/s,剂量0.1 mmol/kg。
表1 多参数MRI扫描序列及参数
由两位低年资(3年)和高年资(10年)前列腺MRI诊断经验的医师在未获得病理结果的情况下根据PI-RADS V2.0和PI-RADS V2.1独立评估每个病灶T2WI、DWI和DCE序列图像,并完成PI-RADS评分。当同时存在两个及以上病灶时,选择PI-RDAS评分最高者或长径较大者为主病灶。因PI-RADS V2.1要求至少在两个T2WI平面上评估移行区病灶的形状和边缘特征,故由轴位和冠状位图像联合给出T2WI评分。
采用Kappa检验分析PI-RADS V2.0和PI-RADS V2.1系统评估者之间的一致性。计算两个版本评分系统诊断移行区csPCa的灵敏度、特异度、准确度、阳性预测值和阴性预测值。在计算诊断效能时,根据预设的临界值对数据进行二分类:对于两个PI-RADS版本,评分≥3分定义为影像学阳性。使用McNemar检验比较两个版本灵敏度、特异度和准确度的差异。根据病理结果,绘制受试者工作特征(receiver operating characteristic, ROC)曲线并计算曲线下面积(area under the cure, AUC)。采用Delong法比较两个版本的AUC。以P<0.05表示差异有统计学意义。
纳入研究的123例患者中csPCa 39例,ciPCa 10例,BPH 74例。39例csPCa中,ISUP 2级(Gleason评分=3+4)12例,ISUP 3级(Gleason评分=4+3)16例,ISUP 4级(Gleason评分=4+4、3+5、5+3)6例,ISUP 5级(Gleason评分=4+5、5+5、5+4)5例。病灶直径范围8.1~23.2 mm,平均直径(10.3±4.3)mm。
两位医师应用PI-RADS V2.0评分时一致性适中(Kappa值=0.590),应用PI-RADS V2.1的Kappa值为0.654,一致性较好。在PI-RADS V2.0中,两位医师对42例病灶的评分不一致。在PI-RADS V2.1中,对28例病灶的评分存在分歧。PI-RADS V2.1中两位医师间病灶评分的比例较PI-RADS V2.0更为接近。对于低年资医师,PI-RADS V2.0中45例评估为3分,其中10例被重新定义为PI-RADS V2.1中的2分。对于高年资医师,74例PI-RADS V2.0中评为2分的病灶里有16例被PI-RADS V2.1重新分类为1分(10例)或3分(6例),15例PI-RADS V2.0中3分病灶里有1例降为PI-RADS V2.1中的2分(表2)。
表2 两位医师对两个版本PI-RADS的评分变化情况及病理结果对照
低年资医师使用PI-RADS V2.1与PI-RADS V2.0诊断移行区csPCa的灵敏度分别为94.9%、97.4%;高年资医师则为94.9%、87.2%,二者差异均无统计学意义(P=0.482、P=0.204)。低年资医师使用PI-RADS V2.1诊断移行区csPCa的特异度和准确度分别为63.1%、73.2%,较PI-RADS V2.0的52.4%、66.7%更高(P=0.001、P=0.030)。高年资医师两个版本间诊断csPCa的特异度及准确度分别为79.8%、82.1%和84.6%、83.7%,差异均无统计学意义(P=0.500、P=0.501)。对于低年资医师,PI-RADS V2.1的AUC为0.918,高于PI-RADS V2.0(AUC为0.901,差异有统计学意义(P=0.043);对于高年资医师,PI-RADS V2.1与PI-RADS V2.0的AUC分别为0.948、0.949,差异均无统计学意义(P=0.511)(表3,图1)。
以PI-RADS≥3分为诊断阈值,共有17例病灶在PI-RADS V2.0和PI-RADS V2.1二分类评估结果中存有异议。PI-RADS V2.0评估结果的错误率为64.74%(11/17),包括8例假阳性结果(低年资医师7例,高年资医师1例,PI-RADS评分3分)和3例假阴性结果(高年资医师3例,PI-RADS 评分2分)。PI-RADS V2.1评估结果的错误率为35.3%(6/17),包括3例假阳性结果(高年资医师3例,PI-RADS评分 2+1分)和3例假阴性结果(低年资医师3例,PI-RADS评分2分)(图2、3)。
表3 PI-RADS V2.0与PI-RADS V2.1对移行区csPCa诊断效能比较
图1 两位医师使用PI-RADS V2.0和PI-RADS V2.1诊断移行区csPCa的ROC曲线图
A:轴位T2WI,显示左侧移行带可疑稍低信号区,边界欠清(箭头所示);B:冠状位T2WI压脂,显示病灶包膜不完整(箭头所示),低年资医师根据PI-RADS V2.0将该病灶评分为3分、高年资医师的评分为2分,两位医师根据PI-RADS V2.1均将该病灶描述为包膜不完整的结节,评分为2分;C:DWI呈明显高信号;D:ADC呈明显低信号。综合C、D图,DWI评分为4分。低年资医师PI-RADS V2.0总体评分为3分,高年资医师为2分;两位医师PI-RADS V2.1总体评分均为3(2+1)分图2 MRI示左侧移行带PCa(Gleason评分=3+4,83岁,PSA 9.45 ng/ml)
本研究以MRGB病理联合系统穿刺结果为标准比较了PI-RADS V2.0和PI-RADS V2.1对移行区csPCa的诊断效能,以及不同评估者之间的诊断一致性。在PI-RADS 评分中,3分是区分csPCa与ciPCa最常用的阈值,其敏感性较高,通常用来确定患者是否需要靶向活检,多项研究证实了将PI-RADS评分≥3分作为诊断阈值对移行区csPCa的检出能力[9-10]。本研究病例中BPH和ciPCa共84例,csPCa 39例,其中ISUP 2级12例,ISUP 3级16例,ISUP 4级6例,ISUP 5级5例,符合移行区PCa的发病率及风险分层特点[11-12]。当两位医师的PI-RADS评分存在差异时将影响临床决策,无法明确MRGB的适应证。本研究发现,两位医师之间PI-RADS V2.1不同评估结果的组合数量低于PI-RADS V2.0中的组合数量,且PI-RADS V2.1的Kappa值高于PI-RADS V2.0,这说明应用PI-RADS V2.1评分系统评估的一致性优于PI-RADS V2.0,使低年资医师阅读图像后能给出与高年资医师相近的评估结果,有助于减少分歧,降低临床医师决策难度。此外,PI-RADS V2.1中五种评分的病灶数目较PI-RADS V2.0更加接近,原因可能是PI-RADS V2.1中细化了T2WI 1分和2分的诊断标准,并将DWI评分引入T2WI 2分和3分病灶作为参考,部分病灶会由2分升级为3分(DWI≥4分)或由3分升级为4分(DWI≥5分)[13]。值得注意的是,低年资医师采用两个版本对病灶的评分重合度较高,仅有部分病灶评分最终发生了改变,我们认为原因可能是修订后的T2WI标准,如“有几乎完整包膜结节”或“结节间均匀低信号”,对没有经验的评估者来说仍较难把握。
本研究发现,无论是低年资医师还是高年资医师,应用PI-RADS V2.1与PI-RADS V2.0评分系统对病灶评估均有较高的灵敏度,差异无统计学意义,说明PI-RADS V2.1对提高csPCa诊断率作用有限。原因可能是对于移行区病变,新定义的T2WI评分为2,DWI评分为4或更高的病变将总体评分由2分提升为3分。然而,符合这些标准的病灶在临床工作中很少见[14],在本研究中仅占4.9%(6/123)。此外,我们还发现PI-RADS V2.1可以提高低年资医师对移行区csPCa诊断的特异度、准确度及AUC(P<0.05),但是对高年资医师的影响不显著(P>0.05)。这些结果与Tamada等[15]报告PI-RADS V2.1比PI-RADS V2.0有更高的特异度和准确度一致。本研究中低年资医师根据PI-RADS V2.0评分为3分的病灶有10例降级为PI-RADS V2.1的2分,真阴性率为90%(9/10)。PI-RADS V2.1正确地诊断了11个PI-RADS V2.0中两位医师诊断结果为假阳性或假阴性的病变,同时只误诊了6例PI-RADS V2.0中正确诊断的病变。导致这些结果的原因可能是PI-RADS V2.1建议将非典型BPH结节从3分降至2分,对T2WI 1~3分结节内部和周边特征的判读标准作了细化和规范,以及在确定T2WI评分为2分的不典型病变进行PI-RADS评分时引入DWI标准,可能会进一步提高mpMRI对BPH、间质性BPH和csPCa的鉴别诊断[16]。然而,PI-RADS V2.1中1~3分病变与组织病理学改变之间的关系有待进一步研究,以证实PI-RADS V2.1可提高诊断效能的科学性。虽然PI-RADS V2.1未提高高年资医师对移行区csPCa诊断的特异度、准确度及AUC,但随着PI-RADS V2.1中移行区病变基于T2WI的1分和2分病灶的定义发生了根本性的变化,可能会影响1到2分病变的分布情况。在PI-RADS V2.0中,呈圆形且包膜完整典型的BPH结节被评分为2分,而在PI-RADS V2.1中,这些结节被评分为1分。在本研究中,有8例移行区病灶在PI-RADS V2.0中被评为2分,在PI-RADS V2.1中被降级为1分,所有这些结节在活检后均被证实为BPH。这一变化构成了新版本的一项重要改进:典型增生结节极不可能是Gleason评分≥7的csPCa,因此现在被归类为1分病变,通常不建议对其进行活检。虽然这一改变可能不会影响大多数患者的预后,但对于PI-RADS评分1分或2分的病变通常都不进行活检,这就提高了影像学报告结论的可靠性,并可以防止临床风险因素较高且没有可疑MRI病变的患者进行不必要的活检[17]。
本研究的局限性:①本研究为回顾性单中心研究,患者数量相对较少,研究结果需要更大样本量的多中心研究进一步验证。②病理结果由MRGB联合系统穿刺获得,未与前列腺根治术后全组织病理逐层对照。既往研究表明,同一病灶穿刺病理与术后病理可能存在差异,导致csPCa诊断假阳性或假阴性结果[18]。③仅评估PI-RADS V2.1对移行区csPCa的诊断效能,未将外周带病变纳入研究。尽管PCa在外周带发病率较高,本研究仍专注于移行区病灶的研究,原因是PI-RADS V2.0在诊断移行区肿瘤时存在评估者间一致性较差、癌症检出率较低以及包括T2WI在内的多项评估标准(尤其对3分病变)模糊不清等问题。④未探索PI-RADS V2.1评分与Gleason分级之间的联系。
综上所述,PI-RADS V2.1具有更高的评估者间一致性,并且有助于提高低年资医师诊断水平;此外,PI-RADS V2.1将移行区典型BPH结节和不典型BPH结节有效区分,从而更大程度减少了不必要的穿刺。因此,与PI-RADS V2.0相比,PI-RADS V2.1更适合在前列腺活检之前检测移行区中csPCa。