韩超,朱丽娜,刘想,刘伟鹏,张晓东,王霄英
图1 纳入研究对象的流程图。TURP:经尿道前列腺切除术。
良性前列腺增生(benign prostate hyperplasia,BPH)、前列腺炎和前列腺癌是影响男性健康和生活质量的泌尿系统常见疾病,这三种疾病常常合并存在,在症状、体征和实验室检查结果上有一定交叉,不易鉴别,并且多数情况需要长期随访和多次检查。
在前列腺疾病的长期随访过程中,前列腺特异性抗原(prostate specific antigen,PSA)是最常用的实验室检查指标,当PSA<4 ng/mL时前列腺癌的可能性较小,而PSA>10 ng/mL时临床应高度怀疑前列腺癌的可能。但BPH和前列腺炎等前列腺良性病变也会导致PSA结果的异常,一些PSA衍生指标也有助于进一步鉴别前列腺癌与其他前列腺疾病。临床上最受认可的PSA衍生指标是前列腺特异性抗原密度(prostate specific antigen density,PSAD)[1],这个指标是将PSA和前列腺体积(prostate volume,PV)进行综合评价得到。因此,测量前列腺体积、计算PSAD用于鉴别诊断也是影像检查的任务。
常规MRI或超声检查都可以提供前列腺体积的测量值。前列腺影像报告和数据系统(prostate imaging-reporting and data system,PI-RADS)等国际指南对前列腺三维径线,即左右(transverse,RL)径、前后(anteroposterior,AP)径和上下(longitudinal,SI)径的测量有明确的指导[2]。获得径线测量值后,利用椭圆公式计算前列腺体积。但是在实际临床工作中,医师手工测量前列腺径线比较耗时、步骤单一。因此实现前列腺三维径线的自动测量,不仅能减少医师不必要的简单劳动,且能缩短报告时间。
近年来,随着人工智能(artificial intelligence,AI)在影像医学领域的广泛研究和应用[3-5],通过机器学习(machine learning)或深度学习(deep learning),利用前列腺多参数磁共振成像(multiparametric MRI,mpMRI)实现前列腺腺体的自动分割[6-8]和前列腺癌的计算机辅助诊断(computer-aided diagnosis,CAD)[9-11]已基本成为现实。我科已实现在前列腺T2WI上使用U形全卷积神经网络(U-shaped fully convolutional neural network,U-Net)进行腺体分割[8]。本研究利用临床实际病例,以影像医师手工测量的结果为参照,对基于U-Net的前列腺自动分割和径线自动测量的准确性进行验证, 探索此模型植入临床工作流程的可行性。
本研究获得本院伦理审查委员会的批准。将2018年10月7日-2019年4月28日在本院行前列腺多参数(multi-parameter,mp)-MRI检查的291例连续病例的影像和报告纳入分析,最终筛选出符合研究要求的病例共130例(图1)。
U-Net自动分割模型是一个U形全卷积神经网络(fully convolutional neural network,FCN),通过在各卷积层的网络体系结构中进行上下文信息的跨层连接,实现精确的逐像素预测分类。在既往研究中,本单位已训练了分割模型,利用163例患者的前列腺T2WI图像进行验证,分割前列腺整体的Dice系数为92.7%±4.2%[12],模型的输出结果被认为达到临床要求[8]。在此基础上,运用最小体积包围盒(minimum volume bounding box)算法自动获得前列腺径线[13],并与结构式报告对接,软件分割和计算结果自动返回到前列腺PI-RADS结构式报告中[14,15]。
图2 前列腺径线的2种测量方法的操作步骤(图a~c为自动测量,图d~e为医师手工测量)。a)在T2WI上由U-Net模型分割得到前列腺的外轮廓;b)用最小体积包围盒包围三维前列腺后得到长方体的长、宽和高;c)将测量值自动填写到报告中;d)根据PI-RADS指南要求,手工测量前列腺的三维径线;e)手工录入到报告中。
实现上述功能的模型在临床实际病例中的运行过程:在前列腺T2WI每一层图像上,利用U-Net分割模型自动分割出前列腺外轮廓(图2a),通过多层轮廓的累加获得前列腺三维图像(图2b)。在前列腺三维图像的基础上,运用最小体积包围盒的算法规则,得到长方体的长、宽和高分别作为前列腺的RL、AP和SI径(图2c)。
以前列腺PI-RADS结构式报告中获取的前列腺径线值作为参照标准。此径线值由实际临床工作中一线报告医师根据PI-RADS[2]的要求测量前列腺各个径线得到(图2d),RL径在横轴面T2WI前列腺最大层面上进行测量,AP径和SI径在正中矢状面T1WI上测得,填写到结构式报告内(图2e)。测量结果由二线医师审核,并最终记录下来。将结构式报告中记录的径线数据导出为Excel表,作为评价软件测量结果的金标准。
应用SPSS 22.0及Medcalc 15.8软件进行统计学分析。正态分布的计量资料以平均值±标准差(mean±SD)表示。采用配对样本t检验比较两种测量结果的差异,以P<0.05为差异有统计学意义。使用Bland-Altman散点图分析评估软件自动测量和医师手工测量结果的一致性,置信区间取95%。
基于130例患者的前列腺T2WI图像,U-Net分割模型均成功实现前列腺的自动分割,并且自动测得前列腺的RL、AP和SI值。
既往前列腺结构式报告医师手工测量径线的数据中,有1例数据结果异常,测得的RL、AP和SI径分别为43.5、30.3和33.5 cm,信息偏倚较大,剔除此例,因此纳入其余129例的前列腺径线数据进行后续分析。
两种测量方法所测得的前列腺各径线结果见表1。对于前列腺RL径,软件自动测量和医师手工测量结果之间的差异无统计学意义(P>0.05),而对于前列腺AP和SI径,两种方法的测量结果之间的差异有统计学意义(P<0.05)。
表1 两种测量方法获得的前列腺径线值 (cm)
图3 软件自动测量和医师手工测量结果的Bland-Altman散点图。a~c)分别为两种不同测量方法所得前列腺RL、AP和SI径测量值的Bland-Altman散点图。Bland-Altman散点图中X轴为两种测量结果的平均值,Y轴为测量结果的差异值。实线代表两次测量结果差值的均数,极上、极下两条虚线代表95%置信区间的上下限。
运用Bland-Altman 散点图分析一致性(图3),显示两种测量方法得到的前列腺RL、AP及SI径测量值的一致性均较高,仅4.65%的数据位于95%置信区间之外。
其中RL径测量结果的一致性最好,而SI径测量结果的一致性最差。对于RL径的测量,两种方法的平均差异值为0.0 cm,95%置信区间为-1.6~1.5 cm,并且差异值分布相对集中,集中于0.0 cm附近。对于SI径的测量,95%置信区间为-2.1~1.7 cm,差异值分散。
另外,软件自动测量得到的前列腺AP径与医师手工测量值的差值多数为正值,说明软件自动测得的AP径值较医师手工测量普遍偏大。
PV的测量对于前列腺疾病的诊断、鉴别和随访有重要作用。针对前列腺癌患者,mpMRI提供的定性诊断和定量测量结果均是影像检查价值的体现。检出可疑的临床显著癌用于指导穿刺或监测肿瘤变化,提供体积测量值可以用于计算PSAD。在特定人群中,PSAD和PI-RADS评分结合的临床价值优于单独PI-RADS评分。在穿刺前,将PASD与MRI检查结果相结合可提高PI-RADS评分的阴性预期值,提高除外前列腺临床显著癌的能力,可以安全地避免20%不必要的活检[16]。在确诊前列腺癌后,对患者主动监测(active surveillance),将PSAD与MRI结果相结合用于风险分层,可避免不必要的活检,且并不漏检Gleason分级为4级(Gleason pattern 4)的前列腺癌[17]。大量研究结果证实,对前列腺癌患者做出精准治疗决策时,PI-RADS评分和PSAD指标均应被纳入风险分层模型中[18],因此临床测量前列腺体积是必要的。PSAD的参考价值受PSA值的影响。当血清总PSA正常或很高时,PSAD等衍生指标参考价值不大;在PSA 为4~20 ng/mL时,PSAD对BPH、前列腺炎和前列腺癌有一定鉴别作用。
PV测量对BPH患者提供了客观指标,不仅用于制定治疗计划、监测疗效,也对手术方式的选择提供一定信息[19-21]。例如对继发于BPH的下尿路症状患者,前列腺体积较大时(>40 mL)推荐使用5-α还原酶抑制剂,前列腺体积较小时(<30 mL)则推荐使用α-肾上腺素受体阻滞剂。前列腺手术的选择很多,包括消融、经尿道切除、微创手术和开放前列腺根治切除等,其中前列腺体积是选择手术方法的重要参考,对机器人手术特别重要。因此,前列腺大小在前列腺MR影像报告中是必报告内容之一。当然,仅仅测量前列腺整个腺体的体积信息量尚不足,在有条件的情况下分割前列腺不同区带的体积进行测量,其临床价值应该更大,这也是AI工具进一步研发的方向之一。
目前临床上测量PV的方法主要为B超或mpMRI,在图像上测量RL、AP和SI径后,运用椭圆公式(PV=RL×AP×SI×0.52)计算得到[2],此三维径线的测量是对前列腺大小的大致评估。体积测量的验证也可以用手术标本或体模进行,在本单位既往做过类似的尝试,但不适用于本研究。首先,扫描体模获得的MR图像与活体盆腔MR图像的性质不同,分割体模的深度学习模型不能直接用于人体图像的预测。另外,也可以用排水法测量根治手术切除的前列腺标本,但是根治手术范围并非完全按照MR图像所示的前列腺区域切除,所以图像上测量的体积和排水法测量的体积不能完全对应。因此前列腺体积测量的临床研究中,在MR图像上勾画轮廓测量体积被认为是最可行的方法,准确性优于其它临床技术[22]。再者,目前临床工作中椭圆公式的使用符合指南,实际临床过程中PSAD主要由椭圆公式所得体积计算得到,PSAD阈值相关研究也是由椭圆公式而来。因此,我们目前对前列腺分割后三维径线自动测量的临床植入进行了验证。
在临床研究中,使用软件进行在体脏器的体积测量,其金标准的定义常常是有局限性的。目前多数对前列腺分割的研究,是以有经验医师手工勾画的前列腺轮廓作为金标准[23],既往研究结果证明不同经验的医师勾画准确性基本相似,因此在训练分割模型时,我们亦选择了以有经验医师手工分割的前列腺轮廓作为金标准[8]。本研究另外关注的重点为自动测量模型在临床前列腺大小测量实际工作中的应用价值,研究目的为此径线测量模型是否可以达到医师手工测量的水平,从而减少医师的简单重复工作的劳动量;因此,我们选择实际临床工作中医师手工测量的前列腺三维径线为参考标准,观察此模型植入临床工作的“自动化”能力,将模型表现与医师真实工作场景中的表现做比较。虽然不同医生针对同一个前列腺的径线测量结果变异较大,但从患者人群整体平均水平来看,多个医师测量的大量数据的平均准确性是大致相似的。因此虽然本研究的金标准是有瑕疵的,但是尚可接受。
应用此U-Net自动分割+自动测量模型软件获得的径线值,可被自动返回到前列腺PI-RADS结构式报告中,替代了医师手工测量的过程,其精确度在临床上是可接受的。在 “真实工作场景”前提下,此自动分割和自动测量的模型有三方面的优势:节省工作时间,提高一致性,减少低级错误。首先,将此模型植入到临床工作中,在结构式报告中自动填写前列腺径线的测量值,可节省医师写报告的时间。医师测量径线的过程中,要调阅MR图像的各个序列,找到合适的层面,放置ROI等,还需要把测量值手工录入到报告模板中相应的位置,平均至少花费约1 min。而软件自动测量可以认为对医师的时间成本几乎为0。其次,在前列腺随访过程中的多次MR检查都需要测量径线得到PV,医师很难保证每次测量的一致性,而模型的表现基本是稳定的[24]。最后,手工录入结果时,可能发生抄写错误、数据单位错误等情况,而模型自动录入则不会发生这种情况。本实验收集的130例入组病例,软件自动成功测得全部病例的三维径线值,而在导出的医师手工测量值中有1例患者的数值标注的单位是错误的。软件自动测量可以避免这种人工较难避免的因粗心而导致的误差,从而保证数据的完整性和稳定性。
本研究有一定局限性。首先,本研究只验证了模型自动测量前列腺三维径线的临床植入结果,前列腺体积仍需从椭圆公式而来。显然,对于因重度增生或前列腺癌引起前列腺形变严重的情况,椭圆公式有局限性。既往有研究尝试在手工勾画前列腺外缘得到前列腺立体图形的基础上,以体素×体素数的方法来精确测量前列腺体积[25],未来可尝试利用AI自动分割替代手工勾画来研究精确的体积测算方法。另外,目前的分割模型还未实现前列腺前纤维基质带、移行带、外周带和中央带四个带的精细分割,分带PSAD的研究可能为前列腺癌的检出及随访提供新思路。
综上所述,基于U-Net的前列腺分割和径线自动测量是准确的,与真实临床工作场景下医师测量的表现相近。将模型结果自动返回到前列腺PI-RADS结构式报告中,可能提高影像科医师的工作效率,减少不必要的低级错误,未来应进一步推广验证。