谢立平 沈海祥 应宇凡
人工智能(artificial intelligence,AI)是研究如何在机器上模拟人的认知功能,包括分析、学习及对相应问题作出类似甚至超越人类智能反应的一门学科[1]。为辅助临床医生更好地解决临床问题,使临床诊疗过程变得更加准确、高效,AI技术在医学领域得到了快速发展和初步应用,主要包括辅助诊断、疾病相关风险预测[2]。目前,AI技术在乳腺癌[3]、皮肤癌[4]、脑部肿瘤[5]、前列腺癌[6]及心脏病[7-8]等疾病诊治中的应用已有初步研究。作为AI技术的重要组成部分,机器学习(machine learning,ML)及深度学习(deep learning,DL)技术的开发极大地促进了其在医学领域应用研究的发展。ML是通过算法的选择,基于输入的数据库信息构建信息分类器,对数据信息进行自动化学习,分析其与目标值的相关性并建立模型,可对新输入的数据进行相关性预测[9-10]。数据库信息的不断扩充可提升分类器的性能,进一步提高模型的预测效能。DL是指一种可使用多个处理层对数据进行特征学习的算法,通过建立人工神经网络,利用输入的数据库信息得到训练,从而提高数据特征的识别度[11]。DL技术尤其在图像特征识别及分析方面具有强大的优势。随着AI技术在医疗健康领域的不断发展与成熟,其在疾病预防、影像学诊断、个体化诊疗以及临床决策中的应用受到越来越多的关注。本文就AI技术在泌尿系结石、肾癌、膀胱癌及前列腺癌诊治中的应用作一述评,以期为广大同行提供参考和新的启发。
泌尿系结石是泌尿外科常见的疾病之一。随着结石病因研究的深入以及微创碎石技术的进步,泌尿系结石的诊疗水平得到不断提升。不同的碎石技术处理不同部位、不同种类的结石具有不同的结石清除率,直接影响结石患者术后复发率及二次手术率。因此,术前进行准确的预后评估并选择合适的碎石方式十分重要。近来研究显示,AI技术的应用有助于尿路结石的诊断和预后评估,并能辅助泌尿外科医生及患者进行最优化的临床决策。相关研究显示,AI技术可用于结石种类的预测。2018年Kazemi等[12]构建了基于人工神经网络算法的肾结石种类预测模型,该模型相关参数来自于2012—2016年单中心纳入的936例肾结石患者的临床资料,初步研究结果显示其预测肾结石种类的准确率为97.1%。
在明确诊断的基础上,碎石方式的选择是影响患者预后的关键因素之一。2014年Kadlec等[13]基于单中心382例经内镜碎石的肾结石患者资料开发了一项人工神经网络模型,以用于预测肾结石患者经内镜碎石术后结石清除率(肾-输尿管-膀胱X线检查显示无可见结石或CT检查显示结石<4 mm)及术后二次手术率。该模型预测结石清除率的灵敏度、特异度、AUC分别为0.753、0.604和0.749,预测术后二次手术率的灵敏度、特异度、AUC分别为0.300、0.983和0.863。近年来针对输尿管结石,Choo等[14]研发了基于DL算法的体外冲击波碎石(extracorporeal shock wave lithotripsy,ESWL)疗效的预测模型,其建模数据来源于791例输尿管结石患者的临床资料。初步研究结果表明,该模型对ESWL的疗效预测准确率为92.3%;同时该模型也证实了结石体积、长径及CT值是影响疗效的重要因素。Seckiner等[15]的研究结果也表明,人工神经网络可预测ESWL的结石清除率,并辅助临床决策的制定。
肾癌是常见的泌尿系肿瘤之一。2018年全球肾癌患者约占所有肿瘤患者的2.2%,其死亡率约为1.8%[16]。随着诊疗技术的发展,目前肾癌总生存率明显提高,尤其对于早期确诊患者,多数能通过手术处理获得较好的生存预后;但是局部晚期及转移性肾癌患者的预后仍较差[17-18]。因此,早期明确诊断是治疗肾癌的关键。然而,对于偶然发现的肾脏小占位(≤4 cm),目前尚难以通过无创检查明确诊断,这是临床医生实际工作中经常遇到的难题。近年来,利用DL算法技术对患者的临床资料及影像学资料进行分析,以精准预测肿瘤类型及预后并辅助治疗决策的制定是该领域的研究热点。利用DL技术,研究人员试图将肾肿瘤的影像学特征和肿瘤组织学分型、分级相关联,从而建立精准的预测模型。
纹理分析是一种通过提取图像纹理特征(包括灰度值等参数)从而获得并分析其空间分布特征的图像分析技术[19]。2015年Yan等[20]发现基于DL技术的纹理分析有助于肾脏小占位的鉴别诊断。该研究结果表明,通过纹理分析技术对肾脏的CT图像进行分析,其鉴别肾错构瘤、透明细胞肾癌及乳头状肾细胞癌的准确率为90.7%~100.0%。2018年Feng等[21]单中心研究结果显示,基于CT图像的纹理分析技术鉴别肾错构瘤和肾癌的准确率、灵敏度、特异度、AUC分别为93.9%、0.878、1.000和0.955。其他研究团队也相继报道了类似的结果[22-23]。有文献报道DL模型可通过对肾癌CT影像进行纹理分析来确定Fuhrman核分级,其准确率为73.0%~93.0%[24-25]。Bektas等[24]利用DL技术开发的SVM模型预测高级别肾癌的准确率、灵敏度、特异度、AUC分别为 85.1%、0.913、0.806和 0.860。
膀胱镜检查是膀胱癌明确诊断的主要方式。然而,膀胱原位癌(carcinoma in situ,CIS)在膀胱镜下的表现与膀胱正常黏膜较难区分。有文献报道,普通膀胱镜对CIS诊断的灵敏度、特异度、准确率分别为0.777、0.827和79.3%;窄谱光成像膀胱镜的诊断效能相对较高,其灵敏度、特异度和准确率分别为0.929、0.735和86.7%;荧光膀胱镜可通过荧光区分病灶和正常黏膜,提高隐匿的小肿瘤和原位癌的检出率[26-27]。为进一步提高CIS的检出率,有学者利用AI技术对62例膀胱癌患者的MRI图像进行纹理分析,提取出29个纹理特征应用于CIS与正常黏膜的鉴别,结果显示诊断膀胱癌的灵敏度、特异度、AUC、准确率分别为 0.900、0.850、0.900 和 88.0%[28]。也有文献报道,利用DL技术构建的纹理分析模型可基于MRI的弥散加权序列(DWI)图像在术前区分高级别与低级别膀胱癌,其灵敏度、特异度、AUC、准确率分别为 0.780、0.870、0.860 和 83.0%[29]。2018 年 Eminaga等[30]报道了其开发的深度卷积神经网络技术可辅助膀胱镜下组织活检,组织活检医生可对预测阳性区域进行靶向组织活检,减少或避免不必要的组织活检。尿液脱落细胞学检查是诊断膀胱癌的重要辅助检查之一。Sokolov等[31]发现,结合DL技术和原子力显微镜,对于含有5个细胞的尿液样本,其对膀胱癌诊断的准确率为94.0%,提示尿液脱落细胞学检查技术与膀胱镜检查相结合,可明显提高膀胱癌的诊断效能。
目前也有AI技术在膀胱癌的复发及化疗敏感性的预测方面研究的报道。Bartsch等[32]利用ML算法,筛选出和预后相关的主要基因,从而构建膀胱癌复发预测模型,旨在预测膀胱癌经尿道膀胱肿瘤切除术后5年复发率。在训练组中,该模型预测膀胱癌复发的灵敏度和特异度分别为 0.800、0.900,在验证组中为 0.710、0.670。对于肌层浸润性膀胱癌患者,术前新辅助化疗是改善其生存预后的重要治疗方式之一。然而,不同患者对新辅助化疗效果差异较大,而化疗反应性的评估对患者治疗方案的选择十分重要。预测患者对新辅助化疗的敏感性,不仅有利于合理配置医疗资源,还能减轻患者不必要的经济负担,提高患者的生活质量。2018年Cha等[33]从CT图像提取相关参数,利用DL技术开发出一项计算机决策支持系统。该系统可辅助临床医生更准确地评估膀胱癌患者的化疗反应性,优化治疗方案。Wu等[34]基于膀胱癌患者的CT图像信息,利用DL卷积神经网络技术构建模型,探索其在预测膀胱癌化疗敏感性中的应用价值。初步结果显示该模型预测膀胱癌化疗敏感性的AUC为0.790。
前列腺癌是男性人群中常见的恶性肿瘤之一,其发病率及死亡率均较高。2018年肿瘤相关统计数据显示,全球前列腺癌的发病率约为13.5%,仅次于肺癌(14.5%),位列第二;前列腺癌相关死亡率为6.7%,位列第五[16]。然而,早期诊断、早期治疗可明显降低前列腺癌死亡率。
计算机辅助诊断系统(computer-aided diagnostic system,CAD)是医学影像及病理图像诊断的辅助工具,可对图像特征进行自动分析处理,标注感兴趣区域,并利用数据库数据对感兴趣区域进行诊断分析。早期有学者对CAD在乳腺癌[3]、肺癌[35]、直肠癌[36]等影像诊断中的应用进行了研究,结果显示相对于经验积累较少的阅片者,CAD可明显提高其对肿瘤的诊断能力[37-38]。近来,基于前列腺MRI的图像信息并结合AI技术,涌现出一系列应用于前列腺癌诊断的CAD。
Peng 等[39]利用前列腺多参数 MRI(mpMRI)的图像信息,包括 T2加权、弥散加权及动态对比增强序列图像,从中提取图像特征信息,用于计算机辅助诊断前列腺癌。以AUC作为诊断效能的评价指标,通过线性判别分析法对表观扩散系数(apparent diffusion coefficient,ADC)的第10百分位数、ADC平均数、T2加权序列的信号强度偏态直方图及Tofts模型的容积转移常数Ktrans进行单独和联合分析。结果显示上述指标单独分析时,鉴别前列腺癌与正常组织的AUC分别为0.92±0.03、0.80±0.03、0.86±0.04、0.69±0.04;而联合 ADC 的第 10百分位数、平均ADC和T2加权偏态直方图的AUC为0.95±0.02。
Reda等[40]首次将临床生物标志物和DL算法结合,利用前列腺MRI中的DWI序列图像信息和前列腺特异抗原(prostate specific antigen,PSA)开发出一种用于前列腺癌早期诊断的CAD。该系统通过对前列腺DWI图像及相应PSA信息进行预处理,提取特征信息,建立融合上述2种信息的SNCSAE分类器,最终建立特殊算法输出最后诊断结果。该系统的初步研究结果显示,其诊断准确率为94.4%,灵敏度和特异度分别为0.889、1.000。
Gleason评分与前列腺癌生物学行为密切相关,也是评估前列腺癌患者预后的重要指标之一[41]。Gleason评分越高,表明前列腺癌恶性程度越高,预后越差。因此,诊断早期对患者进行准确的Gleason评分风险分组和预后评估,并据此给予相应的治疗方案显得十分重要[42]。目前在临床实践中,病理科医生主要通过前列腺穿刺活检或根治手术获得的病理组织在显微镜下的特征分析得出Gleason评分。Donovan等[43]为提高Gleason评分评估的准确性,利用ML,通过图像分析技术提取病理组织镜下特征并结合生物标志物(AR、Ki-67等)特征,开发了前列腺癌术后临床复发预测模型。训练数据(n=306)的结果显示,该模型预测前列腺癌临床复发的一致性指数为 0.82(95%CI:0.76~0.86),HR为 6.7(95%CI:3.59~12.45),P<0.01;验证数据(n=284)的结果显示,一致性指数为 0.77(95%CI:0.72~0.81),HR为 5.4(95%CI:2.74~10.52),P<0.01。Boesen 等[44]发现,前列腺 mpMRI的ADC与前列腺癌Gleason评分相关。在鉴别Gleason评分6分与≥7分的前列腺癌中,肿瘤组织ADC、正常组织与肿瘤组织的ADC比值(ADCnormal/ADCtumor)的AUC分别为 0.73、0.80,在鉴别 Gleason 评分≤7(3+4)分和≥7(4+3)分的前列腺癌中,两者的 AUC 分别为 0.72、0.90。Peng等[39]研究也得到类似的结果。Abdollahi等[45]研究结果进一步证实了ADC和Gleason评分的相关性,利用ML技术,基于前列腺MRI图像信息建立了影像组学预测模型,该模型对Gleason评分和临床分期预测结果的平均AUC为0.70、0.68。
1990年,德国基尔大学的Tillmann Loch教授创新性地将人工神经网络技术运用于经直肠前列腺超声检查(transrectal ultrasonography,TRUS),以助于前列腺癌的早期诊断。笔者作为项目参与者,于2013年将该技术引入中国,并对该技术进行了优化和发展,将其命名为“AI前列腺超声(artificial intelligence ultrasound of prostate,AIUSP)”。本中心的初步研究结果提示,AIUSP引导下的前列腺穿刺活检总阳性率为46.2%,平均穿刺针数为(4.9±1.0)针,平均 Gleason评分为(6.8±0.8)分。其中首次穿刺者的穿刺阳性率为51.5%(17/33),重复穿刺者的穿刺阳性率为36.8%(7/19)[46]。在此基础上,笔者所在团队进一步开展了一项比较AIUSP靶向穿刺(AIUSP组)、12针系统穿刺(系统穿刺组)及mpMRI辅助12针系统穿刺(mpMRI组)的随机对照研究,初步相关结果已于2017年欧洲泌尿外科年会上进行了汇报[47]。本研究共纳入了284例前列腺穿刺患者,研究结果显示:(1)AIUSP组前列腺癌检出率最高,为 47.0%,系统穿刺组和mpMRI组分别为35.6%、35.7%,差异无统计学意义(P>0.05);(2)总穿刺患者中的每针阳性率,AIUSP组为22.7%,明显高于系统穿刺组的11.3%和mpMRI组的13.4%,差异均有统计学意义(均P<0.01);(3)确诊为前列腺癌的患者中,AIUSP组、系统穿刺组、mpMRI组的每针阳性率分别为48.3%、31.9%、37.6%,差异有统计学意义(P<0.01);(4)AIUSP 组每诊断 1例前列腺癌平均只需穿刺12.8针,而系统穿刺组和mpMRI组分别需要穿刺33.7、33.6针。AIUSP通过指导前列腺靶向穿刺,能以较少的穿刺针数取得较高的穿刺阳性率,并能发现既往穿刺阴性的前列腺癌,具有重要的临床应用价值。
AI技术不仅在前列腺癌的辅助诊断上具有应用价值,对于前列腺癌临床治疗决策的制定也具有一定的指导意义。放疗是前列腺癌治疗的重要手段,安全、有效且治疗相关并发症较少[48]。但是因肿瘤细胞异质性的存在,不同前列腺癌患者对放疗的敏感性存在差异。治疗前有效筛选出放疗获益人群可减少甚至避免患者的过度治疗。Abdollahi等[45]利用前列腺MRI组学信息结合ML技术开发了前列腺癌对调强适形放疗技术(intensity-modulated radiation therapy,IMRT)敏感性的预测模型。该研究将病灶治疗前后在MRI中ADC的改变率作为评价敏感性的指标,ADC改变率>20%表明对治疗敏感。该研究共纳入33例接受IMRT治疗的前列腺癌患者,其中15例(45%)患者对IMRT治疗敏感;基于治疗后的T2组学模型对于鉴别前列腺癌患者是否对放疗敏感的AUC为0.626。
临床决策是指诊断确立后,患者及家属在医生的指导下,在多种治疗方案中择优选择对患者最合适的治疗方案。为了让患者更好地参与临床决策的制定,Auffenberg等[6]利用ML技术开发出一项治疗方案预测系统。该系统的原理是通过ML等技术对纳入研究的前列腺癌患者临床信息及其选择的治疗方案进行特征提取并分类,最终形成一种特定算法。将患者临床相关信息输入该系统后,通过该算法,系统可依据已有数据库信息输出最优治疗方案。该系统对前列腺癌患者治疗方案选择的预测具有较高的准确性,AUC为0.81。同时通过该系统,患者可依据自身的疾病现状,了解之前其他类似患者治疗方案的选择及相应治疗结果,更好地选择最优治疗方案并获益。
近年来,随着AI技术在医疗领域的蓬勃发展,疾病的诊治即将进入智能医疗时代。在泌尿系结石及肿瘤的诊治领域中,临床医生的诊疗经验结合AI技术开发的辅助诊断系统、疾病相关风险及疗效预测模型,不仅可以提高泌尿系疾病的诊断效能,而且在一定程度上可辅助临床决策的制定,最终使患者获益。然而,目前的研究结果多基于单中心研究,存在研究数据较少等缺陷,未来仍需开展大规模、多中心研究进一步证实AI技术在泌尿外科领域的应用价值。
(本文由浙江省医学会推荐)