辛仲宏,雷军强,郭 城,张亚萍,陈梓娴
(兰州大学第一医院放射科 甘肃省智能影像医学工程研究中心 精准影像协同创新 甘肃省国际科技合作基地,甘肃 兰州 730000)
宫颈癌(cervical cancer, CC)居于女性恶性肿瘤第二位,严重危害女性健康和生命[1-2];其病因及发病机制尚未完全明了,但87.96%的CC患者伴人乳头瘤病毒(human papilloma virus, HPV)感染,且与其16/18型高度相关[3]。目前对国际妇产科联盟(International Federation of Gynecology and Obstetrics, FIGO)Ⅰ期与ⅡA期CC多以手术治疗为主,术前辅助放射治疗(简称放疗)或新辅助化疗(neoadjuvant chemotherapy, NACT)可提高手术切除率并改善预后;对FIGO分期ⅡB期及以上晚期CC以根治性放疗及化学治疗(简称化疗)为首选。因此,早期诊断CC并进行分期至关重要。人工智能(artificial intelligence, AI)基于数学、计算机及神经科学等发展而来,可通过计算机程序模拟、延伸和拓展人的智能行为,以提供客观的检测、定量、分类及预测方法用于临床辅助诊断[4-5]。深度学习(deep learning, DL)为AI新领域,能大批量处理、挖掘、整合高维数据,自动识别、运算图像信息,在图像分析领域展示出巨大潜力,用于诊断肿瘤、鉴别诊断、指导治疗及预测预后等具有独特特有优势。本文针对DL用于筛查和诊断CC、指导治疗及判断预后的现状、问题及前景进行综述。
机器学习(machine learning, ML)通过计算机模拟人类学习行为,在无明确指令的情况下执行任务并进行数据分析;其常用方法包括logistic回归、线性回归、决策树、随机森林、贝叶斯和K-means聚类分析、多层感知机及支持向量机等。DL是ML的主要研究方向,以计算机模拟人脑机制分析数据,使用分层人工神经网络开发复杂学习模型,包括卷积神经网络(convolution neural networks, CNN)、深度置信网络和递归神经网络等;其中的CNN可自动学习传统图像分析方法无法识别的高维度特征信息,适用于建立医学影像及其解析间的复杂关系模型[6],已在多项相关研究中取得重大进展[6-10]。医疗数据中,影像学数据占比较高,且格式标准、易于获取,是筛查和诊断肿瘤、预测疗效和评价预后的主要依据之一。
2.1 筛查与诊断 DL具有快速、高效及客观等特点,在筛查、诊断及分期CC中发挥着越来越重要的作用。阴道镜引导下活检穿刺对诊断宫颈上皮内瘤变(cervical intraepithelial neoplasia, CIN)至关重要。目前AI电子阴道镜辅助诊断系统已取得一定进展。DL协同数字阴道镜可自动诊断、提高阴道镜诊断和宫颈活检的准确性。HU等[11]经7年随访筛查CC,共纳入9 406名受试者,以其中的99 843幅宫颈图像为训练集,以病理诊断为金标准,所构建的DL模型识别正常、CIN2和CIN3的受试者工作特征(receiver operating characteristic, ROC)曲线下面积(area under the curve, AUC)分别为0.80、0.70及0.69;以342例CC患者进行测试,结果显示该模型识别CIN2及CIN3的AUC为0.91,效能显著高于传统宫颈照相技术、传统细胞学及HPV检测。
PATHANIA等[12]开发了以DNA为中心、运用DL的数字化筛查HPV平台,用于检测HPV16/18型的DNA具有极高的敏感度和特异度,甚至可识别单个细胞,且检测用时低于2 min。WENTZENSEN等[13]构建了基于活检金标准训练的p16/Ki-67双重染色(double staining, DS)载玻片DL平台,在敏感度相同的前提下,其诊断阳性率低于、但特异度高于细胞学和手动DS检测;相比巴氏法,基于DL的DS使转诊至阴道镜的比例降低了约1/3(41.9%vs.60.1%),提示基于该平台可实现自动化检测,且特异度较高,有助于避免不必要的阴道镜检查。
URUSHIBARA等[14]基于117例CC患者488幅和181例非癌症患者509幅腹部T2WI构建DL模型,并以60例CC患者和60例非癌症患者的120幅图像进行测试,结果显示DL模型和3名影像科医生诊断CC的敏感度分别为0.883和0.783~0.867,特异度分别为0.933和0.917~0.950,准确率分别为0.908和0.867~0.892,即DL模型的诊断效能与影像科医生相当甚至更优。杨易等[15]提取159例经病理证实CC患者的396个T2WI影像组学特征,根据最终筛选出的11个特征建立了预测早、晚期CC的模型,其在训练集和验证集中的拟合优度均较高(χ2=2.68、8.87,P均>0.05),AUC达0.80,提示基于T2WI的影像组学模型预测CC临床分期具有较高价值。早期诊断并拟定治疗决策对改善预后及生存质量至关重要。DL模型的诊断准确率取决于训练集数据质量及算法精度。开展大样本、多中心研究,进行规范化诊断及结合多种临床数据是DL发展的方向。
2.2 预测淋巴脉管间隙浸润及淋巴结转移 淋巴脉管间隙浸润(lymph-vascular space invasion, LVSI)包括血管或微血管浸润及淋巴管浸润。早期判断有无LVSI和淋巴结转移对制定治疗方案和预测预后至关重要。WU等[16]基于894例接受根治性子宫切除术和盆腔淋巴结清扫术的ⅠB期至ⅡB期CC患者的术前MRI构建的DL模型用于预测CC淋巴结转移显示出良好效能,其AUC为0.844[95%CI(0.780,0.907)]。DONG等[17]基于CC患者术前CT、组织学和临床分期构建了术前预测CC淋巴结转移的DL模型,共提取1 045个影像组学特征,其中28个与淋巴结转移显著相关(P均<0.05),模型预测淋巴结转移的AUC为0.99,内部验证准确率为97.16%,外部验证的AUC为0.90,准确率为92.00%。
DL模型预测LVSI和淋巴结转移的准确性来源于大样本术前影像学资料与术后病理对照研究结果。影像学无法明确提示LVSI和淋巴结转移时,DL能够识别传统图像分析方法无法识别的高维度特征信息。JIANG等[18]纳入167例CC患者的2 056幅MRI,包括1 070幅T1WI和986幅T2WI,其中862幅可见LVSI、1 194幅无LVSI,所构建的T1WI DL模型的判断力高于T2WI模型,二者联合预测早期CC LVSI的AUC为0.911,敏感度为0.881,特异度为0.752。
2.3 指导放疗 基于AI的放疗主要包括依据CC的组织学特征智能制定放疗方案,以及结合影像学特征自动区分肿瘤组织与正常组织,实现精准勾画靶区,避免损伤正常组织。CHEN等[19]纳入140例CC患者,将其中100例用于训练、20例用于验证、20例用于测试,以构建的基于CNN的预测模型和自动优化策略确定自动调强放疗(intensity modulated radiation therapy, IMRT)的靶区,其靶标覆盖率和计算剂量与初级或高级技师手动制定方案相比差异无统计学意义,而剂量均一性略有降低,但多数危险器官的平均剂量明显降低,并使膀胱及直肠的临床靶区体积分别降低6.3%及12.3%,直肠及骨髓的平均剂量分别降低1.1 Gy和1.8 Gy,提示自动IMRT程序可在不牺牲目标剂量的情况下降低剂量、减少正常组织损伤。
RHEE等[20]纳入2 254例CC患者的CT图像构建放疗靶区自动勾画模型,实现了自动勾画病变组织及11个正常结构(7个危险器官和4个骨性结构),其中原发病变、盆腔淋巴结、主动脉旁淋巴结的临床靶区的戴斯相似性系数(Dice similarity coefficient, DSC)分别为0.86、0.81及0.76,平均表面距离分别为0.19、0.21及0.27 cm,豪斯多夫距离(Hausdorff distance, HD)分别为2.02、2.09及2.00 cm;在外部测试集中,该模型勾画的80%临床靶区、97%危险器官和98%骨性结构均可接受。秦楠楠等[21]将自动勾画模型用于100例接受IMRT治疗的CC患者CT图像,其勾画临床靶区的DSC为0.860,HD为13.9 mm,勾画危险器官(膀胱、直肠和左、右股骨头)的平均DSC为0.898,平均HD为5.3 mm,且在内部和外部数据集中均表现良好,临床适用性较高。随着算法的进一步精准化,DL将成为指导放疗的主要方法之一。
2.4 预测预后 SHEN等[22]基于142例CC患者的18F-FDG PET/CT构建DL模型,其预测放化疗后局部复发和远处转移的敏感度分别为71%及77%,特异度分别为93%及90%,阳性预测值分别为63%及63%,阴性预测值分别为95%及95%,准确率分别为89%及87%,能够较好地预测临床疗效。于治疗前影像学资料中获取预测疗效信息并制定个体化治疗方案是DL的研究方向,虽然目前基于影像学数据构建DL模型用于预测CC患者生存期的文献较少,基于临床相关数据构建的DL模型已在预测CC患者预后方面表现出一定优势[23-24]。联合临床及影像学信息共同构建预测模型将是未来发展方向。
DL用于CC诊疗已取得一定成果,但目前仍属临床辅助工具,且面临以下问题:①模型的准确性、泛化性和鲁棒性,模型基于数据驱动算法,需要大样本、高质量训练数据支撑,但目前缺乏多中心、高质量、大样本训练数据集,且图像质量和规范未能实现同质化;②模型的可解释性,模型可解释性越高,输出结果越易被用户理解,随着模型性能的提高,其结构越来越复杂,随之而来的可解释性成为DL发展的难题之一;③图像标注需要影像科、妇科、病理科、流行病学专家及AI工程师进行跨学科协作,存在质量一致性与规范性问题;④数据安全及个人隐私,DL数据收集涉及医学伦理和法律法规等多个领域,如何绝对保证数据安全和严格保护个人信息是必须面对的问题。
随着DL技术的快速发展,其在筛查和诊断CC、指导治疗、评估疗效及预测预后中必将发挥重要作用。基于DL技术和多模态影像学构建的CC诊疗模型可为定量评估CC提供客观依据。如何在提高诊疗效率及医疗服务质量的同时减轻医生工作负担将成为DL在CC的主要研究方向。