高远菁,朱庆莉,姜玉新
中国医学科学院 北京协和医学院 北京协和医院超声医学科,北京 100730
乳腺癌已成为全球女性发病率最高的恶性肿瘤,在每年因癌症导致死亡的病因中排名第5,是全球广泛关注的重点疾病[1-2]。早期诊断和有效治疗是降低乳腺癌死亡率的关键[3]。乳腺癌腋窝淋巴结转移(axillary lymph node metastasis,ALNM)的术前准确评估对于手术治疗决策至关重要,而传统的腋窝超声对少量和微转移识别困难[4],无法满足精准治疗需求。近年来,随着人工智能和影像技术的快速发展,机器学习领域涌现出了影像组学和深度学习[5]两大热门技术,通过将医学影像资料转化为高通量数据,综合患者的多维临床信息建立预测模型,为解决上述问题提供了新的研究方向。
目前乳腺癌ALNM诊断的金标准为腋窝淋巴结清扫(axillary lymph node dissection,ALND)和前哨淋巴结活检(sentinel lymph node biopsy,SLNB)。根据美国临床肿瘤学协会Z0011试验结果[6],最新临床指南指出T1或T2期原发浸润性乳腺癌女性患者,在腋窝淋巴结触诊阴性时,存在1~2个前哨淋巴结转移(sentinel lymph node metastasis,SLNM)无需行ALND,仅接受放射治疗作为替代疗法,从而减少术后并发症[7]。这一转变也对ALNM状态的术前评估提出了新要求:应识别淋巴结的肿瘤负荷,而不能仅限于判断是否发生转移。
目前,评估乳腺癌术前腋窝淋巴结状态的主要无创影像学评估方法为超声[8-9]。然而,不同研究应用超声诊断ALNM的效果存在较大差异,其灵敏度和特异度范围分别为18.5%~87.1%和39.5%~98.0%[8-13]。Ahmed等[14]研究表明,超声提示ALNM阳性的患者中43.2% 存在较低的淋巴结肿瘤负荷(SLNM<3个)。根据最新指南,这意味着近1/2超声评估ALNM阳性的患者可免于ALND。但由于超声对腋窝肿瘤负荷的甄别能力相对有限,迫切需要一种更有效的方法解决此问题。
借助预测模型评估术前乳腺癌ALNM是临床广为接受的方法。目前,被广泛接受的预测模型为纪念斯隆-凯特琳癌症中心(Memorial Sloan-Kettering Cancer Center,SKCC)模型和Tenon评分系统,后续研究建立的模型也多与之对比。SKCC模型由Bevilacqua等[15]建立,主要用于预测浸润性乳腺癌患者的SLNM,该模型应用于其他中心的受试者操作特征曲线下面积(area under the curve,AUC)范围为0.58~0.81[16-17]。Tenon评分系统由Barranger等[18]建立,主要用于预测SLNB结果阳性的患者发生非SLNM的风险,该模型的AUC范围为0.63~0.82[17-19]。但上述预测模型主要纳入原发灶的病理信息,而影像学特征有限,且模型准确性尚未达到临床应用要求。
近年来,影像组学及深度学习技术在乳腺癌影像分析中的应用成为研究热点[20]。两者均可结合患者的特征数据(如临床信息、免疫组化、基因信息等)构建临床预测模型,辅助医生进行诊断,提高决策的准确性。影像组学是一类数据挖掘技术,通过提取图像深层次、肉眼不可识别的高通量特征,将影像视觉分析转化为可量化的特征进行研究。影像组学的流程主要包括医学影像采集、图像前处理、特征提取及筛选、模型构建与分类器等。影像组学提取的特征由业界专家基于先验知识,通过图像像素值及几何关系等多阶参数的计算公式确定。深度学习是一种模拟人脑分析的技术,通过构建神经网络,提取抽象特征,构建临床预测模型。深度学习提取的特征为特定研究问题的特定指标。两者均为从图像中提取数据特征的方法,但前者是由先验知识所获得的人为设计的可知特征,相对固定;而后者的提取过程则被称为“黑匣子”,每组模型所提取的特征差异较大。根据哈佛人工智能医学研究组提出的定义[21],广义影像组学(radiomics)应包括传统影像组学(engineered features)和深度学习(deep learning),但由于“影像组学”概念早年引入我国时用于指代前者[22],为便于读者理解,本文统一使用“影像组学”(与“深度学习”并列),而标题中的“影像组学”则指代广义的概念。
乳腺癌原发灶的形态特征与淋巴结转移高度相关[23],然而在临床研究中,实现术前影像所见淋巴结与病理诊断的淋巴结逐一对照难度较大,因此多数研究针对乳腺癌原发灶的形态进行特征提取以预测淋巴结转移。
2.1.1 基于影像组学特征的预测模型
目前,影像组学研究均采用Pyradiomics程序进行组学特征提取,主要包括一阶特征、纹理特征、小波特征等广泛认可的影像组学特征[24-27]。特征数量增加使得计算更为复杂,导致预测模型性能下降,可使用拉索回归筛选特征,构建预测模型[28]。此类研究流程设计相对固定,主要差别在于纳入人群及分析部位的不同,Qiu等[27]和Lee等[24]的临床预测模型未对乳腺癌患者的分期进行设定,Gao等[25]和Yu等[26]的临床预测模型仅纳入早期乳腺癌患者,临床上判定此类患者淋巴结转移的需求更大。上述研究在训练集和验证集中的AUC范围分别为0.82~0.86和0.72~0.81。相较于Bevilacqua等[15]等和Barranger等[18]的临床预测模型,超声影像组学预测模型的准确度显著提高。Qiu等[27]和Yu等[26]的研究发现,将医师对超声图像上淋巴结状态的评估结果[29]与影像组学特征相结合,其AUC可提升5%~10%,提示基于淋巴结的传统影像特征虽难以与病理结果一一对应,但影像显示的淋巴结结构仍与转移淋巴结密切关联。除此之外,Gao等[25]根据最新指南,将评估重点放在淋巴结肿瘤负荷(转移淋巴结个数≤2或>2)上,获得了良好的预测结果。
此外,不同学者提出了改进超声影像组学分析的方法。由于超声图像的操作者依赖性,不同医师对病灶的放大程度不同,最终提取的病灶图像比例尺也不尽相同,即图像上的肿瘤面积与实际切面面积无法对应。基于此,Gao等[25]和Yu等[26]在影像组学特征之外加入实际肿瘤径线特征建模。而Lee等[24]尝试将图像像素的标尺统一化以解决此问题,虽然研究未使用同一批数据对两种方法进行比较,但仍为未来研究提供了新思路。Gao等[25]尝试对影像组学模型纳入的高通量特征进行一定程度的形象化解释,并对Pyradiomics模型提出了改进建议,如加入方向特征以适应肿瘤的生长方向与良/恶性倾向存在相关性这一生物学指征,即目前共识认为垂直于皮肤生长的肿瘤较平行于皮肤生长者更具有恶性倾向[30]。
2.1.2 基于深度学习特征的预测模型
目前,影像组学模型预测乳腺癌淋巴结转移的诊断效能AUC仅为80%左右,研究人员将目光投向了深度学习方法。采用深度学习方法的研究纳入的病例和图片数量均较影像组学更多,其独立外验证集AUC可提升至90%左右。Zhou 等[31]最早在该领域采用深度学习方法,其研究纳入756例淋巴结阴性的早期乳腺癌患者的974张原发灶图像,并率先在78例患者的独立外验证集验证模型,其AUC达0.89。Sun 等[32]首次将肿瘤的感兴趣区勾画分为肿瘤内部区域和周边区域(肿瘤轮廓外5 mm),并尝试对比两种不同区域及相结合后3种情况的诊断效能,采用深度学习和影像组学方法与3种勾画区域排列组合构建了6个预测模型,结果显示深度学习模型相较于影像组学模型的预测效果更好,且将内部与周边区域结合分析的诊断效能更好(深度学习模型结合分析内部及周边区域法的验证集AUC为0.933),而后者也与针对瘤周区域的传统影像学研究结果相符合[33-34],为今后的研究提出了新的感兴趣区勾画要求。Zheng 等[35]的模型首次将弹性成像图像纳入研究,既可区分淋巴结有无转移(AUC为0.902),又可判断淋巴结肿瘤转移负荷(AUC为0.905),引起了广泛关注。
虽然基于乳腺癌原发灶的形态分析取得了较好效果,但目前有研究显示,将医师对影像图像上的淋巴结判断结果纳入最终模型,其效果较未添加时更好。由于医师行普通腋窝超声检查时无法明确所探查淋巴结是否为前哨淋巴结,这可能说明腋窝各淋巴结群组的影像表现与腋窝前哨淋巴结转移结果存在一定联系[26-27,36]。索静峰等[37]分析了158例乳腺癌患者的腋窝淋巴结弹性图像及二维图像,并将弹性图像硬度值的彩色值进行转化(称为“软度值”图),纳入从两种图像中提取的部分影像组学特征,结果显示其灵敏度达86.96%,为未来相关研究的开展指明了方向。但因该研究纳入的病例数较少,且提取的影像组学特征不够全面,未使用目前广泛认可的Pyradiomics工具,导致其结果的推广受限。
目前大多数研究着眼于乳腺癌腋窝SLNM或前哨淋巴结肿瘤负荷的评估,但近年来非SLNM的评估也逐渐引起关注。Z0011试验证实出现1~2个腋窝SLNM的患者后续发生非SLNM的风险非常低[6]。研究发现,腋窝前哨淋巴结阳性患者中40%~70%未发生非SLNM[38],即这些患者并未从区域放疗和ALND中获益。Guo等[36]选择最大径线图像及其垂直面超声图像,采用深度学习影像组学算法分别构建了预测前哨淋巴结(DLR-1)和非前哨淋巴结(DLR-2)转移风险的模型,当两者均评估为转移低风险时,则输出低风险,反之则输出高风险;使用决策树法将高风险-前哨淋巴结患者输入DLR-2模型可进一步评估非SLNM的风险。DLR-1和DLR-2两个模型在训练集/验证集上的AUC分别为0.876/0.848和0.909/0.812。值得注意的是,该研究的假阴性率<5%,即模型的假阴性率低于SLNB(9.8%)和ALND(5%),提示该模型有助于免除ALND。与前文所述的经典MSKCC模型[15]相比,该模型在训练集与验证集中的效果均显著提升。
目前各类医学影像技术(CT、MRI、核医学、超声)在图像获取和重建协议上存在较大差异,缺乏统一规范的标准和流程,因此难以进行结合分析。同时,各医院所选用的设备及参数设置也存在差异,建立模型的外推适用性存在挑战。因此,影像组学研究的数据需在大样本和规范化中寻求平衡,高质量的原始图像标准化数据库的建立是未来研究不可逾越的关键所在。此外,影像组学技术的部分操作步骤,需人工参与调节,尤其在图像前处理过程和感兴趣区勾画中,操作者误差可能难以复现,且每个阶段的细微变化均可能影响最终结果[39]。深度学习方法可通过自动学习预测特征以规避这些误差,直接输出模型,其特征生成过程被称为“黑匣子”[40],即针对不同的研究目的,深度学习方法所提取的特征不同,且缺乏解释性。而影像组学特征已初步形成了规范化体系,有利于研究的稳定开展。
值得注意的是,目前的研究多聚焦于利用原发灶的超声图像预测淋巴结转移,未来使用定位较好的前哨淋巴结图像预测可能为新思路。为探讨肿瘤异质性与淋巴结转移的相关性,预测模型仅纳入单个病灶的情况,对于多个病灶发生转移的复杂情况未涉及,对其推广泛化产生一定的影响,各个模型的优劣尚需更多临床研究进一步验证。
影像组学和深度学习研究已在预测乳腺癌淋巴结转移方面取得了较好效果,有望为临床决策提供重要帮助。超声造影、弹性成像、彩色多普勒技术等多模态超声影像学技术尚未结合起来,而多模态影像学结合乳腺MRI、乳腺X线等影像结果的联合诊断已是目前临床公认的诊疗常规。因此,多模态影像综合预测模型的设计是未来研究的方向。
作者贡献:高远菁负责文献检索、数据分析及论文初稿撰写;朱庆莉负责论文初稿修订;姜玉新负责论文审校。
利益冲突:无