帅鸽, 郁义星, 董佳, 杨玲, 胡春洪
乳腺癌的全球发病率逐年上升,已成为危害全球女性健康的第一大肿瘤疾病[1],其中人体表皮生长因子受体2(human epidermal growth factor receptor 2,HER2)表达阳性的的乳腺癌侵袭性强、死亡率高[2],且未接受抗HER2治疗的HER2阳性乳腺癌患者复发的风险很高[3]。目前,临床上主要采用荧光原位杂交法(fluorescence in situ hybridization,FISH)和免疫组织化学法(immunohistochemistry,IHC)来确定乳腺癌患者HER2扩增和过表达状态。由于部分组织标本尺寸较小和肿瘤的异质性,利用针吸活检标本评估乳腺癌中HER-2的扩增和过表达状态可能并不代表整个肿瘤[4]。如果能在术前准确预测HER2的表达状态,尽早准确地对肿瘤进行干预,对后续的治疗方法以及预后均有帮助[5]。影像组学被定义为“高通量、自动地从医学影像中提取大批量的影像特征”[6]。近年关于乳腺X线、CT及MRI影像组学均有一些应用,如利用乳腺X线图像纹理特征鉴别良恶性乳腺肿块[7]、基于CT增强图像影像组学模型评估乳腺癌腋窝淋巴结转移、利用乳腺MRI影像组学预测乳腺癌肿块对化疗后反应[8]以及预测是否为三阴性乳腺癌等。本研究对乳腺癌乳腺X线图像进行影像组学分析,旨在探讨乳腺X线影像组学标签在术前预测乳腺癌患者HER2表达中的应用价值。
1.病例资料
回顾性分析2018年1月-2020年10月在苏州大学附属第一医院和苏州市立医院放射科接受乳腺X线摄影检查的所有乳腺癌女性患者的临床、病理及影像资料。病例纳入标准:①年龄≥18岁的女性初诊乳腺癌患者;②经组织病理学证实的浸润性乳腺癌;③IHC染色和/或FISH明确Her2状态[9];④乳腺X线检查后一周内行乳腺穿刺或手术病理活检。病例排除标准:①Ⅳ期(转移性)乳腺癌;②有其他恶性肿瘤病史;③乳腺X线检查图像不全或图像无法评估;④既往接受过乳腺穿刺、手术或新辅助化疗。按照以上纳入和排除标准,共入组222例女性患者,年龄25~83岁,平均年龄(53.70±14.46)岁,其中乳腺癌HER2阳性59例,HER2阴性163例。222例患者均为非特殊类型浸润性乳腺癌,其中44例患者合并导管原位癌(ductal carcinoma in situ,DCIS)(成分<20%)。按照数据的不同来源,将苏州大学附属第一医院的患者作为训练组(n=154,其中HER2阳性41例,HER2阴性113例),苏州市立医院患者作为外部验证组(n=68,其中HER2阳性18例,HER2阴性50例)。本研究经医院伦理委员会审批通过,免除患者知情同意。
2.乳腺X线摄影及分析
乳腺X线摄影采用Hologic Selenia(Hologic Medical Systems, Boston,USA)数字乳腺X线机。扫描方位包括双乳内外斜位(mediolateral oblique,MLO)和头尾位(cranial caudal,CC)。乳腺X线图像均以DICOM格式存储于图像储存与传输系统(picture archiving and communication system,PACS)系统。乳腺X线图像评估内容包括:①病灶大小:在病灶较大的拍摄体位图像上测量病灶最大径;②病灶位置:左侧乳腺和右侧乳腺。③X线征象:参照第5版乳腺影像报告和数据系统(breast imaging reporting and data system,BI-RADS)[10],包括肿块、钙化、肿块伴钙化、结构扭曲和非对称致密。
3.影像组学分析
利用MaZda4.6软件(http://www.eletel.p.lodz.pl/mazda/)对训练集HER2阳性及HER2阴性图像分别进行影像组学分析。图像均一化处理:选择MaZda软件中μ+3σ(其中μ为图像灰度值的平均值,σ为图像灰度值的标准差)进行图像灰度均一化处理,最大限度地降低对比度和明亮度对图像灰度值的影像。图像分割:由2位放射科医师选择病灶显示清楚且长径较大的拍摄体位图像(CC位或MLO位)手动勾画感兴趣区(region of interest,ROI),参考Zhou等[11]研究中的勾画方法,ROI尽可能包括整个病灶,大部分肿瘤的境界较为清晰,对于无法清晰显示边界的区域用平滑的弧线相连(图1、2)。其中60例乳腺肿块图像分别由有5年和8年工作经验的医师分割并评估观察者之间的差异,之后再由有8年工作经验的医师再分割1次评估观察者内的差异。所有图像的分割数据由有8年工作经验的医师第1次分割的60例和剩余162例的数据组成。影像组学定量特征提取:利用MaZda软件提取乳腺X线摄影图像的定量特征,包括灰度直方图、绝对梯度、灰度共生矩阵、灰度游程矩阵、自回归模型和小波变换等特征。特征选择:利用MaZda软件提供的3种特征选择方法,即费希尔参数法(Fisher cofficients,Fisher)、分类错误率联合平均相关系数法(classification error probability combined average correlation,POE+ACC)和相关信息测度法(mutual information,MI)对提取的定量特征进行筛选,MaZda软件自动选择出10个最优的特征参数,得到3组特征子集。使用MaZda软件中的B11模块提供的非线性判别分析法(nonlinear discriminant analysis,NDA)对3组特征子集进行判别分析,分别计算出其判断HER2表达状态的准确率。原始数据标准化:在SPSS软件中运用Z-Score算法将所有患者的10个特征参数的原始数据进行标准化。构建影像组学标签Radscore:将准确率最高的特征子集利用二元logistic回归进一步筛选,利用选择特征的线性融合构建影像组学标签[12],并计算每例患者的组学标签得分,并进行受试者工作特征(receiver operating characteristic,ROC)曲线分析,计算其预测HER2表达的曲线下面积(area under curve,AUC)、准确率、敏感度、特异度、阳性预测值和阴性预测值。
图1 右乳乳腺癌HER2阳性患者,女,52岁。a)乳腺X线图像示右乳1枚不规则结节影(箭),长径约1.8cm,边缘可见分叶、毛刺,内部可见细小钙化; b) 使用MaZda图像分割工具在乳腺X线上手动勾画ROI,提取影像组学特征; c) 右乳结节ROI的灰度直方图。 图2 左乳乳腺癌HER2阴性患者,女,46岁。a) 乳腺X线图像示左乳1枚类圆形结节影(箭),长径约3.5cm,边缘光整; b) 使用MaZda图像分割工具在乳腺X线上手动勾画ROI,提取影像组学特征; c) 左乳结节ROI的灰度直方图。
4.统计学分析
采用SPSS 26.0软件进行统计学分析。对两位医师手动分割病灶及同一位医师前后两次手动分割病灶所提取的组学特征采用组内相关系数(intraclass correlation coefficient,ICC)进行一致性分析,ICC>0.75 为一致性较好。定性资料以频数表示,符合正态分布的定量资料以均值±标准差表示,不符合正态分布的定量资料以中位数(25%百分位数,75%百分位数)表示。采用独立样本t检验(符合正态分布时)或Mann-WhitneyU检验(不符合正态分布时)比较不同HER2状态乳腺癌患者之间定量数据的差异;采用卡方检验比较组间病灶位置和X线征象的差异。最优特征子集采用二元logistic向后逐步回归法进一步筛选 。以P<0.05为差异有统计学意义。
1.临床及乳腺X线摄影结果
根据病理结果,将222例患者分为HER2阳性组59例和HER2阴性组163例。HER2阳性患者年龄为(54.16±14.54)岁,HER2阴性患者年龄为(52.42±14.25)岁,差异无统计学意义(P=0.429)。HER2阳性患者病灶大小为(31.01±17.88)mm,HER2阴性患者病灶大小为(31.90±17.88)mm,差异无统计学意义(P=0.746)。222例患者病变位于右侧乳房105例(47.3%),左侧乳房117例(52.7%)。乳腺X线摄影表现为肿块52例(23.4%)、钙化35例(15.7%)、肿块伴钙化52例(23.4%)、结构扭曲42例(18.9%),非对称性致密41例(18.5%)。训练集与验证集、HER2阳性组与HER2阴性组患者在年龄、病变大小、病灶位置及乳腺X线摄影表现上差异均无统计学意义(P值均>0.05,表1、2)。
表1 乳腺癌训练集与验证集患者的临床指标比较结果
表2 乳腺癌HER2表达阳性与阴性患者的临床指标比较结果
2.影像组学标签预测乳腺癌HER2表达的效能
两位医师对病灶进行手动分割的一致性较好,观察者内与观察者间的ICC分别为0.88和0.84。
利用MaZda软件提取训练集HER2阳性和HER2阴性患者的乳腺X线摄影图像定量特征,共323个。3种特征选择方法Fisher、POE+ACC和MI对提取的定量特征进行筛选,得到鉴别HER2阳性与HER2阴性乳腺癌的3组特征子集(表3)。利用非线性判别分析法,对三组特征子集进行分析,结果显示Fisher、(POE+ACC)和MI法选择的三组特征子集预测HER2表达的准确率分别为85.06%、88.31%和77.27%。
表3 训练组HER2阳性和HER2阴性乳腺癌的3组特征子集
将准确率最高的POE+ACC法筛选出的10个特征用二元logistic回归进一步筛选,利用选择特征的线性融合构建影像组学标签:Radscore=-2.149-0.548×WavEnLH_s-4+0.475×Kurtosis-0.765×Perc.01%-0.703×WavEnHH_s-5-0.513×Teta4+1.069×135dr_ShrtREmp-3.831×WavEnHH_s-1
计算每例患者的影像组学标签得分,在训练集HER2阳性组和阴性组乳腺癌的影像组学得分分别为0.159(-0.357,0.928)和-2.987(-3.997,-1.184),差异有统计学意义(Z=-8.088,P<0.001);在验证集HER2阳性组和阴性组乳腺癌的影像组学得分分别为0.475(-0.412,1.541)和-3.093(-4.126,-1.157),差异有统计学意义(Z=-4.865,P<0.001,图3)。将得到的影像组学得分进行ROC曲线分析(图4),结果显示训练集预测HER2表达的AUC、准确率、敏感度、特异度、阳性预测值和阴性预测值分别为0.927(95%可信区间0.881~0.973)、85.4%、87.6%、71.4%、94.3%和87.0%;验证集预测HER2表达的AUC、准确率、敏感度、特异度、阳性预测值和阴性预测值分别为0.889(95%可信区间0.813~0.964)、94.4%、74.0%、56.7%、97.3%、79.4%(表4)。
图3 a) 训练集乳腺癌HER2阳性与阴性患者影像组学得分的箱线图; b) 验证集乳腺癌HER2阳性与阴性患者影像组学得分的箱线图。 图4 a) 乳腺X线影像组学标签预测训练集乳腺癌HER2表达的ROC曲线; b) 乳腺X线影像组学标签预测验证集乳腺癌HER2表达的ROC曲线。
表4 乳腺X线影像组学标签预测乳腺癌HER-2表达的效能
本研究基于乳腺X线摄影图像提取影像组学特征参数,构建影像组学标签RadScore,运用乳腺X线摄影影像组学标签预测乳腺癌患者HER2表达情况,结果显示训练集和验证集均有较高的效能,训练集、验证集的AUC和准确率分别为0.927和85.4%、0.889和94.4%,具有较高的预测价值。HER2是乳腺癌患者最重要的分子靶点之一,有研究发现,接受或不接受曲妥珠单抗(最常见的HER2靶向治疗药物之一)治疗的HER2阳性乳腺癌患者的3年无事件生存率(event free survival,EFS)差异有统计学意义(P=0.013)[13]。此外,由于IHC和FISH检测中选取组织尺寸较小,可能并不代表整个肿瘤,且可引发很多并发症,如乳腺炎、乳房瘘、血肿、缝合脓肿等[14],因此,开发一种准确、无创的方法对评估乳腺癌患者的HER2状态至关重要。
近年来,一些研究分析了常规影像特征与HER2状态之间的相关性。Gajdos等[15]指出乳腺X线摄影的节段性钙化与HER2阳性状态显著相关(P<0.05)。另一项研究表明边缘模糊的肿块、肿块内的钙化和节段性钙化与HER2阳性显著相关(P值分别为0.011、<0.001和0.030)[16]。本研究发现HER2阳性和HER2阴性乳腺癌中表现为钙化、钙化和肿块两种X线表现的患者总和占比分别为38.9%和39.3%,差异无统计学意义(P>0.05);结论与上述研究不同,可能是因为大多数钙化由DCIS导致,而本研究中乳腺癌病理类型主要为浸润性导管癌,仅有44例合并了DCIS,且DCIS成分<20%。本研究对患者年龄、病变大小、病灶位置及X线表现进行了比较,差异均无统计学意义,主要原因可能为本研究参考了谭红娜等[17]研究中的方法,仅对有无钙化作了对比,未对钙化的特征进一步细分和对比。
Li等[18]的一项研究结果表明,使用仅基于DCE-T1序列的MRI定量影像组学特征对于确定HER2状态的效能较差,其AUC值为0.65,导致这一结果的原因可能是由于其研究选择的磁共振序列较单一,并且样本量较少(n=91)。Zhou等[19]研究发现多参数乳腺磁共振(T2抑脂加权联合DCE-T1序列)影像组学评估乳腺癌患者HER2状态优于仅使用单参数,前者在训练集、验证集中的AUC和准确率分别为0.86和79.5%、0.81和78.3%。部分乳腺肿块在DCE-T1序列并无明显强化,且与超声、MRI等检查方法相比,乳腺X线摄影对钙化和结构扭曲显示清晰,所以乳腺X线摄影对乳腺病变的诊断非常重要。Zhou等[11]的一项研究结果表明,基于乳腺X线图像影像组学定量特征预测HER2表达情况,在训练集和验证集中的AUC分别为0.846和0.787。本研究预测模型的效能稍高于前者,其原因可能为Zhou等[11]的研究仅从乳腺X线摄影中提取了186个影像组学特征,而本研究提取了324个影像组学特征,且本研究在进行影像特征组学筛选时先利用MaZda软件提供的3种特征选择方法进行筛选,再运用逻辑回归获得7个独立预测指标,进而构建影像组学标签;而Zhou等的研究中利用了40个影像组学特征构建模型,其模型较复杂,且并未利用独立的预测指标来构建组学标签。另外,本研究采用了外部验证,相比于Zhou等的研究,更加客观可靠。
本研究存在以下局限性:①采用手动勾画ROI,可能存在一些偏差,在将来的研究中可采用更为成熟的软件进行结节的自动或半自动分割;②样本量偏小,研究结果是初步的,还有待于大样本的进一步研究;③所有选取的病例中只包括最常见的乳腺癌病理类型-非特殊类型浸润性导管癌。
综上所述,乳腺X线摄影影像组学标签可作为一种无创和方便的方法用于术前预测乳腺癌患者HER2表达情况,对于临床医生决策及患者预后有一定帮助。