MRI纹理分析联合机器学习模型对前列腺腺泡癌Gleason分级的预测价值

2022-12-01 09:27邢朋毅孟英豪阳青松陆建平
生物医学工程与临床 2022年2期
关键词:危组组学分类器

邢朋毅,孟英豪,马 超,宋 涛,阳青松,陆建平

前列腺癌是老年男性常见的恶性肿瘤之一,其死亡率居于男性肿瘤死亡率第二位[1];近年来中国前列腺癌的发病率亦不断增加[2]。根治性前列腺切除术标本中前列腺癌的Gleason评分(Gleason score,GS)是患者预后的有力预测因素。GS系统通过分析腺体分化的程度对前列腺进行组织学识别,并依照主要评分及次要评分来反映肿瘤的异质性。GS=3+4分和4+3分的患者具有不同的生物学特性,与GS=3+4分的肿瘤相比,GS=4+3分的患者生化复发率更高[3]。多参数磁共振成像(multiparametric magnetic resonance imaging,mpMRI)被认为是检测和定位前列腺癌的有效方法。常规的前列腺mpMRI方案包括高分辨率T2加权成像(T2weighted imaging,T2WI)、扩散加权成像(diffusion-weighted imaging,DWI)和动态对比增强(dynamiccontrast enhancement,DCE)序列。T2WI+DWI是最常见的序列,且不需要进行侵入性对比剂的注射。研究[4,5]表明,双参数MRI(T2WI和DWI)检测肿瘤的准确度与传统的mpMRI相当。纹理分析是一种数学模型,它从图像中提取人眼无法察觉的特征信息,在前列腺癌的主动监测过程中,MRI的纹理分析可作为评价前列腺癌侵袭性的生物标志物[6]。因此,笔者研究旨在探讨基于前列腺腺泡癌双参数MRI纹理分析对前列腺腺泡癌GS高危组(GS≥4+3分)和低危组(GS≤3+4分)进行预测的价值。

1 资料与方法

1.1 临床资料

选择2018年5月至2020年3月在海军军医大学第一附属医院就诊前列腺腺泡癌患者148例,年龄43~90岁,平均年龄61.18岁(标准差8.13岁);其中高危组(GS≥4+3分)80例,低危组(GS≤3+4分)68例;血清前列腺特异抗原(prostate specific antigen,PSA)为0.70~161.92 ng/mL,PSA中位数7.16 ng/mL;前列腺体积(prostate volume,PV)为13.42~174.81 cm3,平均PV 45.32 cm3(标准差25.71 cm3);前列腺病灶体积为0.26~122.70 cm3,病灶体积中位数2.71 cm3;病灶位置外周带(peripheral zone,PZ)69例,交界地带13例,移行带(transitional zone,TZ)66例。笔者研究通过医院伦理委员会审批;所有患者检查前皆签署知情同意书。

选择标准:①行前列腺根治切除术,获得大体标本,病理诊断为前列腺腺泡癌;②肿瘤为单一病灶;③术前接受3 T MRI检查,且检查时间与手术时间间隔<7 d;④在MRI检查之前未进行前列腺活组织检查、手术、放射治疗或内分泌治疗。

排除标准:①行MRI检查前,肿瘤已发生远处转移;②术后病理诊断为前列腺间叶肿瘤或其他瘤样病变;③患者放置导尿管;④MRI图像存在伪影,影响病灶分割。

1.2 方法

1.2.1 MRI扫描

采用3 T MRI系统(MAGNETOM Skyra。西门子医疗系统有限公司,德国),使用标准18通道相控阵体部线圈及32通道集成脊柱线圈。

患者排空肠道及膀胱,检查前禁食4~6 h。横轴位DWI扫描参数:重复时间(repetition time,TR)/回波时间(time of echo,TE)=5 100/89 ms,视野(field of view,FOV)=224 mm2×280 mm2,矩阵=120×150,层厚=4 mm,层数=20,层间距=0 mm,b值=1 500 s/mm2,采集时间为479 s。前列腺行横轴面、冠状面、矢状面二维(two-dimensional,2D)T2WI快速自旋回波扫描,横轴面T2WI扫描参数:TR/TE=5 460/104 ms,FOV=180 mm2×180 mm2,矩阵=384×384,层厚=4 mm,层数=24,层间距=0 mm,回波链长度=18,采集时间为229 s。横轴位DWI扫描定位时尽可能保证与T2WI序列的层面一致。

1.2.2 病理检查

所有前列腺腺泡癌大体标本均来自机器人辅助前列腺根治切除术,术后将含有肿瘤组织的前列腺标本用甲醛溶液固定,经石蜡包埋后,从尖部到底部连续切片。切片采用苏木精-伊红(hematoxylin and eosin,HE)染色。每张切片都由1名具有10年泌尿系统病理诊断经验的病理科医师根据国际泌尿外科病理学会 (International Society of Urological Pathology,ISUP)的Gleason评分系统进行评估[7]。总分是根据细胞在显微镜下的外观来计算的,前半部分是主要评分,后半部分是次要成分的最高评分。病理科医师记录最大病变的GS作为责任肿瘤病灶,并在每张切片上绘制肿瘤边界。

1.2.3 图像分析

将T2WI、表观扩散系数(apparent diffusion coefficient,ADC)及DWI(b值=1 500 s/mm2)图像以医学数字成像和通信(digital imaging and communications in medicine,DICOM)格式从医学数据库导出到ITKSNAP(版本3.8.0,http://www.itksnap.org/)进行手动分割,最终生成三维(three-dimensional,3D)感兴趣区域(region of interest,ROI)。

参照病理大切片由1名具有4年前列腺MRI诊断经验的放射科医生在整个肿瘤上逐层勾画ROI,并且所有轮廓均由1名具有8年前列腺MRI诊断经验的放射科医生审查。PZ病变勾画以ADC图为主,DWI和T2WI序列为辅;TZ病变以T2WI为主,DWI和ADC图为辅。如果有判别差异,则由上级放射科医生最终确定肿瘤的边界。

1.2.4 特征提取

使用AK软件(3.2.0版。GE healthcare,中国)从图像中提取特征。根据影像生物标记物标准化倡议(image biomarker standardization initiative,IBSI),影像组学特征可分为3种类型。(A)一阶特征,反映ROI内体素强度的分布。(B)形态特征,反映ROI的几何形态,如面积和体积。(C)纹理特征,反映基于3个矩阵计算出的ROI内高阶灰度信息。灰度共生矩阵(gray-level co-occurren cematrix,GLCM)表示3D体积中沿图像方向之一的相邻像素的离散灰度级别的组合。游程长度矩阵(run length matrix,RLM)评估在一个方向上具有相同灰度级的像素或体素的连续序列的长度。通过灰度大小区域矩阵(gray-level size zone matrix,GLSZM)计算出链接体素的组(或区域)的数量。

1.2.5 纹理特征筛选与模型构建

在模型构建之前,首先进行纹理特征筛选。研究采用Mann-Whitney U检验筛选两组间有显著差异的影像组学纹理特征,随后为减少纹理特征间的冗余和模型的复杂性,采用最小冗余和最大相关算法(min-redundancy and max-relevance,MRMR)进一步筛选[8],最后获取包含10个相对重要纹理特征的集合。对保留的10个纹理特征分别进行受试者工作特性(receiver operating characteristic,ROC)曲线分析,评估单个纹理特征的诊断性能。用MRMR分析后保留的10个纹理特征构建随机森林(random forests,RF)分类器[9],在训练过程中采用100次交叉验证调整分类器的参数,得到最优的预测模型,以用于前列腺腺泡癌高危组和低危组的鉴别。

1.2.6 随机森林分类器模型的评估

采用ROC曲线分析,用于评价RF分类器模型对高危组、低危组前列腺腺泡癌的预测能力,用曲线下面积(area under curve,AUC)量化各纹理特征和组合纹理特征预测模型的判别能力。此外,采用100次的留组交叉验证法(leave group out cross-validation,LGOCV)评价RF分类器模型的可靠性和可重复性。

1.3 统计学方法

采用SPSS 26.0版和R软件版本4.0.3(https://www.r-project.org)进行统计分析。以P<0.05为差异具有统计学意义。符合正态分布的计量资料以均值±标准差表示,不符合正态分布的计量资料以中位数(四分位区间)表示;计数资料和等级资料以例数表示。

2 结果

2.1 术后病理诊断分级结果与临床资料

148例待预测病例中Gleason评分为:3+3分42例,3+4分26例,4+3分21例,4+4分27例,4+5分19例,5+4分8例,5+5分5例。

高危组80例,年龄43~90岁,平均年龄69.71岁(标准差8.88岁);PSA<4 ng/mL 2例,4~10 ng/mL 17例,PSA>10 ng/mL 61例;病灶位置PZ 37例,交界地带13例,TZ 30例;病灶体积1.55~13.30 cm3,病灶体积中位数4.00 cm3。低危组68例,年龄53~83岁,平均年龄63.95岁(标准差6.99岁);PSA<4 ng/mL 1例,4~10 ng/mL 24例,PSA>10 ng/mL 43例;病灶位置PZ 32例,交界地带0例,TZ 36例;病灶体积0.95~3.95 cm3,病灶体积中位数1.60 cm3。

2.2 纹理特征选择结果

从研究的每个图像中总共提取了396个影像组学纹理特征,包括42个直方图特征,180个RLM特征,9个形态特征,11个GLSZM特征,10个haralick特征和144个GLCM特征。通过Mann-Whitney U检验,剩下112个影像组学纹理特征。随后使用MRMR方法减少了预测模型的冗余性和不必要的复杂性,最终使用RF分类器分析并保留了10个相对重要的纹理特征,它们的重要性是指在进行交叉验证时,每次构建模型时该特征都会保留(图1)。高危组和低危组前列腺腺泡癌中这10个纹理特征的比较见表1。

表1 高危组、低危组前列腺腺泡癌纹理特征比较Tab.1 Comparison of texture features between high-risk group and low-risk group of prostate acinus cancer

2.3 机器学习分类器性能结果

这10种纹理特征对高危组、低危组前列腺腺泡癌的预测性能如表2所示,包括每个纹理特征的AUC、灵敏度、特异度、准确度、阳性预测值和阴性预测值。利用这10个纹理特征参数组合构建了RF分类器预测模型,其ROC为0.76,灵敏度为0.63,特异度为0.77,准确度为0.70,阳性预测值和阴性预测值分别为0.75、0.65。纹理特征组合RF分类器预测模型的诊断性能如图2所示。

表2 纹理特征对高危组、低危组前列腺腺泡癌分类的预测性能比较Tab.2 Comparison of predictive performance of texture features for prostate acinus cancer classification between high-risk group and low-risk group

3 讨论

前列腺癌是全球最常见的非皮肤性男性肿瘤,GS系统是预测前列腺癌患者预后的有力工具[9~11]。由于GS=3+4分与GS=4+3分之间无生化复发生存率(biochemical recurrence-free survival,BRFS)有很大差异,它们相对于GS=6分的风险比分别为1.9和5.1[10]。美国约翰霍普金斯医院提出了一种新的预后分级系统,不再将GS=7分为单一组,而将其分为GS=3+4分(预后分级Ⅱ级)和GS=4+3分(预后分级Ⅲ级)[11]。影像组学是从多模态医学图像中提取大量的高维定量特征,然后挖掘这些特征与肿瘤的诊断及预后之间的相关性[12]。这些相关性通过影像组学分析得以揭示,将肿瘤解码为不同的影像学表型,结合临床特征及基因组/蛋白质组学检测的补充信息,影像组学可以对肿瘤的异质性进行全面评估[13]。与以前将医学图像进行视觉检查的方法相比,影像组学引入了一种新方法来挖掘医学图像中包含的信息。纹理分析作为影像组学的一部分逐步应用于临床,可对肿瘤的精准诊断与疗效评估提供帮助。

许多研究已经表明了GS=3+4分与GS=4+3分的前列腺癌患者预后的差异。在一项对263例前列腺癌根治术后病理GS=7分肿瘤患者的研究中,GS=4+3分的患者更有可能有精囊受累,病理分期更高,前列腺癌易外周侵犯,术前PSA中位数更高[3]。Sakr WA等[14]发现,在局限性前列腺癌患者中,GS=4+3分的患者的BRFS明显高于GS=3+4分的患者[14]。Chan TY等[15]调查了570例GS=7分的前列腺癌(无淋巴结转移,无精囊浸润,无第三级Gleason类型),GS=4+3分是预测肿瘤转移的有效指标。Alenda O等[16]通过对1 248例GS=7分肿瘤患者的单中心队列研究发现,GS=4+3分是生化复发的独立预测因子。有研究对959例接受根治性前列腺切除术治疗的日本前列腺癌患者(GS=7分)进行连续观察,发现4分为主要成分的GS与生化结果显著相关[17]。关于前列腺癌相关死亡率,Stark JR等[18]报道称,GS=4+3分患者致命性前列腺癌的发病率是GS=3+4分的3倍。笔者利用前列腺癌MRI纹理分析对前列腺癌GS高危组(GS≥4+3分)与低危组(GS≤3+4分)进行分类具有一定的临床价值。

近些年来,多项研究表明前列腺MRI纹理分析可用于前列腺癌的诊断及其侵袭性的评估[19]。Wibmer A等[20]研究了MRI的Haralick纹理在区分GS≤7分与GS>7分中的作用,发现GS≤3+4分癌与GS≥4+3分癌的熵有显著性差异。并揭示了ADC图对GS分期的有效性。Aerts HJWI[13]在前列腺切除术前对23例前列腺癌患者进行了3 T mpMRI,并分别从T2WI、DWI和DCE图像上提取肿瘤的纹理特征[角秒矩(angular second moment,ASM)对比度、相关性和熵],评估纹理特征与GS和MRI衍生参数之间的关联,以及这些参数在区分GS=3+4分和GS=4+3分前列腺癌中的效用,结果显示ASM和熵与GS和中位数ADC显著相关(P<0.05)。纹理特征与Ktrans和Ve相关不显著,GS=4+3分的癌ASM显著低于GS=3+4分的癌,熵明显高于GS=3+4分的癌。Sun Y等[21]对30例术前经mpMRI检查的前列腺癌患者回顾性分析,用T2WI纹理分析结合mpMRI来预测前列腺癌的级别高低,区分GS≥4+3分与GS≤3+4分,并与单独使用mpMRI进行对比。结果表明GLCM与GLRLM+mpMRI特征对肿瘤病理风险等级分层的AUC分别为0.84和0.82,二者结合AUC为0.91(95%CI为0.87~0.95)。谢金珂等[22]基于T2WI、ADC图对92例前列腺癌患者进行纹理分析,鉴别低级别(GS≥4+3分)和高级别的前列腺癌,AUC达到0.714。以往MRI纹理分析预测前列腺癌Gleason分级的研究中,病例数多在100例之内,且分析的纹理特征数有限。笔者研究对148例患者的T2WI和ADC图像进行纹理分析,共提取396个影像组学纹理特征,采用Mann-Whitney U检验和MRMR筛选,保留了10个可鉴别前列腺腺泡癌高低危组的相对重要纹理特征,最终基于这些纹理特征联合构建RF分类器预测模型,对前列腺癌高低危前列腺腺泡癌进行分层预测AUC为0.76。在筛选的10个相对重要纹理特征中,T2_wavelet_HHL_glszm_GrayLevelNonUniformity、T2_log_sigma_2_0_mm_3D_glszm_Gray-Level NonUniformityNormalized、ADC_wavelet_HLH_glszm_Large_AreaHighGrayLevelEmphasis单独鉴别高低危组前列腺腺泡癌的AUC分别达到了0.73、0.72、0.71。T2_wavelet_HHL_glszm_GrayLevelNonUniformity指T2图像灰阶的不均匀性,其数值越低,图像灰度越均匀[23],提示高危组前列腺腺泡癌实质内部更加不均匀。T2_log_sigma_2_0_3D_glszm_GrayLevelNonUniformityNormalized的意义为T2图像灰阶不均匀性的归一化,即数值越高,图像对比度越大,呈现的视觉效果越清晰,低危组前列腺腺泡癌相对于高危组前列腺腺泡癌的边界较为清晰[24],这与前列腺癌MRI的人工判读是一致的[25]。ADC_wavelet_HHL_glszm_Large-AreaHighGrayLevelEmphasis是指ADC图中大面积的高灰度优势,高危组前列腺腺泡癌在ADC图上呈现较高的灰度,即更低的信号强度[26]。其余的7个相对重要特征ADC_log_sigma_2_0_mm_3D_glszm_Size-ZoneNonUniformityNormalized(大小区域非一致性)、T2_log_sigma_3_0_mm_3D_glszm_ZonePercentage(区域百分比)、T2_wavelet_HHL_glszm_GrayLevelVariance(灰度方差)、ADC_wavelet_LHH_firstorder_Kurtosis(峰度)、T2_wavelet_LHL_glszm_LargeAreaHighGray-LevelEmphasis(大面积高灰度优势)、ADC_orginal_firstorder_10 Percentile(第10百分位数)、T2_log_sigma_4_0_mm_3D_glszm_SizeZoneNonUniformityNormalized(大小区域非一致性)的统计结果表明:高危前列腺腺泡癌的成分更为复杂[7],低危前列腺腺泡癌的图像纹理更加均匀[27]。笔者基于10个相对重要纹理特征建立的RF分类器模型对高低危前列腺腺泡癌进行预测时,AUC为0.76,大于单一纹理特征的鉴别效能,其原因可能在于从大量的影像组学特征中筛选出的最佳纹理特征组合,对高低危前列腺腺泡癌的鉴别效能较单一纹理特征更优。

尽早评估前列腺癌侵袭性对于疾病管理、治疗选择和患者预后至关重要。穿刺活组织检查、PSA水平和mpMRI是目前评价前列腺癌侵袭性的常用工具,前列腺穿刺活组织检查可能产生血尿、血便、感染、迷走神经反射等各种并发症,一定程度上限制了其临床应用[28]。探索一种新的、高精度的非侵入性检测方法已迫在眉睫。影像组学利用数据特征化算法可以从原始医学图像中自动提取大量高通量的定量特征,并且提供远远超出视觉分析范围的附加信息。此外,适当的特征降维和机器学习方法可以帮助临床获取最优的特征,从而对肿瘤患者实现高效和稳定的分类,采取精确适当的治疗,减少不必要的干预。

笔者的研究具有局限性:第一,该研究属于单中心研究,使用相同的扫描设备和序列,一定程度避免了数据产生较大的差异性,但对结果的推广使用不利,需要多中心、大数据的验证支持;第二,在勾画病变ROI时,MRI图像与病理切片难以完全匹配,这对ROI勾画的准确度有一定影响;第三,模型构建中未联合临床特征,可能降低纹理特征的病理分层效能。

综上所述,MRI纹理分析联合机器学习模型对前列腺腺泡癌Gleason分级具有一定的预测价值,可将高低危前列腺腺泡癌进行病理分层,有助于对前列腺腺泡癌患者的临床决策。

猜你喜欢
危组组学分类器
实时三维斑点追踪超声心动图联合微小RNA 评估早期急性心肌梗死危险程度的价值△
学贯中西(6):阐述ML分类器的工作流程
影像组学在肾上腺肿瘤中的研究进展
术前超声影像结合实验室指标对前列腺癌患者术后Gleason评分的预测效果
东莨菪碱中毒大鼠的代谢组学
老年人上消化道出血临床特点及治疗体会
影像组学在核医学影像中的应用进展
基于朴素Bayes组合的简易集成分类器①
蛋白质组学技术在胃癌研究中的应用
基于动态分类器集成系统的卷烟感官质量预测方法