李飞,张白霖,王学涛(通信作者)
广州中医药大学第二附属医院 (广东广州 510006)
医学影像学是医学科学的重要分支,在肿瘤诊断、治疗及预后评估中发挥着重要作用。肿瘤具有空间和时间异质性,且异质性是预测肿瘤患者预后的重要因素,但即使采用活检也难以准确评估肿瘤异质性。近年来,随着医学及信息技术的发展,医学成像分析成为了新的研究方向。影像组学通过采用先进的医学图像计算方法可定量描述肿瘤组织特征,从而进行数据化分析,辅助医师对整个肿瘤进行评估,具有无创、可重复的优点。
Aerts 等[1]于2014 年开创性地发表了影像组学相关研究成果,在肺癌和头颈癌患者的独立数据集中,大量影像组学特征具有预测肿瘤患者在接受常规治疗后各项身体机能恢复和预后复发情况的作用,从而可鉴定预后表型。Liu 等[2]基于35 例鼻咽癌患者腮腺的CT 影像组学特征建立模型,该模型预测鼻咽癌放疗期间急性口干症的灵敏度、特异度分别为1.000、0.922。Zhuo 等[3]建立了基于658 例非转移性鼻咽癌患者的多参数MRI 影像组学特征模型,结果表明,该模型可将患者分为不同的生存亚组,且预后分层效果优于TNM 分期系统。但目前影像组学在推广应用方面存在一些问题,如特征稳定性(可重复性)较差等。影像组学应用时需进行图像采集、靶区勾画、特征提取和临床问题建模。由于各研究使用的数据及方法缺乏统一标准,影像组学应用过程中的每个步骤均可使结果产生差异。其中,非标准化的影像采集对样本数据质量影响较大,导致特征稳定性较差,进而影响影像组学的临床研究效果。因此,影像组学研究的标准化成为一个重要的研究领域。2016 年,Kim 等[4]通过卷积神经网络学习低分辨率图像和高分辨率图像间的残差,并利用残差和低分辨率图像之和将低分辨率图像转换为高分辨率图像。Choe 等[5]在研究中将肺癌患者的CT 图像进行转换,分析重建核和图像转换对肺部肿瘤影像组学特征稳定性的影响。针对影像组学稳定性差的问题,本研究通过将深度学习卷积神经网络应用于图像转换,从而减小CT 重建核函数对影像组学特征稳定性的影响。
选取29 例鼻咽癌患者的头颈部CT 影像数据,每例均选择4 种核函数(B10、B30、B50、B70)进行重建,并勾画肿瘤靶区及脑干、眼球等14个感兴趣区。
采用分割算法分割感兴趣区,然后利用Pyradiomics 库以Python 语言提取影像组学特征,对每个样本分别提取851 种特征,其中原始107 个,小波滤波744 个。
本研究使用的卷积神经网络具有6 个卷积层,核的大小为3×3,除最后一层外,每层均含64 个滤波器组,可提取64 个不同的特征图。训练的迭代次数为300 次,训练1 次批量为5,以均方差为损失函数,优化方案为Adam(4),学习率为0.0001。以原始的512×512矩阵为输入和输出图像的大小,并于训练中应用残差学习。图像输入网络后,生成残差图像(输入图像和目标图像之差),最终输出转换后的图像(输入图像与残差图像之和),见图1。B10、B30、B50、B70 图像经转换后分别变为fB70、fB50、fb30、fB10 图像。以29 例头颈部CT 图像(共计4 417 张DICOM 图像)为训练集,以10 例头颈部CT 图像(共计1 333 张DICOM 图像)为测试集。
图1 卷积神经网络结构
以核函数B10 重建的CT 图像经卷积神经网络转换为fB70 的CT 图像为例(图2)。利用完成训练的神经网络模型结构及参数,将以核函数B10 重建的CT 图像作为输入图像,即可得到以核函数B10 重建的CT 图像与以核函数B70 重建的CT 图像之间的残差,将残差值与输入值相加即可得到输出值,即生成fB70 的CT 图像,见图2B。同理,将4 种不同重建核函数的图像进行转换。
图2 头颈部CT 转换图
以B10-B70 组图像为例,对转换后的fB10、fB70 图像进行影像组学稳定性评估。将fB70 的CT图像与重建核为B70 的CT 图像进行配对,将fB10 的CT 图像与重建核为B10 的CT 图像进行配对,与重建核B10、B70 的CT 图像CCC 进行比较。
以CCC 阈 值(0.60,0.65,0.70,0.75,0.80,0.85,0.90,0.95)为x轴,以达到各CCC 阈值的特征数量占比为y轴,绘制折线图(图3、图4)。以CCC>0.85 为影像组学稳定的标准,符合标准的B70-fB70、B10-fB10 的CCC 的特征数量占比高于B10-B70。
图3 CCC 阈值折线图(B70-fB70 与B10-B70)
图4 CCC 阈值折线图(B10-fB10 与B10-B70)
利用Python 提取并计算图像fB10、fB70 的CT值,并分别计算fB10 与B10、fB70 与B70、B10 与B70 的均方差、平均绝对值误差、峰值信噪比、结构相似性数值的平均值,见表1。由表1 可知,B10-fB10 与B70-fB70 的均方差、平均绝对值误差均低于B10-B70,而B10-fB10 与B70-fB70 的峰值信噪比、结构相似性高于B10-B70。
表1 转换后图像均方差、平均绝对值误差、峰值信噪比、结构相似性指标
影像组学的概念最早由荷兰学者Lambin 等[6]提出,即从医学影像中提取高通量成像特征并创建高维数据集。近年来,影像组学研究在疾病诊断、治疗及预后评估方面取得了一系列进展。在疾病诊断和分类方面,Sun 等[7]对170 例患儿的脑部MRI图像进行了研究,基于影像组学特征诊断注意力缺陷多动障碍并预测分型,取得了较好的预测结果。Kirienko 等[8]通过评估CT 和PET 影像组学特征将肺部病变分为原发性与转移性,从而得知影像组学具有区分原发性肺癌组织学亚型的作用。在治疗方案决策方面,Teruel 等[9]通过动态对比增强MRI 纹理分析可预测局部晚期乳腺癌患者对新辅助化疗的临床和病理反应的预处理,结果表明,纹理分析可辅助判断治疗方案的合理性,为临床医师提供参考信息。Shiradkar 等[10]基于影像组学的靶向放射治疗计划(Rad-TRaP)和MRI 前列腺癌治疗计划的计算框架可生成重点治疗计划,减少危及器官受照射剂量,并增加靶向癌性病变的剂量。
各项数据间差异较大是影像组学研究过程中需迫切解决的问题。CT 扫描为肿瘤诊断及治疗的常用影像手段。研究表明,不同条件(扫描设备、扫描参数、重复扫描、感兴趣区分割、特征提取)是影响CT 影像组学特征稳定性的不利因素[11-14]。Hunter 等[11]研究了不同扫描机器和不同图像类型对特征稳定性造成的影响。有研究表明,过拟合和欠拟合均为影响统计学习或机器学习模型稳定性的重要因素,模型的泛化能力差,无法正确分类或预测,通过对CT 图像进行重复扫描可提高模型稳定性[12-13]。另有研究表明,相较于手工勾画,自动(或半自动)分割方法同时兼顾减少人工干预、提高分割精度及稳定性,因此能够获得更加稳定的感兴趣区[14]。此外,使用不同核函数重建得到的图像提供的诊断信息侧重点不同。因此,临床通常使用不同核函数进行图像重建。卷积神经网络是一类包含卷积计算且具有深度结构的前馈神经网络,擅长处理图像特别是大图像的相关机器学习问题。卷积神经网络通过一系列方法,可成功将数据量庞大的图像识别问题不断降维,最终使其能够被训练。本研究旨在分析基于卷积神经网络重建核函数对头颈部CT 影像组学特征稳定性的影响。与相关研究不同,本研究不仅评估肿瘤区的影像组学特征稳定性,同时也对如脑干、脊髓、中耳等共13 个正常器官予以评估,共勾画14 个感兴趣区,提取了851 种影像组学特征。结果显示,符合标准(以CCC>0.85 为影像组学稳定的标准)的B70-fB70、B10-fB10 CCC 的特征数量占比高于B10-B70,B10-fB10 与B70-fB70 的均方差、平均绝对值误差均低于B10-B70,而B10-fB10 与B70-fB70 的峰值信噪比、结构相似性高于B10-B70,表明通过卷积神经网络实现图像转换可提高影像组学特征稳定性,减小不同重建核函数产生的差异。