杨翠红,张璐雯,王子兴,姜晶梅
(中国医学科学院基础医学研究所 北京协和医学院基础学院流行病与卫生统计学系,北京 100005)
肺癌是我国乃至世界上死亡率最高的恶性肿瘤,5年生存率不足20%[1-2]。肺癌高危人群的早期诊断、早期治疗能提高患者预后,如Ⅰ期肺癌患者切除术后5年生存率达70%以上[3-6]。肺癌筛查是发现早期肺癌的重要手段,但其伴随的极高假阳性率是一项重大挑战[7]。肺癌筛查中的“假阳性”是指按照一定的标准判断为阳性而事实上并非肺癌的情况[8-9]。美国国家肺癌筛检试验对高危人群进行低剂量CT筛查发现,肺癌的死亡率降低了20%,但假阳性率高达96%[9]。这给筛查对象带来身心负担、过度诊治等问题[10-12]。大规模筛查中医师人数和精力相对有限,且影像图像的噪声和肺结节特征多样性均会影响筛查效率,而20世纪中期兴起的计算机辅助诊断则提高了检测效率[13],但假阳性问题同样不容忽视,如Silva等[14]在2 303例低剂量CT肺癌筛查数据库基础上,对磨玻璃样结节进行检测,计算机辅助诊断的灵敏度为88.4%,但平均每4次扫描存在1个假阳性结节(假阳性结节数/筛查总人数)。
在肺结节筛查过程中,通常用经典的欧氏几何来量化结节特征(如体积、直径),这些指标具有临床可解读性,然而对于隐匿复杂的结构信息,欧式几何则很难将其准确量化,该部分信息常会被忽视;数学学科中的分形分析可有效捕捉这一复杂结构信息。分形分析可为临床医师筛查或诊断肺部疾患提供丰富的图像信息。现就分形分析在肺部肿瘤和其他肺部病变中的应用进展予以综述。
1.1几何特性 “分形”的概念最早由Mandelbrot[15]于20世纪60年代提出,是对没有特征长度(如圆的半径可视为其特征长度)但具有一定意义的自相似图形和结构的总称。分形理论是了解自然界不光滑、不规则的几何形体的基本工具。分形有3个特性[16]:①自相似性,即在某种形式上,总体的任何一部分与总体相似;②尺度可变性,即尺寸缩放不影响分形特点;③分形是不规则的,不能用传统的几何语言来描述,与欧式几何的整数维度不同,分形可以是非整数维。
1.2主要参数
1.2.1分形维数(fractal dimension,FD) FD是分形分析中的重要参数,用于描述具有分形填充研究空间的方式[16-17]。1919年Hausdorff给出FD理论层面的定义,而后有学者提出具有实际应用价值的FD[17]。下文对经典的盒维数的定义及常用算法进行介绍。
设某集合是度量空间S上的有界子集,对每个r>0,用Nr表示覆盖该集合的半径为r>0的闭球的最少个数,如果存在
(1)
则此极限值为该集合的盒维数。
在医学图像数据挖掘中,盒维数最经典的计算方法是盒计数法(box-counting method,BCM),其他实用的校正BCM的方法——差分盒计数法(differential box-counting method,DBCM)、扩展BCM、分段修正盒计数也在文献中有所涉及[18-19]。在肺部图像分析中,以BCM与DBCM最为常用[20-29]。
BCM假设用边长为r的盒子覆盖不规则形体,则
Nr=Kr-D
(2)
随着r的变化,可以得到不同的盒子数Nr,对其进行log转换
logNr=logK-Dlogr
(3)
根据式(3),绘制得到以logr与logNr为x轴和y轴的散点图,对其拟合回归直线(图1),回归系数D为盒维数,logK表示研究对象的面积或体积,更接近于一个简单的欧式几何意义[30]。
盒维数估计值=1.63
BCM原理和计算简便,但信息提取能力有限,只能提取研究对象的几何结构信息。与BCM相比,DBCM可很好地量化粗糙表面,估计出的FD更精确[31]。
DBCM于1995年由Chaudhuri和Sarkar[19]提出,将图像映射到以(x,y)为二维位置,以灰度值作为高度(z)的三维空间,得到
(4)
其中nr(i,j)=l-k+1,表示第(i,j)位置的盒子数,l和k分别表示在(i,j)位置上的最大高度值和最小高度值分别落在第l和第k个小盒子;然后依据式(3)得到差分盒维数。DBCM利用了图像的灰度级,可以弥补BCM无法很好地提供粗糙表面这一缺陷。
另外,由于影像图像的像素强度和位置不能以相同的比例缩放,使用符合强度标度独立性的方法计算FD更为合适,如傅立叶功率谱法[31]。
1.2.2空隙度 20世纪60年代后期Mandelbrot和Van Ness[32]提出空隙度,即具有相同FD的研究对象也可能具有显著不同的外观或纹理,为此,1983年Mandelbrot[33]引入空隙度来描述这一特征。
空隙度[22]用于描述物体或图像中的空隙的分布和大小,与FD相对应。其定义为:
(5)
M=KLD
(6)
其中M是分形集的质量,E(M)是期望质量。这一定义测量了实际质量和预期质量之间的差异。空隙度能给出易于解释的图形结果,可应用于任何维度的数据[34]。
分形参数可用于度量肺部肿瘤以及其他肺部疾患的形态信息,且与诊断疾病的关键指标有较好的相关性[26,35]。在肺部研究中,分形分析在肺部肿瘤、慢性阻塞性肺疾病、间质性肺疾病中均有应用,更多的是应用于肺部肿瘤以及慢性阻塞性肺疾病的诊断,见表1、2。
表1 分形分析在肺部肿瘤图像的应用
表2 分形分析在其他肺部病变图像的应用
2.1肺部肿瘤 在肺部肿瘤中,小细胞癌恶化速度快、手术预后差,难以实现早期诊断和治疗,且占比较小,因此非小细胞癌尤其是发病率相对较高的鳞癌和腺癌是分形分析研究的重点。
2.1.1提取感兴趣区域(region of interest,ROI) 提取ROI是计算机辅助诊断的首要环节,有研究者采用FD对图像进行增强,FD的选择多是基于DBCM获得的盒维数[21,37]。将每个像素点转化为FD值,使图像增强,不同组织结构的边缘更加清晰,从而达到更易提取ROI的目的;计算肺结节纹理特征的盒维数并结合最大类间方差法,设计出图像分割判别条件从而提取ROI。Al-Kadi和Watson[21]应用前者对分辨率为512×512 pixels的增强CT图像进行ROI的提取。罗晓华[37]则应用最大类间方差法提取ROI,并对低对比度的图像进行加权分数维灰度增强,从而更易提取ROI。
2.1.2量化肺结节特征 肺结节的形态信息量化对计算机辅助诊断效果至关重要,常采用的特征分类包括几何特征和纹理特征。FD可分别或同时量化这两种特征,而后者在应用于肺结节鉴别的研究中更为多见。联合分析FD量化结节的几何特征和纹理特征[24,35,38]可为结节的诊断提供更多信息。此外,根据不同设备成像的特点,FD还可量化结节的内部异质性[20,36]。Miwa等[36]基于氟代脱氧葡萄糖(fluorodeoxyglucose,FDG)PET/CT鉴别非小细胞癌患者,FDG PET/CT可同时获得肺部解剖和功能图像,由于肿瘤细胞可浓聚FDG,恶性肿瘤在显像上表现为FDG摄取增高的阳性病灶,因此除盒维数量化几何特征外,还可通过量化FDG摄取的异质性来反映结节内部异质性,联合利用其量化两方面特征的鉴别准确度较仅量化几何特征更高(分别为62.9%和94.4%)。
2.1.3肺结节性质的鉴别与分期 FD的分析简洁明了,多数研究比较良性、恶性结节的FD值的差异性,结果显示恶性结节的FD值高于良性结节[20,22-24,38-39]。然而,虽然FD对图像本身所产生的噪声不敏感[21],但如果肺部肿瘤患者同时患有其他肺部疾病,则噪声会对鉴别造成干扰。Matsuoka等[22]对周围型孤立性肺小结节进行鉴别,发现FD对含有肺气肿结节鉴别的错误率较高,在含有肺气肿的结节中鉴别准确度为63%,且误诊的结节中56.7%含有肺气肿,而在没有肺气肿的结节中,鉴别准确度为93%,且恶性结节FD值高于良性结节。提示在使用FD作为参考指标进行诊断时,应充分重视肺气肿等其他肺部疾病对结果的影响。
一般来说,量化结节的几何特征通常利用BCM得到二值图像的盒维数,而对于纹理特征通常采用DBCM得到灰度图像的盒维数。研究者通常根据所利用图像数据维度将FD分别表示为二维FD和三维FD。在肺结节良、恶性鉴别的研究中常将二维FD、三维FD联合应用[24,36,38],而肿瘤分期鉴别一般应用三维FD进行分析[21,35]。虽然三维FD较二维FD提供的结节信息更多,但不同类型结节具有不同的几何和纹理特征,仅对其中一种特点进行分析并不能区分多种类型的结节,因此两者应用又各有优势。Kido等[38]基于薄层CT图像结合二维FD和三维FD对不同类型结节(良性:错构瘤、组织性肺炎、结核瘤;支气管癌:腺癌、鳞状细胞癌)进行细致分类。在几何特征方面,由于错构瘤的轮廓较其他结节光滑,在大小为64×64 pixels ROI中,二维FD可识别出错构瘤,其二维FD值在所有类型结节中最小;但二维FD无法区分除错构瘤外的其他结节,因此以三维FD量化大小为32×32 pixels ROI的纹理特征,结果显示组织性肺炎三维FD值在所有类型结节中最大(P<0.000 1),腺癌的三维FD值大于鳞状细胞癌(P<0.05),但三维FD不能区分错构瘤与恶性肿瘤[38]。
不同阶段肺癌的形态不同,FD也可作为鉴别肺癌分期的指标进行辅助诊断。如Al-Kadi和Watson等[21]利用FD对15例肿瘤面积>10 mm2的肺癌患者(晚期9例、早期6例)的肺癌分期进行鉴别,结果显示晚期(Ⅲ和Ⅳ期)恶性肿瘤的FD值高于早期恶性肿瘤,以1.913为阈值鉴别的准确度为83.3%。
2.1.4影像组学指标联合应用 FD虽然在区分不同类型结节以及不同阶段恶性肿瘤方面均有良好的表现,但仅是量化结节的几何特征和纹理特征,而结节的复杂性远不仅表现为这两种特征。因此,除二维FD、三维FD结合应用外,研究者还考虑其他影像组学指标[26,35-36],如结合灰度特征参数(平均密度值[35]、标准差[35]、方差[23])、其他分形参数(空隙度[21])等。然而,在以FD为主要参考指标的研究中,研究者多仅关注FD,较少探讨其与其他影像组学指标的关系及联合应用的综合效果。
2.2慢性阻塞性肺疾病 除应用于肺部肿瘤外,分形分析也被用于其他肺部疾病。2018年中国肺健康研究计划数据显示,中国成人慢性阻塞性肺疾病总患病率为8.6%[28],而近年来分形分析也应用于慢性阻塞性肺疾病。
肺部气管、支气管,形状似“树”,这种存在自相似性且复杂的形体很难用欧式几何描述特征,而采用分形分析可以很好地了解肺部气管支气管的结构和肺部疾患的严重程度[42]。一般侵袭性越强肺结节FD值越高,而在慢性阻塞性肺疾病的研究中,FD值与疾病严重程度呈负相关[25-26,43-45]。Hwang等[25]与Bodduluri等[26]通过分形分析探讨慢性阻塞性肺疾病患者的生存情况,以盒维数量化组织结构的复杂性,从而判断慢性阻塞性肺疾病的严重程度,FD值较高提示肺实质在三维空间中具有更大的空间填充特性,表明肺功能相对较好[25];Bodduluri等[26]通过FD度量气道的形态复杂性,气道分形维数(airway fractal dimension,AFD)较小表明气道形态狭窄或气道堵塞,则患者肺功能越差;AFD不仅能通过度量气道狭窄程度反映肺功能,也是慢性阻塞性肺疾病预后的独立预测因子,AFD越小患者的生存率较低,由于FD值与肺功能指标具有相关性,临床可接受性较强。气道狭窄程度也可以通过肺部呼出气溶胶的复杂程度来判断,根据每个气道结构的特定气溶胶指纹,Xi等[44]通过计算所构建得到呼出气溶胶图像FD,揭示了FD值大小与呼吸道疾病严重程度的关系,即气溶胶指纹的FD值越大,呼吸道疾病的严重程度越轻。
肺部结构满足分形特征,其图像在不同放大倍数下也呈现自相似性[17,29,37],Baish和Jain[46]也讨论了分形分析应用于肿瘤研究的价值。分形分析在肺部疾患临床诊疗中具有一定应用潜力,但仍存在以下问题:①FD结果可能受组织学类型或炎症条件的影响[20,27],需要深入探讨分形分析在不同类型肿瘤的应用;②在肺癌分期的鉴别中,CT切片越薄以及图像分辨率越高则肺癌分期鉴别的准确性越高,也使研究形态较小的早期肿瘤成为可能[21];③与其他指标联合应用进行鉴别的研究有待丰富;④二维图像可能会丢失肿瘤的整体信息,且肿瘤较小时,三维图像的结果更平稳[27],但三维图像的分形分析方法在医学影像图像领域尚有待普及[17];⑤多数研究是通过BCM和DBCM获得FD,双毯法[39]和功率谱法[29]应用较少,开发更适用于影像图像的计算方法值得进一步探索。分形分析能够挖掘具有复杂结构的肺结节图像信息,现有研究提示可考虑将其参数纳入肺癌筛检的影像组学指标,以降低肺癌筛查的假阳性率,从而减少筛查对象过度诊疗等问题。