【作 者】张耀楠,张永亮,,肖杨
1 西安思源学院电子信息工程学院,西安市,710038
2 东北大学中荷生物医学与信息工程学院,沈阳市,110169
3 中国科学院深圳先进技术研究院生物医学与健康工程研究所,深圳市,518055
用于乳腺癌诊断的超声弹性图像特征选择与分类实验
【作 者】张耀楠1,2,张永亮2,3,肖杨3
1 西安思源学院电子信息工程学院,西安市,710038
2 东北大学中荷生物医学与信息工程学院,沈阳市,110169
3 中国科学院深圳先进技术研究院生物医学与健康工程研究所,深圳市,518055
乳腺癌是女性最常见的恶性肿瘤,而怎样利用超声弹性图像定量地诊断乳腺癌还是尚未解决的问题。该文根据乳腺肿块图像弹性信息,提取5个弹性特征来描述肿瘤的弹性属性;提取肿块的4个灰度共生矩阵特征来描述乳腺肿块的纹理特征。为进一步研究应用SVM分类器,对这些特征进行训练而完成分类,并且运用一致性、分类精度、ROC曲线及曲线下面积AUC对分类结果进行评估。利用超声弹性成像设备从实际病人采集数据,共采集了142例患者195个病灶的图像数据。实验结果表明,提取出的弹性特征分类性能良好,而支持向量机比较适合乳腺图像分类,分类精度比较高,有比较好的诊断价值。同时也发现,提取的灰度共生矩阵特征诊断价值比较低,参考意义较少。
超声;弹性图像;纹理;SVM分类器;乳腺癌
乳腺癌是女性最常见的恶性肿瘤之一,其发病率已居女性恶性肿瘤首位。超声因为便宜、无创伤、灵便、无辐射等优点,已经成为了诊断乳腺疾病的常规影像学方法之一,而超声弹性成像(Ultrasound Elastography,UE)是将人体组织的软硬程度显示为彩色图像,可以帮助医生诊断乳腺肿瘤良恶性,能够为临床诊断提供更准确信息,已经显示出良好的前景[1-2]。
弹性成像的概念被提出后,在最近的几十年间得到了快速的发展,已经成为了诸多医学应用领域广泛关注的课题。1998年Krouskop 等[3-4]学者发现乳腺内部弹性系数由于组织的不同而各不一样,弹性系数按大小排列依次为浸润性导管癌、非浸润性导管癌、乳腺纤维化、正常乳腺组织和脂肪组织。2004年Itoh[5]最早提出弹性成像评分系统,之后日本Tsukuba大学的植野教授提出5分法,对乳腺肿瘤的弹性进行分级,并且提出以UE评分≥3分作为恶性病变的诊断标准。但是植野教授提出的评分法不能够包含所有类型的UE 图像,这使得检测结果出现误诊或漏诊情况;继而中山大学第二附属医院罗葆明教授[6]提出改良5分法,目前临床多采用改良的5分法评分标准;随后,沈建红等提出新的7分法评分标准,曾婕等提出8分评分标准。还有学者提出一种新的估算组织硬度的方法,即应变率比值(Strain Ratio, SR)法,它是一种定量估算的方法,通过计算病灶区域和周围组织区域的应变率的比值,推断出病灶相对于周围正常组织的硬度,该弹性特征主要用于占位性病变的检测和诊断[7-9]。
超声弹性成像技术已经有一些成熟的产品,开始在临床得到应用,但现在医生面临的问题是怎样利用这些新的成像模式定量地进行诊断,这方面还有不少工作需要完成。针对此问题,本文根据乳腺肿块图像弹性方面信息,提取5个弹性特征来描述肿瘤的属性;提取肿块的4个灰度共生矩阵特征来描述乳腺肿块的纹理特征;提取圆度特征来描述肿块的形状变化情况。这些特征对于乳腺肿瘤的定量鉴别有着重要意义。本文进一步研究应用SVM(Support Vector Machine)分类器,对这些特征进行训练,完成分类,并且运用一致性、分类精度、ROC曲线及曲线下面积AUC对分类结果进行评估,以评价特征分类性能的好坏。
本文所用数据是由科学院深圳先进技术研究院保罗·劳特伯生物医学成像研究中心国家工程超声实验室和中山大学附属第三医院超声科共同采集的。由3名有着 2~10年乳腺超声信息采集工作经验的医生,采用日本日立公司 HITACHI-8500彩色多普勒超声诊断仪采集。该设备具备实时组织弹性成像(Real-Time Elastography imaging,RTE)功能。
采集的具体流程如下:选择设备预设的乳腺检查条件[9],根据乳腺腺体层、脂肪层及胸壁肌层的厚度,调整深度、增益及聚焦部位,使二维超声能够清楚显示乳腺的解剖分层;嘱咐患者仰卧,必要时左侧卧或右侧卧,双手自然上举,充分地漏出乳房和腋窝,以乳头为中心行乳腺放射状纵切、横切、斜切面常规检查;然后待图像稳定后,再切换到超声弹性成像模式,采用双幅实时显示功能,调节取样框大于病灶范围2倍,使用 Itoh 等描述的手动加压技术生成图像,手持探头垂直于胸壁与胸大肌,在病灶部位作微小振动,探头在加压时外力要<10%,主要靠自主呼吸和心搏的幅度完成超声诊断仪的弹性计算。观察二维图像与弹性图像,重点观察肿块及周围组织形变情况,调整图像清晰程度。
2.1 图像去噪
超声图像固有的斑点噪声由超声成像的相干性导致,斑点噪声降低了图像质量,图像某些细节信息遭到掩盖,给图像的边缘检测、特征提取等后续处理带来困难。去噪主要目的是抑制斑点噪声,改善图像质量。本文采用一种各向异性扩散滤波器(Speckle Reducing Anisotropic Diffusion,SRAD),它能够在降噪的同时,保留甚至增强图像中的边缘信息。较小明亮细节存在于经过斑点噪声滤波后的图像较低灰度值区域(如肿瘤内部),而较高灰度值区域(如周围的软组织)存在着较小暗色细节,这主要由肿瘤内部微细结构(如血管、钙化灶等)组成,可通过形态学滤波器平滑。采用交替顺序滤波,即用一系列不断增大的结构元素来执行开闭滤波,结构元素取圆盘型,半径可以设置为 2~5个像素。
2.2 肿瘤区域分割
由于弹性信息图像上仅显示组织间弹性系数关系,因此病灶区域分割首先在B模式图像上实现,然后映射到弹性信息图像上,以便于用于接下来的弹性特征提取。本文的分割方法是水平集方法,分割结果如图1所示。
图1 肿瘤区域分割结果Fig.1 Tumor segmentation result
2.3 软硬区域界定
在弹性图像中,良恶性肿瘤软硬程度差异大,弹性模量量化值代表了组织的弹性程度,即软硬程度,因此可通过组织的硬度值量化其弹性模量值。为了确保弹性模量量化值提取的准确性,需要对病灶及其周边区域内的硬区间进行精确的定义。
以往的弹性模量量化值提取中,软硬区域通过一个固定阈值来定义。不同患者弹性图像中同一颜色实际对应的应变力不一定相同,固定阈值分割技术适用性不强,导致弹性值量化有较大的误差。乳腺弹性信息图像上组织内部颜色变化没有明显的界限,肿瘤内部软硬区域的界限是不分明的模糊集。针对这一特征,本文采用模糊聚类分析技术实现软硬区域的自动界定。结果如图2所示,图中白线为硬区间边界线。
图2 软硬区域的自动界定Fig.2 Automatic separation of soft and hard regions
在弹性图像中,弹性系数小的组织较软,显示为红色;弹性系数中等的组织显示为绿色;弹性系数大的组织较硬显示为蓝色。结合病理学知识和医生的临床经验,一般认为[10]:良性表现为蓝、绿色,病灶内部弹性分布较均匀,与周围组织弹性的对比度较小;恶性病灶表现为红、黄色,病灶内部的弹性分布不均匀(如血管,钙化灶等),与周围组织弹性的对比度较大。本文根据乳腺肿块图像弹性方面信息,提取5个弹性特征来描述肿瘤的弹性属性[11-14];提取肿块的4个灰度共生矩阵特征来描述乳腺肿块的纹理特征;提取了圆度特征来描述肿块的形状变化情况,下面分别描述。
3.1 弹性特征
(1) 肿瘤区域硬度率
肿瘤区域硬度率定义为肿瘤内部硬区域面积与肿瘤面积之比。它能够表现出肿瘤内部的软硬程度,对于乳腺良恶性肿瘤来说,恶性肿瘤区域硬区域所占比重大于良性肿瘤区域内硬区域所占比重,硬度率可以作为乳腺肿瘤良恶性判别的一个重要依据。
(2) 肿瘤周边区域硬度率
肿瘤周边区域硬度率定义为肿瘤周边区域硬区域面积与肿瘤周边区域面积之比。肿瘤周边区域的划分方法为:采用形态学图像处理方法,设定半径为20个像素的圆盘型结构元素,对肿瘤区做膨胀运算,得到肿瘤周边组织区域,结果如图3所示。恶性肿瘤重要的生物学特征之一就是恶性肿瘤的浸润性生长,因此对于乳腺恶性肿瘤来说,肿块区域周边的硬度率会因为恶性肿瘤的浸润性发生变化。
图3 病灶周边区域Fig.3 The surrounding area of lesions
(3) 弹性比
弹性比定义为肿瘤内部均值与除肿瘤区域外的ROI区域均值之比,弹性比值能够表现出来肿瘤与周围正常组织区域的弹性变化程度,相对于乳腺正常组织来说,乳腺病灶区域的硬度会发生变化,弹性比就有了重要的研究价值。
(4) 面积比
面积比定义为总面积(肿瘤周边区域与肿瘤内部区域)内硬区域面积与肿瘤内部硬区域面积之比,肿瘤区域及周边区域中的硬区域的面积由于恶性肿瘤的浸润性特性会发生变化,面积变化的情况能够有效地描述乳腺肿块的特性。
(5) 同深度均值比
均值比定义为肿瘤内部像素均值与其同深度组织处像素均值之比,乳腺组织由于肿块的产生使得肿块处的硬度相对于同深度组织处的硬度发生变化。
3.2 纹理特征
灰度共生矩阵(Gray Level Co-occurrence Matrix,GLCM)是像素距离与角度的矩阵函数,是一种检测像素之间空间关系纹理特征的统计方法,它通过计算图像中特定的像素在某一空间位置关系中出现的次数来反映图像灰度在不同方向、不同间隔上的变化幅度及变化快慢上的综合信息。
本文使用下面几种基于灰度共生矩阵的纹理特征:① 对比度(Contrast) 对比度反映了图像的清晰度和纹理沟纹深浅的程度;② 相关性(Correlation)相关性是用来度量空间灰度共生矩阵元素在行方向上或列方向上的相似程度;③ ASM能量(Angular Second Moment,ASM) ASM能量是灰度共生矩阵元素值的平方和,表征图像灰度均匀分布程度和纹理粗细度;④ 同质性(Homogeneity) 同质性表征图像纹理局部变化的程度。
3.3 圆度
在乳腺肿瘤图像中,圆度是用来描述病灶区域与圆形的偏离程度的参数,计算公式为:
式(1)中,A为病灶区域的面积,D为病灶区域的周长。相同面积条件下,圆形区域的周长最短,其圆形度roundR=1。若可疑区域越接近于圆形,其圆度值越接近于1,反之越接近于0。对于良恶性肿瘤来说,良性肿瘤边界比较清晰、光滑,呈现类圆型;恶性肿瘤边界模糊,带有毛刺,不规则形。故良性肿块圆度值要大于恶性肿块,圆度值可以作为肿瘤良恶性判断的特征标准之一。
4.1 数据病理统计
本文中,实验数据来源于中山大学附属第三医院超声科,经病理证实,数据有142例患者共195个病灶,年龄范围是16~81岁,平均年龄为48.5岁。其中,良性病灶129个,尺寸范围为3.2~112.4 mm,平均尺寸是17.8 mm;良性肿块中有纤维腺瘤88个,纤维囊性乳腺病33个,导管内乳头肿瘤3个,良性叶状肿瘤4个,囊性增生1个;恶性病灶66个,尺寸范围为4.1~43.2 mm,平均尺寸为23.4 mm;恶性肿块中有浸润性导管癌59个,粘液癌3个,重度非典型增生2个,导管内原位癌1个,乳腺浸润性小叶癌伴粘液癌1个。
4.2 实验结果
实验中对195副图像各提取10个特征值构成特征向量,采用支持向量机分类器训练分类模型,应用留一法对特征进行交叉验证,同时将这些特征的联合特征(Computer Aided Diagnosis,CAD)与医生评分系统(Breast Imaging-Reporting and Data System,BI-RADS,美国放射学会推荐的乳腺影像数据报告系统)做对比研究。除此之外,均值、一致性测度的P参数(分布),ROC (Receiver Operating Characteristic Curve)曲线及曲线下面积AUC(Area Under Curve)、分类精度,也被运用于分析10个特征值的分类性能。
4.2.1 均值及t分布参数
实验结果中,特征的均值及t分布参数见表1。表1中10个特征参数的分布下P值均小于0.001(标准为P<0.05),具有统计学意义,乳腺良恶性肿瘤的10个特征差异显著。
4.2.2 分类准确率(精度)及曲线下面积AUC
实验结果中,10个特征、联合特征(CAD)以及医生评分系统(BI-RADS)的准确率(Accuracy)、灵敏度(Sensitivity)、特异度(Specificity)、阳性预测值(Positive Predictive Value,PPV)、阴性预测值(Negative Predictive Value,NPV)、曲线下面积(AUC)被计算列举在表2、表3中。
表1 特征的均值及t分布参数Tab.1 The means of features and parameters of t distribution
表2 弹性特征、CAD及医生评分的分类精度及AUCTab.2 The classifcation accuracy of elastographic features, CAD and BI-RADS
表3 灰度共生矩阵特征的分类精度及AUCTab.3 The classifcation accuracy of GLCM and AUC
总体来说,5种特征在乳腺肿瘤良恶性分类有一定的分类价值,能够运用到分类系统中,尤其是CAD联合特征表现出良好的性能,在乳腺肿瘤良恶性诊断中表现的性能很好,虽然存在一定的假阳性及漏检率,但是比医生评分系统(BI-RADS)性能要好,可以说本文设计的方法具有一定的应用价值,为医生在乳腺肿瘤良恶性的诊断上提供帮助。
表3中,可以直观地发现,5种灰度共生矩阵特征的准确率、灵敏度、特异度均低于70%,有的甚至低于50%,只有对比度特征的准确度(60%)及特异度(69%)表现为诊断价值极低,在乳腺肿块良恶性分类中表现为不能够有效地诊断其良恶性。总的来说,5种灰度共生矩阵特征诊断的结果没有借鉴价值,不能够有效地识别乳腺肿瘤的良恶性,在肿瘤分类中体现的意义不大,在以后的研究学习中会去除这几个特征以加快计算速度,提高SVM的分类效率。
4.2.3 ROC曲线
实验结果中,10个特征、联合特征(CAD)、医生评分系统(BI-RADS)以及基准线的ROC曲线图被呈现在图4~图7中,4张图分别为10个特征的ROC曲线图、5个弹性特征与医生评分系统(BI-RADS)的ROC曲线图、5个弹性特征与联合特征(CAD)的ROC曲线图、联合特征(CAD与医生评分系统(BIRADS)的ROC曲线图。
图4 10个特征的ROC曲线Fig.4 The ROC curves of 10 features
图5 弹性特征与医生评分系统的ROC曲线图Fig.5 The ROC curves of elastographic features and BI-RADS
图4 可以发现,5个弹性特征相比于5个灰度共生矩阵特征,ROC曲线明显的靠近左上角,说明弹性特征分类准确性要高于灰度共生矩阵特征,分类性能比灰度特征好;并且5个弹性特征的曲线下面积AUC(表2)均大于0.85,其中硬度率、弹性比、面积比、均值比的曲线下面积分别为0.960 5、0.912 3、0.914 9、0.939 4,均高于0.9,大于周边硬度率的曲线下面积(0.871 6),特征的分类价值很高;而5种灰度共生矩阵特征的曲线均靠近基准线,曲线下面积在0.5~0.7之间,诊断价值很低,在乳腺肿瘤分类中没有意义,与表3中分类精度测试结果一致。
图5、图6、图7对比可以发现,5种弹性特征曲线比较接近医生评分系统(BI-RADS)周边硬度率除外,其曲线下面积(0.871 6)较小于医生评分系统(0.935 7),没有医生评分系统诊断价值高;联合特征明显比5种特征的ROC曲线靠近左上角,曲线下面积大于5种特征,诊断准确率更高。
图6 弹性特征与CAD的ROC曲线图Fig.6 The ROC curves of elastographic features and CAD
图7 CAD与医生评分系统的ROC曲线图Fig.7 The ROC curves of CAD and BI-RADS
而联合特征与医生评分系统相比,联合特征相比于医生评分曲线更靠近左上角,联合特征曲线下面积(0.968 1)大于医生评论系统曲线下面积(0.935 7),联合特征系统具有更好的诊断性能。
分析实验结果可以发现,超声弹性成像技术在乳腺肿瘤良恶性分类中有较高的价值,使用的图像处理方法流程有较好的检测结果,实现了肿瘤区域的分割,为特征的提取及分类提供了基础,达到了预期目的;提取出的弹性特征表现为分类性能良好,支持向量机比较适合乳腺图像分类,分类精度比较高,有比较好的诊断价值,在临床判断上有较大的借鉴意义。
本文同时也发现,提取的灰度共生矩阵特征诊断价值比较低,没有参考意义,分析原因如下:灰度图像上乳腺病灶没有与周围图像形成强烈对比,而一些病灶还伴随有囊肿及增生,共生矩阵高灰度值点影响较大,不能有效反映图像纹理情况;乳腺病灶的边界多为不规则形,不是简单的圆形,边界上点比较多,共生矩阵受到边界上的点影响比较大;另外在确定灰度共生矩阵计算区域时,程序中分割坐标P值的估算也对共生矩阵的生成及后续计算产生有较大的影响。
另外,图像中一些区域的灰度分布、纹理结构呈现为与肿块接近,造成肿块在图像上不显示为高亮区域,使得这些区域特征与肿块相似,在利用SVM分类时,会出现错误的分类,产生假阳区域;一些肿块体积较小,会对肿块的检测造成不利影响。
在弹性图像中,不同组织间的弹性系数会发生交叉重叠的现象,例如恶性病变出现囊性时,硬度会有所降低,可能会出现假阴性结果,良性病变发生钙化或者纤维化程度较高时,病变硬度增加,可能会出现假阳性结果,比如纤维腺瘤;弹性成像图像质量依赖于换能器频率、带宽和射频采样率等,弹性成像仪器会对图像质量造成影响,病灶形状不规则,病灶的深度等也会影响图像质量,使得鉴别良恶性肿块的敏感性降低;某些病灶太大,取样框很难达到肿块的2~3倍,也影响诊断的准确率;支持向量机本身存在一定的局限性,分类的准确率不能达到100%,分类过程存在误差,会导致肿块漏诊。
本文实现195幅图像的病变区域检测,对均值、ROC曲线、分类精度等结果进行数据分析,完成10个特征值的分类性能评估。总的来说,本文提出的操作流程即图像处理方法能够比较客观地诊断鉴别乳腺肿瘤的良恶性,可以实现重复操作,提取的特征值,弹性特征分类性能良好,这些定量的弹性特征在乳腺肿瘤分类中是有意义的。而灰度共生矩阵特征无诊断价值,没有参考意义。而关于圆度特征的实验还比较初步,需要在以后的实验中进一步加强。
[1] 童清平, 张俊楠, 杜欢, 等. 一种新型实时超声弹性成像定量化系统的构建[J]. 中国超声医学杂志,2015, 31(6): 552–555.
[2] 李竞, 张立春, 赵连春. 超声弹性成像技术在乳腺肿瘤诊断中的应用[J]. 齐齐哈尔医学院学报, 2015, 36(8): 1163-1164.
[3] Krouskop TA, Wheeler TM, Kallel F, et al. Elastic moduli of breast and prostate tissues under compression[J]. Ultrasonic Imag, 1998, 20(4): 260-274.
[4] Hao Y, Guo X, Ma B, et al. Relationship between ultrasound elastography and myofbroblast distribution in breast cancer and its clinical signifcance[J]. Scientifc Reports, 2016, 6:19584.
[5] Itoh A, Ueno E, Tohno E. Comparison between ultrasonic elastogram and histologic fndings in breast diseases[C]// Seventh Congress of Asian Federation of Societies for Ultrasound in Medicine and Biology (AFSUMB 2004), 2004: 330.
[6] 罗葆明, 杨海云, 肖晓云, 等. 改良弹性评分标准在乳腺良恶性病灶鉴别诊断中的前瞻性研究[J]. 中华超声影像学杂志, 2009, (6): 514-516.
[7] Wells PNT, Liang HD. Medical ultrasound: imaging of soft tissue strain and elasticity[J]. J R Soc Interface, 2011, 8(64): 1521-1549.
[8] Mu WJ, Zhong WJ, Yao JY, et al. Ultrasonic elastography research based on a multicenter study: adding strain ratio after 5-point scoring evaluation or not[J]. PLoS ONE, 2016, 11(2): e0148330.
[9] 宋宇, 夏稻子. 超声弹性成像观察正常成年女性乳腺组织[J]. 中国医学影像技术, 2012, 28(10): 1831-1834.
[10] Moon WK, Chang SC, Chang JM, et al. Classification of breast tumors using elastographic and B-mode features: comparison of automatic selection of representative slice and physician-selected slice of images[J]. Ultrasound Med Biol, 2013, 39(7): 1147-1157.
[11] Xiao Y, Zeng J, Qian M, et al. Quantitative analysis of peri-tumor tissue elasticity based on shear-wave elastography for breast tumor classifcation[C]// 35th IEEE EMBC, 2013: 1128-1131.
[12] Cai L, Wang X, Wang Y, et al. Robust phase-based texture descriptor for classifcation of breast ultrasound images[J]. Biomed Eng Online, 2015, 14:26.
[13] Chou YH, Tiu CM, Hung GS, et al. Stepwise logistic regression analysis of tumor contour features for breast ultrasound diagnosis[J]. Ultrasound Med Biol, 2001, 27(11): 1493-1498.
[14] Zhou Z, Wu S, Chang KJ. Classifcation of benign and malignant breast tumors in ultrasound images with posterior acoustic shadowing using half-contour features[J]. J Med Biol Eng, 2015, 35(2): 178-187.
Experiments on the Feature Selection and Classification of Ultrasound Elastography Images for the Diagnosis of Breast Cancers
【 Writers 】ZHANG Yaonan1,2, ZHANG Yongliang2,3, XIAO Yang3
1 College of Electronics and Information Engineering, Xi’an Siyuan University, Xi’an, 710038
2 Sino-Dutch Biomedical and Information Engineering School,Northeastern University, Shenyang, 110169
3 Institute of Biomedical and Health Engineering,Shenzhen Institutes of Advanced Technology, Chinese Academy of
Science, Shenzhen, 518055
Breast cancers are the most common malignant tumors in women, and how to use ultrasound to diagnose breast cancers quantitatively is still an unsolved problem. This paper extracts fve elastic features based on the elastography images of the breast tumors, furthers extract four features related to gray co-occurrence matrix to describe the texture of breast masses. we study the application of SVM classifer to classify these features, and uses the consistency, classification accuracy, ROC curve and AUC (area under the curve) to assess the classification results. we used ultrasound imaging technique to collect data from the actual patients, with the data of 195 lesions in 142 patients. Experimental results show that the classifcation performance of the elastic features is good, and the support vector machine is suitable for breast image classifcation, and its classifcation accuracy is high, which provides a good value for diagnosis. Meanwhile, it is found that the extracted features related to gray level co-occurrence matrix have a low diagnostic value.
ultrasound, elastography images, texture, SVM classifer, breast cancer
R445.1
A
10.3969/j.issn.1671-7104.2016.06.002
1671-7104(2016)06-0397-06
2016-04-11
西安思源学院校级重大科研项目(XASY-B1601)
张耀楠,教授,E-mail: johanzyn@qq.com
肖杨,博士,E-mail: yang.xiao@siat.ac.cn