基于超声弹性成像的支持向量机对颈动脉易损斑块的自动识别

2019-06-17 02:17徐游民刘志何琼罗建文
中国医疗设备 2019年5期
关键词:易损易损性集上

徐游民,刘志,何琼,罗建文

清华大学 医学院 生物医学工程系,北京 100084

引言

中风是中国第一大杀手[1],中风的一个主要原因是颈动脉粥样硬化斑块的破裂[2]。因此,评估颈动脉粥样硬化斑块的破裂风险(即易损性)对预防中风至关重要。目前,颈动脉粥样硬化斑块的危险性评估主要是根据超声成像对斑块大小和狭窄程度的检测[3]。在临床上,当斑块引起的颈动脉狭窄程度大于70%时,医生会建议患者做颈动脉内膜剥脱术或血管支架移植手术[4]。然而有研究表明,很多发生脑血管事件的患者的颈动脉狭窄程度低于50%[5]。因此,单一颈动脉狭窄程度的判断标准不够准确。另有一些研究表明,经过组织学验证,易损斑块通常有大的脂质核、薄的纤维帽、斑块内出血、炎症和新生血管等特征,而稳定斑块通常有钙化、厚的纤维帽以及没有脂质核,因此评估斑块成分可以有效区分斑块的易损性[6]。

目前,多种影像技术可以应用于颈动脉易损性评估,如超声(Ultrasound,US)、磁共振成像(Magnetic Resonance Imaging,MRI)、正电子发射型计算机断层显像(Positron Emission Tomography,PET)和X射线电子计算机断层扫描(X-Ray Computed Tomography,X-CT)等[7]。PET 对检查者操作要求高,且存在电离辐射。CT同样存在电离辐射,且对脂质和纤维化成分缺乏足够的对比度[8]。MRI被认为是评估颈动脉粥样硬化斑块成分的一种可靠的成像方式[9]。通过对颈动脉内膜剥脱术得到的斑块样本进行组织学分析发现,MRI可以有效地评价颈动脉斑块的特征,进而对斑块易损性进行评估[10]。MRI无电离辐射,但是扫描时间长,检查费用昂贵。而超声成像性价比高,成像速度快,无电离辐射,适合于大规模人群的筛查及病情的持续监测。有研究证明,不同的斑块成分有不同的弹性模量(如杨氏模量)。因此,超声弹性成像可用于斑块成分的检测[11]。de Korte等[12]利用血管内超声弹性成像成功区分了稳定和易损斑块,但是血管内超声成像有创,且成本高,也不适用于颈动脉。因此,我们需要一种性价比高、无创的血管成像方式去评估颈动脉斑块的易损性。

近些年来,无创超声颈动脉弹性成像的研究越来越多。它的基本原理是:首先在体外无创地获取颈动脉(斑块)的超声射频数据,然后用运动估计算法进行处理,得到位移和应变(或应变率)分布[13],反映其弹性模量分布。一些研究结果证明,超声颈动脉弹性成像可以有效评估斑块的易损性[14],然而,这些研究只是验证了应变或应变率等单一特征(比如最大值、均值、中值、标准差等)对于评估颈动脉斑块易损性的可行性,并没有对未知易损性的颈动脉斑块(即测试数据集)进行检测。

随着计算机技术的发展,机器学习的方法被广泛应用于医学影像研究中。国内外开展了很多医学图像自动分析及计算机辅助诊断的研究[15],帮助医生自动检测相关疾病。采用机器学习的方法可望实现应变或应变率的多特征分析,达到对测试数据集中的斑块自动检测的功能。支持向量机(Support Vector Machine,SVM)是目前应用较为广泛的一种机器学习方法[16]。与传统的机器学习方法以及人工神经网络方法相比,SVM在样本数相对较少、特征维数高的情况下,仍然具有很好的识别能力。同时,SVM通过“核函数”和“大间隔”的思想,有效地解决了以下两个问题。首先,通过核函数,将原空间的非线性问题转化成新空间中的线性问题,因此,计算可以在低维空间里进行,大大减少了计算复杂度;其次,通过最大化分类间隔,使其在高维空间里仍可以保持很好的分类结果[17]。因此,国内外有越来越多的学者将SVM方法应用于医学影像领域[18-19]。但是,到目前为止,SVM还没有应用于颈动脉易损斑块的自动检测中。本研究以高分辨率MRI的诊断结果作为参考,通过SVM的方法对已知易损性的颈动脉斑块的超声弹性成像结果进行训练,得到一个颈动脉易损斑块的自动识别模型,并对测试数据集中的斑块进行自动检测。

1 材料与方法

1.1 数据获取

本研究涵盖了197个年龄在58到86岁之间的志愿者,他们在6个月内均没有发生过明显心血管事件(比如心脏病、中风、心肌梗死和短暂性脑缺血等)。随后,有经验的临床医生用配备L9-3线阵探头的飞利浦iU22超声成像系统采集每个志愿者颈动脉长轴方向的超声射频数据,以用于后续颈动脉斑块的应变率估计。

同时,每个患者也接受配备自主设计的36 通道神经血管线圈的飞利浦 Achieva TX 3.0 T MRI系统对颈动脉进行扫描。MRI有三个多对比度的三维黑血序列,分别是3D-MERGE、VISTA和SNAP[20-22]。MRI沿横截面采集,覆盖整个颈动脉,包括颈总动脉、颈动脉分叉、颈内动脉和颈外动脉。

为了便于超声弹性成像的分析以及考虑到较大的斑块更具有临床意义,本研究选择厚度大于2.5 mm的斑块(即剔除了无颈动脉粥样硬化斑块以及动脉粥样硬化斑块比较小的数据),共计52位志愿者的80例斑块数据用于后续的分析。

MRI的判读是在飞利浦工作站上重建MRI切片,并在空间上匹配3D-MERGE,SNAP,VISTA 图像[20-22],对比斑块的信号强度,根据标准的判别流程识别钙化(Calcification,Ca)、斑块内出血(Intraplaque Hemorrhage,IPH)和富含脂质的坏死核(Lipid-Rich Necrotic Core,LRNC)等斑块成分。手动分割LRNC和血管壁,获得LRNC与血管壁横截面面积之比,将出现IPH或者LRNC面积超过20%的斑块归为易损斑块[23]。最后,80例斑块中,50例判读为稳定斑块,30例判读为易损斑块。

颈动脉斑块的应变率估计流程如下所述。首先利用光流法,从连续采集的斑块超声射频数据中依次估计出相邻两帧间的二维位移(包括轴向和侧向位移)和应变(包括轴向和侧向应变)。由于侧向估计结果较差,本研究只采用轴向应变估计结果[24]。为了消除不同帧频的影响,对应变结果进行归一化,得到应变率结果(应变率=应变×帧频)。在所有帧的应变率估计完成之后,确定每个心动周期中绝对应变率最大的那一帧,然后对其进行斑块分割。斑块的分割由两位有丰富经验的研究者结合斑块的B超图和应变率图来完成。最后,将斑块的应变率结果提取出来,用于后续的特征提取及斑块易损性分析。

1.2 斑块特征选择

本研究采用最大绝对应变率(Maximum Absolute Strain Rate,MaxASR)、绝对应变率中值(Median Absolute Strain Rate,MedASR)、绝对应变99%分位数(99thPercentile of Absolute Strain Rate,99thASR)、绝对应变均值(Mean Absolute Strain Rate,MeanASR)和绝对应变标准差(Standard Deviation of Absolute Strain Rate,SDASR)[25]作为颈动脉斑块的应变率特征。

使用受试者工作特征(Receiver Operating Characteristic,ROC)曲线下的面积(Area Under Receiver Operating Characteristic Curve,AUC)[26],分析不同应变率特征对斑块进行分类的效果。首先,通过设定不同的阈值,画出某一特征对斑块进行分类的ROC曲线;然后,计算其对应的AUC;通过比较不同特征的AUC大小,评估特征与易损斑块识别的相关性,以此剔除与易损斑块识别关系不大的特征,避免影响后续分类器的设计。

1.3 SVM自动识别技术

假定有线性可分的训练样本集:

其中每个样本都是d维向量,y是样本标签。存在一个超平面:

当原始样本集是非线性的,可以引入核函数,新空间的决策函数为:

本研究采用的核函数为径向基(Radial Basis Function,RBF)核函数

本研究先分析各单一特征的AUC,排除AUC值最小的特征,并将剩下的特征按AUC值从大到小排序,分别将前两个特征、前三个特征、......、前n个特征组合在一起,然后利用SVM方法分别基于单一特征、各个特征组合对斑块进行分类。当多特征组合的线性程度降低时,采用RBF核函数,将原始特征空间的非线性问题转换为新特征空间的线性问题。当核函数为RBF时,的选择非常重要。太小时,RBF只会作用于支持向量样本附近,使得该方法在训练样本上有很高的准确率,而在测试样本上分类效果很差;太大时,平滑效应太大,无法在训练集上得到特别高的准确性,进而影响在测试集上的分类效果[17]。本研究以基于RBF核函数的SVM在测试集上的准确性为指标,选择最优的,最后用优化后的RBF核函数,基于各个特征组合对颈动脉易损斑块进行识别。

1.4 评估标准

由于样本量较少,为了保证数据充分利用,本研究采用留一法对数据集进行交叉验证。留一法的原理是把n个样本中的n-1个样本作为训练集,将剩下的一个作为测试集,这样就有n次训练过程,且每个样本都预测了一次,然后取预测结果的平均值作为最后预测结果[27]。本研究使用灵敏性(Sensitivity,SEN)、特异性(Specificity,SPC)、准确性(Accuracy,ACC)作为SVM分类的评价指标,具体定义如下:

其中TP、FN、TN和FP分别为真阳性、假阴性、真阴性和假阳性。

2 结果

由单一特征得到的ROC曲线和AUC结果如图1、表1所示。可以看出,颈动脉斑块弹性成像的99thASR的AUC值最大(0.817),说明该特征与易损斑块识别的关联性最高;而MedASR的AUC值最小(0.719),表明该特征与易损斑块识别的相关性最低。因此,我们剔除了MedASR这个特征,最终选择了99thASR、MaxASR、SDASR和MeanASR这四个特征用于后续的SVM分析。

图1 各个特征的ROC曲线

表1 各个特征的AUC值

基于各个特征,线性核函数的SVM在测试集上的分类结果如表2所示。可见,当选择的特征分别为99thASR、MaxASR、SDASR时,其准确率最高(78.8%),而灵敏性、特异性相差不大。

表2 基于各单一特征的线性核函数的SVM在测试集上的分类结果(%)

根据各个特征的AUC值大小排序,取99thASR、MaxASR为两特征组合,取99thASR、MaxASR和SRASR作为三特征组合,最后将99thASR、MaxASR、SRASR和MeanASR作为四特征组合。

基于两特征、三特征和四特征组合,线性核函数的SVM在测试集上的分类结果如表3所示。对比表3与表2可知,当基于两特征组合时,线性核函数的SVM的准确性较单个特征时略微提高,但基于三特征、四特征组合时,灵敏性、准确性比基于两特征组合更低。

表3 基于两特征、三特征和四特征组合,线性核函数的SVM在测试集上的分类结果(%)

图2 灵敏性、特异性、准确性随值的变化曲线

表4 基于多特征,采用最优值的RBF核函数的SVM在测试集上的分类结果(%)

表4 基于多特征,采用最优值的RBF核函数的SVM在测试集上的分类结果(%)

注:① 99thASR+MaxASR;② 99thASR+MaxASR+SDASR;③99thASR+MaxASR+SDASR+MeanASR。

特征 灵敏性 特异性 准确性两特征组合① 66.7 88.8 80.0三特征组合② 70.0 88.0 81.3四特征组合③ 70.0 88.0 81.3

3 讨论

本研究以高分辨率MRI诊断结果作为参考,根据AUC分析超声颈动脉弹性成像获得的应变率特征与颈动脉易损斑块识别的相关性,选择99thASR、MaxASR、SDASR和MeanASR等四个特征用于后续分析;进一步,按照AUC值大小顺序形成两特征、三特征和四特征组合,利用线性核函数的SVM分别基于单一特征和多特征对斑块进行分类。结果表明,三特征、四特征组合的线性核函数的SVM的灵敏性、准确性比两特征的要差,说明当线性核函数的SVM分类结果较差的特征加入时,组合的特征线性程度会降低。最后,以灵敏性和准确性为指标,对RBF核函数的参数进行优化,用四特征组合获得更好的斑块分类结果。

采用RBF核函数的SVM方法能够实现颈动脉易损斑块的自动识别,并通过“大间隔”和“核函数”的思想,在保证灵敏性和准确性的情况下,大大减少运算时间。表5是当99thASR、MaxASR、SDASR和MeanASR四特征组合在一起时,线性核函数的SVM、RBF核函数的SVM、logistic回归(Logistic Regression,LR)[28]及K最近邻(K-Nearest Neighbor,KNN)[17]方法的分类结果与耗时对比。

表5 基于四特征的不同分类方法在测试集上分类结果与耗时

其中,logistic回归分类由随机梯度下降法实现,KNN方法中选择了最优的K值,K=3。由表5可见,RBF核函数的SVM方法在保证高灵敏性、准确率的条件下,耗时更低;其时间复杂度主要跟支持向量的个数(一般小于样本数量)有关。logistic回归分类过程需要利用梯度下降法,在每次更新回归系数时遍历整个数据集,如果样本量及样本维度增大,时间复杂度大大增高[28]。对于KNN方法,新样本需要和每一个样本计算距离,再通过排序找出前K个最近邻,对于大样本而言计算量也非常大[17]。当样本量增大时,RBF核函数的SVM方法在保证高的灵敏性、特异性、准确性的情况下,能够快速计算,因此该 方法性能更优。

本研究存在一些局限性。首先,本研究采用颈动脉长轴方向的扫描,只能涵盖前壁和后壁的斑块,而无法包含血管侧壁的斑块,可能会对模型的训练造成影响。其次,本研究使用的特征来源于手动分割的颈动脉斑块应变率结果;手动分割受人为因素影响较大,容易将边界处的噪声划入斑块区域,影响本研究分类的准确性。再次,本研究所使用的特征均为一阶应变率特征;用灰度共生矩阵、Hough变换、小波变换等方法可以提取斑块的二阶特征[29],可能可以提高SVM分类的准确性。此外,本研究的样本量比较少;当样本量足够大后,可以采用SVM自动识别方法对斑块成分进行进一步的统计分析,可能可以提高训练模型对斑块易损性识别的准确性。

4 结论

本研究以高分辨率MRI的诊断结果作为参考,开展了基于超声弹性成像的支持向量机对颈动脉易损斑块进行自动识别的研究。首先,利用AUC来评估超声弹性成像获得的应变率特征与易损斑块识别的相关性,选出四个特征。接着,采用基于RBF核函数的SVM方法,并利用训练得到的模型对测试数据进行自动识别。结果表明,当这四个特征组合在一起时,采用最优值的RBF核函数,SVM方法对80例颈动脉斑块进行分类的效果最好。本研究初步验证了基于超声弹性成像的支持向量机用于颈动脉易损斑块自动识别的可行性。

猜你喜欢
易损易损性集上
冠心病患者冠状动脉易损斑块形成的危险因素及CT的诊断价值分析
基于受体易损性评估的区域环境风险应急管理
基于振动台试验的通信机柜地震易损性分析
GCD封闭集上的幂矩阵行列式间的整除性
直升机易损性指标分配与实现方法研究
基于互信息的多级特征选择算法
基于GIS与AHP法的岩溶塌陷易损性评价及其在城市建设规划中的意义
探究CT诊断冠状动脉易损斑块价值及危险因素
更正声明
师如明灯,清凉温润