(1.湖南师范大学 物理与信息科学学院,湖南 长沙 410081; 2.长沙师范学院 信息与工程系,湖南 长沙 410100)
高强度聚焦超声(High Intensity Focused Ultrasound,HIFU)作为一种非侵入式病变组织治疗新手段,是把高强度超声的能量聚焦于靶区,由于瞬间高温效应、瞬间化学效应、机械效应、声化学等,致使肿瘤细胞蛋白质发生变性而产生凝固性死亡,却不损伤周围正常细胞[1]。准确地对HIFU辐照后的生物组织进行变性分类识别,是对HIFU治疗效果评判的基础[2]。
目前组织变性分类识别方法主要有基于成像技术和信号检测两种。Sun等人[3]提出多光谱光声成像的生物组织变性评估方法。邹孝等人[4]提出了B超图像灰度和小波变换系数并结合BP神经网络监测HIFU辐照生物组织变性识别。此外,明文[5]从信号处理方面提出了基于BP神经网络的HIFU辐照生物组织损伤分类识别方法,利用多参量构成矢量矩阵输入神经网络,训练神经网络并对样本进行损伤分类识别。然而,这些方法主要基于生物组织变性的某个参量,难以全面反映组织特性变化。
主元分析(Principal Component Analysis,PCA)是一种基于高斯统计假设的常用的特征提取方法,但它对非线性问题的处理效果通常不佳,而生物组织变性识别中各特征要素之间在本质上是非线性关系。Scholkopf等提出的KPCA(核主元分析,Kernel PCA)在非线性特征提取方面优于PCA。与SVM(支持向量机,Support Vector Machine)相比,FSVM(模糊支持向量机,Fuzzy SVM)具有更高的分类准确率[6]。本文对离体猪肉组织多个变性特征参量进行二次特征提取,以HIFU辐照后猪肉组织中的超声回波信号特征为研究对象,提出了一种结合KPCA和FSVM各自优势的猪肉组织变性分类识别方法。
Kij=exp[-‖xi-xj‖2/(2σ2)]
(1)
y=(y1,y2,…,yq)T=UTφ(x)
(2)
通过求累计方差贡献率最终决定KPCA主元特征数量。累计方差贡献率定义为
(3)
模糊聚类(Fuzzy C-Means,FCM)的效果取决于最初聚类中心选择,此外,初始值也对聚类性能有较大的影响。样本模糊隶属度的求解属于局部搜索,易出现局部极值问题[8]。而粒子群优化算法(Particle Swarm Optimization,PSO)是一种全局寻优方法,结合PSO全局寻优和FCM局部寻优来求解样本的模糊隶属度。将FCM获取的聚类中心当作初始参照中心,利用FCM计算模糊隶属度,通过PSO搜寻最优聚类中心。因此,关键是寻找最优聚类中心。对聚类中心Ai(i=1,2,…,c)的任一粒子编码定义如下:
xi=(ai1,ai2,…,aij,…,aic)
(4)
式中,aij为第i种聚类中的第j个聚类中心。针对FCM算法,最优聚类即目标函数值取最小时所对应结果;PSO通常取适应度的最大值所对应的最优解,适应度函数如下定义[8]:
f=1/(JFCM(X;U,A)+1)
(5)
聚类效果越好,其JFCM(X;U,A)越小,个体的适应度f越高,寻找粒子在每次迭代过程中的适应度,寻找到该粒子当前的最优解就是个体极值,同时也可寻找到粒子群当前的最优解,也就是全局极值。PSO优化FCM求解模糊隶属度步骤如下:
(1) 初始化。设定学习因子c1、c2、最大迭代次数M、模糊因子m′、聚类类别数c、粒子种群规模n的初始值,初始迭代次数k=1,随机选出c个样本作为聚类中心集,确定粒子的开始速度,设定粒子的最大速度为Vmax,迭代终止阈值定为ε。
(2) 计算每一个粒子与聚类中心之间欧氏距离,然后计算粒子的隶属度,可得隶属度矩阵U,对聚类中心值进行更新。
(3) 对种群进行评估。依据适应度函数f来计算每一个粒子的适应值,得到个体的最优值与全局的最优值。
(4) 对每一个粒子所经历的个体的最优值、全局的最优值分别进行比较,若较好则替换目前个体的最优值与全局的最优值。
(5) 寻优结束。若粒子完成最大迭代次数M或符合小于规定的阈值ε,则计算终止;否则将粒子的速度及位置进行更新,迭代数自加1,用最优粒子的位置产生新的聚类中心,再转至步骤(2)重新循环。输出模糊隶属度矩阵,获得最终的模糊隶属度。
(6)
式中,ω为权重向量;b为偏置;ξi为松弛变量;C为惩罚因子。将式(6)转化为其对偶问题[8]:
(7)
求得拉格朗日乘子αi和偏置b,得到最优分类超平面的决策函数(也称分类器):
(8)
实验系统主要由HIFU探头、B超探头、A/D信号采集卡、计算机控制系统等组成,如图1所示。实验所用的HIFU探头频率为1.391 MHz,焦距约为13 cm,输出的最大功率为300 W。新鲜猪肉样品放置在正对HIFU探头下面的吸声橡胶上。信号通过A/D采集卡送入计算机,通过改变HIFU剂量及辐照方式重复进行大量实验。为确定组织是否发生变性,每次辐照实验后都作组织切片验证。
图1 HIFU辐照组织回波信号提取实验系统
分别提取能反映猪肉组织变性的时频域特征[8-9]:回波能量、峭度、裕度、方差、回波功率谱积分、频率方差、衰减系数、背向散射积分、样本熵、模糊熵、shannon小波熵、对数能量小波熵、q内积小波熵、小波时间熵、小波能量、EMD能量熵、EMD奇异熵等,建立混合域特征集。为提高FSVM分类器的分类能力,先对初始特征集作KPCA二次特征的提取。由于RCVC与核主元向量成正比,需选取合适特征向量维数,防止增加冗余数据;与此同时,为了保证猪肉组织变性识别准确率,需要较高的累积贡献率以保证数据的可靠性。按累计贡献率大于95%的标准,经过多次取值实验,当标准差σ=86,前2个特征主元RCVC≥95%,如图2所示。因此,核主元特征向量个数为2,将选出的前2个核主元特征向量作为FSVM训练样本的特征向量。
图2 KPCA核主元数与累积贡献率的关系
针对FCM求解样本模糊隶属度时易陷入局部极值问题,利用PSO全局寻优能力搜寻最优聚类中心,结合PSO和FCM求解噪声样本较小的模糊隶属度,降低异常点对最优超平面选择的影响。设置FSVM的最初参数,用KPCA选取的前2个核主元特征向量训练FSVM分类器。将待测样本的核主元特征向量输送到训练好的FSVM分类器中,实现组织变性分类识别。组织变性识别流程图如图3所示。
图3 基于KPCA-FSVM的组织变性识别流程图
实验选择102例离体猪肉组织经HIFU辐照产生的超声散射回波信号作为FSVM的训练样本,获取FSVM最优超平面。利用KPCA对回波信号进行特征参数二次提取,将提取的前2个特征输入FSVM并对116例超声辐照后的猪肉组织进行变性分类识别。这116例组织通过手工切片验证得到60例变性样本,56例未变性样本。为了验证提出的KPCA-FSVM组织变性识别方法的有效性,选取与KPCA二次混合域特征集提取的前2个特征呈非线性映射关系的衰减系数及背向散射积分特征,将其分别输入FSVM中进行变性识别比较。
116例猪肉组织回波信号分别采用衰减系数、背向散射积分变性检测结果,如图4所示。针对KPCA二次特征提取的2个特征、衰减系数及背向散射积分的FSVM猪肉组织变性分类识别结果如表1所示。由表1可知,检测样本为116例,通过切片验证变性的样本数60例,未变性样本数56例。变性识别率是待测样本中判断正确的变性样本数与切片验证所得的变性样本数的比值;未变性识别率是待测样本中判断正确的未变性样本数与切片验证所得的未变性样本数的比值。
图4 116例猪肉组织变性识别的衰减系数及背向散射积分检测结果
特征变性样本未变性样本数量误判数量识别率/%数量误判数量识别率/%总识别率/%衰减系数60690.056394.692.2背向散射积分60493.356492.993.1KPCA二次混合域特征提取的2个特征60296.756296.496.5
利用KPCA二次提取混合域特征集的前2个特征并用FSVM进行分类识别,其变性样本识别率、未变性样本识别率、总识别率分别高于衰减系数6.7%、1.8%、4.3%,高于背向散射积分3.4%、3.5%、3.4%。
由此可见,在相同条件下,本文提出的KPCA方法降低了输入特征维数,并保证输出的特征能较好地反映组织特性并具有适合模式识别的可分性。通过KPCA二次提取混合域特征集的前2个特征,并运用FSVM对组织变性进行分类识别,获得的总识别率超过了96%,KPCA二次提取混合域特征集相对单一特征能更准确地检测猪肉组织是否发生变性。
结合非平稳信号处理方法,分别从时域和频域取得反映组织变性的特征,并建立相应的混合域特征集,该特征集可较全面、准确地反映组织变性信息。利用KPCA对混合域特征集作二次特征提取,将特征集映射到一个较低维的特征空间,剔除那些对猪肉组织变性识别贡献不大或不敏感的特征量,并提取出对组织变性敏感的特征,从而获得数目少、敏感度高且分类错误率低的主要特征。综合PSO、FCM及SVM 各自优点构建FSVM分类器,使传统SVM具有更好的离体猪肉组织变性分类识别能力。对116例离体猪肉样本在HIFU辐照后获得的超声回波信号进行特征提取并用KPCA-FSVM进行分类识别。结果表明,KPCA二次提取混合域特征集后的总识别率为96.5%,高于单一特征识别率。后续将进一步提高样本数量并收集多种不同生物组织的样本,使该分类识别方法具有可推广性。