基于小波和小波包变换的苯丙酮尿症傅里叶变换衰减全反射红外光谱筛查模型的研究

2016-10-16 06:06蔡嘉华尹嵩杰王淑美梁生旺
分析科学学报 2016年4期
关键词:层数波包小波

蔡嘉华, 尹嵩杰, 陈 超*, 王淑美, 梁生旺*

(1.广东药学院中药学院,广东广州 510006;2.国家中医药管理局中药数字化质量评价技术重点研究室,广东广州 510006;3.广东高校中药质量工程技术研究中心,广东广州 510006)

苯丙酮尿症(Phenyketonuria,PKU)是一种先天性代谢疾病,其临床表现为智力低下、癫痫、精神异常等。PKU作为国内外常见的新生儿疾病,其治疗的关键是及早诊断与治疗。目前,常用的筛查方法是采集新生儿足底干血片,应用细菌抑制法(BIA)、荧光法(FA)、高效液相色谱法(HPLC)、串联质谱法(MS/MS)等检测苯丙氨酸(Phe)的含量,但这些方法普遍存在消耗试剂、费用高、步骤繁琐、耗时长等缺点。

本课题组曾利用傅里叶变换衰减全反射红外光谱(FTIR/ATR),结合化学计量学方法建立了PKU筛查模型,取得了一定效果[1,2]。红外光谱多以透射谱形式出现,一般不直接用于微量或痕量分析;而ATR技术通过增加全反射的次数,与红外光谱相结合,增强了吸收谱带的强度,大大提高了分析灵敏度,检出浓度达到了mg/L甚至μg/L水平[3]。与传统分析方法相比,FTIR/ATR技术具有操作简便、分析速度快、能耗低、无需处理样品、不消耗试剂、不产生污染、可同时测定多种成分等优势[4],已报道用于肿瘤、地中海贫血、冠心病、脂肪肝、白血病等疾病的筛查[5,6]。在测量过程中,红外光谱受到光源强度微小变化、杂散光、外界震动、干涉仪动镜移动、电子线路等因素干扰,不可避免产生噪声,影响建模结果[7],因此需要在建模前对光谱进行去噪处理。

本文在课题组前期工作基础上[1,2],引入小波变换和小波包变换两种去噪方法,进一步考察和提高模型精度。小波变换具有独特的时频分离特性,能适应不同波形谱图的去噪要求,已被广泛用于图像处理、电信号分析、能源勘察、语音分析、医药分析等多个学科领域[8,9]。小波和小波包变换对FTIR/ATR光谱可以有效去噪,进一步提高了PKU筛查模型的精度,使这种简便、快速、绿色的筛查方法的推广应用成为可能。

1 实验部分

1.1 仪器与材料

德国BRUKER公司的Tensor 37 型傅里叶变换红外光谱仪,安装有OPUS7.2红外光谱软件,DLATGS检测器,水平三次全反射ATR附件;光谱范围600~4 000 cm-1,扫描间隔为2 cm-1,扫描次数为16次。

样本材料:69例干血片样本由广州金域医学检验中心提供,采用串联质谱法测定Phe的浓度,其中35例阴性样本的平均浓度为47.2 μmol/L,标准差为9.1 μmol/L;34例阳性样本的平均浓度为292.8 μmol/L,标准差为258.9 μmol/L。

1.2 光谱采集

以空气作为空白背景,采用FTIR/ATR法对干血片样进行光谱采集,对每个血斑各取5个不同位置扫描,取平均值作为该血片的红外光谱数据。用红外光谱仪自带的OPUS7.2软件对所得光谱进行平滑和一阶微分9点平滑预处理。

2 方法原理

2.1 小波变换和小波包变换的基本原理

本文采用的小波去噪方法为非线性小波变换阈值法,其基本过程参见文献报道[10]。小波包变换是小波变换的推广,二者最根本的区别在于小波变换只对信号的低频部分作分解,而小波包变换对高频部分也提供更精细的分解,而且这种分解既无冗余,也无疏漏[10]。

2.2 模型建立与评价指标

本文以多模型共识偏最小二乘法(cPLS)[11,12]建立模型,它为传统偏最小二乘法的一种改进方法,在同一训练集中建立一系列不同子集,以多个训练子集结果取平均作为最终结果,从而降低了模型对某一样本的依赖性,提高了其稳定性和精度。

本文将小波或小波包变换去噪后的光谱数据归一化后输入。由于样本的Phe浓度范围太广,故先对其进行了对数转换,再作为模型的预期输出。根据训练集与测试集的相对误差小于1%,训练集浓度范围可覆盖测试集浓度范围这一要求,将69例样本按3∶1随机分配训练集与独立测试集。经考察后,选取cPLS最佳主成分数为10,模型总数为120,重复运行20次结果取均值,作为最终结果。

模型评价指标有相关系数(R)、均方根误差(RMSEP)、平均相对误差(MRE)、准确率(Acc)、灵敏度(Sens)和特异性(Spec),其计算见文献方法[1,2]。R越趋近于1,RMSEP和MRE越趋近于0,Acc、Sens和Spec越趋近于100,模型的精度越高。

3 结果与讨论

3.1 小波变换和小波包变换的参数优化

在进行小波变换时,小波的去噪效果跟小波基、阶数、分解尺度、阈值选取和重调方式等参数有关,但是目前其选取方法并未规范,如文献报道[13 - 15]各自采用不同方法选取了这些参数。为获得较优的PKU筛查模型,本文以模型结果的R和预测RMSEP作为小波和小波包变换参数优化的评价指标。

3.1.1小波母函数db小波系是最常见且应用较多的小波系,其较好的正则性能在信号或图像的重构中获得较好的平滑效果。sym小波系是db小波系的改进,在保持了db小波的优点外,还具有更好的对称性。coif小波和sym小波一样,有比db小波更好的对称性,其更高的消失矩能使尽量多的小波系数置零,有利于数据的压缩和去噪。bior和rbio都是双正交小波,两个对偶的小波分别用于信号的分解和重构,解决了线性相位和正交性要求的矛盾,使光谱在获得较好的平滑的同时,信号能量也能较好地集中,很好地克服了db小波的缺点。

本文先以Stein 无偏似然估计作为阈值选取的规则,根据不同层的噪声估计来调整阈值,分解尺度为1,分别计算上述小波系,以样品的1D9S光谱去噪后模型的R和RMSEP来选取最优小波基和阶数,结果见图1。从图中可以看出sym1、sym12、bior2.4、 bior2.8、 bior6.8、rbio1.1、rbio3.5、rbio3.9和rbio4.4小波的相关性较好,R值均达到0.91或以上;而RMSEP较小的小波则为sym12、bior2.8、bior6.8,其值分别为89.17、89.30和89.95。综合考虑,选择R较大而RMSEP较小的小波基sym12、 bior2.8和bior6.8作为小波去噪的母函数。图2为小波包去噪的结果,从中可以看出R值达0.90以上的有db3、db6、db10、sym1、sym4、sym6、sym11、bior1.5、bior3.5、rbio1.1、rbio2.2、rbio3.1、rbio3.5和rbio4.4;而RMSEP较小的小波分别是db4、db10、sym1、bior1.5、bior5.5和rbio4.4,其值均在96.08以下。综合考虑,选择db10、sym1和bior1.5作为小波包去噪的母函数。

图1 小波变换中小波基的优化结果Fig.1 The optimization of the base of wavelets

图2 小波包变换中小波基的优化结果Fig.2 The optimization of the base of wavelet packets

图3 不同分解层数的光谱图Fig.3 The spectra at different decomposition levels spectral region 600-4 000 cm-1,scanning interval 2 cm-1,scan times 16.

3.1.2分解层数本文用MATLAB自带函数wmaxlev( )[16]计算出本实验光谱的最大分解层数为10,即可分解层数为1~10。以R和RMSEP为指标选取最佳层数,其结果相近且没有一定规律,因此本文选择以对比光谱分解后的信噪比(snr)来优化层数[17]。信噪比值越大说明去噪效果越好[6]。以样品编号为“N14070493”的原始光谱为例,以sym1为母小波,Stein 无偏似然估计作为阈值选取的规则,根据不同层的噪声估计来调整阈值,对比1到10层的去噪效果,其snr值依次从56.34降低到6.69。可见,随着分解层数的增大snr逐渐减少,光谱中有效信息随着分解层数的增加而丢失,这与图3中光谱分解后的失真程度越来越高相对应。用其余60个小波分别对75个样本进行去噪,所得结论一致。因此,本文选取最优的分解层数为1层。

3.1.3阈值选取和重调本文用MATLAB自带函数wden( )对信号进行自动降噪,经考察小波去噪以软阈值方式、小波包去噪以硬阈值方式进行。以1D9S光谱为例,选取sym1小波及分解层数1,对比snr选择合适的阈值选取和重调方式。从表1可以看出,结果最优的阈值选取方式为Stein无偏似然估计(rigrsure)和启发式阈值(heursure),其次是极大极小值的方法(minimaxi),最差的是通用阈值的方法(sqtwolog);以第一层的系数进行噪声层的估计来调整阈值(记作“sln”),比不进行调整(记作“one”)的结果要好。因此,本文选取文献常用的“rigrsure”和“sln”方法,作为阈值选取和重调规则。

表1 各组阈值选取和重调方式下的信噪比

3.2 cPLS模型结果

本文用上述优化后的小波基和参数分别对原始光谱(OS)、9点平滑光谱(9S)和一阶微分9点平滑光谱(1D9S)进行小波和小波包去噪,然后构建cPLS模型,结果列于表2和表3。从表2可见,原始光谱因为包含较多噪声,所建模型性能最差;经过平滑(9S)、求导(1D9S)处理后,性能有所改善,而最优模型是1D9S+sym12,说明小波变换进一步提高了模型精度。与小波去噪前相比,R从0.87提高到0.91,RMSEP从114.79降低到89.17,MRE从0.3降低到0.28,Acc、Sens和Spec均提高到100。小波包去噪得到的最优模型为1D9S+sym1。与去噪前相比,R从0.87提高到0.91,RMSEP从114.78降低到94.13,MRE从0.3降低到0.29,Acc、Sens和Spec同样均提高到100,而且结果的标准差均为0。上述结果表明,光谱经小波或小波包变换去噪后,所建模型更加准确、稳定。

表2 OS、9S和1D9S光谱经小波变换后模型输出结果

表3 OS、9S和1D9S光谱经小波包变换后模型输出结果

4 结论

本文在FTIR/ATR光谱预处理阶段引进小波和小波包变换,对OS、9S、1D9S光谱分别进行去噪处理,比较去噪前后模型的各项评价指标,结果发现经小波或小波包处理后的模型精度均有明显提高,优化后的模型对PKU阴、阳性样本的识别准确率均达到了100%,为FTIR/ATR光谱提供了一种有效的去噪方法,有利于进一步提高模型精度,有望成为PKU的快速、准确和绿色筛查方法。

猜你喜欢
层数波包小波
填筑层数对土石坝应力变形的影响研究
上海发布药品包装物减量指南
构造Daubechies小波的一些注记
基于支持向量机和小波包变换的EOG信号睡眠分期
基于MATLAB的小波降噪研究
MoS2薄膜电子性质随层数变化的理论研究
基于小波包Tsallis熵和RVM的模拟电路故障诊断
基于改进的G-SVS LMS 与冗余提升小波的滚动轴承故障诊断
基于小波包变换的电力系统谐波分析
住在哪一层