基于核Fisher判别和加权码书映射的音频信号削波修复方法

2014-07-25 04:29鲍长春
数据采集与处理 2014年2期
关键词:子带特征参数时域

邓 峰 鲍长春 鲍 枫

(北京工业大学电子信息与控制工程学院,北京,100124)

引 言

在将老旧磁带或唱片转录成数字信号的过程中,数字音频信号经常会发生削波现象[1-6],为了恢复原始音频的听觉效果,需对削波的数字音频信号进行修复。

削波主要分为两类[5-6]:数字削波和模拟削波。数字削波是指音频信号幅度超过了录音存储设备的幅值动态范围,从而会在峰值处产生削波现象,其削波的幅值严格相等;模拟削波是指在模拟系统中,由于高电平信号超出了模拟器件的线性区而产生削波现象,此时削波处的幅值不完全相等,会具有一些微小抖动。本文主要考虑数字削波的修复,图1给出了一段音频信号削波前后的波形对比图。从图1可以看出,削波信号的峰-峰值受到了严重损坏,峰-峰值趋于平坦。这种削波将严重影响听觉质量。

传统的削波修复方法都在时域完成,即首先检测削波的起始位置,然后修复削波。如,文献[1]采用了基于概率模型的贝叶斯决策理论来检测消波的起始位置,然后利用AR(Auto regressive)模型对削波信号进行平滑,以达到修复削波的目的。文献[2]则将音频信号的削波样点看作是缺失样点,并在带限信号的约束条件下,将削波修复问题构建为l2-范数的最小化问题,通过非削波样点来重建削波样点,但是该方法仅适用于带限信号,不具有普适性。文献[3]利用最大后验概率准则,提出一种解卷积算法来修复削波,该算法虽然对削波的修复具有一定的效果,但是其计算复杂度较高,不适合实际的工程应用。文献[4]采用三次样条插值的方法进行削波修复,该方法可以较好地修复削波音频信号的时域波形,但是其不能有效消除因削波而引入的多余频谱成份,从而导致修复音频的听觉质量没有得到有效改善。文献[5]根据削波发生在音频信号峰值附近的特点,提出时域峰值检测算法检测削波的起始位置,然后假设这些削波样点为缺失样点,采用最小二乘自回归(Least square auto regressive,LSAR)模型进行预测插值来恢复这些削波样点,该方法的性能严重依赖削波样点的数目多少,普适性较差。文献[6]也采用了时域峰值检测方法来检测削波的起始位置,然后提出软阈值函数和谱加权函数相结合的方法来修复削波,该方法对音频信号的削波具有一定的修复效果,但是存在较大的音频失真。

上述削波修复方法的性能易受削波样点数目的影响,削波样点数越多,其修复效果越差。为了解决这个问题,本文在MDCT域提出了一种基于核Fisher判别(Kernel Fisher discriminant,KFD)和加权码书映射(Weighted codebook mapping,WCBM)的削波修复方法,该方法首先利用KFD,判别检测削波的发生,其次利用 WCBM修复削波。该方法有效提高了削波修复的性能。

图1 削波前后的音频信号波形对比Fig.1 Waveform comparison between original and clipped audios

1 本文削波修复方法

实验发现,削波不仅影响音频信号的时域波形,而且对其频谱也有严重影响。图2为一段音频信号的原始音频和削波音频时频分析对比图。

图2 原始音频与削波音频时频分析对比图Fig.2 Spectrogram comparison between original and clipped audios

从图2可以看出,削波音频时频分析图的中、高频部分引入了多余的频谱成分,这些成分使得原始音频信号出现扰人的声音,严重影响原始音频信号的听觉质量。此外,本文还可以看出削波只影响部分音频帧的频谱,所以在进行削波修复前,首先需要检测音频信号是否存在削波,然后再对其进行修复处理。图3给出了本文提出的削波修复流程。

图3 本文削波修复方法流程图Fig.3 Flow chart of proposed restoration method

本文提出的削波修复方法包括削波检测和削波修复两个模块。首先对一帧输入音频信号进行MDCT变换,并根据得到的MDCT系数进行特征参数的提取;然后利用核Fisher非线性判别方法[7-9]检测削波帧,如果当前帧为削波音频帧,则利用子带包络WCBM修复削波,得到修复的MDCT系数;如果当前帧为非削波音频帧,则直接输出MDCT系数;最后将输出的MDCT系数进行MDCT逆变换得到修复音频的时域信号。

1.1 基于核Fisher判别的削波检测方法

对于一帧音频信号的削波检测问题,可以把他看作是一种只有两个类别的分类问题,一类是削波音频帧,表示为CLIP类,另一类是非削波音频帧,表示为UNCLIP类。由于核Fisher判别是一种很好的两类问题分类方法,因此,本文结合核Fisher判别提出了一种MDCT域的削波检测方法,其基本原理如图4所示。

图4 削波检测原理Fig.4 Block diagram of clipping detection method

削波检测包含分类器训练和削波检测两个阶段。在训练阶段,首先将原始音频训练数据集进行削波处理,得到削波音频训练数据集;其次对该训练数据集进行MDCT变换,并根据得到的MDCT系数按帧提取削波音频和非削波音频的特征参数;最后利用这些参数进行核Fisher分类器的训练,确定核Fisher分类器的最优投影向量和分类阈值。

在检测阶段,首先对测试音频数据进行MDCT变换;然后在MDCT域提取特征参数;最后利用训练好的核Fisher最优投影向量和分类阈值进行削波的分类决策,检测出削波类和非削波类,从而完成削波检测。

1.1.1 特征参数的提取与选择

特征参数提取和选择的基本任务就是从许多特征中找出那些最有效的区别性特征。本文从传统听觉感知特征[10]和 MPEG-7[11-12]音色特征来考虑削波特征参数的选取,主要包括归一化自相关函数系数、MDCT系数过零率、梯度指数、谱质心、谱重心、子带均方根能量、子带通量、音频扩展度、谱熵、MDCT系数幅度方差和MDCT系数幅度均值参数。通过统计直方图分析发现,子带均方根能量、子带通量、MDCT系数幅度方差和MDCT系数幅度均值特征能有效区分削波,其他参数的区分性较小,从而可以得到各个特征参数用于削波检测的能力,如表1所示。图5给出了具有削波检测的能力的特征参数的统计直方图。

表1 削波特征参数的检测性能Table 1 Feature selection for clippingdetection

从表1和图5可以看出,本文选取的子带均方根能量、子带通量、MDCT系数幅度均值和MDCT系数幅度方差特征参数具有很好的削波辨别能力。

图5 各特征参数统计直方图Fig.5 Statistical histograms of the most discriminable features

下面将基于一帧音频1 024点的MDCT,介绍上述4个特征参数[11-12]的具体提取方法。

(1)子带均方根能量Frms(b):将一帧音频信号划分Nsubband=16个子带,每个子带的频点数为Lsubband=64,然后分别计算各子带的均方根能量Frms(b)为

式中:b为子带索引;k为 MDCT系数频点索引;Y(k)为削波音频信号的 MDCT 系数;Bup(b)和Blow(b)分别为第b子带对应的频率上界和下界。

(2)子带通量Fflux:表示相邻子带能量局部变化的总和,其计算式如下

(3)MDCT系数幅度均值Fmean:根据一帧音频信号的MDCT系数,得

式中:N为帧长,即一帧音频的MDCT系数的个数。

(4)MDCT系数幅度方差Fvar:根据一帧音频信号的MDCT系数,得

这样,本文提取了Nsubband=16维的子带均方根能量、1维子带通量、1维MDCT系数幅度均值、1维MDCT系数幅度方差特征,构成19维的特征参数向量,用于后面的核Fisher分类器的训练、削波检测以及修复处理。

1.1.2 核Fisher判别[7-9]

KFD就是将Fisher线性判别方法与核函数相结合实现一种非线性判别。它的核心思想是通过一个变换函数Ф,将原始特征空间Rn中的非线性特征向量x变换到一个高维特征空间H中,得到一个新的线性特征向量Ф(x),然后在新的高维特征空间H中使用Fisher进行线性判别。也就是说,它使原始特征空间Rn中的非线性不可分问题转化为高维特征空间H中的线性可分问题。核Fisher非线性判别分析的步骤如下。

(1)核函数

变换函数Ф(x)通常利用满足 Mercer条件[7]的核函数K(x,y)来完成。核函数K(x,y)是一种Ф(x)的内积运算,即对于所有的原始特征向量x,y∈Rn,满足K(x,y)=Ф(x)TФ(y)。目前常用的核函数有线性核函数、多项式核函数、双曲正切核函数、径向基(Radial basis function,RBF)核函数等。其中,RBF核函数最为常用。另外,通过实验发现,采用RBF核函数获得的削波修复性能优于其他几种核函数,因此,本文采用RBF核函数,其计算式为[7]

式中:x,y∈Rn为原始特征向量;σ为尺度参数,控制RBF核函数的性能,本文取σ为1.0。

(2)核Fisher最优投影方向

令X为包含两类样本集ψ中的某个样本矢量,样本集ψ由N个样本组成,其中,削波类ψ1的样本数为N1,非削波类ψ2的样本数为N2,每个样本X为前一小节提取的d=19维削波特征向量。通过变换函数Ф,将两类样本向量X变换到高维特征空间H,得到新的向量Ф(X),则H空间中两类样本向量的均值分别为

式中:n为样本索引;表示第i类的第n个样本。

设样本向量X在H空间中的投影向量为W,将Ф(X)投影到W,得到投影样本yX,即yX=WTФ(X),这样,可以得到类ψi的投影样本yX的类内均值μi和类内方差为

为了区分两类样本,KFD需使两类样本的类内均值之差最大,并使两类样本的类内方差最小。因此,定义KFD准则函数为

将式(7,8)代入式(9),得

式中:Sb为投影样本类间离散度矩阵,SW为投影样本类内离散度矩阵,即

Sb,SW和J(W)的计算依赖于变换函数Ф的获取,根据再生核理论[7],在高维线性特征空间H中,任何一个向量W∈H都可表示为

根据式(6,13),可得

根据式(11,14),式(10)的分子可表示为

式中M=(M1-M2)(M1-M2)T。

根据式(12,14),式(10)的分母可表示为

将式(15,16)代入式(10),可得

利用拉格朗日乘子法求式(17)的最大值,可得到高维线性特征空间H中的最优投影向量为

在实验中,为了防止F非正定,通常引入一个正则化参数λ=0.001,即用Fλ=F+λI代替F,其中I为N阶单位矩阵。

(3)分类阈值y0

利用式(18)得到的最优投影向量α,将原始特征向量X投影到α上,则投影样本值yX为

这样,前面提及的19维样本矢量的分类问题转化成了一维分类问题,因此只需要确定一个分类阈值y0,将投影样本yX与y0相比较,就可进行分类决策。本文利用先验知识来选定一维空间中的分类阈值y0,即它可以用两类样本投影到向量α上的投影样本的均值来表示

式中:ρ,υ为经验常数,用于控制分类阈值的选定,满足ρ+υ=2。μi(i=1,2)表示将ψi类的样本矢量投影到向量α上得到的投影样本yX的均值

(4)分类决策规则

对于任意待分类的未知特征样本向量X,根据式(19)得到其投影样本值yX,这样,结合分类阈值y0,得到KFD的决策规则为

1.1.3 分类器的训练

本文选用44.1kHz采样的音频数据作为非削波类训练数据集,然后将这些音频进行削波处理,得到削波类训练数据集,同时把发生削波的帧索引号保存到削波帧索引文件中,用于提取削波音频的特征参数。根据削波和非削波训练数据集,本文可得KFD分类器的训练流程如图6所示。

图6 核Fisher分类器训练流程图Fig.6 Training flow chart of kernel Fisher analysis

从图6可知KFD分类器的训练流程为:首先,将削波和非削波训练音频数据分别加窗分帧并进行MDCT变换,帧长为1 024个样点(约为23 ms);其次,根据削波帧索引文件,利用式(1~4)提取削波帧和非削波帧的子带均方根能量、子带通量、MDCT系数幅度均值和MDCT系数幅度方差四类特征参数,这样得到削波音频和非削波音频的19维特征参数集;然后,将这些特征参数集进行归一化处理;最后,训练核Fisher分类器,确定高维线性特征空间H中的最优投影向量α和分类阈值y0。

1.1.4 削波检测

首先,将待检测音频进行加窗分帧并进行MDCT变换;其次,提取一帧音频信号的子带均方根、子带通量、MDCT系数幅度均值和MDCT系数幅度方差特征参数向量X,并对其进行归一化处理;然后,利用式(19)计算其在核Fisher分类器的最优投影向量α上的投影值yX;最后,根据式(22)进行削波检测。

1.2 基于加权码书映射的削波修复方法

本文实验结果表明,削波在音频时频分析图的中、高频处引入了多余的频谱成分,使其谱包络得到提升。图7给出了原始音频和削波音频的包络对比图示例。

从图7中可以看出,削波音频的两种包络在中、高频处要明显高于原始音频谱包络。也就是说,对于削波的修复,可以通过处理削波音频的子带包络来实现,因此,本文提出一种基于子带包络的WCBM方法来修复削波。

首先,根据一帧音频信号的MDCT系数计算子带均方根能量(即子带包络)、子带通量、MDCT系数幅度均值和方差4个特征参数;然后,对当前帧音频信号的MDCT系数进行去子带包络处理,得到去包络的MDCT系数;接着,利用 WCBM方法得到修复音频的子带包络;最后,根据该子带包络结合去包络的音频信号的MDCT系数,进行子带包络的恢复处理,得到修复音频信号的MDCT系数,从而实现削波的修复。

1.2.1 去子带包络处理

首先根据式(1)计算削波帧的子带包络Fclip-rms(b),其中,b∈[0,Nsubband)为子带索引;然后利用Fclip-rms(b)对削波音频信号的 MDCT系数Y(b,k)进行去子带包络处理,得到去包络的MDCT系数(b,k)

式中:k表示 MDCT系数索引号;N=1 024为MDCT系数的个数,Nsubband=16为子带个数;Lsubband=64为每个子带的频点数。

1.2.2 子带包络加权码书映射

本文采用WCBM方法来修复子带包络,其基本原理如图8所示[14]。该方法包含削波特征参数和子带包络2个码书,它们的码字是一一对应的。削波特征参数码矢量为Fclip,它是由削波帧的19维特征参数构成;子带包络码矢量为Frms,它是由原始音频的16维子带包络构成。削波特征参数和子带包络码书由LBG算法[13]离线训练得到,码书大小为1 024。

图8 加权码书映射原理Fig.8 Block diagram of WCBM

WCBM的具体步骤如下:

(1)对于输入的每一帧削波音频信号,首先在MDCT域提取19维削波特征参数矢量,这里定义为Fx。

(2)根据欧式距离测度,计算削波特征参数矢量Fx和削波特征参数码书各个码矢量Fclip间的距离,并选出M个欧式距离最小的码矢量,将其欧式距离分别记作{d1,d2,…,dM},并且这M个码矢量对应的子带包络码矢量分别记作{Frms(1),Frms(2),…,Frms(M)}。

(3)根据上述步骤得到的M个欧式距离{d1,d2,…,dM},计算削波特征参数矢量Fx与M个码矢量之间的隶属度[14]为

本文M取为3。

(4)利用隶属度ρi计算M个子带包络码矢量Frms(i)的权值ωi为

(5)利用权值ωi对M个子带包络码矢量Frms(i)进行加权求和,得到修复音频信号的子带包络矢量rms

1.2.3 子带包络修复

利用式(26)得到的修复音频信号的子带包络矢量rms,结合式(23)得到的去包络的 MDCT系数(b,k)来修复削波,得到修复音频信号的MDCT 系数(b,k)为

式中:b∈[0,Nsubband)为子带索引;Nsubband=16为子带数目;k为 MDCT系数索引;N=1 024为MDCT系数个数。

2 实验结果及分析

为了验证本文所提方法的性能,本文将从削波检测和削波修复两个方面分别进行测试。

在测试实验中,测试音频数据取自于MPEG标准音频测试数据库,采样率为44.1kHz。它们不同于训练数据集,是训练数据集之外的音频数据,共计19段不同风格的音频数据,包括大提琴、流行音乐、鼓乐、交响乐和混合乐等。将这些测试数据集进行削波处理,得到削波测试数据集。本文的削波比例分别为其幅度的30%,40%和50%,即对音频信号的幅度削去其幅度最大值的30%,40%和50%。

2.1 削波检测性能测试

为了验证本文方法对削波检测的有效性,本文采用虚警率RFAR、漏检率RMDR以及准确率RRIGHT来衡量,其定义式分别为[6]

式中:Nfalse表示未削波类被判为削波类的帧数目;Nnonclip表示实际未削波类帧数目;Nmiss表示削波类被判为未削波类的帧数目;Nclip表示实际CLIP类削波类帧数目;Ntotal表示总的帧数目,满足Ntotal=Nclip+Nnonclip。

根据1.1.4节介绍的削波检测方法,分别对3种不同削波比例的测试音频信号进行削波检测测试,并统计不同音频类别的检测准确率、虚警率和漏检率,统计结果如表2所示。

从表2可以看出,本文算法在3种不同削波比例下,对不同类别音频数据的削波检测准确率都达到90%以上。虽然有些音频类别的虚警率或漏检率较大,但也都低于10%。另外,从表中还可以看出,随着削波比例的增大,检测准确率会增加,且虚警率和漏检率都有所减小。这是因为随着削波比例的增大,削波失真对音频信号产生的影响也会增大,即会引入更多的多余频谱成分,这样就会造成削波与非削波帧的特征差别增大,从而使得检测准确率提高,虚警率和漏检率减小。

表2 削波检测结果Table 2 Clipping detection test results %

传统的削波检测方法都是在时域进行[5-6],检测音频信号的时域波形峰值,通过峰值来确定是否出现削波。对于数字削波,这些方法的检测准确率可以达到100%。而对于模拟削波,由于时域波形峰值存在微小抖动,所以时域峰值检测方法的检测准确率会大大下降[5-6],并且其检测准确率与抖动大小直接相关,抖动越大,检测准确率越低。但是,本文提出了一种频域削波检测方法,其不依赖音频信号的时域波形,而是在MDCT域检测音频信号是否出现削波,也就是说,本文方法对数字削波和模拟削波会具有相同的检测效果。因此,本文提出的削波检测方法更具有通用性。

2.2 削波修复性能测试

在测试实验中,参考方法为三次样条插值方法[4]、软阈值和谱加权函数相结合的方法[6]。为了简化起见,这两种参考算法分别记为三次插值法和软阈值法。本文分别从音频时域波形及时频分析、谱包络对比分析、对数谱失真(Log-spectral distortion,LSD)[15]和时域分段信噪比(SNRseg)4个方面与参考算法进行修复性能比较。

2.2.1 音频时域波形及时频分析

图9给出了原始音频信号、削波音频信号、本文算法和两种参考算法的削波修复音频信号的时域波形对比图。从图中可以看出,软阈值法没有明显修复削波音频的时域波形;三次插值法与本文方法能较好的修复时域波形。但是,本文方法修复音频的时域波形与原始音频最为相似,从而可以说明本文方法在修复时域波形方面优于两种参考算法。

为了进一步说明本文方法的性能优于参考算法,图10给出了图9中各音频信号对应的音频时频分析图。

通过对比图10的时频分析图可以发现,削波音频频谱因削波引入了大量的多余成分;软阈值修复方法修复音频频谱损失较大,且其削波修复效果较差;三次插值法对削波虽然具有一定的修复效果,但是其修复音频频谱仍然残留不少的多余成分;本文方法能很好地消除削波引入的多余频谱成分,并且音频频谱的失真较小。因此,从时频分析图上也可以说明本文方法的修复性能优于两种参考算法。

图9 音频信号时域波形对比图Fig.9 Waveform comparison between original and clipping restoration audios

2.2.2 谱包络对比分析

图11,12分别给出了原始音频、削波音频以及本文算法和两种参考算法的削波修复音频的子带包络和LPC谱包络对比图,测试音频片段与图7相同。

从图11,12可以看出,两种参考算法在一定程度上降低了削波音频中、高频处的谱包络,但是与原始音频的谱包络还具有较大的偏差。而本文算法修复音频的子带包络和LPC谱包络都能较好跟踪原始音频的包络趋势,偏差较小,即更好地消除了削波导致的扰人声音。因此,可以说明本文方法的性能优于两种参考算法。

2.2.3 对数谱失真测试

本文采用LSD来衡量削波修复算法修复后音频的频谱相似性,其计算公式如下[15]

图10 音频时频分析对比图Fig.10 Spectrogram comparison between original and clipping restoration audios

式中:l为帧索引;k为频点索引;L为总帧数;N为FFT长度;X(l,k)和(l,k)分别为原始音频和修复后音频第l帧、第k频点的傅里叶变换系数。

根据各削波修复算法得到的修复音频,在不同削波比例下分别进行LSD测试,测试结果如表3所示。

图11 子带包络对比图Fig.11 Sub-band envelope comparison between kinds of audios

图12 LPA谱包络对比图Fig.12 LPA comparison between kinds of audios

从表3可以看出,软阈值法和三次插值法的LSD失真高于本文所提方法的LSD失真,即本文方法修复音频的LSD失真最小,从而进一步说明本文方法修复削波的有效性,其性能优于参考算法。

2.2.4 时域分段信噪比测试

本文采用时域分段信噪比来衡量不同算法得到的修复音频在时域波形上的差异程度。分段信噪比反应了音频序列帧信噪比的几何平均,定义为

表3 LSD失真测试结果比较Table 3 Test results of LSD

式中:L为测试音频信号的总帧数;N为帧长;x(n)表示原始时域音频信号;y(n)表示削波时域音频信号或修复后时域音频信号。表4给出了削波前后分段信噪比提高的结果。

表4 分段信噪比提高测试结果比较Table 4 Test results of segmental SNR

从表4可以知道,本文算法的分段信噪比提高程度明显好于两种参考算法,从而再次说明本文算法比参考算法具有更好的削波修复性能。

2.2.5 计算复杂度分析

本文的计算量主要集中在特征提取以及加权码书映射两部分,而特征提取的计算复杂度为N(帧长)次加法操作,加权码书映射的计算复杂度为码书大小与码书向量维数的乘积。因此,本文的计算复杂度较小,实时性较好,可以应用于实时性要求较高的场合。

3 结束语

对于削波的检测和修复,传统的方法都是在时域进行,本文在MDCT域提出了一种新的削波检测与修复方法。首先是基于KFD提出一种MDCT域的削波检测方法。该方法根据音频信号的MDCT系数提取子带包络等削波特征参数,然后利用这些特征参数训练核Fisher分类器,用于检测削波;最后根据检测结果,提出一种基于子带包络的WCBM方法来修复削波,得到修复音频信号的MDCT系数,并将其变换到时域,实现削波的修复。测试结果表明,本文所提方法能有效修复音频信号中的削波(削波比例分别为30%,40%和50%),并且其性能优于参考修复方法。

[1]Godsill S J,Rayner p J W.Digital audio restoration—A statistical model-based approach[M].London:Springer-Verlag,1998:191-204.

[2]ABEL J S,Smith J O.Restoring a clipped signal[C]//ICASSP.[S.l.]:IEEE,1991:1745-1748.

[3]Olofsson T.Deconvolution and model-based restoration of clipped ultrasonic signals[J].IEEE Trans on Instrumentation and Measurement,2005,54(3):1235-1240.

[4]Audacity.Cubic interpolation method for declipping in clipfix plug in [EB/OL].http://www.gaclrecords.org.uk/audacity.html,2013.

[5]刘春花,付强,杨家玮,等.音频信号截幅失真的检测与修复[J].声学技术,2009,28(4):498-502.

Liu Chunhua,Fu Qiang,Yang Jiawei,et al.The clipping detection and restoration for audio signal[J].Technical Acoustics,2009,28(4):498-502.

[6]Zhang D W,Bao C C,Deng F.et al,A restoration method of the clipped audio signals based on MDCT[C]//ISSPIT 2011.Bilbao,Spain:IEEE,2011:253-257.

[7]Li Z G,Wang F L,Zhu W Z.An optimal kernel Fisher nonlinear discriminant analysis method and applied on face recognition[C]//CIS 2008.Suzhou,China:IEEE,2008:233-237.

[8]Zhou X,Wu Y.Application of kernel fisher discriminant analysis to digital signal classification[J].Journal of Beijing University of Posts and Telecommunications,2011,34(2):35-39.

[9]Zhu J,Hoi S C H,Lyu M R.Face annotation using transductive kernel Fisher discriminant[J].IEEE Trans on Multimedia,2008,10(1):86-96.

[10]Larsen E R,Aarts R M.Audio bandwidth extension—Application of psychoacoustics,signal processing and loudspeaker design[M].UK:John Wiley &Sons Ltd,2004:145-234.

[11]Deng J D,Simmermacher C,Cranefield S.A study on feature analysis for musical instrument classification[J].IEEE Trans on Systems,Man,and Cybernetics,2008,38(2):429-438.

[12]MPGE Audio Group.Information technology—Multimedia content description interface-Part 4:Audio[S].ISO/IEC15938-4,2001.

[13]鲍长春.数字语音编码原理[M].西安:西安电子科技大学出版社,2007:109-153.

Bao Changchun.The principles of digital speech coding[M].Xi′an:Xidian University Press,2007:109-153.

[14]张勇,胡瑞敏.基于高斯混合模型的语音频带扩展所发的研究[J].声学学报,2009,34(5):471-480.

Zhang Yong,Hu Ruimin.Speech wideband extension based on gaussian mixture model [J].Acta Acustica,2009,34(5):471-480.

[15]Pulakka H,LAaksonen L,Vainio M,et al.Evaluation of an artificial speech bandwidth extension method in three languages[J].IEEE Trans on Audio,Speech and Language Processing,2008,16(6):1124-1137.

猜你喜欢
子带特征参数时域
一种基于奇偶判断WPT的多音干扰抑制方法*
故障诊断中信号特征参数择取方法
基于特征参数化的木工CAD/CAM系统
子带编码在图像压缩编码中的应用
基于时域信号的三电平逆变器复合故障诊断
基于PSO-VMD的齿轮特征参数提取方法研究
基于极大似然准则与滚动时域估计的自适应UKF算法
基于虚拟孔径扩展的子带信息融合宽带DOA估计
基于时域逆滤波的宽带脉冲声生成技术
统计特征参数及多分类SVM的局部放电类型识别