基于欠定盲源分离的双路音频信号噪声自适应分离

2024-12-18 00:00:00蓝壮青
现代电子技术 2024年24期

摘" 要: 当多个源信号同时存在于同一频段或时间域内时,它们可能会相互干扰,导致信号混叠。这种情况下使用双路音频传感器进行捕捉,无法准确地捕捉到所有源信号的信息,导致分离过程具有不确定性。对此,提出一种基于欠定盲源分离的双路音频信号噪声自适应分离方法。首先,构建欠定盲源分离模型,基于小波包变换分解和重构信号获取信号分量,并依据信号和分量之间的互相关系数筛选分解后的分量,删除其中的冗余分量后生成新的观测信号;然后,依据贝叶斯信息准则的奇异值分解方法估计该源信号的数量,将其转换为正定白化信号;最后,利用快速独立成分分析法将该信号分类,实现双路音频信号噪声自适应分离。测试结果显示:所提方法能够在保证信号质量的前提下完成信号变换处理,信干比均在15 dB以上;筛选后保留的各个分量相关系数均在0.65以上,有效地完成了对信号噪声的分离。

关键词: 欠定盲源分离; 双路音频; 信号噪声; 自适应分离; 小波包变换分解; 贝叶斯信息准则

中图分类号: TN911⁃34" " " " " " " " " " " " " " 文献标识码: A" " " " " " " " " " " "文章编号: 1004⁃373X(2024)24⁃0068⁃05

Dual channel audio signal adaptive noise separation based on underdetermined

blind source separation

LAN Zhuangqing

(Guangxi Minzu University, Nanning 530006, China)

Abstract: When multiple source signals coexist in the same frequency band or time domain, they may interfere with each other, resulting in signal aliasing. In this case, using dual channel audio sensors for capture cannot accurately capture the information of all source signals, resulting in uncertainty in the separation process. A dual channel audio signal noise adaptive separation method based on underdetermined blind source separation is proposed. An underdetermined blind source separation model is constructed, which can decompose and reconstruct the signal based on wavelet packet transform to obtain signal components. The decomposed components are selected based on the number of interrelationships between the signal and the components, and redundant components are removed to generate new observation signals. Based on the Bayesian information criterion, the singular value decomposition method is used to estimate the quantity of the source signal and convert it into the positive definite white signal. The fast independent component analysis method is used to classify the signal, so as to realize adaptive noise separation of dual channel audio signals. The testing results show that this method can complete signal transformation processing while ensuring signal quality, the signal⁃to⁃noise ratio results are all above 15 dB, and the correlation coefficients of each component retained after screening are all above 0.65, which can effectively separate signal and noise.

Keywords: blind source separation; dual channel audio; signal noise; adaptive separation; wavelet packet transform decomposition; Bayesian information criterion

0" 引" 言

双路音频信号也称为双声道,指的是音频信号同时通过两个独立的音频频道进行传输[1]。这两个频道一般为左声道和右声道,是相互独立的,它们共同组成了立体声效果[2]。在双路音频信号噪声自适应分离中,分离目标是将原始信号从观测到的信号中分离出来,且该观测信号具备混合特点[3⁃4],以此提取纯净的目标信号,获取高质量的音频信号。如何自适应地处理噪声和提高欠定盲源分离的性能,是当前研究的重点之一。文献[5]为实现信号的有效处理,对音频信号在强噪下的信号特性进行分析,并构建联合稀疏信号重构模型,计算信号的功率谱后,通过谱减法实现音频信号的降噪。但是谱减法在处理过程中可能会对语音信号造成一定的失真,尤其是在低信噪比条件下,会导致语音质量相对粗糙。文献[6]为处理小信号中的干扰噪声,提取信号中描述音频的特征向量,将提取的结果作为改进的支持向量机的输入,对特征进行分类,再对分类出来的噪声信号进行处理。然而在实际应用中,处理大量音频信号时如果应用场景的实时性需求较高,该算法的检测速度无法满足。文献[7]为有效实现噪声处理,设计并行计算架构,以此满足多时间序列数据信号的处理需求,并且采用分批计算方式进行信号处理,采用自适应滤波方法处理信号中的噪声。目前的并行模式在系统柔性、容错性和冗余性方面存在不足,这可能导致在处理大型噪声项目时,系统容易受到外部因素的干扰,无法满足复杂场景下的应用需求。文献[8]为去除音频中的噪声,将音频信号划分为多个子带,并在每个子带上独立应用自适应滤波技术,使用递归的方式更新滤波器系数,以最小化滤波后的信号与期望信号之间的误差,保证噪声处理效果。该方法在应用时如果音频处理规模较大并且音频较为复杂,可能会存在音频信号损坏现象。

欠定盲源分离技术作为一种有效的信号处理技术,可将信号中不确定分布情况、不同的源信号进行分离[9]。基于此,本文提出一种基于欠定盲源分离的双路音频信号噪声自适应分离方法。

1" 基于欠定盲源分离的源信号提取

1.1" 欠定盲源分离问题转换

当多个源信号同时存在于同一频段或时间域内,它们可能会相互干扰,导致信号混叠。这种情况下即使使用双路音频传感器进行捕捉,也无法准确地捕捉到所有源信号的信息,从而导致分离过程具有不确定性和非唯一性[10]。本文通过构建欠定盲源分离模型,并基于信源数量估计和信号分解重构处理,将欠定问题转换为正定问题,从而为实现源信号分离奠定基础。数量为[n]的双路音频原信号用[st=s1t,s2t,…,sntT]表示,其中[T]表示转置,[t=1,2,…,M]表示信号采样点数量。[snt]在传播以及接收过程中受到环境干扰后,会导致信号发生混叠现象[11],此时天线阵列接收的观测信号用[xt=x1t,x2t,…,xmtT]表示,任意[xt]均为[st]的混叠,则可构建线性瞬时混叠欠定盲源分离问题的模型,公式为:

[xt=Ast+εt] (1)

式中:[A]表示混合矩阵;[εt]表示混叠加性噪声。欠定盲源分离问题时[mlt;n],为有效解决该分离问题,依据[xt]进行信源数量估计并获取[A],在此基础上实现信号的分解和重构处理,将欠定盲源分离问题转换为正定盲源分离问题,再实现源信号分离。该分离的主要目的是将[st]从[xt]中分离出来,以此完成噪声自适应分离。

1.1.1" 基于小波包变换的欠定问题转换

小波包变换是一种有效的信号处理工具,可以通过逐层分解的方式保留更完整的有效信号,实现信号恢复。本节利用小波包变换对观测信号进行分解,以提取频带分量中的有效信息分量。被噪声污染的双路音频信号是[st]和[εt]混叠形成,则噪声信号的公式为:

[εt=st+ε1t+ε2txt] (2)

式中[ε1t]和[ε2t]分别表示电噪声和声学噪声信号。

采用逐层分解的方式对高频信号部分进行分解,以此保留更完整的有效信号,实现信号恢复[12]。如果小波包分解系数用[ξk]表示,则小波包变换的分解和重构公式为:

[ξj+1,2ck=εtlh2l-kξj,clξj+1,2c+1k=εtlg2l-kξj,cl] (3)

式中:[j]表示分解尺度;[c]表示第[c]条分叉树;[ξj,cl]表示该尺度下的分解系数;[l]表示分解层数;[h2l-k]和[g2l-k]分别表示低通滤波器和高通滤波器。

通过小波包变换后获取的高频和低频信号中均包含源信号和噪声信号,并且信号的能量存在一定差异。[xt]的能量计算公式为:

[Exin=1Nn=1Nξj+1,2c+1kxin2] (4)

通过上述公式即可完成[xt]的分解。根据能量[Exin]设定阈值,对高频和低频部分的小波系数进行筛选,高于阈值的系数被认为是有效信息,以此提取频带分量中的有效信息分量[Qit]。

1.1.2" 信号分量筛选

提取频带分量[Qit]后需要对其进行筛选,以删除冗余分量,提高信号分离的效率和准确性[13]。本节采用互相关系数作为筛选标准,通过计算信号和分量之间的互相关系数来判断两者之间的关联程度。两者之间的关联程度的计算公式为:

式(5)中[μxin,Qit]的值越大,表示[xin]和[Qit]之间的关联性越大,则说明该信号的效用值越大;值越小表示相关性越小,冗余越大。将其中相关性小的信号删除后,保留的信号重新组合形成新的观测信号[Xt],其表达式为:

[Xt=Q1t,Q2t,…,Qp-1t,xnTμxin,Qit] (6)

在完成信号分量筛选后,需要进一步对源信号进行估计。

1.2" 源信号估计

针对前文获取的新观测信号[Xt],采用贝叶斯信息准则的奇异值分解方法来估计源信号的数量,并获取转换后的正定白化信号。

在进行信号分离前,先依据贝叶斯信息准则的奇异值分解方法估计源信号的数量,估计步骤如下。

1) 计算[Xt]的协方差矩阵[χe],公式为:

[χe=EXtXHt] (7)

式中[XHt]表示共轭转置。

2) 通过奇异值分解对[χe]进行处理,获取其中的主特征,并按照由大到小的顺序进行排列,以此获取主奇异值特征量[Ya],再将[Ya]中特征值等于0的元素删除后生成长度为[L]的新特征向量。

3) 以贝叶斯信息准则为基础,获取该准则的最值,从而确定源信号的数量。贝叶斯信息准则公式为:

[Bk=j=1kλj-L2σ-LL-k2kL-dk+k2χe] (8)

式中:

[σ2k=j=1LλjL-k] (9)

[dk=Lk-kk+12] (10)

式中:[k]表示变量,取值为[1≤k≤L];[j=1,2,…,L];[λj]表示特征值。

通过公式(8)获取[Bk]的最大值对应的特征序号值,该值即为源信号数量,将获取的[Xt]转换为正定盲源分离问题,获取转换后的正定白化信号[Zt],公式为:

[Zt=vXtBk] (11)

式中[v]表示最优分离矩阵。

在上述公式的基础上计算源信号的估计值,公式如下:

[st=vZt] (12)

最后对源信号的估计值[st]进行后续的噪声信号自适应分离。

2" 噪声信号自适应分离

通过公式(12)获取[st]值后,采用快速独立成分分析(FastICA)法进行噪声信号自适应分离。FastICA法主要是利用极大化信号的非高斯性完成分离处理,该方法能够根据观测信号的变化自动调整分离参数,且具有适应噪声信号的特性可能随时间、环境等因素发生变化的动态特性,从而可靠地分离出独立的噪声信号和有用信号。

如果第[τ]次迭代后的分离矩阵用[vτ]表示,则[τ+1]次迭代后的分离矩阵计算公式为:

[vτ+1=ηZtδvτ-ηvτZtvτst] (13)

式中:[η·]和[δ·]均表示函数,前者对应均值运算,后者对应非线性,且[η·]导数用[η·]表示。

当[Δv=vτ+1-vτ]时,且[Δv]小于设定的迭代误差,即可获取[v]和[st],对[st]各个维度进行辨识后,确定各个源信号的类别,以此完成双路音频信号噪声自适应分离。为保证信号的分离效果,文中采用相关性指标量化噪声信号分离效果,公式为:

[μs,s=vτ+1ψst,stκstκst] (14)

式中:[st]表示真实双路音频源信号;[κ·]表示标准差函数;[ψ·]表示协方差函数。

3" 结果分析

3.1" 实验环境

为验证所提方法对于双路音频信号噪声自适应分离的效果,以某公司的实时双向音频监听和对讲产生的双路音频信号为例展开相关测试。共计采集音频的时序为72 h,该音频的采集环境为正常车间内的环境背景,信号的频率为300~3 400 Hz。测试环境示意图如图1所示。

3.2" 实验指标

本文方法在进行双路音频信号噪声自适应分离前,通过小波变换对采集的双路音频信号进行变换。为分析其变换效果,文中采用信干比作为评价指标,衡量信号处理后的质量,其值越大表示信号质量越佳,即小波变换的效果越佳。信干比的计算公式为:

[ςs=10lgxtxt-Qit] (15)

3.3" 实验测试结果分析

1) 信干比测试结果

采用本文方法进行不同频率的双路音频信号处理,依据公式(15)计算信号处理后的[ςs]值(期望标准达到10 dB以上),以此衡量该方法变换后的信号质量,测试结果如表1所示。

对表1测试结果进行分析后可知,信干比结果均在15 dB以上,即使信号中噪声干扰较大时,依旧能够在保证信号质量的前提下完成变换处理。

2) 信号分量筛选测试分析

利用所提方法对信号进行分解后,需对获取的各个信号分量进行筛选,从而有效处理分量中的冗余信号。为衡量该方法的筛选效果,设定相关系数阈值为0.65,将低于该阈值的分量定义为冗余分量,筛选结果如图2所示。

对图2测试结果进行分析后可知:通过文中方法进行不同频率信号的分量筛选后,保留的各个分量结果均在0.65以上,相关系数最大值接近0.96,最小值约为0.72。由此说明文中方法能够可靠完成双路音频信号分量筛选,去除分量中的冗余分量,可为后续噪声自适应分离提供依据。

3) 噪声分离效果分析

为验证文中方法对于双路音频信号噪声的分离效果,通过该方法对获取的双路音频信号进行分离,获取该信号的分离结果,并呈现分离获取的噪声信号情况和有效源信号情况,分离结果如图3所示。

对图3测试结果进行分析后可知:采用文中方法能够完成双路音频信号噪声分离,分离后源信号被有效保留,并且源信号的幅值相对稳定地在一定范围内浮动;噪声信号则呈现不稳定的显著波动。因此,文中方法能够有效完成信号噪声分离。

4" 结" 论

双路音频是多个领域中产生的较为重要的音频信号,会存在观测信号数量少于源信号数量的情况,此时实现信号中信号噪声的可靠分离则属于欠定盲源自适应分离。文中为保证分离后信号质量,提出一种基于欠定盲源分离的双路音频信号噪声自适应分离方法,对该方法的应用效果进行相关分析,得出其能够较好地完成双路音频信号噪声分离,从而满足应用需求。

参考文献

[1] 解元,邹涛,孙为军,等.面向高混响环境的欠定卷积盲源分离算法[J].通信学报,2023,44(2):82⁃93.

[2] 王晶,李炜,洪心睿,等.基于改进密度聚类算法的语音信号欠定盲分离[J].信息与控制,2023,52(6):784⁃796.

[3] 王力辉,刘通,谢代梁,等.基于SVD的涡街流量计信号处理方法[J].传感技术学报,2023,36(5):731⁃737.

[4] 汤敏,顾炜江.多路音频传感信号低功耗实时采集方法设计[J].传感技术学报,2024,37(4):690⁃695.

[5] 樊一帆,张丽丹.强噪环境基于谱减法的录音数字音频信号降噪[J].计算机仿真,2023,40(11):433⁃436.

[6] 高原,邓艾东,范永胜,等.基于MFCC和MDE⁃SVDD的滚动轴承音频信号异常检测方法[J].动力工程学报,2024,44(2):277⁃283.

[7] 吴超,卫谦,周俊伟,等.基于异构计算平台的背景噪声预处理并行算法[J].计算机工程与科学,2023,45(10):1711⁃1719.

[8] TAHEREH Bahraini, ALIREZA Naeimi Sadigh. Proposing a robust RLS based subband adaptive filtering for audio noise cancellation [J]. Applied acoustics, 2024, 216: 109755.1⁃109755.10.

[9] 韩烨宸,贺兴,艾芊.基于GRU⁃EEMD算法的非侵入式配电网功率欠定盲源分离[J].电力系统自动化,2023,47(14):64⁃71.

[10] 潘伟豪,盛卉子,王春宇,等.基于欠定盲源分离和深度学习的生猪状态音频识别[J].华南农业大学学报,2024,45(5):730⁃742.

[11] 吴宸之,李炜,房琪,等.基于小波包混合优化的欠定盲源分离方法[J].电子测量与仪器学报,2023,37(9):213⁃224.

[12] 白琳,温媛媛,李栋.动态变化混叠模型下盲源分离中的源数估计[J].电讯技术,2024,64(3):396⁃401.

[13] 庾天翼,李舜酩,陆建涛,等.强噪声中检测微弱目标信号特征的量子信号处理算法[J].计算机集成制造系统,2024,30(2):482⁃495.

作者简介:蓝壮青(1979—),男,壮族,广西南宁人,博士研究生,副教授,研究方向为音频处理、计算机应用。