听力学测试中常用的声信号

2017-03-23 22:33冀飞
中国听力语言康复科学杂志 2017年4期
关键词:纯音特异性言语

冀飞

听力学测试是测量人的听觉系统对于声音刺激的主观或客观反应。针对不同的测试,需要使用不同时域和频域特性的声信号,并使用适当的测试方式量化地呈现给受试者。本文对常用声信号的特性进行介绍。

1 纯音(pure tone)

纯音是最常用的听力学测试信号。纯音测听得到的听阈是听力测试的金标准。纯音是时域波形为一简单正弦时间函数的声波,从主观感觉是单一音调。从频域上看,理想的纯音具有单一的谱线(见图1)。任何复杂的周期性信号都可在频域上分解为不同频率的纯音。临床用作气导和骨导听阈测试的声信号是各种频率的纯音[1]。

图1 纯音的时域和频域波形[2]

然而,临床实际测试应用给出的声信号,不可能是理想化的时程无限长。其从无声到某一预定声压级需经过一定时长,这一过程即上升时间(rise time)。同样,声信号达到某一程度后持续的时间可长或短,这一持续时间(即时程)内声压级稳定不变,然后经过下降时间(fall time)降到无声。

声信号的时程和响度和频率特性都有关。例如,对1000 Hz纯音来说,其时程(duration)需在200 ms左右才能充分累积达到最高限度的响度。这时即便再延长时程,响度也不会增加,但是缩短时程就会使响度降低。另一方面,信号时程还会影响信号的频率特性。时程越短声刺激的频谱主瓣越宽、频率特性越差,特别是低频纯音更易失去其频率特征。这也是临床上纯音测听要求每次给患者呈现信号至少1~2秒的原因。

2 短时程信号(short-duration signal)

短时程信号是指持续时间短于200 ms的信号[3]。使用这些信号的常用测试包括记录听觉诱发电位、诱发性耳声发射和神经耳科检查等。

2.1 短声(click)

短声是加载一个方波脉冲信号到换能器终端所产生的宽频谱的瞬态声学或振动信号。短声是一种宽频带信号,频率特异性较差,能量主要集中在3~4 kHz。其能量分布主要取决于耳机或扬声器的频响特性[1],图2显示了经插入式耳机播放的典型的短声频谱。

图2 短声频谱特性

2.2 短音(tone)和短纯音(tone burst)

短音和短纯音是时程短于200 ms的正弦信号。二者均由纯音信号施加一个时窗(包络)截取而成,包含数个正弦波。短音和短纯音的区别仅在使用线性时窗截取时在时域上是否具有平台期。短音不具有平台期。使用非线性时窗截取信号时,短音和短纯音并无显著区别,可统一称为短纯音。由于时程较短,所以与纯音相比,短音和短纯音的频谱并非单一谱线,而是形成一个窄带,其频率特异性与时程、上升/下降时间有关。为去除测试中的刺激伪迹,通常采用由疏波信号和密波信号交替组成的交变极性短时程信号。

短纯音的时程是指短纯音包络的上升沿和下降沿上50%最大幅度点之间的时间间隔(图3,图注①)。短纯音包络的上升沿上10%最大幅度点与90%最大幅度点之间的时间间隔称为短纯音的上升时间(rise time)(图3,图注②);下降沿上90%最大幅度点与10%最大幅度点之间的时间间隔称为短纯音的上升时间和下降时间(fall time)(图3,图注③)。

图3 线性时窗交变极性短音/短纯音时域波形示意图[3] ①时程②上升时间③下降时间

图3给出的是线性时窗截取的短纯音信号。在评估听阈时,使用非线性时窗如Blackman等产生的短音比起一般的线性时窗短纯音引发的刺激同步性更好,同时还能保证频率特异性。目前多用Blackman时窗来截取短纯音。图4是Blackman时窗短纯音的时域波形图。

图4 Blackman时窗短纯音的时域波形[4]

2.3 信号的频率特性

听力学测试需要尽可能了解受试者各个频率上的听阈水平。因此,所使用的测试信号需要具有频率特异性。在进行客观测听如ABR测试等时,信号的频率特异性尤为重要。ABR反应阈值的确定需要主观判断,因而要求ABR波形具有较好的分化程度(即神经冲动同步化好)。这就要求刺激声具有较好的瞬态特性。因此,ABR的刺激声信号需要同时具备频率特异性和瞬态特性两个特点。

纯音具有最好的频率特异性,但是因其时程长、频谱窄,无法使得大量神经元有效同步化反应。传统的ABR使用短声可以在短时间诱发大量听觉神经元产生同步化神经反应,但是缺乏频率特异性。短纯音和短音综合了短声与纯音特点,理论上可在听神经同步化反应与频率特异性之间取得最佳平衡。短纯音/短音刺激声由其时程的长短决定频率特异性。上升、下降时间和时程越长,频率特异性越好;上升、下降时间越短,声刺激的频谱主瓣越宽、频率特性越差。非线性时窗截取的短音能够提高诱发ABR频率特异性[5]。

3 调制信号(modulated signals)

3.1 用于ASSR测试的调制信号

用于ASSR测试的调制声信号与诱发ABR的瞬态信号如短声等不同。

3.1.1 调幅声(AM)和调频声(FM):正弦调幅或指数包络(exponential envelopes)的纯音、宽带噪声和限带噪声(band-limited noise)均可诱发ASSR。其中正弦调幅音(波形见图5-a)的频率特异性最好,调幅噪声诱发的反应振幅最大。调频声是对载波的频率进行调制,使载波的频率产生变化,调制深度的百分比是相对于载频而言,等于全部频率变化范围除以载频,调频反应振幅随调制深度和声音强度增加而增加。临床多用调制深度为10%的调频声。

3.1.2 混合调制声(mixed modulation,MM):MM是以同一调制频率同时调制载波的振幅和频率(波形见图5-c)。如果调制频率在80~100 Hz之间,AM和FM反应基本上是独立的,两者相加构成MM反应。一般AM反应的相位比FM反应的轻微延迟,MM反应的振幅随着AM和FM之间的相位差变化,当AM和FM的反应相位一致时,振幅达到最大,仅比单独AM和单独FM反应振幅之和减少10%~20%。

3.1.3 独立调幅调频声(independent implitude and frequency modulation,IAFM) 是同时以不同的调制频率对某一载波分别调幅和调频。IAFM反应比只调幅或只调频诱发的反应振幅稍有减低(减少14%)。同时给以多个IAFM声,可用于评价人类听觉系统分辨频率和振幅同时变化的能力。言语模式的IAFM声是以不同的调制频率同时对某一载波同时分别调幅和调频,载频(0.5,1.0,2.0和4.0 kHz)的调幅、调频深度与日常用语的声学特性相似,四个载频同时给出。

图5 诱发听觉稳态反应的调制信号[6]

3.2 chirp声信号

chirp声又称线性调频脉冲声,是一种调频调制声,具有耳蜗行波延迟代偿的特性,其频率可随时间改变。它以耳蜗模型为基础,低频声音早发出,高频声音晚发出(时域波形见图6)。chirp声能代偿耳蜗传递时间,克服耳蜗的特殊解剖结构造成的低频区行波延迟,在耳蜗中增加了实时同步性,提高ASSR评估听阈的效果并提高测试速率。chirp声在频率特异性ASSR测试中应用广泛。

图6 Chirp信号波形图[4]

4 言语信号(speech signal)

4.1 言语测听用的信号

临床常需要进行言语测听(speech audiometry)。言语测听使用的信号。可以是监控下的现场发声,即由测试者朗读或口述,也可由发音人的物理言语声信号转换成电信号,经过控制和调整,再由电信号转换成物理言语声,如通过磁带、CD、计算机声卡等。与纯音、短纯音等信号不同,言语信号是波动的、复合的信号(见图7)。

图7 言语信号波形

言语信号的强度控制是非常重要的,使用经过校准的测试信号得到的结果才具有可比性。言语测听中使用的言语信号可用言语级(speech level,Lp)表示,也可用言语听力级(hearing level for speech,HLspeech)表示。由于言语信号幅度随时间波动,因此通常采用一段时间内的方均根值来描述言语信号级。言语听力计或者听力计中言语测试线路的校准,主要是以1000 Hz窄带噪声(narrow-band noise)或啭音校准信号代替声强、频率和时间都不断变化的言语信号进行校准。

4.2 测试言语ABR用的信号

使用较复杂的声信号如言语声诱发的听觉脑干反应称为言语ABR(speech ABR)或复杂ABR(complex ABR,cABR)。speech ABR/cABR可通过更精细的反应波形时域分析评估与语音和词汇处理相关的语言障碍以及听觉系统的退行性变,以及研究皮层稳定性和可塑性。speech ABR/cABR的诱发信号通常为时程几百毫秒(ms)的合成音节,包含辅音(共振峰迁移区)和元音(稳态区)部分,可具有不同的声调,常用测试音如/da/、/ba/[7],/mi/[8]等。图8给出了一种用于诱发speech ABR/cABR的/da/音节的时域和频域波形[7]。研究人员通过这些合成音刺激诱发脑干反应从而研究言语中的周期性信息的编码机制、辨认元-辅音的神经基础研究、言语声的基频信息、不同声调的识别机制等[9、10]。

图8 Anderson S等报道的用于诱发speech ABR/cABR的/da/音节的时域和频域波形[7]

5 噪声(noise)

5.1 噪声的定义

在听力学测试中,噪声通常与信号相对。噪声有两层含义,一是从声学本质上是指紊乱断续或统计上随机的声振荡,二是广义上可引申为任何不需要的声音或者电干扰。本文从声学本质上介绍听力学测试中常见的噪声。

5.2 噪声的种类

5.2.1 白噪声(white noise) 用固定频带宽度测量时,频谱连续并且均匀的噪声。白噪声的功率谱不随频率改变,即用等带宽的滤波通带,以对数分布的频率刻度做横坐标,基本上呈水平线分布。

5.2.2 粉红噪声(pink noise) 用正比于频率的频带宽度测量时,频谱连续并且均匀的噪声。粉红噪声的功率谱密度与频率成反比。

5.2.3 窄带噪声(Narrow band noise) 频谱连续且功率谱密度恒定的白噪声,通过在通频带以外基本上是恒定衰减的带通滤波器,所产生的噪声信号。在纯音测听时,为避免非测试耳通过交叉听力听到测试声信号,需用中心频率与测试纯音信号频率相同的窄带噪声在非测试耳施以掩蔽(masking)。所谓掩蔽,是一个声音的听阈因存在另一个声音而上升。掩蔽的大小就是上升的分贝数。

5.2.4 言语噪声(speech noise) 某些声场下的噪声中言语识别测试材料使用与测试项频谱形状一致的言语谱噪声进行校准。较为常用的有国际长时平均语谱(ILTASS)噪声和多人谈话(babble noise)噪声。

5.3 信噪比(Signal to noise ratio)

信噪比是信号相对于噪声的倍数,通常以dB表示。信噪比越高,代表信号越清晰。由于信噪比是两个同类别的量进行倍数运算得到的数值,代表两个量之间的倍数关系,与基准量的选择无关,因而信噪比的单位不应在dB后面任何后缀[11]。

[1]韩东一,翟所强,韩维举.临场听力学(第二版)[M].北京:中国协和医科大学出版社,2008.14-17.

[2]Stanley AG.Acoustics and sound measurement.In Essentials of audiology[M].Thieme Medical Publishers,1997.1-35.

[3]GB-T 7341.3:2017电声学,测听设备第3部分,短时程测试信号.

[4]Elberling C,Crone Esmann L.Calibration of brief stimuli for the recording of evoked responses from the human auditory pathway[J].J Acoust Soc Am,2017,141(1):466-474.

[5]冀飞,梁思超,史伟,等.短音信号的频率特异性分析[J].中国听力语言康复科学杂志,2015,13(5):338-341.

[6]李兴启,王秋菊.听觉诱发反应及应用(第二版)[M].北京:人民军医出版社,2015.211-228.

[7]Anderson S,Kraus N.The Potential Role of the cABR in Assessment and Management of Hearing Impairment[J].Int J Otolaryngol,2013,2013(s2):604729.

[8]王倩,王燕,刘志成.Speech-ABR安静及噪声环境下音位的对比研究[J].中华耳科学杂志,2016,14(5):634-638.

[9]Greenberg S,Marsh JT,Brown WS,et al.Neural temporal coding of low pitch.I. human frequency-following responses to complex tones[J].Hear Res,1987,25(2-3):91-114.

[10]Nina K,Trent N.Brainstem origins for cortical what and where pathways in the auditory system[J].Trends in Neurosciences,2005,28(4):176.

[11]冀飞.听力学测试中的“dB”浅析[J].中国听力语言康复科学杂志,2016,14(6):460-464.

猜你喜欢
纯音特异性言语
CT联合CA199、CA50检测用于胰腺癌诊断的敏感性与特异性探讨
老年慢性非特异性腰痛综合康复治疗效果分析
言语思维在前,言语品质在后
自动纯音听阈检测技术
血清铁蛋白、IL-6和前列腺特异性抗原联合检测在前列腺癌诊断中的应用
管家基因突变导致面部特异性出生缺陷的原因
ABR、40Hz-AERP和ASSR与主观纯音听阈测定的相关性研究
《世说新语》中的“言语”趣味故事
高压氧综合治疗高频下降型突发性聋疗效分析
关于冬天