符秋养赵靖 摘译 梁勇 审校
南方医科大学附属南方医院耳鼻咽喉-头颈外科(广州 510515)
一般的简短刺激如短声、纯音和简单言语声均可诱发出听皮层诱发电位(auditory-evoked potentials,AEPs)的P1、N1和P2成分,由于P1的幅值相对较小,因此N1和P2波通常被认为是AEPs的特征波,通常将其归为N1/P2复合波。N1波对刺激声的起始特征敏感,P2波则反映了刺激声的声学或语音学特征。人类言语声包含时域和频域上快速变化的信息,其中嗓音起始时间(voice onset time,VOT)影响N1和P2的潜伏期。对比单音节/sei/、齿擦音/s/和元音/ei/诱发的AEPs,发现/sei/诱发的AEPs是/s/和/ei/诱发反应的组合,其中重叠的AEPs成分称为声学变化复合波(acoustic change complex,ACC),反映了整个刺激过程中的声学变化,由N1/P2复合波构成。当音节包含的音素之间具有足够长的延迟时间时,其诱发的AEPs各个成分之间没有重叠,因此ACC清晰可见;但当延迟时间较短时,ACC由于AEPs成分波的重叠而难以辨认,此时即使仅出现一个较明显的N1/P2复合波,也可能是多个N1/P2复合波的组合。为了证明这个观点,本研究采用纯音诱发出的AEPs通过加权参数来合成具有不同VOT的言语声诱发出的AEPs。
刺激声为1 kHz的短纯音(时长300 ms,升降时间各5 ms)和5个不同VOT的男性语音Ei /a:i/(VOT = 0 ms)、Bett /bet/(VOT = 35 ms)、Dieb /di:b/(VOT = 60 ms)、Pult /pult/(VOT = 80 ms)和Tau /tau/(VOT = 105 ms)。记录这两类刺激声在7例听力正常青年(年龄22~27岁)引出的皮层听觉诱发电位。以短纯音诱发的反应作为拟合对照模版,根据刺激言语声VOT的不同来乘以不同的加权系数k1和k2合成仿真波形,将合成的仿真波形与对应言语声所诱发的单个受试者的波形以及7个受试者的总体平均波形进行比较,以评估仿真波形的拟合效果。为获得仿真波形与反应波形的最佳拟合,使两者波峰的潜伏期和幅值在数值上基本相等,应用高斯-牛顿算法,求出使仿真波形与反应波形的误差最小的加权系数k1和k2,由此可发现和比较不同的VOT对N1/P2复合波的影响。
结果显示,短纯音诱发的AEPs为单一的N1/P2复合波,而言语声诱发的AEPs成分较为复杂,随着VOT的变化而不同:VOT较长的言语声诱发出的AEPs可观察到两个N1/P2复合波,而VOT较短的言语声诱发出的AEPs则只有一个N1/P2复合波。所有受试者同一言语刺激声诱发出的AEPs相似,仿真波形与对应的诱发波形在不同刺激间以及不同受试者间均无显著性差异,两者相应波峰的潜伏期和幅值的平均差值分别为10 ms和0.3 μV。仿真波形与相应的个体波形以及总体平均波形均高度相关,其相关系数范围分别为68%~85%和77%~96%。由此可知仿真波形能很好地拟合诱发波形,其最佳拟合的加权系数k1和k2均在0.30~0.41范围内。
上述结果说明,VOT较短的单音节言语声诱发的皮层听觉反应可以近似地描述为两个重叠的N1/P2复合波,其中一个N1/P2复合波反映了音节的起始,另一个则对应于音节中元音的起始,可以根据VOT来预测并分离这两个复合波。VOT较长的音节刺激因为刺激声变化的潜伏期足够长,从而避免了神经反应的相互重叠,可记录到两个N1/P2复合波;而VOT较短的音节刺激则因为神经反应的重叠只能记录到一个N1/P2复合波。
(摘译自:Burger M,et al.Ear & Hearing,2009,30:16~22)