黄贺梅 刘履方 蔡跃新 李佳鸿 陈桂生 郑亿庆*
1 中山大学附属第七医院耳鼻咽喉科(深圳 518107)
2 中山大学附属第七医院康复医学科(深圳 518107)
3 中山大学孙逸仙纪念医院耳鼻咽喉头颈外科(广州 510120)
听力损失是老年人身体功能衰退的常见表现之一[1],世界卫生组织2021年《世界听力报告》指出,中度及以上听力损失的患病率随着年龄的增长呈指数增长[2]。我国60 岁以上老年人听力残疾人数超过2000 万[3]。年龄相关性听力损失(age-related hearing loss,ARHL)也称为老年性聋,它被定义为进行性,双侧对称性的年龄相关的感音神经性听力损失,以高频听力下降最为明显[4]。
听觉言语理解障碍是最困扰老年性聋人群的问题,Mitchell 等[5]表明,只有23%的老年性聋患者真正受益于助听器。除了外周听力损失外,中枢加工缺陷[6]以及认知缺陷[7]也参与老年人听觉处理能力下降的过程。Mukari等[8]研究结果表明较好耳高频平均值主要与安静环境下的语音识别有关,而噪声环境下的语音识别能力主要通过认知能力进行衡量。时间压缩阈值(time-compression threshold,TCT)是指使用自适应方法测量的语音速率变化时的语音识别阈值,Versfeld 和Dreschler[9]的研究结果证实了TCT 测试能够比平稳噪声下言语接受阈更好地评估个体的语音理解能力。
“鸡尾酒会效应”是指在复杂声学环境中选择性关注特定声源的能力[10],它对于空间中的交流和定向都至关重要。在具有挑战性的声学环境中年龄对理解声源信息的能力产生更为明显的影响。在目标声源的位置发生快速且意外变化时,需要灵活且快速的切换听觉空间注意[11],然而注意力抑制能力随年龄增长而下降,影响了声源信息的提取理解。
事件相关电位(event related potential,ERP)是给予神经系统特定的刺激或使大脑对刺激的信息进行加工,在该系统和脑的相应部位产生的可以检出的、与刺激有相对固定时间间隔和特定相位的生物电反应,可反应大脑高级皮层对特定刺激的中枢脑反应[12]。“鸡尾酒会”任务中皮层网络活动可由包括N1、P1、N2在内的事件相关电位成分进行反映。
老年性聋组:60岁以上老年人25名(9名男性和16名女性;平均年龄69.2±5.46岁),右耳平均听阈31.40±8.48dB HL,左耳平均听阈33.15±9.16 dB HL。
纳入标准:①以高频听力损失为主的双侧对称性听力损失(基于WHO-1997标准,听力损失被定义为0.5~4kHz平均听阈>25 dBHL;非对称性听力损失被定义为两个或以上频率耳间差≥15dB[13]);②调整后的MMSE评分提示认知正常(文盲者>19分,小学文化水平者>22分,中学或以上文化水平者>26分)。
排除标准:①传导性听力损失;②任意耳鼓室图非A 型;③耳部外伤或手术史;④严重中枢神经系统疾病史;⑤严重心血管疾病史。
年轻对照组:25 名听力正常的健康年轻人(13名男性和12名女性,平均年龄24.6±4.1岁)。右耳平均听阈9.45 dB HL±3.72 dB HL,左耳平均听阈9.80±3.20 dB HL。所有参与者均无神经系统、耳科或全身疾病史。听力均值及标准差见图1。
图1 受试者听力图Fig.1 Audiogram of subjects
在实验之前,所有参与者均被告知实验流程,并签署了书面知情同意书。该研究已获得中山大学孙逸仙纪念医院伦理委员会批准(伦理号:SYSEC-KY-KS-2021-311)。
1.2.1 “鸡尾酒会”场景事件相关电位
在环境声小于25dBA 的房间中,声刺激经过Lenovo笔记本电脑,利用耳罩式耳机重放生成的虚拟声像模拟在水平方位角-75°、-45°、0°、+45°、+75°(+代表右侧,-代表左侧)五个参考位置进行目标信息的定位和识别。初始信号约为65dB SPL,并根据受试者听觉舒适阈水平对信号强度进行调整。使用Neuracle 32导脑电仪收集脑电数据,阻抗保持在50 kΩ 以下,采样率1000Hz,设置带通(0.1~70Hz)和陷波(50 Hz)滤波器。
水果名称(菠萝、西瓜、香蕉、荔枝)以及数字被用作刺激,材料由以普通话为母语的两位男性及三位女性进行录制。使用Adobe Audition 软件将水果词语片段调整为600ms,数字片段为400ms,通过华南理工大学HRTF 转换为立体模拟声文件。播放“水果-数字”的刺激,目标事件与6个数字中的1个(“1”,“3”,“4”,“6”,“7”,“8”)以伪随机组合在-45°或+45°的位置出现。在水果播放后的800ms 出现数字,即其间有200ms间隔,图2为模拟扬声器位置及基本测试流程。
图2 “鸡尾酒会”听觉任务扬声器位置及基本流程图Fig.2 Speaker locations and basic flowchart for the "cocktail party"auditory task
实验为2×2×2 混合设计,个体内效应为注意力情况和声源情况,个体间效应为分组。参与者的任务是注意目标水果(菠萝),并在其数量为“3”时做出响应。分散注意力情况需要同时对两侧目标刺激做出响应,集中注意力情况只需要注意和响应其中一个位置的目标。所有参与者均完成分散注意力,集中左侧,集中右侧三轮测试。单声源情况目标刺激单独呈现,多声源情况在-75°、0°及+75°位置同时出现三个不重复的干扰声,两种条件交替呈现。练习完成后,共有360 次试验,每一试次1200ms,间隔800~1200ms,模块间设置休息时间,实验共持续约30分钟。
1.2.2 认知量表
利用中文版简易精神智能量表(Mini-Mental State Exam,MMSE)对总体认知情况进行评估。
1.2.3 语速识别阈值测试
语音材料来自普通话噪声下言语测试语料库[14],共12 个句表。参与者母语为中文,普通话交流流利。要求被试复述听到的内容,记录正确率为50%时语速。
1.2.4 ERP分析
使用EEGLAB 在MATLAB R2019a 中对数据进行预处理和分析。带通滤波设置为0.5~20 Hz,手动去除伪迹并插补电极后将数据进行全脑平均重参考,以事件进行分段后对-500~1500ms 内的数据进行检测,剔除标准为分段的极差值>200 μv或单个采样点的最大电压阶跃>50 μv。
个体数据按照测试场景分别叠加平均,每个听觉场景各60试次,控制伪迹剔除率<10%。水果名称刺激诱发的ERP 成分的峰值被定义为特定潜伏期窗口内的最大正值或负值(P1:在语音开始后20~120ms 出现于FCz;N1:60~160ms 于Cz;P2:160~260ms 于FCz,其峰值和潜伏期在Cz 电极进行测量)。CNV 被量化为言语开始后600 至700ms 时间间隔内Fz处的平均振幅。
1.2.5 溯源
使用标准化低分辨率电磁扫描成像技术(Standardized low-resolution brain electromagnetic tomography,sLORETA)对CNV 成分的神经起源进行研究。sLORETA 使用MNI模板及并利用6239个体素进行标准化电流密度的评估,其已被证明能够对可能的脑源进行可靠定位,方法基于统计非参数映射并使用5000 次随机置换进行检验及多重比较校正。显著体素(P<0.05)表明组间存在差异。
使用SPSS 软件(vision 25.0; IBM Corporation,Armonk,NY,USA) 进行统计分析。对各ERP 成分振幅和潜伏期分别进行重复两因素的三因素混合设计的方差分析,若变量间存在交互效应,则进行简单效应检验。利用η2p进行效应量评估。
对于各项数据,满足正态分布的两连续变量间相关选用Pearson 相关性分析,否则选用Spearman相关性分析。
水果刺激诱发了典型的P1-N1-P2 复合体,见图3,分别在约60ms、110ms 和210ms 达到峰值。与年轻组相比,老年性聋组P1 潜伏期延长(F=13.985,P=0.001),P1 振幅下降(F=5.878,P=0.020),N1 振幅提高(F=4.301,P=0.049),N1潜伏期延长(F=6.067,P=0.021)。相比单声源情况,多声源情况P2 峰值潜伏期延长(F=5.869,P=0.025),分散注意力情况下P2振幅较集中注意力情况提高(F=5.540,P=0.029)。
图3 Fz、Cz及Pz电极ERP成分(n=50)Fig.3 ERP components of Fz,Cz and Pz electrodes(n=50)
在P2 成分后出现明显的CNV 成分。声源情况、注意力情况及老年性聋均影响CNV 振幅,老年性聋组振幅较年轻组显著降低(F=5.174,P=0.027),多声源或分散注意力情况下出现更小的CNV(声源:F=19.755,P<0.001;注意力:F=6.939,P=0.011)。图4表示各情况下CNV 振幅及相关成分潜伏期的均值,表1列出三因素方差分析结果。
表1 ERP成分振幅及峰值潜伏期的三因素方差分析结果(F值及效应量η2p)Table 1 Results of ANOVAs of ERP amplitudes and peak latencies(F value and effect sizes η2p)
图4 ERP成分振幅和潜伏期条形图Fig.4 Amplitude and latency bar graphs of ERP components
使用sLORETA 分别在单声源和多声源情况下在最大差异的CNV 峰值点比较年轻组及老年性聋组的脑区激活差异。单声源情况下老年性聋组枕叶的激活显著减弱,主要集中在舌回和楔叶区域(BA17、18 区,t=-4.396,P<0.001,图5a);多声源场景下老年性聋组包括舌回、楔叶、颞叶颞上回和颞中回(BA39 区)以及顶下小叶(BA40 区)的激活出现显著减弱(t=-5.569,P<0.001,图5b)。
图5 基于sLORETA 的大脑区域激活分析Fig.5 activation of brain regions as revealed by sLORETA analysis
a)单声源情况下老年性聋组舌回和楔叶区域(BA17、18 区)激活显著减弱(t=-4.396,P<0.001);b)老年性聋组在多声源情况下包括舌回、楔叶、颞叶颞上回和颞中回(BA39 区)以及顶下小叶(BA40区)的激活显著减弱(t=-5.569,P<0.001)。
在老年性聋组内,年龄与CNV 峰值振幅呈负相关(r=-0.460,P=0.021,图6a),与P1 潜伏期呈正相关(r=0.419,P=0.037,图6b)。同时MMSE 总分与N1振幅呈负相关(r=-0.643,P=0.002,图7a),与N1潜伏期呈负相关(r=-0.601,P=0.002,图7b)。在14 名老年性聋受试者中获得的TCT 结果与CNV 振幅呈正相关(r=0.601,P=0.023,图8)。
图6 年龄与ERP成分间相关性Fig.6 Correlation between age and ERP components
图7 认知量表与N1相关性Fig.7 Correlation of cognitive scales with N1
图8 CNV振幅与TCT相关性Fig.8 Correlation between CNV amplitude and TCT
本研究对老年性聋患者在“鸡尾酒会”场景下定位及言语识别过程中的事件相关电位进行了分析,并结合认知量表和语速识别阈值测试分析其言语辨别能力下降的中枢处理机制。与年轻人相比,老年性聋患者的注意准备及注意力资源的预期分配能力显著下降,并且这种下降与年龄增长相关,参与了快速语音识别能力下降的过程。
在语音识别任务中,老年性聋组在各个场景下均表现出较年轻组CNV 振幅的下降,说明其在相同难度任务中注意准备能力较差。CNV 可分为早期和晚期。早期的CNV 反映了与感知警告刺激有关的定向过程,而晚期的CNV 则与对随后的命令性刺激作出反应所需的预期和准备过程有关。Zanto等[15]研究表明,老年人利用时间线索引导注意力的能力低于年轻人,更难将注意力分配到预先指定的时间点,同时CNV 的与年龄相关的延迟与运动和知觉过程自上而下控制的下降有关,本研究中在老年性聋组内发现的年龄相关的CNV 振幅下降和P1 潜伏期延长提示基于时间的预期注意过程和听觉注意的灵活调控存在年龄相关的缺陷。Wostmann 等[16]的研究没有发现CNV 振幅与年龄相关的差异,表明在健康老龄化过程中保留了准备性注意力分配的基本神经机制。然而,本研究在分散注意力多声源情况下观察到了年龄相关的CNV 降低,在单声源情况中没有这种相关性。这可能说明老年性聋的长期听觉输入减少和聆听负荷增加已经影响到了多声源情况下预备性注意力分配的能力,但在单声源情况下这种能力仍然得以保持,这也符合老年性聋患者日常生活中嘈杂环境交流困难的特点。我们在老年性聋患者中发现了更好的快速语音识别能力与更高的CNV 振幅相关,提示注意力分配和准备能力与言语辨别能力存在一定关系,选择性注意能力的下降参与了老年性聋言语辨别能力障碍的中枢过程。
同时,老年性聋患者的N1 振幅相对于年轻人更高。N1 是传入听觉刺激早期自动处理的相关成分,它少部分依赖于早期注意过程[17]。同时老年性聋组内MMSE 总分与N1 振幅及潜伏期存在相关,提示较好的早期注意与总体认知水平的保持有关。有报道指出,年龄较大的参与者中N1 振幅的提高通常与下降补偿假说一致,提示老年人在任务执行期间表现出额外的大脑活动以抵消与年龄相关的神经认知缺陷。与年轻组相比老年性聋组N1潜伏期的延长与早期听觉注意的延迟有关,James 等[18]将听觉神经处理速度定义为Click 声诱发的听觉诱发电位的P1 和N1 潜伏期,结果表明时间扭曲语音的处理受到较低水平的听觉神经处理和较高水平的知觉运动和执行过程的影响。而老年性聋组中出现的与年龄相关的P1 延迟也提示了老年性聋人群中可能存在的听觉处理能力损伤机制。
脑激活区溯源表明安静情况下老年性聋患者注意准备能力的下降主要与楔叶和舌回的激活减少有关,楔叶参与认知过程,而舌回的异常被认为与选择性注意和工作记忆异常有关。有fMRI 研究指出,听觉任务中老年性聋患者表现出涉及舌回的连接减弱[19]。然而多声源情况下,老年性聋患者的脑区激活减弱进一步扩大到了颞上回和颞中回,提示其听觉皮层功能的减退,也表明在复杂环境言语理解过程中对于认知和听觉信息处理的共同依赖。
总的来说,“鸡尾酒会”场景事件相关电位研究结果发现了听觉任务下老年性聋人群面临的中枢处理困难。其注意资源的预期分配能力较年轻人有显著下降,且随着年龄的增加,听觉注意准备能力下降,同时这种预期准备能力也与快速语音识别能力呈正相关,提示年龄相关的注意分配能力的下降可能参与了言语辨别能力下降的过程,该研究结果为老年性聋康复提供了思路和研究基础。
60 岁以上老年人听力损失患病率超过65%[2],且受到文化程度影响[20]。本次研究中未能募集到足够样本量的听力正常老年人进行比较分析,但在与年轻人比较的基础上,结合既往研究结果在老年性聋组内进行了研究。未来研究中我们将进一步扩大样本量,以明确听力损失和老化对于老年人中枢声处理的影响。