但果 综述 陈作鹏 审校
随着医疗电子技术飞速发展,喉内高速摄像机、喉镜(间接喉镜、电子喉镜、纤维喉镜)、电声门图仪、计算机嗓音测试仪等在临床喉科检测中得到了广泛应用。电声门图检测作为一种非侵入式、无创检测技术,弥补了喉镜的不足,尽最大可能保留了原始发声环境。目前关于电声门图仪应用于嗓音疾病检测的报道屡见不鲜,但是对电声门图仪的原理研究却相对薄弱。本文就电声门图的定义及检测方法、技术原理、指标定量分析、应用进行综述。
传统的电声门图检测是在测试者的颈部甲状软骨两侧对称放置两片电极,发元音/a/或/æ/,持续3~5s,采集测试者声带振动的信息,经计算机分析处理后得到嗓音声学指标。现代的电声门图仪在传统的电极采集数据基础上增加麦克风通道,融合计算机嗓音测试仪的特点。检测方法:选择元音/a/或/æ/,环境噪声控制在45dB SPL 以下;测试时,麦克风距受试者口腔10~15cm,电极放置在甲状软骨处,受试者先经过短暂的发声训练,直到能平稳发出元音为止;然后平稳地用胸声区发稳态元音3~5 s,采集的信号经前端调理电路后送至计算机,利用分析软件处理,得到嗓音各指标值。
电声门图信号的采集:将两片电极对称放置在甲状软骨处,在电极上施加一个固定频率的恒定电流(或电压),测量受声带振动调制的阻抗(或导纳)。得到的阻抗信号经过一个高通滤波器(或小波降噪处理)、解调器、带通放大滤波器,送至计算机处理。对于施加电流频率选择,万明习[1]研究指出在1~4 MHz可以有效去除微音器效应、高通滤波器滤除发声时甲状软骨附近其他软骨、肌肉组织运动产生的干扰噪声。值得注意的是高通滤波器截止频率会歪曲电声门图形状,影响后面结果分析,Baken[2]指出不同电声门图仪厂家设置的高通滤波器截止频率各有不同,这会引起电声门图非接触段的形状变化,定量分析结果受到极大影响,因此如何选择电声门图仪的高通滤波器截止频率仍是一个值得研究的课题。高通滤波器并不能完全解决噪声问题,有学者尝试小波变换降噪方法[8]去除干扰噪声,保留原始信号重要信息,效果比高通滤波器好;但需对阈值选取进行详细研究。带通滤波器带宽选择与语音基频有关,国人平均言语基频的分布在104~1 033 Hz,随着年龄增大而减小[3]。
嗓音信号采集:利用麦克风采集语音信号,经过一个带通滤波器放大,送至计算机进行处理。
电声门图和嗓音两个信号采集通道是独立工作的,互不影响。电声门图部分参数目前在学术上仍有争议,例如声门接触面的基础算法、声带关闭点和开启点的测定。对电声门图进行定量分析时,首先要在电声门图波形图上确定声带关闭点和开启点,目前主要有两种算法:尺度算法、微分电声门图算法。Rothenberg[4]提出尺度算法,指出使用信号总幅度20%~50%的尺度为开启点和关闭点;Henrich等[5]运用电声门图的一阶导数(二阶导数)的最大(小)值,提出Decom(分解)算法,导数的最大(小)值代表着声带关闭点和开启点,高速摄影跟电声门图的比较研究指出这些峰值能对应声门的关闭点和开启点。在这两种算法中,尺度算法在抗噪性和稳定性方面有优势,但只靠一个尺度来确定声带关闭点和开启点,在精确度方面不如微分算法。微分算法在精确度方面比较好,但稳定性不好,它易受到噪声成分影响,经常遇到双峰或无峰问题,故大部分电声门图仪厂商采用尺度算法。如何确定正确的尺度标准,成为众多学者研究的热点问题,Herbst[6]通过电声门图和喉记波扫描图像(Videokymography,VKG)的对比研究,提出20%~25%尺度最准确说法。目前电声门图仪厂商都有自己的尺度算法,针对某些跟尺度相关的指标,临床上应用较多的是患者自身治疗或康复训练前后结果对照,不同的产品间结果一致性差别较大。
3.1 电声门图波形(EGG) 声带振动时,声带接触阻抗变化引起调制电流变化,声门张开时阻抗高,闭合时阻抗低,形成电声门图。正常的电声门图波形曲线类似光滑有规律正弦波,曲线由闭合相(接触段)和开放相(不接触段)组成,反映了发声过程中声带接触面积的变化[7](图1)。当声带病变时,电声门图波形会有切迹、陡直、平坦、毛刺及粗糙等现象。不同的病理性声带的波形各有其特点。
图1 电声门图波形分析
3.2 临床常用的电声门图分析指标 临床上常用的分析指标是基频F0、基频微扰(jitter)、振幅微扰(shimmer)、标准化噪声能量(normalized noise energy,NNE)和谐噪比(harmonic-to-noise,HNR),两个通道数据采集方法不同,得到的结果相差不大;从电声门图波形曲线还可以得到接触率(contact quotient,CQ)、接触率微扰(contact quotient perturbation,CQP)、接触幂(contact Index,CI)和接触幂微扰(contact index perturbation,CIP)等临床常用指标。
基频反映了声带振动的频率;噪声能量、谐噪比反映了声门不完全闭合程度;基频微扰、振幅微扰反映了声音的声嘶、粗糙程度。这几个指标临床上应用比较多。NNE算法比较多,频域上有梳状滤波器法[8]、独立分量分析法[9]、听觉流法[10]、噪声基底法等,时域上有加零补齐法、动态时间卷积法和零相传输法。但是嗓音是一个复杂和非完全周期振动的信号,其中谐波与噪声成份很难定量分析,目前已有的方法仍没有得到令人满意的结果。
另外,当前的电声门图仪在嗓音高频段检测存在不足,在频段上注重嗓音低频段(人的嗓音基频处在低频段),不能有效检测早期声带疾病。声带早期病变者嗓音噪声首先在频谱的高端(4 000 Hz)出现。随着病情加重,噪声开始逐步在越来越低的频段出现,即对于早期喉疾病的嗓音信号,一般低频段谐波能保持正常,极少有噪声出现,必须检测频谱的高端噪声是否存在。语音中低频成份占极大的比例,高次谐波一般都会以5~30dB 的速率递减,王修信[11]提出应用小波变换方法提取高频段的噪声,可用于早期声带疾病的检测。
接触率(CQ)是指声带接触段时间与声带振动时间之比,它反映声带的闭合程度。当声带发生占位病变时,声带振动时不完全闭合,如声带带蒂大息肉、广基小息肉,均表现为CQ 增高;声带带蒂小息肉、声带麻痹表现为CQ 下降。该指标也可以通过小波变换多尺度积方法从一段语音信号中获取[12],但比较少用。
接触率微扰(CQP)是指相邻振动周期间接触率的变化量,如果声带的关闭和开放有规律,则接触率微扰值较小。CQP 增高常见于声带息肉、小结、白斑及癌等。
接触幂(CI)是指声带振动时渐闭相与渐开相的对称度,在一定程度上体现了声带开闭运动在垂直面上相位差,该指标对声带麻痹非常敏感。CI增高见于声带麻痹、白斑、癌等。
接触幂微扰(CIP)是指相邻振动周期间接触幂的变化量,若声带在振动周期内渐闭相和渐开相对称性好,则声带振动有规律,CIP较小。CIP增高见于声带息肉、小结、白斑及癌。
4.1 电声门图临床应用
4.1.1 正常人的电声门图 正常人的电声门图呈现有规律的类正弦光滑曲线,曲线由闭合相和开放相组成,其中闭合相由渐闭相(关闭段)和渐开相(分离段)组成。开放、关闭周期呈规律性;声带闭合比开放快(图2)。
图2 正常人电声门图
4.1.2 声带息肉 与息肉大小、基底宽窄有关,声带小息肉患者的电声门图波形为闭合相缩短,呈尖峰状,偶有双峰,开放相稍延长(图3);声带大息肉波形为峰顶变宽且扁平,并出现双峰(图4);广基息肉波形为开放相陡直,波峰平坦(图5);带蒂小息肉CQ、F0值降低;带蒂大息肉CQ 升高,F0 值降低;广基息肉CQ、F0值升高,shimmer值异常;其中声带息肉的波形具有特异性,CQ 值较灵敏[13]。患者术前jitter、shimmer和NNE值异常,术后有明显降低,2周后声音恢复正常[14]。
图3 声带带蒂小息肉患者电声门图
图4 声带带蒂大息肉患者电声门图
图5 声带广基息肉患者电声门图
4.1.3 声带小结 声带小结引起声门闭合不彻底,开放时则因声带黏膜弹性弹起而使接触时间延长,在电声门图上表现为闭合相缩短,开放相延长,且有切迹、毛刺和波峰平坦(图6);jitter、shimmer、NNE值均异常,接触时间(contact phase,CP)升高。jitter、shimmer和嗓音障碍严重程度指数(dysphonia severity index,DSI)指标[15]可用于喉显微手术微创切除声带小结效果评估。
图6 声带小结患者电声门图
4.1.4 声带肿瘤 电声门图波形曲线呈现锯齿状改变,波峰低矮,闭合相及开放相均不对称,出现双峰(图7)。jitter、shimmer、NNE 值均异常,CIP 值增大。中晚期喉癌患者喉环状软骨上部分切除环舌骨吻合术(supracricoid partial laryngectomy-cricohyoidopexy,SCPL-CHP)手术后言语发声重建效果评估,可以长期观察jitter、shimmer和NNE 指标[16]。
图7 声带肿瘤患者电声门图
4.1.5 声带麻痹 因声带为非对称性振动,波形表现为非对称性的移动波,且曲线呈扁平状,开放相明显延长(图8)。CQ 减少,CI、CQP及CIP增大。
图8 声带麻痹患者电声门图
4.1.6 声带白斑 电声门图波形因白斑多少及部位不同而形态各异,大多与声带小息肉波形相似(图9)。jitter、shimmer、NNE 值均异常,CQP、CIP 值增大。
图9 声带白斑患者电声门图
4.1.7 声带局部肥厚 声带肥厚多见于声带的中段,使声带生理特征发生改变,造成与声带振动密切相关的jitter与shimmer升高,同时由于声门关闭不完全,NNE值较高[15]。
4.1.8 男声女调 患者在接受发声训练后,可通过电声门图仪对发声矫治效果进行客观评估。经过发声训练后,F0、CQ 明显下降[16]。
4.1.9 声带囊肿 电声门图波形表现为渐开相有切迹或陡直,渐闭相有切迹。jitter、shimmer 和HNR 异常。手术后EGG 多数回归正常[17]。
4.1.10 功能性发声障碍 肌紧张性发声障碍患者jitter、shimmer数值升高,NNE在正常范围,而声谱图高频区谐波不规则、断裂、消失或不平稳、抖动,噪声成分增多等[18]。
4.1.11 吞咽障碍 正常人在吞咽开始后,喉上提与咽收缩一致,阻抗增大,电声门图有一尖锐直立波。正常电声门图多为2~3相,吞咽障碍时出现直立波潜伏期延长、波形经过时间延长、出现多相波(大于等于5相)。但由于特定肌肉的潜伏期、波幅尚无正常值,一次检查不能做定量分析;而且有主观干扰及运动伪迹存在,所以尚不能广泛应用于临床。
4.1.12 帕金森言语障碍 帕金森言语障碍患者的jitter升高,HNR、F0降低,且不受疾病时间和强度影响,术后这些指标有所改善,可用于临床脑卒中患者言语障碍的诊治和康复效果评价。
4.2 电声门图在嗓音学研究中的潜在应用 随着艺术类人才培养需要,可以引入电声门图仪对艺术嗓音信号进行分析,得到艺术嗓音评估指标,通过人工神经网络方法得出一个客观的平均分数,与主观听感知评估结果具有较好一致性。艺术嗓音评价指标与电声门图评估指标不一致,王修信、王建群等提出了一系列的评估指标[19,20],其中一个很重要的指标是共振峰频率。但究竟哪些指标更适合对艺术嗓音进行评估,有待更多学者进一步研究。
电声门图仪是一种具有无创、客观、可量化指标等特点的喉科检测手段,由于它采用测量声门阻抗变化的手段检测,也具有一定的局限性。首先是缺乏直观性,不能提供可视化图像,无法了解病变的部位、大小、形态,需要借助其他设备来确诊,比较适合一些无法使用侵入式检查手段的患者,如三岁以下儿童。针对一些学术上尚有争议的指标,需要借助更多其它的手段来辅助论证,力求更加科学。对于电声门图仪电极作用于声带振动过程中许多理论(喉内的电场分布、声带振动时的电场扰动、声门图灵敏度分布、微音效应、声带振动模型等)目前研究还不够深入,需要更多的学者关注。
嗓音的形成是一种复杂的多维现象,单凭电声门图数据无法全面评价发声功能正常或异常,临床上常与喉镜检查配合使用。因此电声门图的可视化研究日益迫切,与纤维喉镜配合,利用数字图像处理技术,通过图像快速定位病灶位置,并进一步探讨电声门图特异性,将对喉科的研究和喉疾病诊断起重要作用。同时与临床医生配合,在电声门图检测技术的基础上引入治疗手段,将形成检测、治疗于一体的体系。另外,艺术嗓音评价也是今后电声门图应用发展一个重要领域,可为艺术嗓音训练效果评价、人才选拔提供一种客观的评价手段。
1 万明习,燕金元,程敬之.声门图信号特征及其数字处理[J].中国医疗器械杂志,1990(01):1.
2 Baken RJ,Orlikoff RF.Clinical measurement of speech and voice[M].2nd Revised edition edition,Thomsoni Singular Publishing Group Inc,2002.216~227.
3 王蓓,杨玉芳,吕士楠.汉语韵律层级结构边界的声学分析[J].声学学报,2004,29:29.
4 Rothenberg MJ,Mashie JJ.Monitoring vocal fold abduction through vocal fold contact area[J].Journal of Speech and Hearing Research,1988,31:338.
5 Henrich N,d’Alessandro C,Doval B,et al.On the use of the derivative of electroglottographic signal for characterization of nonpathological[J].Journal of the Acoustical Society of America,2004,115:1 321.
6 Herbst C,Sten T.A comparison of different methods to measure the EGG contact quotient[J],Logopedics Phoniatrics Vocology,2006,31:126.
7 Krausert CR,Olszewski AE,Taylor LN,et al.Mucosal wave measurement and visualization techniques[J].Journal of Voice,2011,25:395.
8 Kasuya H,Ogawa S,Mashima K,et al.Normalized noise energy as an acoustic measure to evaluate pathologic voice[J].The Journal of the Acoustical Society,1986,80:1 329.
9 邹原,万明习,牛海军,等.嗓音源谐波噪声独立分量分离估计方法[J].声学学报,2001,26:521.
10 王迪,付强,杨琳,等.基于人耳听觉模型的自动嗓音评估方法[J].物理学报,2008,57.
11 王修信,胡维平,梁冬冬,等.基于小波变换的相对信噪比在喉疾病检测中的意义[J].听力学及言语疾病杂志,2002,10:225.
12 Bouzid A,Ellouze N.Open quotient measurements based on multiscale product of speech signal wavelet transform[M].NY,United Stated:Hindawi Publishing Corporation,2007.5~12.
13 方红雁.电声门图在喉部疾病及嗓音声学研究中的应用[J].听力学及言语疾病杂志,2002,10:60.
14 周红宇,屈季宁.嗓音声学分析和电声门图在声带息肉手术疗效评估中的应用[J].武汉大学学报(医学版),2008,29:660.
15 许倩,陈磊,赵运华,等.声带小结患者显微手术前后嗓音声学分析[J].听力学及言语疾病杂志,2012,20:113.
16 丛林海,何晓光,李玉晓,等.喉环状软骨上部分切除-环舌骨吻合术治疗中晚期喉癌及发声功能重建效果研究[J].听力学及言语疾病杂志,2011,19:26.
17 刘睿清,林建云.声带小结及声带局部肥厚患儿嗓音声学及电声门图分析[J].听力学及言语疾病杂志,2007,15:318.
18 陈佳媚,杜建群,杨宝琦.青春期后持续性假声发声矫治前后的电声门图变化[J].中国中西医结合耳鼻咽喉科杂志,2010,18:226.
19 魏春生,王薇,陈小玲.声带囊肿显微喉镜手术前后的电声门图评估[J].中国临床医学,2004,11:95.
20 徐洁洁,陆美萍,陈曦,等.肌紧张性发声障碍的临床特征及嗓音声学评估[J].听力学及言语疾病杂志,2008,16:462.
21 王修信,徐国钰,梁冬冬,等.艺术嗓音歌声客观评价初探[J].听力学及言语疾病杂志,2007,15:372.
22 王建群,高下,刘晓宙,等.艺术嗓音中不同唱法的元音共振峰研究[J].临床耳鼻咽喉头颈外科杂志,2008,22:679.