邬晓力 徐新林 郭永清 庄佩耘 李琳 张宇 蒋家琪
1 厦门大学附属中山医院耳鼻咽喉-头颈外科(厦门 361004);2 厦门大学海洋与地球学院;3 复旦大学附属眼耳鼻喉医院
离体狗喉作为模拟人体喉的动物模型,常用于分析喉功能评估指标评估嗓音疾病的敏感性和特异性[1~3],研究声带振动发声的原理,分析发声障碍的病因、发病机制[4~7],模拟嗓音疾病的病变模型,探索疾病的治疗方式等[8,9],其对嗓音医学的发展具有重要意义。研究发现声带振动存在一定的规律性,离体狗喉在动力驱动因素变化及单侧声带外展或延长不对称等情况下声带振动存在分叉现象[10],分叉现象是非线性动力系统中的一种表现,当其外在因素变化至一定程度时,其结果会发生质的变化[11]。Zhang等[1]研究显示动力驱动因素变化到一定值时,声带振动出现分叉,因此,不同的声门下压(supglottal pressure,SGP)驱动声带振动时产生的声音质量可能会有一定差异。
评估声音质量的方法主要包括传统的线性方法和非线性方法。目前,临床应用较多的线性方法为基于提取基频的扰动方法,由此发展起来的基本频率F0(fundamental frequency)、频率微扰(jitter)和振幅微扰(shimmer)已经成为嗓音分析的经典指标。然而Titze[12]从非线性动力学的角度,将声音信号定性地分成三类:第1类信号是周期或者似周期,含有强烈的基本频率;第2类信号含有强烈的周期调制或次谐波;第3类信号是非周期的混沌信号和噪声。扰动方法(jitter,shimmer)只适用于第1类信号,不适用于第3类信号[12]。非线性动力学方法对状态扰动高度敏感,能够定量描述嗓音信号的复杂程度,适用于分析上述三类声信号。非线性动力学指标主要包括维数、熵及李亚普诺夫指数,其中维数是用来描述物体的空间几何形状,又分为1维、2维等整数维及1.5维、3.2维等分数维,关联维是分数维中的一种,常被用来分析生物医学信号[13]。
Zhang等[1]研究定义了离体狗喉声带振动出现分叉时的SGP为发声不稳定压力(phonation instability pressure,PIP),定义PIP和发声起始阈压(phonation threshold pressure,PTP)的差值为发声压力范围(phonation pressure range,PPR),本研究根据PTP的均数为0.618kPa,PIP的均数为3.341 kPa[2],设计SGP分别在PPR内、外的压力,控制SGP分别为2kPa和4kPa,驱动离体狗喉声带振动发声,采用非线性动力学方法和扰动方法分别分析收集的声信号,验证离体狗喉的SGP在PPR范围内和PPR范围外发声信号规则性的差异,比较非线性动力学方法和扰动方法分析声信号的应用价值,探讨SGP变化和离体狗喉声音质量变化之间的关系。
1.1 离体狗喉制备 6只中华田园犬的狗喉均来自当地屠宰场,双侧声带形态对称,位置对称,剔除有声带疾病和损伤的狗喉。将取下的狗喉放入装有生理盐水的袋子,并放入-20℃冰箱快速冻存,3~6个月内使用。实验前将冻存的狗喉放入生理盐水缓慢解冻[14],制作离体狗喉[15]:切除甲状软骨前喉外肌及连接组织,切除喉内室带及声门上软组织,保持声带在整个视野和杓状软骨声带突的肌肉完整。6只狗喉声带平均长度为1.385±0.09cm,所有实验均在离体狗喉制作后24小时内完成。
1.2 实验方法
1.2.1 离体狗喉的发声及声样采集 把制作好的离体狗喉于声带处于轻度闭合位时固定于实验平台上(图1、2),在声带上外15cm处放置麦克风(型号ECM-678,日本Sony),由放置在实验平台外的空气压缩机(型号为2530,厦门太星机电有限公司)产生具一定压力的气流,气流经雾化加湿器(简易喷雾器,型号022G877S,德国百瑞有限公司,改制而成)加温加湿(温度37℃左右,湿度90%以上),经人工肺(自制的半径8cm、高16cm的圆柱体)驱动声带振动,在人工肺下面的压力记[型号为YE-100B(定制),量程为0~5kPa,上海环弘自动化仪表科技有限公司]记录气流的压力为2kPa和4kPa时,在无噪声及干扰的环境里收集声信号。Adobe Audition 5.0音频软件采集声信号,采样频率44.1 kHz。在SGP为2kPa和4kPa时,每个狗喉分别发声5次(6只狗共收集60次声音样本),每次3~5秒,每次间隔1分钟。
图1 离体狗喉发声实验平台示意图(Jiang JJ,2003)
图2 狗喉固定装置
1.2.2 离体狗喉的声样声学分析
1.2.2.1 扰动方法分析 从声音样本中提取平稳段(3.0秒)(图3),运用 Kay PENTAX-Multi-Speech软件中的multi dimensional voice program(MDVP)Model5105系统分析,获得声学指标:F0、jitter、shimmer和噪谐比(NHR)值[15]。
图3 离体狗喉声样功率谱图
1.2.2.2 非线性动力学方法分析 提取平稳段的声音样本,采用chao软件分析。chao软件已被多次应用于分析嗓音信号[3,16],它是基于Parkard等[17]提出的时间延长技术方法对原始信号形成重构相空间,对于任何维数的动力系统,都可以表示:
用时滞变量和它的延迟时间τ变量x(t+τ)代替x’(t),得到延迟坐标矢量:
τ是延迟时间,根据Fraser等[18]提出的交互信息程序评估最优延迟时间τ,即交互信息量第一次降到最低并开始上升时的延迟时间(图4),m是嵌入维数,时间延迟向量决定了相空间重构的图形,相空间重构的点均选择10 000点(图5),Takens(1981)等[19]从数学上证明了在m>2D+1(D为系统的维数)时,即对于D2时,当m>5时重构相空间与原始相空间是等同的。由于关联维D2比较简单,且在大量数字中的快收敛率和描述不规则行为的有效性,已被广泛应用(Grassberger and Procaccia,GP法[20])。噪声的关联维D2随着嵌入维数m的增加不会出现收敛,而混沌系统的关联维D2会达到限值,收敛处即为D2值的大小(图6),如广泛知道分形维一样,关联维D2的计算如下(Pawelzik and Schuster,1987):当q=2时,Dq将减少成为D2。∮(x)满足:如果x>0,∮(x)=1,而如果 X≤0,∮(x)=0。当 m 非常大时,Dq将在缩放处出现收敛。
图4 交互信息与延迟时间图交互信息量第一次降到最低并开始上升时的延迟时间为最优延迟时间
1.3 统计学方法 采用SPSS17.0软件,计算离体狗喉发声信号的jitter、shimmer和关联维D2值的均数和标准差;方差齐的数据选择配对t检验,方差不齐的数据选择Mann-Whitney U非参数检验;不能经扰动方法分析的声信号样本数比较采用卡方检验。
图5 相空间重构图
图6 关联维D2收敛图
SGP为4kPa时驱动声带振动的发声信号的相空间重构较SGP为2kPa时更为复杂(图5),关联维D2在更大处出现收敛(图6);在SGP为2kPa(30例)和4kPa(30例)时,关联维D2值分别为1.57±0.28和1.97±0.33,差异有统计学意义(t=4.88,P<0.05);在SGP分别为2kPa和4kPa时,jitter、shimmer、F0和NHR的差异有统计学意义(P<0.05)(表1);共有21次声信号不能提取稳定频率,不能经扰动方法分析,其中SGP为4kPa和2 kPa时分别为16次和5次,在SGP为4kPa和2 kPa时不能分析声信号次数的差异有统计学意义(χ2=8.864,P=0.006<0.05)。
表1 SGP为2kPa和4kPa时F0、jitter、shimmer及NHR比较
狗喉声带与人类声带组织特性较接近,两者几何形态和声带解剖相拟,声带振动特性相似,因此,狗喉常用于模拟人喉发声实验[21,22]。另外,Chan等[14]研究显示冻存狗喉1天和1个月甚至更长时间,其声带组织的粘弹性并没有发生大的改变。离体狗喉发声实验可以人为控制发声起始条件,控制驱动因素及外在环境,另外,一些发声条件在人体很难进行模拟测量,如极高的声门下压、发声时声门闭合和声带拉伸的控制等,因此,离体狗喉发声实验在研究声带振动发声的机制及指导喉功能分析指标在嗓音临床中的应用具有重要意义[1~9]。
声带振动发声过程存在复杂的非线性现象,主要表现在声带组织应力和应变的非线性关系、声带振动的非线性关系及声门气压和气流的非线性关系。声带组织具有粘弹性,其形变并不完全满足弹性体的线性胡克定律,在大的组织形变下,应力和应变明显地表现为非线性时变关系,拉长组织产生的劲度不是固定不变的,而是随着时间而逐渐松驰,这样的粘弹特性也表现在两侧声带的碰撞中[23]。声门内的气压和气流满足非线性纳维-斯托克司(Navier-Stokes)方程,在声门下压的激励下,空气以高速冲出,于声门处产生不稳定声门流或湍流,声带黏膜形成波动[24]。SGP越大,气流经过声门后形成的湍流越强,声带黏膜波会产生紊乱。由于声带组织存在粘弹性,在一定程度上可抵消气流湍流的影响,不能抵消时的SGP即为PIP,声带组织的应力超过一定值时,黏膜波产生紊乱,导致声学信号出现分叉[1,2]。
非线性动力学方法可以定量分析不规则的声学信号,评估信号的复杂程度[15],主要描述信号的不规则和复杂程度,适用于分析复杂的嗓音信号,符合病变声带振动产生异常嗓音信号的病理生理过程。非线性参数关联维D2常用于分析嗓音声学信号,按照GP法[20]计算,度量相空间中轨迹的几何维数,描述轨迹中两点的关联性,关联维数值的大小表示相空间中轨迹的复杂或不规则程度。从文中结果看,在SGP为4kPa时相空间重构较SGP为2kPa时更为复杂,其关联维D2值大于SGP为2kPa时,表明声学信号在SGP为4kPa时较不规则和复杂,可能是较大的SGP引起声门区的湍流较大,黏膜波出现紊乱,导致声学信号不规则。
超过PPR的SGP驱动声带振动发音,声学信号会出现分叉[1],根据 Titze[12]对嗓音信号的分类,属于第2或3类信号,不规则的声学信号不适合扰动方法分析,而非线性动力学方法分析不规则的声学信号较扰动方法具一定优越性[3],适合分析周期、拟周期和混沌的信号。扰动方法分析离体狗喉发声的声样时有21次不能提取稳定频率,不适用于分析,而采用非线性动力学方法则均能分析,表明非线性方法分析声学信号上较扰动方法更具敏感性。
从本研究结果看,SGP为2kPa时离体狗喉声信号有5次不能用扰动方法进行分析,可能是由于背景噪声的影响,虽然实验在无干扰的环境里进行,难免会受到气流和湿化产生的声音影响,但在SGP为4kPa时离体狗喉声信号不能被扰动方法分析的次数(16次)远大于SGP为2kPa时,提示背景噪声虽然可能有一定影响,但声信号的不规则性与SGP大小有关。
F0是指声带振动的固有频率,当SGP增大时,根据Bernoulli效应,声带振动频率会增加,文中结果显示与SGP为2kPa时相比,SGP为4kPa时F0更大,表明该实验结果的正确性。Jitter代表频率的变化大小,shimmer代表振幅的变化大小,NHR表示声音信号中噪声和谐音的比值,其值越小,表明声音信号中噪声成分越小,谐音成分越大。文中在SGP为4kPa时,jitter、shimmer和NHR均小于SGP为2 kPa时,这与既往研究结果不同[1],可能是实验中声带上喷洒的防止声带表面干燥的生理盐水对声带振动产生的声信号有影响,SGP较高时,声带振动的幅度更高,声带表面附着的水被振动至侧边;SGP较低时,声带振动的幅度较低,声带表面附着的水不足以被振动至侧边而留在声带表面,声带振动时声带上仍有水抖动,其对声带振动产生的声信号有影响,故频率扰动、振幅扰动和NHR在高SGP时受到的干扰少而变小,同时也表明声带振动产生的声音受到其他非条件因素影响,有待于进一步的实验研究。
虽然扰动方法的计算依赖于提取稳定的周期性声音信号而有一定的应用限制,但描述的是声学信号的周期和振幅的差异变化以及由此产生的包括声强、噪声谱和共振峰等20多种指标,描述了声学信号不同方面的物理特性,其评估的临床价值是非线性动力学方法不能取代的,具有一定的临床应用价值,但对于不规则性或混沌的声学信号,非线性动力学方法分析更可靠,可补充和完善扰动方法对嗓音进行分析。
1 Zhang Y,Reynders WJ,Jiang JJ,et al.Determination of phonation instability pressure and phonation pressure range in excised larynges[J].Journal of Speech Language and Hearing Research,2007,50:611.
2 Hoffman MR,Rieves AL,Budde AJ,et al.Phonation instability flow in excised canine larynges[J].The Journal of Voice,2012,26:280.
3 Devine EE,Bulleit EE,Hoffman MR,et al.Aerodynamic and nonlinear dynamic acoustic analysis of tension asymmetry in excised canine larynges[J].Journal of Speech,Language and Hearing Research,2012,55:1 850.
4 Regner MF,Tao C,Ying D,et al.The effect of vocal fold adduction on the acoustic quality of phonation:ex vivo investigations[J].Journal of Voice,2012,26:698.
5 Alipour F,Finnegan EM,Scherer RC.Aerodynamic and acoustic effects of abrupt frequency changes in excised larynges[J].Journal of Speech,Language and Hearing Research,2009,52:465.
6 Alipour F,Jaiswal S,Finnegan E.Aerodynamic and acoustic effects of false vocal folds and epiglottis in excised larynx models[J].The Annals of Otology Rhinology and Laryngology,2007,116:135.
7 Alipour F,Scherer RC.On pressure-frequency relations in the excised larynx[J].The Journal of the Acoustical Society of America,2007,122:2 296.
8 Hoffman MR,Witt RE,Chapin WJ,et al.Multiparameter comparison of injection laryngoplasty,medialization laryngoplasty,and arytenoid adduction in an excised larynx model[J].The Laryngscope,2010,120:769.
9 Hoffman MR,Surender K,Chapin WJ,et al.Optimal arytenoid adduction based on quantitative real-time voice analysis[J].The Laryngoscope,2011,121:339.
10 Berry DA,Herzel H,Titze IR,et al.Bifurcations in excised larynx experiments[J].Journal of Voice,1996,10:129.
11 Vestroni F.Nonlinear dynamics and bifurcations of an axially moving beam[J].Journal of Vibration and Acuoustics,2000,122:21.
12 Titze IR.Workshop on acoustic voice analysis:Summary statement[M].Lowa City:National Center for Voice and Speech,1995.1~36.
13 Poon CS,Merrill CK.Decrease of cardiac chaos in congestive heart failure[J].Nature,1997,389:492.
14 Chan RW,Titze IR.Effect of postmortem changes and freezing on the viscoelastic properties of vocal fold tissues[J].Annals of Biomedical Engineering,2003,31:482.
15 Jiang JJ,Zhuang PY,Ford CN.Nonlinear dynamics of phonations in excised larynx experiments[J].Journal of the A-coustical Society of America,2003,114:2 198.
16 Titze IR,Liang H.Comparison of F0extraction methods for high-precision voice perturbation measurements[J].Journal of Speech,Language and Hearing Research,1993,36:1 120.
17 Packard NH,Crutchfield JP,Farmer JD,et al.Geometry from a time series[J].Physical Review Letters,1980,45:712.
18 Fraser AM,Swinney HL.Independent coordinates for strange attractors from mutual information[J].Physical Review,1986,33(A):1 134.
19 Takens F.Detecting strange attractors in turbulence[J].Springer Lecture Notes Math,1980,898:336.
20 Grassberger P,Procaccia J.Measuring the strangeness of strange attractors[J].Physica D:Nonlinear Phenomena,1983,9:189.
21 Berke GS,Moore DM,Hantke DR.Laryngeal modeling:theoretical,in vitro,in vivo[J].The Laryngoscope,1987,97:871.
22 Garrett CG,Coleman JR,Hanson DG.Comparative histology and vibration of the vocal folds:implications for experimental studies in microlaryngeal surgery[J].The Laryngoscope,2000,110:814.
23 Tao C,Jiang JJ,Zhang Y.Simulation of vocal-fold impact pressures with a self-oscillation finite-element model[J].The Journal of the Acoustical Society of America,2006,119:3 987.
24 Marcelo OR,Jose CP.Aerodynamic study of three-dimensional larynx models using finite element methods[J].Journal of Sound and Vibration,2008,311:39.