张庆苏
吞咽是健康人进行能量以及营养摄入的重要功能,是维持正常机体新陈代谢的基础。吞咽过程是一个多个器官和部位参与、条件反射活动与主动意识控制交错的连续运动。吞咽异常是老年人以及脑血管病后的常见并发症,吞咽障碍是指个体因吞咽动作异常造成的摄食困难或不能正常经口进行食物以及水的摄入[1]。吞咽障碍带来的两个主要后果为营养障碍和吸入性肺炎[2-3]。客观评价吞咽能力是吞咽障碍患者获得良好康复的前提,同时也是避免因潜在吞咽异常带来风险的有效方法。
吞咽音指下咽过程中产生的相关声音,主要是由食团从口咽部向喉咽部递送、会厌软骨的折返运动、喉部提升运动、鼻咽部闭锁运动、食道上括约肌开放以及闭合运动,以及声门的闭合和开放运动组成[4]。食物的咀嚼声,食团形成过程中舌体搅拌动作和颊部肌肉运动所产生的声音不属于吞咽声音。吞咽音反映从食团进入喉咽部到被咽下的过程,而这也正是临床医生进行吞咽能力评价时非常关心的部分。颈部听诊探查吞咽声音的技术有显而易见的好处。就临床吞咽功能评定而言,反复唾液试验和饮水试验无法对吞咽功能进行量化评价,而且不能进行吞咽过程的动态观察;内镜下的吞咽功能检查则是一种侵袭性检查,对主观因素和临床经验要求较高,还存在“盲区”时间,部分患者由于吞咽反射亢进带来不适,且价格也较高;作为“金标准”的电视透视吞咽检查(VFSS)价格较高,患者需要暴露于放射线下,对体位有特殊的要求,且不能进行床旁检查,重症患者不能及时评价。颈部听诊对患者几乎没有特殊的检查配合要求,检查过程简便,在床旁就可进行;而听诊器属于低廉的检查工具,费用很低;检查技术要求不高而且可以多次反复进行,甚至与患者的进食同步进行以观察和检测患者的进食情况,因而具有潜在的应用价值[5]。
临床医学家关注吞咽音的历史可以追溯到上世纪60年代,一些作者报道了利用声学处理方法检查在吞咽过程中产生的各种声音;1965年,Lear等利用此项技术评价了成人在24 h内的吞咽次数;1975年,Hollshwandner等测量了与吞咽动作有关的时间,他们利用接触式麦克风在喉部皮肤表面记录了从最后一次咀嚼到产生第一声吞咽声音的时间[4]。但由于受到声学技术的限制,与吞咽音有关的参数难以进行研究,很多与吞咽关联的声音无法探测,限制了此项技术的发展。
到了上个世纪90年代,Hamlet等采用置于患者以及正常人颈部不同位置的加速计或微型麦克风记录吞咽产生的各种声音时,证实了某些可重复声音的存在。1994年,Takahashi及Gropher对探测吞咽声音的方法学进行了全面的阐述以及研究。Takahashi等认为,作为一项潜在的可以用于评价患者吞咽功能的工具,需要确定3方面的内容:①选择合适的吞咽音声学探测设备;②采用适当方法与颈部探测部位接触;③选择最理想的探测部位。他们对14名健康成人分别行了微型麦克风和加速计探测吞咽音的频率衰减和响应的对比,以及颈部24个探测吞咽声音的位置的比较,结果显示双面纸带的加速计对吞咽声音提供了平坦、宽频域的频率响应并且具有最小的频率衰减特性;另一方面,在颈部气管旁环状软骨下方被证明在探测吞咽音时能够提供最大的声音强度并有理想的信噪比,最适合于探测吞咽音;最后,证实了性别在探测方法上没有显著差别[6]。在随后的工作中,Takahashi等在对10名正常人双侧吞咽音的探测研究中证实了探测吞咽音的频率以及时间变量参数没有侧别的差异,但其具有的个体变化特性会导致离散度的增加[7],因此计算吞咽音的特征不能仅从单次录音中得出结论,而应该进行反复测试。
在一项对于听诊器听诊颈部吞咽音的研究中,Hamlet等讨论了临床常用的听诊器的频率响应问题以及对颈部听诊使用的听诊器类型,发现相对于微型麦克风与加速计,听诊器对于低频声音(1000 Hz以下)具有较好的频率响应,在高频时则有明显的频率衰减;钟式和膜式听诊器的听头分别对高频和低频声音提供较好传导,可用于吞咽音同颈部其他声音的区别;听诊器具有较好的声学特征,可以用于进行成人颈部吞咽声音的听诊;但听诊器对吞咽音的放大作用有限。作者推荐了两种常用的听诊器用于颈部听诊:Littman式心脏听诊器和Hewlett-Packard型小型听诊器[8]。
Cichero等对Takahashi的实验进行再回顾和继续研究,重新对声音探测设备以及探测部位进行研究,并且测量了不同设备在自由环境中空气噪声抑制的特征。他们利用微型麦克风对食团吞咽信号采样进行了评价,表明微型麦克风具有优良的信噪比和对周围环境噪声影响具有持续的可接受的低敏感度,说明了微型麦克风在临床吞咽障碍评价应用的价值。此外,对于听诊部位,作者认为在环状软骨中线和环状软骨下方中线更利于听诊,主要原因是解剖标识明确,环状软骨的共鸣特征更有利于放大吞咽声音;对于Takahashi提出的探测位置,他们认为如果位置把握不当,则易受胸锁乳突肌产生的噪声影响[9]。
Cichero等对59名健康个体按性别分组,吞咽两种黏稠液体,每种体积分为5 ml、10 ml和15 ml,对吞咽音进行分析,结果发现无论何种体积和年龄,70%个体吞咽时声音与安静状态下的声音有明显区别,而在体积为15 ml时,该比例可达90%。作者的结果是,在健康的非吞咽障碍个体中,吞咽音大约延续400 ms;吞咽音具有稳定的声音强度,约43dB,平均频率2200 Hz。吞咽音的频率范围与元音[i]在单词“heed”中的频率一致。用文字描述:吞咽声音是一种短时、尖脆的声音,首先的两个吞咽声音听起来像是“咕噜声”,时间几乎相等,连续出现时可能听起来像一个声音。吞咽音时间随年龄增加而增加,随食团体积增加而缩短;当液体变得黏稠时,声音时间变短,音调变低[10]。
Youmans等利用加速计采集了97名年龄20~79岁健康人的吞咽音信号,对吞咽音的声学特征,及其与年龄、性别、食团的关系进行研究,提示吞咽音的平均时间为530 ms,最大强度为60.82 dB,最大频率为2304.46 Hz;从吞咽音开始到最大强度的平均时间为210 ms,在最大声音强度时平均最大频率为586.57 Hz;在不同个体不同食团之间,吞咽音时间和吞咽音最大强度最为稳定,并且与食团的类型相关,与其他声音特征相比,数值的离散度最低;最大声音频率、最大强度声音频率以及最大声音时间则在不同个体、不同食团时表现不稳定,且具有个体化的特征,其中吞咽音时间对年龄变化最为敏感。上述指标在性别差异上都不敏感。具体而言,随着年龄的增长,吞咽音强度逐渐降低,声音时间逐渐延长,最大声音时间逐渐延长,最大强度声音频率逐渐下降;当最大声音强度增加时,最大声音频率以及最大强度声音频率也随之增加;当声音最大频率增加时,最大强度声音频率也随之增加。作者认为,吞咽音时间和最大声音频率是最可靠的指标并具有应用前景[11]。与此相似的是,Cichero等也认为吞咽音时间、频率以及强度是研究与评价吞咽运动的主要指标[4]。
许多作者希望能够把吞咽音和吞咽的生理阶段联系起来,从而使吞咽音所代表的临床意义更加明确。Cichero等参照心脏听诊以及嗓音产生的生理学特点提出了有关吞咽音产生的假说“泵和阀门理论”:口咽部的解剖可以看做是一系列的泵和阀门结构,其中重要的阀门包括唇、舌腭、鼻咽、口咽、上食管以及食管与胃,而泵结构主要包括口腔泵、咽泵、食道泵与呼吸泵。按照这一理论,吞咽音的第1部分是由于喉阀门关闭,口腔泵(舌)的运动使咽壁发生振动;吞咽音的第2部分则是由于环咽肌开放,咽部清洁联合机械活动以及食团在喉咽部产生的扰流活动共同产生;而吞咽声音的第3部分仍有争论,Cichero认为可能是由于吞咽后期咽通道的再开放导致会厌、杓状会厌壁和声带的机械运动产生微小震动,即吞咽时存在呼吸暂停过程,结束后喉部放松,释放出少量气流,类似于“声门放松声音”,这部分声音更接近于呼吸音的特征[11]。
利用内镜检查与颈部听诊进行同步研究,对20名健康成人对半固体食物吞咽进行了吞咽音以及吞咽音发声顺序与吞咽生理过程的联系分析,结果显示,利用内镜检查观察的吞咽运动不能明确与吞咽音的成分相关联;吞咽的时间成分具有较大变异,由于内镜直视下的盲区时间,无法对吞咽各个时期的事件作出分析;研究结果证实吞咽音的前短音与吞咽暂停和会厌伸展运动有关,吞咽音与会厌恢复至静息位和吞咽呼吸暂停时间有关,这两种运动常常同时出现;吞咽音的主要成分常常按特定顺序存在并少有变化,吞咽音的缺失并不是病理性吞咽的明确信号,但异常的反复出现的声音成分可能会预示着吞咽功能的损伤[12]。
利用一种声学-放射诊断装置将吞咽的动态透视图像与吞咽声音进行同步来观察声音的生理来源,通过研究15名健康成人的液体吞咽,作者对吞咽声音成分与生理运动的联系进行了观察:口咽部吞咽时间平均为830 ms,而吞咽音的平均时间为690 ms;吞咽音主要由3个部分组成,第1个声音与喉咽部上抬时肌纤维的收缩以及会厌的活瓣运动有关,第2个声音与食道上括约肌的开放有关,而第3个声音与舌体和咽后壁的分离相关并且发生在喉部回复安静位置之前,因此作者认为所谓的“声门放松音”属于吞咽音的一部分[13]。目前,对于吞咽声音的生理来源仍不能完全确定,需要进一步研究证实。
Stroud等研究了5名言语治疗师对16种吞咽音中的误吸现象进行判断的组内与组间信度,录制吞咽音时通过VFSS进行吞咽误吸的诊断,结果显示,评价者之间信度为仅仅合理(kappa值0.28),而组内信度差异很大(kappa值0.31~0.85,平均0.55),对于误吸诊断的敏感度为86%,特异度为56%,阳性预测值31%,阴性预测值94%,说明评价者虽然对于误吸的评价具有较高的真阳性率,但是他们对于不存在误吸的吞咽进行了过度诊断。作者认为,利用颈部听诊可靠性不够,不能作为一种独立性的诊断工具应用于临床来判断吞咽障碍是否伴有误吸风险[14]。Leslie等利用VFSS进行颈部听诊法的信度与效度研究,结果显示只有少数评价者的判断能被接受;临床医生利用颈部听诊判断吞咽障碍可信度依赖于该项技术的发展以及经验,评价者间信度较差,利用颈部听诊进行吞咽障碍中误吸或渗透的判断信度也受到局限[15]。Borr等不仅对颈部听诊的信度、效度进行分析,也对影响因素进行了总结,他们发现临床医生对于吞咽音的判断不局限于仅对吞咽音本身特点的分析(如吞咽时间),影响判断准确的因素还包括利用听诊的吞咽次数、启动时间以及吞咽音的质量。作者认为,吞咽音所包含的吞咽活动的信息不仅仅局限在吞咽的时间参数上,病理性吞咽音以及伴随吞咽音出现的其他信号都可用于评价吞咽障碍,因此颈部听诊可以作为一种临床评价吞咽障碍的补充手段而不是惟一的可靠的方法[16]。
高桥浩二等提出利用吞咽音和呼吸音来判断吞咽功能的方法。他们认为,根据吞咽音延长或减弱,以及反复多次的吞咽音可推测舌对食团的递送障碍,咽部收缩力的减弱,喉上提障碍以及食道入口失驰缓等异常,当下咽时出现水泡音或清嗓声时则要考虑是否有误吸存在,而有喉渗透或误吸时当结合呼吸音听诊,会发现有呼吸-咽下模式(呼吸暂停-下咽-恢复呼吸)协调异常;吞咽音后出现的特殊呼吸音(呼气声)如为湿音、咳嗽声或液体的震动声则要考虑可能有误吸、喉渗透或喉部有液体残留;误吸时可能会出现下咽时伴随有咳嗽声或喘鸣样呼吸音。作者利用这一标准选择吞咽音的持续时间和呼吸音的平均声音强度两个指标对159个吞咽声和194个呼吸音进行了判断分析,并与VFSS进行一致性分析,结果显示,利用吞咽音和呼吸音判断吞咽障碍的一致性为77.3%,其中吞咽音的持续时间对吞咽障碍判断的敏感度为74.7%,特异度为82.2%,呼气音声强的敏感度为78.2%,特异度为75.7%[17]。在后续的研究中,久保高明等利用吞咽音的声音强度,下咽的持续时间以及下咽次数3个变量对12例患者和5名健康成人的5 ml饮水吞咽功能进行了分析,结果显示,对于吞咽异常的判断准确率为86%,正常吞咽的判断准确率为72%,在全部人群中吞咽异常判断的准确率为75%;3个变量中,以下咽持续时间最为敏感,其次为下咽次数,最后为声音强度[18]。另一项研究对5名健康成人和3例脑血管病致吞咽障碍患者的吞咽音和呼吸音进行小波转换分析(wavelet analysis),结果显示吞咽时产生的声音为一种全频率分布、短时的咔嗒声(click),而吞咽障碍时产生的水泡声分布在300~600 Hz;与健康人呼吸音相比,湿性呼吸音为350 Hz以上,分散起伏分布的声波[19]。
作为吞咽功能的非侵入性动态检测手段,吞咽声音的颈部听诊具有较大的临床应用前景,它丰富了吞咽障碍的临床快速筛查手段,能在床旁于患者吞咽的同时进行有效监测;对吞咽声音参数的分析使吞咽障碍的检查评价有了新的量化指标,扩大了对吞咽生理机制研究的角度和思路[20]。掌握吞咽音的听诊技术对于语言治疗师以及临床康复医师来说很重要。
[1]Groher ME,Gonzales EE.Dysphagia:Diagnosis and Management[M].2nd ed.Boston:Butterworth-Heinemann,1992:53-84,143-171.
[2]Martino R,Foley N,Bhogal S,et al.Dysphagia after stroke:indence,diagnosis,and pulmonary complications[J].Stroke,2005,36(12):2756-2763.
[3]Perry L,Love CP.Screening for dysphagia and aspiration in acute stroke:a systematic review[J].Dysphagia,2001,16(1):7-18.
[4]Cichero JA,Murdoch BE.Clinical Assessment,Cervical Auscultation and Pulse Oximetry[M].//Cichero JA,Murdoch BE.Dysphagia:Foundation,Theory and Practice.New York:John Wiley&Sons Ltd.,2006:166-181.
[5]Santamato A,Panza F,Solfrizzi V,et al.Acoustic analysis of swallowing sounds:a new technique for assessing dysphagia[J].J Rehabil Med,2009,41(8):639-645.
[6]Takahashi K,Groher ME,Michi K.Methodology for detecting swallowing sounds[J].Dysphagia,1994,9(1):54-62.
[7]Takahashi K,Groher ME,Michi K.Symmetry and reproducibility of swallowing sounds[J].Dysphagia,1994,9(3):168-173.
[8]Hamlet S,Penney DG,Formolo J.Stethoscope acoustics and cervical auscultation of swallowing[J].Dysphagia,1994,9(1):63-68.
[9]Cichero JA,Murdoch BE.Detection of swallowing sound:methodology revisited[J].Dysphagia,2002,17(1):40-49.
[10]Youmans RS,Stierwalt AG.An acoustic profile of normal swallow[J].Dysphagia,2005,20(3):195-209.
[11]Cichero AYJ,Murdoch BE.The physiologic cause of swallow sounds:Answer from heart sounds and vocal tract acoustic[J].Dysphagia,1998,13(1):39-52.
[12]Cichero JA,Murdoch BE.What happens after the swallow?Introducing the glottal release sound[J].J Med Speech Lang Pathol,2003,11(1):31-41.
[13]Leslie P,Drinnan MJ,Zammit-Maempel I,et al.Cervical auscultation synchronized with images from endoscopy swallow evaluation[J].Dysphagia,2007,22(4):290-298.
[14]Stroud AE,Lawrie BW,Wiles CM.Inter-and intra-rater reliability of cervical auscultation to detect aspiration in patients with dysphagia[J].Dysphagia,2002,16(6):640-645.
[15]Leslie P,Drinnan MJ,Finn P,et al.Reliability and validity of cervical auscultation:A controlled comparison using videofluoroscopy[J].Dysphagia,2004,19(4):231-240.
[16]Borr C,Hielscher-Fastabend M,Lücking A.Reliability and validity of cervical auscultation[J].Dysphagia,2007,22(3):225-234.
[17]高橋浩二.嚥下障害診断法としての頸部聼診法[J].昭歯誌,2005,25:167-171.
[18]久保高明,湯ノ口万友,内藤正美,等.嚥下音の判別分析の試み[J].日本摂食嚥下リハ会誌,2004,8(2):182-185.
[19]久保高明,湯ノ口万友,内藤正美,他.嚥下音•呼気音のwavelet解析の試み-頸部聼診法の応用-[J].日本摂食嚥下リハ会誌,2004,8(1):64-68.
[20]Sazonov E,Schuckers S,Lopez-Meyer P,et al.Non-invasive monitoring of chewing and swallowing for objicetive quantification of ingestive behavior[J].Physiol Meas,2008,29(5):525-541.