语音频谱分析在单纯功能性语音障碍中的应用效果

2023-02-01 10:26冯晓伟李向军窦晨雷张晓冯莹张晓燕

中国听力语言康复科学杂志 2023年1期

冯晓伟李向军窦晨雷张晓冯莹张晓燕

语音频谱是反映语音信号能量与频率分布关系的曲线[1]。语音信号的频谱、功率谱、倒频谱等是语音频谱分析的主要方面。每种频谱具有丰富的内容和特性且相互关联，被应用于语音信号处理的各个方面[2]。功能性语音障碍是好发于青少年儿童的一种语音障碍疾病，患者构音器官无异常，但构音、语言发育存在不同程度的障碍[3]。可分为痉挛型、迟缓型、失调型、运动过强型、运动过弱型、混合型6类。关于功能性语音障碍的发病原因仍需要探索，目前已知的发病原因有难产导致婴儿缺氧或脑损伤使大脑语言中枢受损；脑炎、高热惊厥、病毒感染等导致中枢神经系统疾病；车祸、自然灾害等心理刺激而构音异常。功能性语音障碍易伴发语言发育迟缓。大多数功能性语音障碍通过语音训练可极大改善甚至全愈[4]。本研究应用计算机软件对单纯性功能性语音障碍患者（即不伴有语言发育迟缓的患者）进行语音频谱分析使语音训练，记录功能性语音障碍的声学特点和语音治疗成效，评价语音频谱分析在功能性语音障碍诊断和治疗中的价值。

1 资料与方法

1.1 临床资料

收集2018年12月～2019年12月本院语音室就诊的功能性语音障碍患者60例作为实验组，同时募集无语音障碍的健康志愿者60例作为对照组。实验组纳入标准：发音器官和构音器官正常；符合功能性语音障碍诊断标准；智力正常；年龄≥6岁。对照组纳入标准：发音器官和构音器官正常；无功能性语音障碍；智力正常；年龄≥6岁。排除标准：伴语言发育迟缓；孤独症及注意缺陷多动症；听力异常；精神异常。实验组男32例，女28例，平均年龄6.93±3.51岁，对照组男29例，女31例，平均年龄7.04±3.76岁，两组一般资料无显著差异（P＞0.05），具有可比性。

1.2 方法

1.2.1 辅音语音样本采样及分析语音室内（20≤dB），受试者由医生领读辅音样本/pa、ka、si、xi、zi、qi/，受试者双唇与麦克风保持5 cm，打开Cooledit2.1软件，采样频率44.100 kHz，16 bit。采样结束后启动Speech Analyzer 1.5，频率设为22.050 kHz，以500 Hz带宽对所有受试者的声样开展语图分析[5]。

1.2.2 元音语音样本采样及分析语音室内受试者自然坐位，唇距麦克风5 cm，发元音/a:/，持续3～5 s，计算机提取平稳段声音信号（≥0.5 s）[6]。采用Dr Speech science for windows软件对语音样本进行分析。

1.2.3 语音训练方法实验组患者在语音评估后，由专科医生向患者解释病情，帮助其认识嗓音问题，采取一对一方式进行语音训练，每周1次。具体训练方式如下：①辅音弱化、缺失：患者进行3～4周强化吹气和鼓气训练。②喉塞代偿纠正：前期口腔鼓气训练，患者按出气音到不出气音从前至后的构音部位顺序轻轻吹气，患者利用唇、舌、牙龈以及上颚控制气流。③送气代偿矫治：在患者口前放置一张纸片，利用发声时纸片的动态引导患者正确的控制口腔气流。④舌后缩发音错误，使用咬舌发音的方式，纠正舌前部向后上移位的习惯[7]；⑤音节因素训练：按/a/-/m/-/a/的顺序发轻声元音，熟练后替换其他元音进行练习；容易发音的辅音如/f、h/和不同的元音组合进行练习；建立正确的爆破音发音方式，如闭唇、鼓气用手指突然开启下唇，可发出爆破音/p/。训练后采用计算机检测分析，与正常声学信息对比，并将患者本人和正常的发声视觉图像、听觉信号反馈给患者，不断调节错误发声。

1.2.4 疗效评价方法语音清晰度主观评价：语音室内，按王国民编“语音清晰度字表”[8]主试领读，患者跟读，并进行录音[9]。录音后由3位专业语音病理学医生对录音文件进行语音清晰度评分，三者均值为语音清晰度的最终得分。语音清晰度客观评价：“/pai/ /kan/ /si/ /te/”为语音样本，Speech analyzer分析声样语图，统计患者治疗前后声学指标变化[10]。

1.3 统计学处理

采用SPSS 18.0统计学软件进行数据分析，计数资料用率表示，采用χ2检验，计量资料用±s表示，采用t检验。P＜0.05提示有统计学意义。

2 结果

2.1 治疗前实验组和对照组辅音声学特点

实验组患者语图中/pa、ka/音的冲直条、空白间隙出现，但塞擦音/zi、ji/的冲直条、擦音乱纹不明显，见图1。实验组塞音和擦音声学指标与对照组未见明显差异，但在塞擦音/zi、ji/存在显著差异（P＜0.05），见表1。

图1 实验组和对照组窄带语音图中冲直条、乱纹和空白间隙比较

表1 两组声学指标出现率比较[n（%）]

2.2 治疗前实验组和对照组辅音声学特点

实验组振幅微扰（shimmer）和标准噪声能量（NNE）值显著升高（P＜0.05），基频微扰（jitter）值高于对照组，但差异不显著（P＞0.05），见表2。

表2 两组语音声学参数值 ( ±s，%）

*P＜0.05

组别例数 jitter shimmer NNE实验组 60 0.23±0.12 3.62±0.73 -8.92±-3.53对照组 60 0.20±0.09 2.38±0.64 -17.61±-3.85 χ2 1.549 9.894 12.887 P 0.124 0.000* 0.000*

2.3 实验组语音治疗客观评价

语音治疗后，Speech Analyzer 1.5软件分析显示/pai、si、te/冲直条、乱纹出现率明显增加（P＜0.05），见表3。

表3 实验组治疗前后辅音声学指标出现率比较[n（%）]

2.4 实验组语音治疗主观评价

语音治疗后，主观语音清晰度显著提高（P＜0.05），见表4。

表4 语音治疗前后患者语音清晰度比较 ( ±s，%）

*P＜0.05

组别语音清晰度实验组 66.89±3.72对照组 93.25±4.34 t 35.721 P 0.000*

3 讨论

频谱是频率谱密度的简称，是频率的分布曲线，语音频谱即声音频率分布曲线。语音频谱分析自开发以来，主要用于嗓音的科学研究，具有无创伤的特点，并可对声音进行可视量化处理，被广泛应用于临床[11]。语音频谱分析在腭裂患者术后的治疗中发挥了积极作用[12]。本研究探讨语音频谱分析在功能性语音障碍中的指导作用。功能性语音障碍患者虽然没有发音器官的器质性病变，但由于患者发音方式不正确或精神压力导致语音异常，如不及时矫治，会进一步发展为器质性病变[13]。本研究实验组患者虽发音器官和构音器官实验室检查均正常，但Speech Analyzer软件分析显示，语音图及声学指标均出现明显异常，这是由于语音特性受不正确发声方式影响，喉内外相关肌肉张力改变，喉结不稳、声带挤压、假声带内收、声门关闭，进而影响声音振动频率和幅度[13]。Dr Speech science for windows声学检测结果表明，shimmer和NNE值明显升高。功能性语音障碍的特征为在元音声样中可出现某段正常声样作为区分功能性语音障碍和器质性语音障碍的诊断依据[14]。语音参数可从声学角度提示患者语音异常，功能语音障碍的语图特征为中、高频能量增加，非周期性波形出现，声能连续性中断[15]。

功能性语音障碍诱因复杂多样，临床上没有立竿见影的手术或药物治疗手段，目前主要通过发声训练、心理暗示等多种非手术方法治疗。语音训练属于发声训练的一种，在临床上应用效果得到广泛认可，但传统的发声训练需要系统、长期的练习，许多患者难以坚持。本研究以Speech Analyzer 1.5软件语图分析为基础，进行视听反馈语音训练，使患者明确嗓音问题，在专科医生指导下训练，能更快纠正语音障碍。语音治疗后，实验组患者发辅音时的冲直条和乱纹频率明显增加。主观语音清晰度评价结果与语音频谱分析结果一致，通过针对性的语音纠正治疗，患者语音清晰度明显提升。相较于传统语音诊断方式，语音频谱分析能够更快速直观的识别功能性语音障碍患者存在的发声问题，及时矫正患者的发声方式[16]。语音功能是大脑皮质和皮质下两个中枢控制，功能性语音障碍是皮层下中枢的一种错误的发音反射[17]。本实验功能性语音障碍患者通过语音频谱分析，进行准确的语音矫治，取得了良好效果，同时缓解了门诊压力，加快患者康复速度，使患者尽快回归正常生活。

综上，语音频谱分析具有快速、客观、直观、准确性高等特征，可作为功能性语音障碍临床诊治的重要手段，指导功能性语音障碍患者康复治疗手段的选择，提高功能性语音障碍的诊治效率。