Reclus Florence(孙乡),杨学智,李海燕,朱庆文,牛 欣
(北京中医药大学基础医学院,北京 100029)
在高级动物中,嗓音是一个很好的生理和心理信号,可以辨别个体差异。人类的研究证明,语音音高与年龄、性别、体积[1]、激素变化、情绪等相关。中医的闻诊研究主要集中在各种疾病或证候所导致的异常语言及声音,而在体质方面着重研究的是《黄帝内经·灵枢》中的阴阳二十五人对应的二十五音[2]。本研究探索了多种语音特征与现代中医9种体质的相关性。
古代音乐学按照“三分损益法”[3]所生成的五音“宫徵商羽角”在中医学中分别与五行“土火金水木”和人体的五脏“脾心肺肾肝”相对应,用于疾病的诊断与治疗。但五音的内涵远远超出我们限制于5个音高的理解,包括了音色与语调的动态情况,以及在心理层次上所产生的或对应的情绪[4]。因此,我们提出了用声学技术对语音进行多种特征的研究思路。
我国目前最常用的现代体质分类法是9种体质[5](即平和质、阴虚质、阳虚质、痰湿质、湿热质、气虚质、瘀血质、气郁质、特禀质)。其中只有气虚体质有明确的语音特征(“语音低弱,短气懒言”),其他体质只有一些能体现在语音上的人格或行为特点。
自然表达虽是“理想”的录音内容,但在实验条件或今后高度自动化的诊断程序中比较难得且并不规范。况且“不自然”的录音内容也能提供丰富的信息。于是,我们的研究分析了多种录音内容所提供的语音参数。不同内容各有利弊,部分内容的优点与缺陷简列入表格1。
表1 录音内容比较
基于上述考虑,我们利用现代声学技术[4]和中医辨证体质分类(9种体质)研究了成人语音特征与体质的相关性,并建立了回归模型。
18岁~38岁的40位女性和10位男性,受试者皆以普通话为母语或常用语,均为健康或亚健康状态的北京中医药大学学生,平均年龄23岁。
躯体或心理病变、听觉障碍、语言障碍、语音障碍患者,鼻子有(或有过)骨折或手术,外感病或其他影响语音疾病,患咽喉疾病或咽喉做过手术者,妊娠妇女,1周吸烟超过1包,受试日有特殊语音或其他疲劳或不适,情绪激动或精神创伤,饮酒过度,服激素类或抗胆碱类药物、服大量热性或燥性中药等。
实验在安静的室内进行(噪音小于40dB),测试人员先把话筒挂在受试者的脖子上让受试者习惯并能尽量忽视设备(话筒在嘴的斜下方,45度角,距离5cm),测试人员距离被测试者1.5m~2m与他聊天,请他取舒适站立体态,待他情绪稳定、呼吸均匀且能够达到自然发声。
数据采纳方法为:测试人员用电容性全方位全谱话筒 Superlux ECM999,连在外接声卡 M-audio 610和笔记本电脑,采取了16bit的精度及44.1kHz抽样频率的数码录音,并用声图分析软件 Praat 4.2.07[6]获得了特征参数。
录音内容:发出最舒服的 a(啊[a])音,连续做3次,隔10min再做1次;用440Hz的固定唱名A=la音高发出a:(啊)音 ;发出1个最舒服有持续最长的a(啊)音,连续做2次取最佳;发普通话四声 a(啊)ā á ǎ à;从 1 数到 10;定音域:从舒适音发到最高音,再从舒适音发到最低音,朗读一小段故事,回答2个问题。
所取参数:通过 Praat软件获得的客观语音参数如下[7]。
表2 本研究所利用的语音声学参数
测试人员通过9种体质量表获得了受试者的中医体质参数。
然后利用SPSS17统计软件分析语音特征和体质特征、体质参数和语音参数的单独相关性、最后用R统计软件进行回归研究。
所用录音方法被所有受试者接受,录音设备、分析软件能够提供64个语音参数。
3.2.1 语音特征 我们为每一类参数都做了描述性统计分析,并研究了男女差异和女性受试者的长幼差异(幼组为18岁~24岁的本科生,长组为25岁 ~38岁的研究生),表3只提供[a]音的基本参数,关于其他变量详情请见2012年本作者的同名博士论文。音基本参数
表3 [a]
3.2.2 体质特征 在本实验的49位受试者中(1位女性受试者的临床信息不符合问卷所得的“平和体质”,所以其数据没有被纳入结果分析),11位的问卷结果属绝对平和体质(平和分数高于60且其他体质偏颇分数低于30),5位属几乎平和体质(平和分数高于60而有1个不超于39分的体质偏颇趋向),共16位平和体质,占总受试者的32%,符合研究年龄段的体质分部。有体质偏颇(平和分数不足60分并有1个超于40分的体质偏颇趋向)的人数与比例列在表格4。
表4 受试者的体质偏颇分布
阴虚体质的比例偏高可能是因为所有受试者都是年轻学生,生活方式容易导致阴虚。超过60分的比例(12.1%)的比较小,说明受试群体总体不处于病态。
很多语音参数都各自与体质参数有关系性,大体符合中医体质理论,在男女、长(25~38岁)幼(18~24岁)有别。在此提供39位女性的语音参数和个体质参数的相关性研究结果:(1)平和参数越高:持续a音的能量付出越小(r(37)=-0.342*,p=0.033),音域越窄(r(37)= -0.358*,p=0.032),朗读速度越快(r(37)=0.370*,p=0.021),朗读音高标准差越小(r(37)=-0.386*,p=0.015);(2)气虚参数越高:第2个持续 a音的音长越长(r(31)=0.381*,p=0.029),朗读音高标准差越大,接近显著性(r(37)=0.315,p=0.051)在幼者显著(r(26)=0.543**,p=0.003),朗读语速越慢(r(37)=-.456**,p=0.004);(3)阳虚参数越高:音域越广(r(37)=0.368*,p=0.027),朗读音高标准差越大(r(37)=0.468**,p=0.003),朗读语速越慢,接近显著性(r(37)= -0.310,p=0.054),在 长 者 显 著(r(9)= - 0.768**,p=0.006);(4)阴虚参数越高,i的第3共振峰越高(r(31)=0.375*,p=0.031),持续 a音音高越低(r(37)=-0.355*,p=0.026),朗读音高标准差越大(r(37)=0.345*,p=0.031),回答的音强越大(r(31)=0.319*,p=0.048);(5)痰湿参数越高:a音共振峰平均值(r(37)=0.393*,p=0.013)和 a音第 3 共振峰(r(37)=0.371**,p=0.02)越高,朗读音高标准差越大(r(37)=0.521**,p=0.001),朗读语速越慢(r(37)=0-.320*,p=0.047);(6)湿热参数越高:i音的第3共振峰越高(r(37)=0.418*,p=0.015),朗读音强微扰越多(r(37)=0.316*,p=0.05),回答音强越大(r(37)=0.332*,p=0.039);(7)血瘀参数越高:i音第3共振峰越高(r(37)=492**,p=0.004),朗读音高标准差越大(r(37)=0.369*,p=0.021),朗读语断越多(r(37)=0.416**,p=0.008);(8)气郁参数越高:音域越宽(r(37)=0.368*,p=0.027),朗读音高标准差越大(r(37)=0.371*,p=0.02),朗读语速越慢(r(37)=-0.319*,p=0.047);(9)特禀参数在整体女组里没有显著的相关性。因为语音参数有内部相关性,所以简单的相关性研究不足以建立预测模型。
在探讨语音特征和体质参数的相关性过程中,我们看到体质参数之间和语音参数之间本身皆存在相关性,所以我们根据方差分析(analysis of variance,ANOVA)和 Akaike information criterion(AIC)①Akaike,Hirotugu(1974).A new look at the statistical model identification.IEEE Transactions on Automatic Control 19(6):716-723.准则对变量进行逐步回归,以便挑选出统计上相对独立并有显著贡献的语音参数作为解释变量。我们发现,通过34个语音参数的线性回归能够非常好的建立模型,预测39位女性受试者的体质参数:测定系数R2很高,模型 p值分很低。平和:R-squared=0.8114,p=0.022;气虚:R-squared=0.9506,p=0.004;阳虚:R-squared=0.9082,p=0.0017;阴虚:R-squared=0.9239,p=0.0016;痰湿:R-squared=0.9032,p=0.0248;湿热:R-squared=0.9922,p=0.0003;血瘀:R-squared=0.9399,p=0.0013;气郁:R-squared=0.9606,p=0.0016;特禀:R-squared=0.9121,p=0.0002。34个独立语音参数主要来自于 a音、持续 a音、四声、朗读、回答5个录音内容,其中11个在5种体质参数以上的预测有显著性,如平均 a音音高、平均 a音音强、平均 a音音强微扰、a音音强标准差、朗读平均音高、朗读音高标准差、朗读最低音高回答平均音高、回答最高音高、回答音高微扰、回答音强微扰和回答语速。
本实验样本量较小、来源单一、缺乏代表性,所以回归模型的有效性限于研究对象人群。如欲进一步深入研究,则需要通过更有代表性的大样本实验来修改和扩展模型。
研究的相关性结果提示我们,体质偏颇虽然与一些证候同名,但性质、症状和严重程度与病态有差异,语音表现也有所不同。根据回归的结果、语音特征与体质的关系部分符合9种体质理论。(1)平和与非平和:多种语音参数在平和与非平和参数里的回归影响是相反的,符合逻辑;(2)音高:平和参数越高,3个a音音高平均值、第2a音的第2和第4共振峰越低,第2a音的基础频率越高。朗读最低音高越低,朗读音高标准差越低,与非平和相反;(3)音强的前后变化:平和参数越高,3个a音的音强标准差越高;(4)语速和连贯性:平和参数越高,回答语速越慢,语断越少,与非平和相反;(5)微扰与波动性:平和参数越高,回答音高微扰越多(朗读也有同样趋向),音强微扰越少;(6)与高平和参数相应的语音特征符合“身体健康,性格随和开朗”:发 a音自然(音高较低),需要重复时认真(音高略有提高),朗读也比较自然,允许自己发出较低音,但情绪稳定,语调较平。平和参数高时,录音过程开始发的2个a音和最后发出的a音的音强有差异(发音比较灵活),表达从容连贯,音高微扰多表现声带不紧张、弹性好,音强微扰少表示气流稳定。
气虚参数越高,a音音高平均值、朗读音高标准差、朗读最低音高、朗读最高音高越高,平均a音音强和a音音强标准差越低,回答语速越快,回答音高微扰越少,回答音强微扰越多。气虚体质参数高时,语音偏高,朗读音高幅度大,音强及其变化幅度不大但并不稳定,音高的自然波动少,持续a音更长,音强大。语调幅度大、付出能量多,看似缺乏内敛,可能是导致气虚的行为原因之一。这些特征不完全符合“喜静懒言,语音低弱,气短、容易疲乏”,体质偏颇严重或有明显气虚症状时可能才会充分符合中医体质理论。
阳虚参数和多个语音内容的音高和音强都是反性的,但与自然回答的音高和音强、持续a音的音长是正性的,所以也不完全符合“性格多沉静、内向”,部分表现与气虚相似,可能也属导致阳虚的行为因素。
回答语速快,音断多,部分符合“外向好动、活泼”。
多种相关性,难以评价是否符合“性格偏温和、稳重”。
大体与音高、音强、语速皆有正性相关性,符合实证的“容易心烦急躁”。
与自然回答的语速和语断的正性相关性符合“易烦”的特征。
与音调幅度、语速和语段的正性相关性大体符合“性格内向不稳定、敏感多虑”,可理解为包括自身抵御气郁趋向反映的气郁症状。
用声学技术获得的客观语音特征和体质参数的相关性是丰富而密切的,大体符合中医传统认识和现代知识。用本研究的语音参数可以建立比较有效的回归模型。我们希望能够用更大的样本量建立一个更可靠的、适合不同年龄段、不同社会背景、不同地域男女的有效模型,并且在这个基础上继续探索不同人群和不同体质的差异性,继续研究不同人格、情绪、劳累程度、体征、症状、证候与疾病对语音特征的影响,通过客观化和量化闻诊信息,进一步发挥中医四诊合参的诊治意义,使得中西心身整合医学更好地服务于人类健康。
[1]Laetitia Bruckert.Women use voice parameters to assess men’s characteristics[J].Proc Biol Sci.,2006 January 7,273(1582):83-89.
[2]高也陶,李捷玮,潘慧巍,等.五脏相音——《黄帝内经》失传2000多年的理论和技术的现代研究[J].医学与哲学:人文社会医学版,2006,27(9):51-53.
[3]Van Aalst.chinese music,shanghai 1884.
[4]肖相如,倪青,张静.中华医学闻诊大全[M].太原:山西科学技术出版社,1998.
[5]王琦.中医体质学[M].北京:人民卫生出版社,2005:2.4.15.
[6]Praat 4.2.07 software(P.Boersma and D.Weenink,http://www.praat.org).
[7]Adrian Fourcin著.张家脲译.嗓音质量评价与测量.Journal of Audiology and Speech Pathology,2008,16(4):350.