印雪晨,吕士良,段力令,于洪志
(西北民族大学 中国民族语言文字信息技术重点实验室,甘肃 兰州 730030)
新陈代谢是生命的最基本特征,而呼吸则为其提供了必需的氧气,可见,呼吸运动对维持生命至关重要。对于呼吸的研究大多集中在医学领域,主要是关于呼吸生理学和临床呼吸障碍及疾病治疗等方面。就呼吸生理学而言,呼吸的过程包含外呼吸、气体在血液中的运输和内呼吸三个环节,外呼吸又包括肺通气和肺换气两个环节,内呼吸又包括组织换气和生物氧化两个环节,本文中我们讨论的呼吸指的是外呼吸中的肺通气环节,即肺与外界环境之间的气体交换过程[1]。
将呼吸信号的研究纳入到语音韵律的研究范围内,可以很好地研究韵律以及韵律和声调的关系[2]。北京大学首次采用呼吸绑带采集胸围或腹围的变化来研究语音的韵律特性,对汉语普通话的语音教学和朗读等都有实际应用价值[3]。之后,包括北京大学、南开大学以及我院中国民族语言文字信息技术重点实验室等对呼吸韵律进行了研究,并取得了一些成果。
本文主要介绍三部分的内容,首先是呼吸得以实现的生理机制,包括呼吸器官、呼吸肌、呼吸过程和呼吸形式;其次介绍呼吸韵律实验研究所使用的设备及软件,主要有呼吸带、生物电采集器Powerlab和其自带信号采集软件Chart7;第三部分综述目前国内关于呼吸韵律的主要研究成果。
生物实现呼吸的生理结构存在由低级向高级逐渐进化完善的过程。相对于低等动物来说,人类的呼吸过程更为复杂和完善,呼吸过程的实现需要多个系统的密切配合和参与,包括呼吸中枢、呼吸器官和呼吸肌等。呼吸系统由大脑呼吸中枢控制,二氧化碳和(或者)氧气和(或者)PH值的异常驱动呼吸运动。呼吸器官包括呼吸道、肺泡和胸廓等,呼吸道又包括鼻、咽、喉、气管及其分支直至终末细支气管,其中鼻、咽、喉属于上呼吸道,气管及其分支直至终末细支气管属于下呼吸道[1](如图1)。
图1 呼吸系统解剖图Fig.1 Anatomy of the respiratory system
引起呼吸运动的肌肉称为呼吸肌,又称骨骼肌,呼吸肌的舒缩为呼吸运动提供动力。呼吸肌分为吸气肌和呼气肌,使胸廓扩大产生吸气动作的肌肉称为吸气肌,主要有膈肌和肋间外肌;使胸廓缩小产生呼气动作的肌肉称为呼气肌,主要有肋间内肌和腹肌。此外,还有一些辅助呼吸肌只有在用力呼吸时才参与呼吸运动,如斜角肌、胸锁乳突肌就是辅助吸气肌(如图2)。胸廓是由12个胸椎、12对肋骨、1对锁骨和1个胸骨构成。胸腔(thoracic cavity)是一封闭的腔隙,由胸廓和横隔围成,上界为胸廓上口,与颈部相通,下界借横隔与腹腔分隔,胸腔中部为纵膈,两侧容纳左右肺脏,肺随着胸腔的运动被动地扩张和收缩[1]。
图2 呼吸肌图Fig.2 Respiratory muscle
正常人在安静状态下,平均每分钟呼吸12-18次。平和呼吸时,肋间外肌收缩,肋骨向前向外移动,胸廓的上下左右径增大;隔肌收缩时,膈向后移动,胸廓前后径增大。胸腔容积增大肺被动牵引而扩张,肺容积增大,肺内压下降低于大气压,空气进入肺内,引起吸气(inspiration)。平和呼吸时,吸气终末,肋间外肌和膈肌由收缩转为舒张,肋和隔回位,胸腔容积减小,肺失去牵引力由自身的弹性和表面张力而回缩,肺容积减小,肺内压升高,高于大气压时,肺内气体压出体外,引起呼气(expiration)。呼吸肌的舒缩是呼吸运动的原动力,呼吸运动引起的肺的被动扩张和回缩所形成的肺内压与大气压之间的压差是呼吸的直接动力,平静呼吸时,吸气是主动的,呼气是被动的;用力呼吸时,吸气和呼气都是主动的,肋间内肌和腹肌参与到呼吸运动中(如图3、4)。
图3 肋间肌与肋骨运动图Fig.3 Intercostal muscles and ribs sports
图4 呼吸时膈肌位置变化示意图Fig.4 Diaphragm position diagram
根据参与呼吸的肌肉工作情况可以分为胸式呼吸(Thoracic breathing)、腹式呼吸(Abdominal breathing)和胸腹混合式呼吸三种类型,一般为胸式和腹式混合型呼吸。胸式呼吸以肋间肌收缩为主,胸壁起伏明显;腹式呼吸以膈肌、腹肌活动为主,腹壁的起落明显;胸腹式呼吸时肋间外肌和膈肌同程度活动,胸腹部均起伏明显。
呼吸韵律研究使用的仪器主要有麦克风、喉头仪(EGG)、肌电脑电仪(EMG)和MLT1132呼吸带传感器,麦克风和喉头仪(EGG)分别用来采集语音信号和嗓音信号,肌电脑电仪(EMG)和MLT1132呼吸带传感器相结合来采集呼吸信号。
著名的PowerLab生物信号采集处理系统是澳大利亚ADInstruments的核心产品,包括软件和硬件两个部分,软件主要有Chart和Scope,提供了实时的多通道记录仪,硬件包括各种类型的信号调节器[4]。以下主要介绍呼吸信号采集时所用的MLT1132压电呼吸带传感器、PowerLab生物电采集器及其配套软件Chart7。
一条呼吸带分为压电传感器、松紧带、电缆三个部分(如图5)。应将呼吸带分别环扎于被试者胸部和腹部(呼吸时胸或腹扩张最大处),胸呼吸带上缘至腋下五厘米,腹呼吸带上缘在肚脐位置,以便同时采集胸部和腹部的呼吸信号,不能接触下肋,以免胸腹呼吸信号混淆[5]。呼吸带的核心是一个压电传感器,它可以把呼吸过程中胸围收缩扩张所引起的压力变化转变为电信号,将胸呼吸带插口与PowerLab生物电采集器通道三相连,腹呼吸带插口与通道四相连,这样电信号即可通过PowerLab采集器进入电脑,在Chart7软件界面上实时显示随时间变化的呼吸幅度信号。
图5 MLT1132压电呼吸带传感器Fig.5 MLT1132 piezo respiratory belt transducer
PowerLab系统采用高速 USB 端口与 WINDOWS 计算机相连。PowerLab主机有四通道、八通道、十六通道等几种型号,采样和实时计算速率高达200千赫(总计400千赫)PowerLab系统的每一个通道都可以分别选择输入灵敏度、高通滤波、低通滤波和保真滤波、16位精度、模拟输出,数字化的输入和输出连接功能还可用于触发和控制外部设备。
图6 PowerLab生物电采集器(16通道)Fig.6 PowerLab bioelectricity collector
图6是一个16通道的PowerLab生物电采集器,呼吸韵律的研究通常只需采集四路信号,分别是语音信号、嗓音信号、胸呼吸信号和腹呼吸信号,采集器上的数字将会分别对应Chart软件界面从上到下各通道信号。
与PowerLab采集器配套的Chart软件可以连续记录和显示最高 16 通道的数据,进行实时和非实时的计算,多种显示的分析窗口和自动化的数据提取[4]。快速而简单的实验室参数设置,强大的计算和分析功能是 Chart 软件的基本特色。
图7 Chart7软件界面Fig.7 Chart7 software interface
图7是Chart7软件界面,共采集了四通道的信号,第一通道时语音信号,第二通道是嗓音信号,第三通道和第四通道就是我们使用以上仪器所采集到的胸、腹呼吸信号。一个完整的呼吸过程,称之为呼吸单元(Breath Cell),包括一个吸气相(Inspiration Cell)和一个呼气相(Expiration Cell)。呼吸信号曲线上升为吸气过程,一般对应于语音信号的静音段,信号下降表示呼气过程,一般对应于语音信号的语音段。
以上是呼吸韵律研究实验时所用到的软硬件设备,在呼吸信号采集完成后,下一步需要根据研究目的对呼吸曲线进行标注和提取参数,这时会使用到在Matlab环境下编写的相应程序,如本实验室已编写完成的言语呼吸韵律平台,实现了对呼吸信号进行自动或手动标注、参数提取和系统分析等多种功能,为言语产生和语音韵律层级等更深层次的研究提供了良好的技术支持。
呼吸是发声的重要生理基础之一,连续语流是受到生理机制制约的,其中呼吸就是影响语流中韵律特征的重要因素之一[6]。目前对呼吸韵律的研究大多集中在音系学、声学和生理学方面,从生理角度进行研究的并不多[7]。Liberman(1967)曾提出过一个了“呼吸群(breath-group)”的理论,他认为人们是通过呼吸群来产生和感知语调的[8]。国内对言语呼吸和韵律方面的研究尚处于初级阶段,主要有北京大学、南开大学等。北京大学孔江平率先采用呼吸绑带采集胸围或腹围的变化来研究语音的韵律特性,迄今为止,完全从生理角度对汉语语流的韵律问题进行研究的还较少[9]。
对汉语普通话的呼吸韵律研究主要有谭晶晶等(2008)研究了汉语普通话不同文体朗读时的呼吸特征,包括近体诗、词等韵文体和小说、散文、新闻等非韵文体,文中对不同文体的呼吸重置时长和幅度做了频度分布图,认为不同文体在朗读时呼吸节奏有明显差异,近体诗、词等韵文的呼吸重置大小大致可以分成2级,小说、散文、新闻等非韵文大致可以分成3级;呼吸重置幅度比重置时长更能有效区分不同文体和呼吸级别;呼吸重置时长和幅度显著正相关[10]。
张锦玉(2010)对普通话语篇朗读时的停延率和呼吸特征进行实验,认为语篇中音节的停延起伏线不规整,呼吸的节律和形式与停延一样受到韵律等级的制约[11]。张锦玉等(2012)以一篇小故事为实验材料,分别在朗读时和讲述时录音,将呼吸单位切分为呼吸群、呼吸段和呼吸节三级,对比在讲述与朗读状态下不同呼吸单位的呼吸信号特点,其结论是:在吸气段上,讲述时与朗读状态相比吸气时间基本不变,但吸气幅度却有明显的下降,讲述与朗读状态下吸气曲线以陡升和缓升为主;在呼气段上,讲述时与朗读状态相比时长明显地加长,但呼气幅度没有显著的变化,讲述与朗读状态下呼气曲线以缓降为主,但讲述时更凸显缓降的情况;在呼吸时间商(RTQ)方面,呼吸单位等级越高,RTQ值越小,呼吸越不平静,反之越平静[12]。
杨锋等(2013)选用的语料文体包括诗词、新闻、散文等,分别在朗读和吟诵状态下录音,文中对平静时、朗读时和吟诵时的胸呼吸和腹呼吸曲线进行了对比分析,认为平静时吸气时长和呼气时长相当,言语时呼气时长远大于吸气时长;腹呼吸重置时间早于语音起始时间和胸呼吸重置时间;吟诵时一级重置增多;韵律句起始处对应胸腹呼吸重置,韵律短语边界对应胸腹呼吸间断凹槽[13]。
在少数民族语方面的呼吸韵律的研究成果主要有西北民族大学的中国民族语言文字信息技术重点实验室李永宏(2009)、杨阳蕊等(2010)对仓央嘉措藏语情歌的韵律研究[14~15],张金爽(2012)对藏语拉萨话新闻朗读呼吸和韵律的研究[16],李永宏(2012)、刘璇等(2013)对蒙古族长调民歌、短调民歌的呼吸信号分析等[17~18]。
在韩语方面有尹基德等(2007)对韩语呼吸节奏和语调模式的探究[19],录音语料有并列型复句、新闻和散文,讨论了韩语朗读语料的呼吸节奏特征,包括呼吸下倾、呼吸上升和语调群的音高调节对呼吸节奏的影响,认为低升调和降升调对引起呼吸重置有决定作用。
本文介绍了呼吸产生的生理机制、言语呼吸研究所使用的实验设备以及汉语普通话和少数民族语言呼吸韵律研究成果,为以后相关领域研究者提供一些参考。目前,国内使用呼吸带研究言语呼吸的成果还比较少,主要集中在几所拥有整套实验设备的高校和科研院所,现有的语音研究成果还需大量实验数据的证实。此外,言语呼吸韵律研究还可与气流气压计相结合,但目前尚未见到二者结合的研究成果,相信随着新精尖仪器的出现,多种仪器相结合的语音多模态研究将成为未来语音学研究的发展方向[20]。
[1]朱蕾, 刘又宁, 钮善福. 临床呼吸生理学. 北京: 人民卫生出版社,2008.9-23.
[2]孔江平. 普通话语音多模态研究与多媒体教学. 第四届全国普通话培训测试学术研讨会论文集, 2009: 196-201.
[3]李永宏, 孔江平, 于洪志. 现代语音学仪器及生理语音学研究. 生命科学仪器. 2008(6): 54-58.
[4]孙婷, 李永宏, 于洪志. PowerLab生物信号处理系统在言语生理研究中的应用. 生命科学仪器. 2010(8): 68-72.
[5]吴君如. 呼吸带说明. 语音乐律研究报告. 2008:81-84.
[6]吴宗济, 林茂灿. 实验语音学概要. 北京: 高等教育出版社, 1989:33-34.
[7]张金爽, 李永宏, 方华萍, 等. 藏语新闻朗读语音停顿和呼吸重置关系研究. 西北民族大学:自然科学版, 2011,32(81): 20-24.
[8]Liberman P. Intonation, Perception and Language. Cambridge.Massachusetts, The MIT Press, 1967.
[9]李永宏, 张金爽, 王姝文, 等. 藏语新闻朗读的呼吸信号声学分析.西北民族大学:自然科学版, 2010, 31(78):17-21.
[10]谭晶晶, 李永宏, 孔江平. 汉语普通话不同文体朗读时的呼吸重置特征. 清华大学学报:自然科学版, 2008,4:613-620.
[11]张锦玉. 普通话语篇停延与呼吸特征初探. 第九届中国语音学学术会议论文集. 2010(5).
[12]张锦玉, 石峰, 白学军. 讲述与朗读状态下呼吸差异的初步分析.南开语言学刊, 2012(1):56-63.
[13]杨锋, 侯兴泉, 孔江平. 言语产生的胸腹呼吸机制. 清华大学学报:自然科学版, 2013,53(6):852-855.
[14]李永宏, 于洪志. 仓央嘉措情歌的词汇组合与节律的关系研究.第十届全国人机语音通讯学术会议暨国际语音语言处理研讨会论文集, 2009, 8:546-548.
[15]杨阳蕊, 于洪志, 李永宏. 基于呼吸信号的藏语诗歌韵律研究. 微计算机信息, 2010, 26(10-1): 20-22.
[16]张金爽. 藏语拉萨话新闻朗读呼吸和韵律研究. 西北民族大学硕士论文, 2012.
[17]李永宏, 方华萍, 格根塔娜, 等. 蒙古语长调民歌的呼吸信号生理分析. 社会与人文科学研究挑战国际学术会议论文集, 2012.
[18]刘璇, 方华萍, 李永宏. 蒙古族短调民歌的呼吸生理信号分析. 西北民族大学:自然科学版, 2013, 34(89):13-17.
[19]尹基德, 孔江平. 韩语呼吸节奏与语调群的关系初步研究. 第九届全国人机语音通讯学术会议论文集, 2007.
[20]张金爽, 胡阿旭, 于洪志. 呼吸生理在言语声学中的应用研究. 生命科学仪器, 2010(8):31-34.