郭中子
(天津外国语大学,天津,300204)
在当今信息社会,语音合成技术发展迅速。在汉语普通话的语音合成过程中,声学基元是拼接的基本单位,它可能是音节、词语、语句等。在基元组合的过程中,韵律的变化是非常复杂的,因此韵律对语音合成后的效果影响很大。其中,自然语流中的抑扬顿挫、轻重转换、节奏分明等特征,主要是通过音高、时长和音强等方面的变化所表现出来的声学特征,而语言的韵律特征则主要是由这些声学特征所体现的。在汉语普通话自然语流中,话语的韵律结构特征会受到多种因素的影响,这些因素包括音高、时长、音强和停顿等等。
因此,本文主要研究汉语普通话自然独白话语的韵律结构特征与言语结构位置之间的交互性,探讨结构位置因素对汉语普通话自然独白话语中两音节韵律词音高的声学特征的影响。本文所考虑的结构位置因素主要包括音节自身的声调类型、韵律词内相邻声调的类型、所在的韵律层级边界以及所在的语调短语位置等。
韵律词这个概念是从西方引进来的,它是从韵律学的角度来规定“词”的概念,指“最小的能够自由运用的语言单位”。韵律学中的语言单位是韵律单位,韵律词是以语言中的韵律单位为基础。言语的韵律组织是一个相当复杂的过程,语句韵律层级就可以看成是这样一个过程:首先将语句划分成一定的层次结构;其次是根据语义和表达的需求协调各个层次内结构之间的整体关系,同时在每个层次的内部还需要分配其子单元之间的节奏和轻重快慢。与言语的韵律实现相关的主要声学参数就是每个语音单元的音高和时长。韵律层级的划分虽然和语法结构有着密切的关系,但不完全是一致的。
尽管国内外学者从实验语音学的角度对汉语韵律结构的音高、时长和重音等方面业已做了很多卓有成效的研究,但是总体看来还是存在一些值得商榷的地方。主要表现在以下两个方面:首先,大多实验设计语料是实验句,对实际生活中自然语言的研究不够深入。一些学者(如林茂灿2002;叶军2008;邓丹2010;梅晓2010;殷治纲2011)运用朗读语料库对普通话韵律结构的语音特征进行了分析,但是必须承认朗读语料和自然独白口语之间存在着很大的差异(刘亚斌、李爱军2002:18)。尽管也有像熊子瑜(2003)、王茂林(2003,2011)等学者基于973口语电话语料库考察了自然口语中普通话韵律结构特征,但是他们的语料是以自然口语的对话为主,这和生活中的自然独白口语还是存在着一定的差异。其次,很多学者(如 Xu 2004,2005,2009;Prom-on et al.2009)在研究汉语普通话语调结构时只是重视功能性因素对汉语语调的影响,忽视了结构位置对连续语流中音节的音高和时长的影响。因此为了能够从多角度对汉语语调特征进行研究,本文会重点关注结构性位置因素对汉语自然独白话语语调的影响。
自然独白话语更加接近人们日常生活口语的表达,它包含了丰富的韵律结构信息,同时有助于我们更加深入了解实际话语中连读语流的特点。本文研究的韵律词不是传统语法分析中的语法词,而是从感知和语音的角度来界定汉语普通话自然话语的韵律单元。此外,本文关注的是汉语语调的基本模式,即自然焦点条件下自然话语的陈述语句的语调模式。这是语调模型构建的基础和语调研究的起点(王萍、石锋2011)。
我们邀请了四位发音人(两男两女),年龄在23~32岁之间,他们通过了普通话水平测试,获得了普通话水平二级甲等证书,其中一位发音人获得了普通话水平一级乙等证书。四位发音人均没有播音专业背景,也没有受过播音的专业训练。为了获得自然话语独白语料,我们选择了普通话水平测试的第四项“说话”为测试内容。题目内容涉及到学习、体育、朋友和业余爱好等多项与普通人生活密切相关的题型。该语料库的句子均是陈述句。因为是自然话语的独白,每位发音人都以自然的方式发音,没有特别的强调和感情色彩,并且语速适中。录音环境为隔音效果良好的录音室。每个人的独白时间大约15~18分钟。声音文件采用16KHz采样,16位数据,单声道WAV格式存储。
本文基于C-ToBI系统的标注方法,所采用的韵律层级模式基本沿用了目前主流的“音节—韵律词—韵律短语—语调短语—语句”的层级结构模式。从韵律词最基本的声学特征音高入手,运用统计手段对音节的音高值进行了归整,重点研究结构性位置因素对两音节韵律词音高的影响,分析两音节韵律词音高的分布特点。采用praat脚本对所有的韵律词音节的音高数据进行提取。
2.2.1 语音学标注介绍
基于前人的研究成果(如邓丹2010;殷治纲2011),本文的语音标注信息主要是以C-ToBI系统为基础。标注层级为四层:声韵母层、拼音层、韵律结构间断指数层和相对重音层。韵律结构间断指数层标记汉语的韵律结构。间断指数代表感知到的音节之间以及音节和无声段(silence)之间的音联程度。话语的韵律结构就是层级组织结构,从小到大依次划分为:音节、音步、韵律词、韵律短语和语调单位。韵律结构和句法结构并非一一对应。对于间断指数层,本研究结合了邓丹(2010)和殷治纲(2011)的研究成果,对韵律层级边界的间断指数层进行了如下界定:
表1 韵律层级边界的间断指数层的界定
(续表)
本研究的所有语音标注均由五位经过了长时间韵律标注培训的听音人完成,他们均具有相关的语音学专业知识,在标注标准和数据一致性等问题上可以得到科学的保证。他们通过听觉感知判断对语料进行了韵律层级结构的标注,例如从语料库中切分得到了研究需要使用的两音节韵律词。本研究所使用的韵律词全部不含有明显的强调重音。五位听音人每人都要独立完成所有语料的韵律标注。在各自完成全部的工作之后,再对五位听音人的结果进行比较,获得最终一致性的标注结论,从而确保标注的可靠性和科学性。此外,本研究标注的各类标准基于前人的研究成果,并且和相关语音学专家进行了多次讨论。因此,本语料库使用的标注标准是可以反映自然话语独白语料的真实规律,其标注的可靠性是符合研究需要的。
经过数据统计分析,样本数据中各类韵律词的具体数目列举如下:
(1)单音节韵律词:616个
(2)双音节韵律词:2371个;不含轻声的2080个。
(3)三音节韵律词:861个;不含轻声的456个。
(4)四音节韵律词:47个
(5)五音节韵律词:1个
根据数据统计,可以发现样本数据中的韵律词共有3896个,其中以两音节的韵律词比重最多,占60.86%,其次是三音节的韵律词,占22.10%,再次是单音节的韵律词,占15.81%,最后是四音节和五音节的韵律词,分别占1.21%和0.26%。两音节和三音节的韵律词共有3232个,占韵律词总数的82.957%。这就证明了在汉语普通话的自然独白连续话语中,发音人的韵律词内的音节数量分布规律符合王洪君(2008)提出的“二常规、三可容、一四受限”的韵律词内音节数量规则。
2.2.2 声学参数的测量与数据的归整
对于音高数据的归整,本文首先将赫兹值(Hz)转换成半音值,然后结合李爱军(2005)的音高归整方法对四个发音人的音高数据进行归整。具体而言,在音高测量中,首先通过修改基频程序去除弯头和降尾,然后每个音节提取10个基频点数据。根据研究的需要,本文对音高数据进行了基频归整,首先将音高数据由赫兹值(Hz)转换为半音值(St)。
其中“f”表示测量点的基频值,“fref”表示参考频率,设为64赫兹。
然后手工修改提取错误的基频值,采用李爱军(2005)的基频归整方法,计算每个发音人的基频F0的最大值和最小值,按照下面的公式对F0进行归整(0-100):
其中,F0i,nor是发音人i的一个基频归整值,F0imin和F0imax分别是发音人i的基频最小值和最大值(即音域上限和音域下限值)。F0i是发音人i的待归整基频值。
本部分主要对从语料库中切分得到的不含轻声的2080个两音节韵律词的音高进行分析,重点分析结构性位置因素对两音节韵律词音高的影响。
我们在语料库中得到了不含轻声的2080个两音节韵律词,在进行音高归整之后,首先对前字的四个声调(无轻声)所有音节的10个音高测量点的归整值做了多因素方差分析,因变量是音节的10个基频点的归整值,自变量是前字音节的自身声调类型(阴平、阳平、上声和去声)、后接声调(阴平、阳平、上声和去声)、所在的语调短语位置(语调短语首、语调短语中和语调短语末),和所在的韵律层级边界(韵律词边界、韵律短语边界、语调短语边界和语句边界)。表2是对两音节韵律词前字音高进行多因素方差分析的检验结果。显著性水平为0.05,置信区间为95.0%。
从表2中可见,在α=0.05的水平上,前字音节的自身声调类型对前字音节的所有基频值的主效应都是显著的(P1-P10的p值均小于0.01)。所在语调短语的位置对前字音节的基频值主效应显著(P1-P10的p值均小于0.01)。所在韵律层级边界对前字音节的基频主效应显著(P1-P10的p值均小于0.01)。后接声调类型对前字音节基频的P4-P10点的主效应显著(P4-P10的p值均小于0.01)。
表2 前字音高的方差分析结果
然后对后字的四个声调(无轻声)所有音节的10个音高测量点的归整值做了多因素方差分析,因变量是10个基频点的归整值,自变量是后字音节的自身声调类型、前接声调、所在的语调短语位置和所在的韵律层级边界。表3是对两音节韵律词后字音高进行多因素方差分析的检验结果。显著性水平为0.05,置信区间为95.0%。
从表3中可见,在α=0.05的水平上,后字音节的自身声调类型对后字音节的所有基频值的主效应都是显著的(P1-P10的p值均小于0.01)。所在韵律层级边界对后字音节的基频值主效应显著(P1-P10的p值均小于0.01)。所在语调短语的位置对后字音节的调头基频值P1点的主效应显著(p<0.05)。前接声调对后字音节基频值的主效应显著(P1-P10的p值均小于0.01)。
表3 后字音高的方差分析结果
多因素方差分析的结果证明,在汉语普通话自然独白口语的连续语流中,两音节韵律词的前字和后字都会受到该音节自身的声调类型、所在的语调短语位置、所在的韵律结构层级边界和韵律词内前接/后接声调类型的影响。其中,音节自身的声调类型、所在的韵律结构层级边界和韵律词内前接/后接声调类型对音节音高的影响更为显著。
多因素方差分析的结果表明,两音节韵律词内前字和后字音节的音高会受到其所在语调短语位置的影响,本部分主要讨论两音节韵律词在语调短语首、中、末三个位置时,前字和后字音节四个声调(无轻声)的音高表现。
图1清晰地表明了两音节韵律词的四个声调在语调短语的三个位置:首、中、末的音高表现。从图中可以看出,在两音节韵律词内,上声除外,前字和后字随着其在语调短语位置的后移,声调的音高在逐渐降低。相反,在上声调类中,后字无论处于语调短语的首、中、末位置,后字的调头音高会比前字调头的音高要高一些。就两音节韵律词内部音高而言,除上声以外,后字音高的整体调域要比前字低。在自然独白话语中,尽管后字上声的调头比前字的调头高,但是后字上声的调尾音高要比前字上声的调尾音高低。从整体上看,两音节韵律词内部存在着音高下倾现象。在语调短语的任何位置上,汉语的四个声调的调型都没有发生特别显著的改变,但是需要指出,在自然话语中,四个声调的调型还是出现了细微的变化,由于受到了音高下倾的影响,阴平调型的调尾有一点下降的倾向,阳平调型并没有像传统语言学理论认为的是“35”那样显著。后字阳平的调体有“凹”的特征,这使得后字阳平的特征有些近似前字上声的特征。前字上声的特征表现为低平调倾向,后字上声的曲拱特征更为明显。与邓丹(2010)的研究结论不同,和处于语调短语首、语调短语中时相比,上声音节在语调短语末尾时倾向于表现为曲折调而不是低降调。后字为去声时,特别是当后字去声处于语调短语末尾时,去声的调尾有向上抬的趋势。在自然独白话语中,汉语的四个声调的音高的微妙变化是受到了诸如相邻声调、音节所在的语调短语位置和音节所在的韵律层级边界等多种变量的综合作用。
图1 语调短语不同位置的两音节韵律词的音高特征
本部分主要探讨音节所在韵律层级边界对音节音高的影响。图2是四个声调在不同韵律层级边界前的音高表现。从图中可以看出音节所在韵律层级边界对声调调型的影响不大。
图2显示,对于两音节韵律词的四个声调而言,无论是当前字和后字音节处于韵律词边界前、韵律短语边界前、语调短语边界前,还是语句边界前,处于韵律词边界前的前字和后字音节整体音高要比它处于其他韵律层级边界前的整体音高要高,处于语句边界前的前字和后字音节的整体音高是最低的,这表明语句的整体音高走势出现了下倾。在两音节韵律词的四个声调的后字中,阴平和阳平的音高整体走势是相同的,即处于韵律词边界前的后字音节的整体音高要高于处于其他韵律层级边界前的整体音高。但是可以发现对于上声和去声而言,情况有些复杂,尽管处于韵律词前边界的音节整体音高要高于处于其他韵律层级边界前的整体音高。值得注意的是,处于语调短语边界前和语句边界前的后字音节的音高整体趋势有些重合现象。
除了上声外,前字阴平、阳平和去声在韵律词边界前、韵律短语边界前、语调短语边界前和语句边界前的音高总体上要高于后字的整体音高。但是,后字上声的调头音高在韵律词边界前、韵律短语边界前、语调短语边界前和语句边界前要高于前字上声的调头音高,这与邓丹(2010)的发现不同。总体上说,后字上声的调尾音高在任何一个韵律层级边界前还是要低于其相对应位置的前字音节。此外,当后字上声处于韵律短语、语调短语和语句边界前时,上声调尾的曲拱形状尤为明显。
图2 在不同韵律层级边界前的两音节韵律词的音高特征
在上文分析中,已经讨论了所在的语调短语位置对四个声调的音高的影响以及所在的韵律层级边界对四个声调的音高的影响。本部分将会分别分析韵律词内后接声调对前字音节音高的影响和前接声调对后字音节音高的影响。
3.4.1 后接声调对前字音高的影响
首先来看后接声调对前字音节音高的影响。两音节韵律词内前字后接不同声调(不含轻声)时的音高表现如图3所示。
前字为阴平,后接不同声调时其音高发生了一些变化。后接高调头的阴平时,前字阴平的整体音高比后接其他声调时要低,后接低调头的上声时,前字阴平的整体音高是最高的。后接低调头的阳平和上声时,前字阴平的调尾段有下降的趋势。这体现了前字调尾受到后字调头的发音协同作用的影响。
前字为阳平,无论后接哪种声调,在阳平的调头和调体之间出现了“凹”的特征。后接低调头的阳平时,前字阳平的整体音高比后接其他声调时要高;后接高调头的去声时,前字阳平的整体音高要比后接其他声调时要低。
前字为上声,后接阳平时,前字上声的整体音高要比后接其他声调时要高。后接阴平和去声时,前字上声调尾的曲折形式非常明显,出现了轻微的上升趋势。但是当后接阳平时,前字上声调尾并未表现出明显的曲折形式,调形近似于低平调。前字上声的起点音高表现为阳平前>去声前>阴平前;前字上声的终点音高为去声前>阴平前>阳平前。这表明,上声的调尾会受到后接声调的影响,后接高起点的声调时,上声的调尾会抬高。
前字为去声,后接低起点的上声时,前字去声的整体音高要比后接其他声调时要高。后接高起点的阴平时,前字去声的整体音高要比后接其他声调时要低。这体现了前字上声的整体音高会受到后字的异化影响。低起点的后字会使前字的整体音高抬高,高起点的后字会使前字的整体音高降低。当后接阳平、上声和去声时,前字去声的调尾都出现了下降的趋势。但是当后接阴平时,由于受到了后字阴平高起点调头的协同发音的影响,前字去声的调尾出现了轻微的上升趋势。因此去声的整体音高既会受到后字声调的异化影响,同时去声的调尾也会受到后字调头的协同发音的影响。
综上所述,后接声调的调头对前字的整体音高趋势会产生一定的影响,主要是体现在前字整体音高受到后字的异化作用和前字调尾音高和后字调头的协同发音上。
具体而言,异化作用体现在当前字后接低起点的阳平和上声时,前字的整体音高是最高的。当前字为阴平、上声和去声时,后接高起点的阴平会导致前字的整体音高变成最低。同时,当前字为阳平时,后接高起点的去声会导致前字的整体音高最低。此外还发现,后接低起点的上声时,前字阴平的整体音高最高;后接低起点的阳平时,前字阳平的整体音高最高;后接低起点的阳平时,前字上声的整体音高最高。后接低起点的上声时,前字去声的整体音高最高。从整体上来看,除前字阳平外,后接低起点的上声时前字调尾的音高是最高的,这一点与邓丹(2010)的发现是不同的。
发音协同体现在上声的调尾会受到后接声调的影响。比如后接高起点的去声和阴平时,前字上声的调尾会抬高。前字去声后接阴平时,由于受到了后字阴平高起点调头的协同发音的影响,前字去声的调尾出现了轻微的上升趋势。
图3 前字后接不同声调的音高表现
3.4.2 前接声调对后字音高的影响
下面将对两音节韵律词后字前接四个声调类型时,后字音高的不同表现进行分析,图4是后字前接不同声调的音高表现。
如图4所示,由于前接声调的类型不同,后字音高,主要是后字调头段的音高产生了相应的变化,但是后字的基本调型并没有产生显著的变化。
1951年,哈电电机成功制造的新中国首台水电机组,单机容量仅为0.8兆瓦;1980年代,葛洲坝电站12.5万千瓦轴流转桨式水轮发电机组成功出世,因其优异的综合性能,被授予国家质量奖金质奖章,这也是我国发电设备获得的第一块金质奖章。自主研制之路艰难坎坷,哈电电机不畏险途,为研发更大容量、更优性能的机组积蓄着力量。
后字为阴平,前接高调尾的阴平和阳平时,后字的整体音高要比前接其他声调要高。由于前接声调类型的不同,后字阴平的调头发生了一些变化。当前接阴平和阳平时,后字调头基本是保持平调调型,当前接去声时,后字调头有轻微的下降趋势,但是当前接上声时,后字的调头出现了轻微的上升趋势,与前接去声时的调头调型截然相反。这是因为前接去声时,前字去声的降调尾会影响后字阴平的调头,产生发音的协同作用,从而后字阴平的调头会出现下降的倾向。而当前接声调为上声时,由于上声的调尾有上升的趋势,所以后字阴平的调头由于受到了发音协同作用,也出现了上升的趋势。前接高调尾的阴平时,后字阴平调头的音高是最高的,当前接低调尾的上声时,后字阴平的调头音高是最低的。
后字为阳平,前接阴平、阳平和去声时,后字阳平的调头有下降的趋势。在连续话语中,后字阳平会受到前字调尾的影响。比如前字去声是低调尾,并且有下降的趋势,由于发音协同作用,所以后字阳平的调头也会有下降趋势,这一点与邓丹的发现不同。邓丹(2010:37)认为前接上声和去声时后字阳平都会表现为升调。在本文的研究中,发现只有当前接上声时,后字阳平的音高才有明显的上升趋势,这是因为其前接的上声声调的调尾是上升的,从而使后字阳平的调头表现为上升趋势。当前接高调尾的阳平时,后字阳平的调头音高是最高的。和后字阴平一样,当前接低调尾的上声时,后字阳平的调头音高是最低的。
后字为上声,无论前接哪种声调,后字上声的调头调型都是下降的趋势,而且其调尾都出现了曲折形状。当前接声调为高调尾的阳平时,后字上声调头的音高是最高的。当前接声调是低调尾的去声时,后字上声的调头音高是最低的,这体现了前字调尾和后字调头之间的发音协同作用。后字为去声时,前接高调尾的阴平时,后字的调头音高是最高的,前接低调尾的上声时,后字调头音高是最低的。当前接阴平、阳平和去声时,后字去声的调头有下降的趋势。当前接升调尾的上声时,尽管后字去声的调头最低,但是它的调头调型出现了上扬的趋势。
综上所述,前字的声调类型对后字音高的影响主要是体现在前字声调的调尾对后字的调头段音高的发音协同作用上。当前接上声和去声这类低调尾的声调时,后字调头的整体音高比较低。当前接阴平和阳平这类高调尾的声调时,后字调头的整体音高比较高。此外,当后字为阴平、阳平、上声和去声时,前接低调尾的上声时,后字调头的音高最低。
图4 后字前接不同声调的音高表现
3.4.3 长距离协同发音
本节关注汉语普通话自然独白话语中韵律词内声调是否会受到长距离的顺向和逆向影响。因为音节本身的声调类型对音节的音高产生显著影响,首先对两音节韵律词的前字进行了声调归类,将前字音节分成阴平、阳平、上声和去声四类,可以排除音节自身的声调类型对音节自身音高的影响。然后在此基础上进行了多因素方差分析,因变量是两音节韵律词中前字音节四个声调的基频值10个点,自变量是前字音节所在的语调短语位置、韵律层级边界、后接声调和后接声调后面的声调类型。
方差分析表明,对于前字的四个声调而言,在α=0.05的水平上,后接声调后面的声调对两音节韵律词前字的音高没有显著的影响(p>0.05)。因此在汉语普通话自然独白话语中,长距离的逆向协同发音可能并不存在。
下面将两音节韵律词内后字音节的声调进行归类,然后进行多因素方差分析,因变量是两音节韵律词内后字音节的四个声调的基频值10个点,自变量是后字音节所在的语调短语位置、韵律层级边界、前接声调和前接声调前面的声调类型。
方差分析表明,对于后字阴平来说,在α=0.1的水平上,前接声调前面的声调类型对后字阴平的基频值P5-P10点产生显著的影响(F5=2.086,F6=2.148,F7=2.366,F8=2.389,F9=2.207,F10=2.098;p<0.1)。对于后字上声来说,在α=0.05的水平上,前接声调前面的声调类型对后字上声的音高基频值P7-P10点产生了显著的影响(F7=2.844,F8=3.966,F9=3.354,F10=3.085;p<0.05)。对于后字阳平和后字去声来说,在α=0.05的水平上,前接声调前面的声调对后字的基频值没有显著的影响(p>0.05)。
根据以上的分析,可以发现在汉语普通话的自然独白话语中,在两音节韵律词内,后接声调后面的声调对前字的音高没有显著的影响;另一方面,前接声调前面的声调对后字阴平和后字上声的音高有显著影响。在自然语流中,阴平作为高平调和上声作为低平调而言,都属于静态调范畴(static tones),而阳平作为升调和去声作为降调而言,都属于动态调范畴(kinetic tones),因此,可以认为在两音节韵律词内,如果后字是静态调的阴平和上声,它们可能会受到长距离的顺向协同发音的影响。
根据统计分析可知,结构性位置因素会对普通话自然独白话语韵律结构的声学特征产生重要的影响。具体而言,音节自身的声调类型、韵律词内相邻声调的类型、韵律词内音节所在的韵律层级边界和所在的语调短语位置都会对音节的音高特征产生显著的影响。本文的主要发现如下:
(1)两音节韵律词内部存在着音高下倾现象。两音节韵律词在自然独白口语中,前字和后字的音高范围随着其在语调短语位置的后移,各个音节的音高范围在逐渐变窄。处于韵律词边界前的韵律词整体音高要比处于其他韵律层级边界前的韵律词的整体音高要高。(2)后接声调的调头对前字的整体音高趋势产生异化作用;前字声调对后字声调的协同发音作用主要体现在前字调尾影响后字调头段的音高。当前字后接低调头的阳平和上声时,前字的整体音高最高。前接低调尾的上声和去声时,后字调头的整体音高比较低。前接高调尾的阴平和阳平时,后字调头的整体音高比较高。(3)就长距离协同发音而言,在汉语普通话自然独白话语中可能存在着长距离协同发音现象。尽管长距离的逆向协同发音可能并不存在,但是在两音节韵律词内,如果后字是静态调的阴平和上声,它们可能会受到长距离的顺向协同发音的影响。
Laniran,Y.O.& G.N.Clements.1995.A long-distance dependency in Yorùbá H tone realization [R].In Proceedings of the 13th International Congress of Phonetic Sciences 2:734-37.
Lin,M.&J.Yan.1991.Tonal coarticulation patterns in quadrisyllabic words and phrases of Mandarin [R].In Proceedings of the 12th International Congress of Phonetic Sciences 3:242-45.
Prom-on,S.,Y.Xu &B.Thipakorn.2009.Modeling tone and intonation in Mandarin and English as a process of target approximation [J].Journal of the Acoustical Society of America 125:405-24.
Shih,C-L.1988.Tone and intonation in mandarin [R].In Working Papers,Cornell Phonetics Laboratory 3:83-109.
Xu,Yi.1993.Contextual Tonal Variation in Mandarin Chinese[D].Storrs:The University of Connecticut.
Xu,Yi.1999.Effects of tone and focus on the formation and alignment of f0contours[J].Journal of Phonetics 27:55-105.
Xu,Yi.2004.Separation of functional components of tone and intonation from observed F0patterns [A].In G.Fant,H.Fujisaki,J.Cao & Y.Xu (eds.).From Traditional Phonology to Modern Speech Processing[C].Beijing:Foreign Language Teaching and Research Press.483-505.
Xu,Yi.2005.Speech melody as articulatorily implemented communicative functions [J].Speech Communication 46:220-51.
Xu,Yi.2009.Timing and coordination in tone and intonation—An articulatory-functional perspective[J].Lingua119:906-27.
邓丹.2010.汉语韵律词研究[M].北京:北京大学出版社.
李爱军.2005.友好语音的声学分析[J].中国语文(5):418-31.
林茂灿.2002.普通话语句的韵律结构和基频(F0)高低线构建[J].当代语言学(4):254-65.
刘亚斌、李爱军.2002.朗读语料与自然口语的差异分析[J].中文信息学报(1):13-18,51.
梅晓.2010.普通话韵律结构的语音特性分析[D].北京:中国社会科学院研究生院.
王洪君.2008.汉语非线性音系学——汉语的音系格局与单字音[M].北京:北京大学出版社.
王茂林.2003.普通话自然话语的韵律模式[D].北京:中国社会科学院研究生院.
王茂林.2011.汉语自然话语韵律模式研究[M].广州:暨南大学出版社.
王萍、石锋.2011.汉语语调的基本模式[J].南开语言学刊(2):1-13.
熊子瑜.2003.自然语句边界的韵律特征及其交际功能[D].北京:中国社会科学院研究生院.
叶军.2008.现代汉语节奏研究[M].上海:上海世纪出版集团.
殷治纲.2011.汉语普通话朗读语篇节奏研究[D].北京:中国社会科学院研究生院.