解 宏, 石 锋
(1.南开大学汉语言文化学院, 天津 300071; 2.南开大学文学院, 天津 300071)
众所周知,语言是人类最重要的交际工具,是人们在社会生活中相互交流沟通以反映对现实世界的认知和情感等心理活动的主要手段。相对于无穷无尽、千变万化的现实现象,任何一种语言系统却都是由有限成分所构成,尤其是语音系统中的构成成分最少,于是人们通过各种排列组合使语言具备了用有限去转化无限的能力,从而实现了语言对现实的编码。在日常交际中,语言是用来“说”的,也是“听”来的,反映现实和情感等信息在大脑中经过加工再通过人的发音器官转换为声波,在说话人和听话人的口耳间传递。言语中声波负载的信息量要大于句子各成分所表达的语言意义,比如,疑问词不同的问句却可以用同样的词语、同样的句法结构组合成的句子来回答。此时,语音流的高低、强弱、快慢、停延等就被赋予了言语交流的意义。在具体的话语情境下,音节流与音高、音强、音长协调变化所构成的韵律特征并行编码,从而完成对信息结构中重要部分的凸显,达到交际的目的。因此,叠加在音节流上的韵律编码只存在于言语中,是表达句子信息结构的重要手段,可提供词汇和句法结构之外的话语信息。本文从言语中句子的信息结构研究出发,总结了与言语信息结构相关的句子的功能语调、节奏单元和重音三个方面的实验语音学的研究成果,期望为言语的韵律特征寻获心理认知的理据,从而为语言习得和语言教学、提高机器合成语言的自然度以及语音识别的准确性等提供可操作性的规则。
人们使用语言进行交际,也是彼此传递信息的过程,并非是新旧信息的随意拼凑,而是要遵循一定的结构或者说组织框架才能实现。说话人要想表达新的信息,通常都是以旧的信息为铺垫。旧信息是听话人本来就已经知道或通过话语中的上文获知的内容,因此也被称为“已知信息”。在交际时,已知信息可以通过指示语或情境实现对所指的“复原”。相对而言,如果通过指示语或情境也无法推测出的那部分信息,对听话人来说就是新信息。Halliday[1]将新信息分为三种情况,一是听话人推测不出的未知信息,二是跟预测的或陈述的某项发生对立的信息;三是针对预设问题中的疑问词进行答复的信息。Halliday[2]指出:“在严格的语言学意义上,信息是已知或可以预测的内容与新的或无法预测的内容之间的张力。这与数学中的信息概念不一样,数学中的信息是对不可预测性的测量。语言学意义上的信息是通过新内容和旧内容的相互作用而产生的。因此,信息单位是一种结构,由新信息和已知信息两种功能构成。”
在言语交际的过程中,信息的流动在新旧信息的交替中波浪式发展,往往是已知信息在前、新信息在后。句子的主位作为表达信息的起点,在绝大多数的情况下都是由已知信息来充当,成为谈论的对象,也就是句子的话题;其后的陈述、说明部分则引入了说话人要传达的新信息。在表达信息时,说话人把希望听话人格外注意的部分用重音来凸显,形成焦点。因此,言语的信息单位就是已知信息与新信息、话题与焦点在句子中的配置。信息单位的始终及其内部组织可以由说话人根据交际意图或交际需要自行确定[3]。
随着信息结构理论在西方语言学界发展深化,也引起了中国语言学界的关注,语法学者开始从信息结构的视角看汉语语法。比如,张伯江、方梅[6]用信息结构分析汉语的主位-述位结构和焦点结构。徐烈炯、刘丹青[7]概括汉语句子的话题的特征时提出,形式上话题位于句首,其后常伴有语音停顿;信息结构上话题是有定的已知信息。袁毓林[8]探讨了句子的信息结构和焦点结构的关系,并用以分析了多种汉语的句法结构。再比如,陆俭明[9-11]几次强调汉语的信息结构研究的意义,指出句子信息结构的六个关注点,总结了汉语句子信息结构会遵循的八条准则。周士宏[5]96-265系统阐述了信息结构理论的发展,并分析了话题和焦点的语用角色及汉语话题结构、焦点结构与语序的关系。
语法学者对信息结构的关注,也促使语音学者开始进行语法信息与韵律结构的接口性研究。毕竟说话人组织话语传递信息,听话人接收话语解读信息,是大脑认知的编码和解码的过程,不仅涉及词法-句法、语义-语用层面,还需要语音要素的包装。语音四要素中的音质是一个音区别于其他语音的内在属性和本质特征,汉语里的元音和辅音、音节里的声母和韵母都是从音质的角度确定的。而且,汉语是典型的声调语言,音高的高低升降的变化也可以起到区别意义的作用。在音质和音高表达句子的语言意义的基础上,说话人在具体语境中想要通过句子传达的语气态度、信息量的大小、焦点的标记、话题的标记等则需要由音高、音长和音强构成的语调、重音和节奏等方面的韵律特征来实现。
赵元任[12]在介绍语音的物理成素时就提到“言语的基本音高同时间所生的函数关系就成言语的腔调(intonation)”。赵元任[13]指出:“耳朵所听见的总语调是那一处地方特别的中性语调加上比较的普通一点的口气语调的代数和。”赵元任[14]认为一种声调语言的实际韵律或音高运动由三种因素构成:“一个个音节词所独有的声调,这些声调在连贯的言语中的相互影响,以及表达说话者情绪或态度的音高运动。”第一种要素通常被称为声调,或词源上的声调,第二种要素赵元任称之为中性语调,第三种称为表情语调。后两者共同构成句调。赵元任[15]还形象地“将音节的声调和句子的语调比作小波浪跨在大波浪上面。实际结果是两种波浪的代数和”。在赵元任[14]746[16]提出的“橡皮带效应”(音域的提高、降低、加宽、收窄)的基础上,沈炯[17]主张“语调就是以句子为单位的声调音域系列”,“在语调的调节下,语流中一系列声调曲拱发生了量变:变幅加宽或压缩,音高水平提高或压低。尽管发生了量变,曲拱所反映的声调特征并不改变”。沈炯[18-19]认为,声调音域的下限和上限分别与节奏和语义加强相关,还提出了由调冠、调头、调核和调尾组成的语调构造。曹剑芬[20]总结性指出:“广义地说,一种语言的语调,在感知上是语音的轻重缓急和抑扬顿挫的腔调,在声学上实现为各种韵律要素包括音高、音长和音强等协调变化的综合效应,主要表现为语句音高变化的总体模式;在功能上主要表达语气、情感,同时也有一定的语义表达作用。狭义地说,语调就是语句的音调模式,也就是语句音高变化的总体轮廓,通常采用音阶运动的走势来描写。”由此可见,言语中句子的语调虽然说并不根本改变音节的声调,但仍然在一定范围内实现了对各音节音高曲拱的调节,主要表现在音域和音阶走向上。即使语调是音高、音强、音长等要素协调变化的综合效应,学者们仍旧把音高表现作为语调研究的主要关注点。
陈述、疑问、祈使和感叹是语言中四种基本的功能语调,也是言语的口气,传达出说话人的感情和态度,是语言中各种句子的基本的分类依据,其音高表现也各不相同。以陈述句和疑问句为例,很多学者(比如吴宗济、沈炯、劲松、林茂灿、曹剑芬、Xu、石锋等)的实验研究都从不同的角度证明句子功能语调的抑扬并不是简单的音高升降问题,而是通过抬高或压低音阶或声调音域来表现。而且,句末重读字音的声调是功能语调的重要表现。
说话人在传达信息的时候,通常是确定其真实性的,这种不含情感因素的简单陈述事实的句子就是陈述句。赵元任[15]28认为,通常的陈述用正常语调(中性语调),较长的句子有句末略微降低的趋势。其后,很多学者通过声学实验证明,陈述句中各字调与语调在音阶上的叠加,呈现出规律性的走势。从全句语调的大波浪看,沈炯[18]提出,陈述语调是高音线骤落形式和低音线下延形式结合而成的。曹剑芬[20]指出,陈述句的音阶走势逐渐下倾,这是生理机制和语音、语用等多种因素的综合作用。石锋等[21]用词调域的起伏度数据证明音高下倾在陈述句的句调域和词调域中是主流,句末词的下限是全句调域的下限,词内起伏度最大是末字调域的下限。从句末调看,劲松[22]通过实验结果说明,话语最后节奏单元重读音节的音高变化对汉语语调的贡献是主要的。林茂灿[23-25]指出,句子的边界调的作用就是传递话语的语气,如疑问语气和陈述语气等。汉语陈述句的边界调是短语末音节音阶相对于这个音节声调的下压,其特征可用[+lowertone]表示。总的来说,陈述句整体音高走势的逐渐下倾,加上句末边界调的音高下压,难免使人从感觉上理解为降调。由此也可进一步猜想,在人类认知的判断命题领域,已经习惯于把这种语调的音高下倾趋势用来体现对所传达信息的确认程度,一旦不确定的程度提高,音高的下倾就会发生变化。有意思的是,在汉语里可以单独表示判断的“是”“对”“错”恰好都是去声降调,而疑问代词和疑问语气助词则大多不是降调。
当说话人对于接收到的信息感到疑惑时,常用疑问语调来表达。实验证明,疑问语调的音高和音长表现与陈述语调不同。沈炯[18]提出疑问语调是高音线渐落形式和低音线上敛形式结合而成的。疑问句全句的时长缩短,但句末音节的时长反而会加长一些。曹剑芬[20]指出,疑问句的平均音高总是高于相应的陈述句,语调轮廓是上升的或相对趋平的。林茂灿[23-25]提出,疑问的边界调调型都保持本调的音高形状,疑问短语的整个或后部基频曲拱比陈述的高,疑问边界调的时长比陈述句长。他指出,汉语疑问的边界调是短语末音节音阶相对于这个音节声调的抬高,其特征可用[+raise tone]表示。王萍等[26]分析调域起伏度的结论是相对于陈述句,语调疑问句的句调域和词调域都整体抬高,句中词调域虽低于句首词,但下限开始收敛提高,为句末调域最大的提升扩展做准备。总结上面的实验结论可以发现,仅以疑问语调为标记的疑问句往往出于听话人的疑惑以及惊讶等情感因素,自然句子的音高起点相对于陈述句要高,而对于接收到的新信息的不确定也使得听话人抬高了句末词的声调音域。当然,语调并不是疑问的唯一标记,一旦疑问句带有疑问词或疑问语气词时,句末词调域的抬高幅度就相对降低了[27-30]。
如果说陈述语调和疑问语调表达了逻辑的口气,那么,祈使语调、特别是感叹语调因为夹杂了更多的情感因素,就是赵元任所说的情感语调,其韵律编码也较陈述和疑问语调更复杂、动态性更强,不仅音高、音长、音强可能大幅变化,甚至涉及发声态,也就是声门活动的各种状态,比如假声等。赵元任[14]745明确指出,情感语调取决于“嗓音的音质、不寻常的重读(或轻读)程度、整个短语总的音高和讲话的速度”。也正因为情感语调的复杂性,目前的实验研究成果不多,比如沈炯[19][31]用语音事实表明,命令禁止式祈使句是短调核型,请求劝阻式祈使句是长调核型,都有调核后高音线骤落和从调核起低音线上敛的基本特征。感叹语调则主要表现为全句高音线渐落和低音线下延,大致可分为四种口气语调,即窄带低语调表达不满、同情、拒绝;窄带中语调表达安慰、犹豫、亲昵;窄带高语调表达惊慌、告警、求助;宽带语调表达欢快、愤怒、威胁。焦雪芬、石锋[32-33]针对命令句和禁止句的实验研究证明,命令句的句末动词是全句的信息焦点,调域最大化扩展,调域下限是全句调域的下限,其音高、时长、音强都占有最大的增幅,末字是全句的最大值。禁止句的主重音出现在否定词,后字是音量的尖峰,音高上限是全句调域的上限,但时长并未延长;句末动词的音高、音量,尤其是时长也都发生了增幅。陈虎[34-36]针对感叹语调的实验研究表明,感叹语调的主要韵律特征是强重音和宽调域。调阶主要反映说话时情绪的兴奋度的高低,调域主要反映感叹时的语势的强弱。比起陈述语调,感叹语调的重音高值和调域的增加显著,调首音阶的上抬也比较明显;而全调调阶及调尾音阶的变化相对很小。邓文靖等[37]通过比较叹词句和后续句语调的声学实验表明,二者在音高走向、音阶、音域、时长等方面有明显协同关系,受到语气和情绪的制约。
由于传统的内部审计方式只对企业风险的后果作出评估,而忽视了在过程上改变使其风险减少的方式。而在大数据的背景下,这不仅要求对内部审计的结果作出评估,更为关键的是要控制过程来实现内部审计。
虽然功能语调的声学实验研究大多以分析音高特征为主,但随着对不同语气语调的研究不断深入, 音高、音长、音强三者协调变化的“三维关系”越来越受到重视,吴宗济[38]总结了以往研究中韵律三特征在句中的相互关系是“音高变,音强、音长不一定变;音强变,音高一定变,音长不一定变;音长变,音高和音强都不一定变。在听觉的重音上,音长可和音高或音强互补等等”。石锋[39]在语音格局的基础上提出“语调格局是语句韵律的高层调节”,“语调结构的基本模式是指非强调的陈述句的语调模式,疑问、祈使、感叹等不同的功能句型以及焦点句和情感句等都是以基本模式为基础,通过参数的变化调整进而得到的变式”。基式(基本模式的简称)的参数包括频域(音高的高低、宽窄的起伏变化)、时域(音长的延长或缩短)、量域(音强的强弱变化)、质域(音质的改变)。多维立体的格局观更适合于并有助于言语的韵律编码的层级系统的可持续性研究。
人们在进行言语表达之前,首先要在大脑中把信息流通过遣词造句转换成语言的代码,而后成为说话人口语中的句子。句子中各个音节并不是一个一个孤立地发出,音节与音节也并非简单的线性组合,而是按照汉语的词法、句法的树型关系形成了一定的节奏。因此,作为韵律编码形式的节奏,与语法、语义、语用有着密切的联系。
赵元任[40]最早关注到汉语的节奏成分在结构词的构成和使用中所起的作用,他在《汉语词的概念及其结构和节奏》中指出:“考虑形式类时再加上考虑重音和声调,可以在标志结构词方面给我们额外的帮助。”“识字人的话语中大多数有意义的词根是单音节的”;“另一方面,跟其他结构词一起在句法关系中作为单位而行动的结构词,则常常是多音节的”;两个以上的音节“形成一种易于抓在一个思维跨度中的方便的单位”。赵元任关于节奏的概念对于汉语的调群结构的分析具有指向性意义,因此语调的研究也可以基于节奏单元,也就是语调变化赖以实施的基本单位及其所具有的特定的层次结构特征。
吴宗济[38]391-392在《试论普通话中韵律规则与其他若干学科中韵律规则的共性》中总结了他1981年到1997年的实验研究,提出:“普通话的韵律在语音学上是包括声调、重音、快慢和音步的节奏;在声学上是包括音高、音强、音长和停延的搭配。韵律的表现无论是在短语、在句子和在篇章中,都是以单字和短语为基本单元,这是所谓语调的底层结构。说话时根据需要,由若干个底层结构通过‘逻辑’(问答或祈使)或/和‘语气’(感情或责难)的韵律修饰,而构成语调的表层结构。”研究语句表层结构受环境支配的或然变量,就必须先掌握短语底层结构受生理、声学、音系规则支配的必然变量。吴宗济归纳出的短语的韵律规则包括单音节调型、双音节、三音节、四音节各短语的音节间连读变调模型,以及语音学、音系学、语法学的“三平面变调规律”、协同变调的“跳板规则”、逐级语法层次的“多米诺变调规则”等。这些短语的多音节连读变调模型反映了词义和语义的差别;而句调则是由短语调群的调阶的变化以及调域的展缩构成的,传递着语法和语气的信息。在诸多学者对于协同发音现象的研究中,吴宗济的阐述是最为详尽和系统化的,并在言语工程中验证。
曹剑芬[41]在《语言的节奏》一文中总结了其1991年到1999年的实验研究,认为“从功能的角度看,节奏组织是跟话语的产生和感知相关的组块分合策略”。指出言语中的节奏单元是一个层级系统,并确定了这个层级系统的三个层面。“汉语普通话的节奏可以大致分为三个基本层次。如果借用一般韵律音系学的术语,那就是韵律词、韵律短语和语调短语。”“韵律词是最基本的节奏单元,通常由两或三个音节组成”,也可以由单个音节充当(音长拉长)。“韵律词内部各个音节之间的关系非常紧密,是某些音系过程作用的最小范围,连读变调通常就在此范围内发生。”韵律短语是中等节奏组块,作为语音、句法和意义结合的包块在言语的生成和感知的过程中发挥作用,是言语里最常用和最重要的节奏组块。“语调短语是言语里的大节奏群”,通常由若干韵律短语(至少由一个韵律短语甚至一个韵律词)构成,一般对应于句法上较短的句子。“语调短语是句调信息的基本载体,话语的不同语气特点通常体现在语调短语上。”曹剑芬在确定了节奏单元的各个层级后,还指出:“每一个节奏层面都有独特的、韵律上的内聚特征和分界标志”,“体现为一定的时域和频域的声学语音学参量变化模式,而且以一定的层级方式起作用”,“节奏上的凝聚性和分界性,反映语言学单元之间在语义关系上的松紧程度”。曹剑芬主要关注音长(时长)要素对节奏组织的贡献,认为节奏本质上是信息时域分布的规律性模式或规则,主要通过规律性的音节时长伸缩和停延分布来实施。
沈炯[19]不仅将音域双线模型理论用于分析句调,还用来分析节奏单元的韵律特征。他的实验结论为分析节奏单元的内部特征和分界标记提供了更加清晰的思路,不仅关注时长的停延,也关注音高曲线的变化。“汉语的节奏形式主要跟音节时长的组合和声调音域低音线调节有关”。节奏单元的末了一个音节可以加长,声调的低音点一般要低一些,如果没有低音点而有中音点的,就用中音点下移来实现节奏调节。节奏单元后还可能有停顿或间顿。“节奏单元里不在两头位置的音节,如果语势较弱,就可能轻化”,音高起伏变小,甚至变成前后音节间的过渡音高。“在大词组和句子中,节奏单元有套叠关系,表现出层次性。”节奏重音是大音段相呼应的有声手段,它区分大音段,又把它们联结在一起,起的是多层括号作用或标记作用。“节奏单元内部音节之间的节奏特征为紧,节奏分界面上是不同等级的松”。
在确定了节奏单元的三个层面后,在发现节奏单元在时域和频域的韵律特征的表现后,语音学者们开始了更为深入的研究,比如杨玉芳[42]研究朗读语句中不同等级的句法边界与邻近音节的韵律学参数和边界处停顿时长之间的系统关系,发现边界前音节的时长和停顿之和随边界等级提高几乎是线性增长;边界前音节时长随边界等级的变化是双向的,在短语边界处达到最大;停顿在大的句法边界处增长很快。边界前音节基频值随边界等级提高而下降,音域逐渐收缩。王蓓等[43]研究韵律层级结构边界的声学表现,也提出汉语语句音高的重置由音域下限的移动来实现。韵律词边界的声学线索是低音线的不连续性和边界前音节的延长,一般没有无声段。韵律短语和语调短语边界的声学线索除了低音线的重置外,还有无声段。随着边界等级越高,低音线重置程度越大,无声段的长度越长。
曹剑芬等[44-45]通过研究发音增强与减缩的语言学动因及语音学机理,指出发音的增强和减缩是韵律结构的另一个重要标志,不但体现了自然话语的结构信息,也揭示了言语产生的计划机制。汉语里的发音增强具有规律性:“边界前的音段发音以音节的韵母的增强为主,边界后的音段发音以音节的声母的增强为主,重音的发音增强则平衡地发生在声母和韵母上,具有相对稳定的区别性特征。增强的程度随着边界或重音等级的提高而累加。韵律边界位置导向的发音增强比重音导向的更为突出。两者之间也是一种并存叠加的代数和关系。”
从上述实验研究的结论可以发现,言语节奏的韵律编码是有层级的,韵律词作为最基本的节奏单元,是言语中句子的最底层的结构,这些最初的静态备选单元其内部的凝聚性最强,协同发音的连读变调通常在此范围内发生。在言语结构中,这些基本单元为表达信息,又因语义、语用的联系而组合成了更大的、更高层次的节奏单元,连读变调也许不会跨越韵律词边界发生,但较长节奏单元中不在首尾位置的音节也可能因语势弱化而轻化,时长也会相应缩短,这也是内聚特征的表现。另一方面,因为节奏单元以组块出现,自然存在着边界标记,主要表现为节奏单元最末音节的时长加长、音高曲拱最低。而边界后另一节奏单元的首音节因发音增强出现了音高重置,就导致了句子低音线的不连续性。这种音高重置和低音线的不连续性是节奏单元频域,也就是音高方面的边界标记,在时域也就是音长方面的边界标记除了边界前音节的延长外,还有无声段的停顿标记,边界等级越高,无声段越长。因而有无无声段及无声段的长短,也就成为了节奏单元等级的时域标记。节奏单元之间因无声段标记形成的或紧凑或松弛的特征,也反映着语义联系、信息的结构,比如话题和述题之间都会出现无声段。除此之外,重音也是节奏单元内部以及节奏单元之间表达语义、语用关联的标记。
作为言语交际中说话人最想传达的内容,信息焦点是信息结构理论中极为重要的概念。Halliday[1]认为,焦点是说话人在语句中标记出的、希望听话人解读为信息重心的部分或全部信息块。在印欧语言中,音高重音常被作为句子焦点的语音标记。根据Halliday对新信息的界定,断言的焦点可分为三种:无法推测出的新信息焦点、反驳选项形成的对比焦点以及答复疑问项的识别焦点。Halliday等[46]也用调核重音的内嵌规则来表达焦点,“重音落在焦点词项中的最后一个重读音节上”。并将焦点进一步二分化,位于句末的是“常规焦点”,位于其他位置的是“标记焦点”。一个信息单位可以只有一个焦点,也可以有一个主焦点加次焦点,相应的,句子有一个主重音,或有一个主重音加次重音。
Lambrecht[4]206-321通过分析多种语言的焦点结构,首先把句子的焦点分为“宽焦点”(broad focus)和“窄焦点”(narrow focus)。窄焦点的辖域只有一个成分,即“论元焦点”,对应着Halliday提出的标记焦点。宽焦点的辖域为一个以上的成分,包括“谓语焦点”和“句子焦点”,与Halliday提出的常规焦点有相似性。Lambrecht指出句子成分是否重读由所指的激活状态与它和整个命题的语用关系决定。
曹剑芬[47]把汉语的重音大致分为两大类:语法重音(句法重音、自然重音、节律重音)和逻辑重音(对比重音、强调重音)。语法重音出现的位置比较有规律,所以也叫常规重音,也就是Halliday提出的常规焦点的重音。而逻辑重音是说话人因为对比、反衬等需要,用以突出想要强调的语义信息而设置的重音,也就是Halliday提出的标记焦点的重音。
通过不断深入的实验研究发现,汉语中焦点重音,特别是标记焦点/窄焦点的重音的韵律特征主要表现为音高、音长和音强的规律性的变化。赵元任[15]23-26认为,轻声是弱重音,既没有弱重音又没有对比重音的音节就是正常重音。“对比重音不同于正常重音,在于它的音高幅度更宽,持续时间更长,音强通常也增加。”沈炯[48]提出,在陈述句中,表义中心音域上限往往很高,表义中心最后一个正常重音之后,音域上限突然下落。音域上限的提升以及随后的落差造成鲜明的听感。这是在整个句子范围内的对比手段。语势重音的音高表现为“高音线单方面向上的调节,如果低音线不变的话,它就使声调音域向上扩张”。Xu[49]进一步提出,焦点音节的调域向上、下两个方向扩展,向上扩展最为明显。焦点后面的音节,一律显著降低和压缩。王蓓等[50]对比研究了话题和焦点的韵律编码方式,发现焦点使音域扩大,话题表现为音域的抬高;焦点后发生音高骤降,但话题后的音高是缓慢下降的。贾媛等[51]通过声学和感知实验考察普通话焦点重音对语句音高(F0)的作用,研究的主要发现是焦点处所有音节H调的F0均被显著抬高,而L调受焦点重音影响不大。焦点重音对前音节的F0作用不明显;对后接音节F0的作用主要体现在将阴平和阳平的H调显著压低。焦点重音的作用范围可延伸至句末。制约焦点重音分布的底层原因为焦点成分所含H调的数量。陈怡等[52]考察了普通话强调焦点句的语调,发现强调焦点所在的词调域最大化扩展,覆盖全部语句调域。焦点前词调域音高相对稳定,焦点后词调域大幅收窄,呈现明显下倾。林茂灿[24]的实验结论是窄焦点重音是音高突显,音域加大,时长往往长。相对来说,宽焦点重音是音高清晰、明显,后词音高的高点不会比前词高,低点逐渐下降,最后一两个音节音域较大,时长较长。秦鹏[53]从音高、音长、音强三个方面比较了自然焦点句和强调焦点在句首、句中、句末位置以及全句的焦点句的语调模式,发现调域、停延率和音量比的最大值都出现在焦点位置的韵律词上。总结这些焦点重音的韵律特征,共同点是重读音节的调域扩展,主要是调域上限向上抬高,后接非重读音节的调域上限相对压低,调域收窄;重读音节的时长往往加长。不过,这些韵律特征表现出的程度会随着重音等级的不同而增减。举个例子,典型SV、SVO的句式里,常规焦点在句末的动词或宾语上,语法重音所在的词调域上限即使抬高也不会比前词高,调域扩展又较难为人耳感知,加之时长的延长又与边界调重合,使其重音的表现“隐形”,往往给人无焦点的感觉。不过,一旦成为标记焦点加上逻辑重音后,词调域上限明显提升,调域扩展度更大,时长更长,即可为人耳识别。如果标记焦点出现在句首或句中,焦点后词调域上限骤降,调域收窄,因此而形成的音高显著落差就成为了人们判断重音的重要指标。换句话说,窄焦点或者说标记焦点带有的逻辑重音的韵律编码的凸显程度要大于宽焦点或常规焦点带有的语法重音,因而更容易被听话人所感知。
不管是常规焦点的语法重音,还是标记焦点的逻辑重音,对节奏基本单元里的词重音往往不只表现为重合与叠加,还可能表现为迁移。以双音节韵律词为例,很多学者(比如赵元任、林茂灿、杨顺安、王韫佳、王蓓等)都注意到在非句末一般为前重,在句末一般是后重。这主要就是因为在节奏单元内首音节发音增强,使人在听感上形成了前重的印象;但在句末则不同,常规焦点与边界调的叠加,使得末字更为凸显,才给人以后重的听感印象。逻辑重音对词重音的迁移效应更为突出,只要后音节形成对比或需要强调,前音节就弱化了。
端木三[54-55]提出的汉语重音规则为:双音节词(包括双音节语法单位)、多音节词(包括1+2复合词)重音在第一音节;句末(停顿前)的双音节词重音可在第二音节;语重音规则(辅重原则)为辅助词有重音,中心词无重音。端木三[56]还提出“信息-重音原则”,即每个语言都有语句重音,而且都遵循同一条原则,信息量大的词重读,信息量小的词不重读。端木三总结的汉语重音规则可以看作常规的语法重音的规则,但他提出的信息-重音原则却可以解释各种重音现象,可以说是为言语结构中的重音的凸显找到了一种根本性的生成机制,并可以形成一种计划机制。语句中的重音分布本质上受语义结构的制约,受信息量大小的制约。这已经通过实验,得到了一定程度的证明。比如,王丹等[57]通过实验发现,新信息重读、旧信息不重读时,听者理解的反应时间较快;如果二者不匹配,理解的时间就会出现延迟。这表明新信息和重音之间的匹配关系有助于听者的口语理解。李晓庆等[58]也通过实验发现重读与信息结构的关系确实会影响到语篇的即时加工。语篇理解中的重读效应,不仅是由于重读能调控听者的注意力分配,更重要的是重读的有无传达着不同的信息加工方式。
综上所述,言语中句子的韵律特征主要包括语调、节奏和重音三个方面,在声学上表现为音高、音长、音强等要素的协调变化。在交际过程中,句子中各音节的声韵调与韵律并行编码才能把信息结构准备完整地表达出来并传递给听话人。
功能语调的韵律特征为言语中的句子确立了逻辑、口气和情感表达的基调,目前的实验研究大多以音高为主要关注点,调阶和调域是功能语调韵律编码的主要控制参数。
节奏单元的层级结构表现出内聚特征和边界特征。基本单元内部发生连读变调是底层结构中静态备用单位内的必然变量,具体语境中叠加上功能语调和重音的凸显,形成了言语中句子表层结构的或然变量。节奏单元的边界标记有时域和频域两方面的表现,边界等级越高,边界前音节的时长越长,无声段出现或越长,音高曲拱越低;而且,边界后音高重置越高。调域(高音点、低音点)与时长是节奏韵律编码的主要控制参数。
重音的韵律特征主要表现为凸显,是一种相对化的调节。重音等级越高,重读音节的调域越大,高音线抬高越显著,时长越长,振幅面积越大。相对地,其后弱读音节调域上限压低,时长缩短。调域(高音点)、时长、强度(振幅)是重音韵律编码的主要控制参数。
说到言语中句子信息结构的韵律编码,还得介绍一下许毅[59]提出的PENTA(parallel encoding and target approximation)模型,其理论基础就是言语的发音-功能观(articulatory-functional view of speech)。也就是言语通过发音机制对于交际功能实施并行编码。目标接近(TA理论)是基本的发音机制,也就是声调(包括轻声)通过与音节同步的音高目标来实现。因此该机制的各个控制参数,除了调域、强度、时长等,音高目标(target)也是交际功能编码的基本参数。言语的信息结构通过目标接近实施并行编码,焦点、新话题通过调整局部目标的调域来体现,多种表意功能在基频中同时、平行存在,表面的整体倾向来源于多种相互独立的因素。许毅提出的PENTA模型比较适合对汉语语调特别之处的考察。
因为汉语学界对信息结构的研究起步稍晚,语法学界对信息结构的理论还有很多概念未达成共识。句法层面对信息结构的关注较多,语音层面、韵律层面的关注度不足,比如话题结构、名词性成分的可识别性和活动状态,信息单位与节奏单元层级结构的关系等。总之,言语信息结构的韵律编码只是信息结构的语言编码的一部分,汉语的词序、虚词、句式等也是信息结构编码的重要方面,也有着独特的韵律分布模式,这都需要大量的声学实验提供韵律编码的各项参数。