诵读音声的采录与韵律特征分析

2018-05-07 08:34宁威林刘亚丽
关键词:音声调子基频

宁威林,刘亚丽

(中国传媒大学 传播声学研究所,北京100024)

1 引言

“诵”是一种运用声音的韵律、节奏变化来达到记忆的方式[1]。“读”涵盖“诵”的内容,更关注对内容的感悟与理解[2]。所以在秦汉前“诵”和“读”分开使用,然后才有“诵读”的合称[3]。广义的诵读音声,包括古代诗词的吟诵,当今校园朗朗读书声,流行音乐说唱,伊斯兰教的宣读和佛教寺的诵经等。

佛教初期对于世俗音乐的享受是禁止的,所以诵读音声不同于市面流行的佛教音乐,不在于发音技巧或哗众,而是以至诚心,使用介于言语和歌唱的形式诵读佛教的经文和咒语[4-5]。该音声于公元前6世纪,随佛教一起进入我国,以口传心授的方式传承至今,具有神圣性、宗教性,是为宣扬佛法教义和专门修行的法门。所以本文采集的素材不包括佛教音乐。

韵律凌驾于语义之上,是对语音流表达方式的结构性安排,决定语音是否听起来自然顺耳、抑扬顿挫等。该特征的情感区分能力已得到语音情感识别领域研究者们的广泛认可和使用,常用的韵律特征有基频、音高、能量、时长等[6-9]。目前对于诵读音声的学科分析还有欠缺。本文从实验语音学的角度,以信号处理的手段,对其进行韵律学特征的提取和分析。

2 诵读音声的采录

寺庙的朝暮课诵是每日修行必做的法事仪轨,所以素材主要针对朝暮课诵,并兼具个别经咒的诵读。

参与录音的诵读者为出家僧众,均具备丰富的诵读经验。朝暮课诵录音地点为寺庙大殿,个别经咒录音地点不限制,以安静适宜为原则。

3 诵读音声的特征分析

本文根据诵读音声的特点,对其提取韵律学特征。

人工听辩素材,将其分三类:

(1)调子:诵读者使用固定的调子反复循环的诵读,类似于音乐单一的旋律循环;

(2)平调:诵读者使用平调诵读,类似于言语无情感的陈述;

(3)调子接平调:上述两者的结合,先调子循环后接平调诵读。

由于调子接平调类型兼具其余两类的特点,所以下文仅对该类素材进行特征提取和分析。

3.1 基频统计分析

基频决定语音的语调。可通过时域短时自相关函数计算出基音频率。

式中k是自相关滞后时间,m表示短时自相关函数所处理的信号帧序列。

图1 调子基频图

图2 平调基频图

图1为调子接平调类型中固定调子单次循环的基频图(横轴代表时间,纵轴代表频率),图2为后接平调部分的基频图。先对前部分的调子类型进行统计分析,再对后接平调部分统计分析,后续各特征类似。

使用软件Praat,人工听辩,手动切分,以调子一次循环为单位,按时间顺序统计基频均值、基频最大值和基频最小值如图3(横轴代表以时间顺序排列的调子编号,纵轴代表频率,大代表基频最大值,小代表基频最小值,均代表基频均值,黑线为多项式拟合趋势线,后续各图类似)。

图3 调子基频均值、基频最大值和基频最小值

对图3数据计算均值和标准差结果如表1。

表1 调子各基频均值和标准差(Hz)

观察图3和表1可知:无论是基频均值、基频最大值还是基频最小值,数据波动很小,趋势平稳,趋势线几乎呈平行直线。

对图3的数据和基频范围,4组数据进行相关性分析如表2(大代表基频最大值,小代表基频最小值,均代表基频均值,范代表基频范围,后续各表类似)。

由表2可知,各类基频彼此相关性极低。基频均值和基频范围都由最大值和最小值计算得到,但由于是固定的调子(图1)循环,所以各类基频和基频范围基本互不影响。

表2 各基频和基频范围的相关系数

具体过程与上述类似,统计后接平调部分各音节的基频均值、基频最大值和基频最小值如图4:

图4 平调音节的基频均值、基频最大值和基频最小值

对图4数据计算均值和标准差结果如表3。

表3 音节各基频均值和标准差(Hz)

观察图4和表3可知:数据在一定范围内波动,基频最大值和基频均值趋势均略有下降,基频最小值略有提升,总体而言各基频趋势较为平稳。

相关性分析结果如表4。

表4 各基频和基频范围的相关系数

基频最大值和基频均值显著相关,基频最小值和基频均值中都相关,其余均为极低相关性。

3.2 音高统计分析

为比较单个调子和素材整体以及部分间的音高分布情况,把素材整体按时间平均分为前、中、后三部分,并随机选取单个调子和素材整体,对上述5者提取音高如图5(横轴代表音高,纵轴代表归一化的能量值,单代表单个调子,整代表素材整体,依此类推)。

图5 调子各部分音高分布

对图5数据进行相关性分析,结果如表4:

表5 调子各部分相关系数

观察图5和表5可得:各部分音高分布相同,主要集中在D和E两处。

统计平调的整体、前、中和后音高分布,如图6。

图6 平调各部分音高分布

对图6数据进行相关性分析,结果如表6:

表6 平调各部分相关系数

从表6系数可知:各部分之间音高的分布相同。

观察图5、6发现音高分布类似,对其进行相关性分析,相关系数0.92(显著相关)。

从音高分布来看,调子循环和平调两部分音高成分少,且分布相同,所以诵读音声并不具有歌唱丰富音高,而更接近语言性的特点。

3.3 能量统计分析

能量体现信号强弱,可对应诵读者所发声音的大小情况。对于某一帧语音数据,能量等于该帧语音数据的采样值的平方,如下式:

(1)

按时间顺序统计逐个调子的能量最大值、能量均值、能量最小值,如图7。

图7 调子能量最大值和最小值

对图7数据计算均值和标准差结果如表7。

表7 调子各能量均值和标准差(dB)

观察上述统计结果可知:能量最小值的趋势从开始到结束有约为5dB的增加,能量最大值和能量均值趋势平稳。体现出诵读者对每个调子的发音力度下限随时间略有提升,上限和均值稳定不变。

对图7数据进行相关性分析,结果如表8:

表8 各能量和能量范围的相关系数

观察表8可知:除了能量最小值和能量范围极高度相关外,其余彼此均为中度相关。

统计平调部分各音节的能量最大值、能量均值、能量最小值,如图8。

图8 平调能量最大值和最小值

对图8数据计算均值和标准差结果如表9。

观察图8和表9可知:能量最小值的趋势从开始到结束有约3dB的增加,能量最大值和能量均值趋平稳。总体而言体具有和前述调子能量近似的特点。

表9 平调各能量均值和标准差(dB)

对图8数据进行相关性分析,结果如表10:

表10 各能量和能量范围的相关系数

观察表可知:除了能量最小值和能量范围极高度相关外,其余彼此均为中、低度相关。与前述调子能量的特点近似。

3.4 时长统计分析

时长的特点可体现诵读语速的快慢。

图9 调子时长

统计逐个调子的时长,如图9。由于每个调子内音节数不一定相同,虽然时长趋势是逐渐下降,但会出现图3中调子编号29和30等,时长增加的情况。

咨询相关人士了解到,每个调子内诵读的音节数,是口传心授约定俗成的结果,不同寺庙间各不相同。

图10 调子内音节平均时长

在图9的基础上统计每个调子内音节的平均时长如图10。时长趋势平滑下降,音节时长均匀递减。表明诵读节奏由慢变快,语速缓缓加快。

图11 调子内每秒音节数

在图9和10基础上统计调子内每秒诵读的音节个数,如图11。

对上图9、10和11数据计算均值和标准差结果如表11。

表11 调子时长和音节数均值和标准差(s)

每秒240-360音节/分钟,属于正常语速[10-11],即每秒4.0-5.7个音节。所以调子循环部分整体而言,语速明显慢于正常语速。

统计平调部分音节时长和每秒音节数如图12、13。

图12 平调音节时长

图13 平调部分每秒音节数

对图12和13数据计算均值和标准差结果如表12。

平调部分延续了调子部分语速缓慢加快的趋势,以正常语速开始,最终以略快于正常的语速结尾。

表12 平调时长和音节数均值和标准差(s)

3.5 讨论与分析

综合上述对诵读音声韵律学特征的提取和分析,得到调子循环部分与后接平调部分虽然类型不同,但是却具有近似的特点。换言之,后接平调延续了调子循环的特点,使得两者顺利地过度,从而构成了完整的诵读音声。总体而言该音声具有语调平稳,旋律单一固定,诵读者发音平和,节奏由缓慢到略快的特点。

在乐理知识中旋律分为上升式、水平式和下降式。水平式的音高走势平稳,旋律节奏缓慢,表现安静祥和的气氛[12]。可以说诵读音声中调子循环部分近似水平式的特点,所以易给人安静放松的感觉,这也基本符合通常人们对该类音声的主观感受。

前人对诵读音声的研究多定性的描述:用咏诵的形式来表达,近语言性,并且速度较快[13]。半讲半唱的语调旋律,音调平稳[14]。听起来可使人安静平和。旋律流畅、基调稳重、和声简洁、曲式短小[15]等特点。通过本文定量的分析,结论基本符合上述描述。

[1]许慎,段玉裁.说文解字注[M].上海:上海书店出版,1992,91.

[2]张心科.论诵读的内涵、意义及要求[J].教育学报,2009,(5):60-65.

[3]周庆元,于源溟.诵读法的历时演化与现时解读[J].中国教育学刊,2004,(10):46-48.

[4]伏俊琏.汉译佛经诵读方式的来源[J].敦煌研究兰州,2002,(2):95-97.

[5]邹燕凌.论佛教音乐的宗教功能[J].求索,2006,(2):167-169.

[6]Caminos L,Garcia-Gonzalez A,Gonzalez-Herrera A.Numerical Analysis of the Influence of the Auditory External Canal Geometry on the Human Hearing Response[C].AIP Conference Proceedings-American Institute of Physics,2011,1403(1):515.

[7]Schroder M,Cowie R.Issues in emotion-oriented computing—Towards a shared understanding[J].Proc of the 2006 Workshop on Emotion and Computing,Hannover:IEEE Computer Society,2006,865-868.

[8]Lee C M,Narayanan S S.Toward detecting emotions in spoken dialogs[J].IEEE Trans on Speech and Audio Processing,2005,13(2):293-303.

[9]Luengo I,Navas E,Hernaez I,Sanchez J.Automatic emotion recognition using prosodic parameters[J].Proc of the 2005 INTERSPEECH,Lisbon:ISCA,2005,493-496.

[10]朱莹堃.央视春晚33年主持人语速流变[J].新闻知识,2015,(9):93-95.

[11]穆佳帅.有声语言表达方式的语速研究[D].西安:西安工程大学,2014.

[12]赵健谕.语音情感识别方法研究[D].辽宁:辽宁大学,2011.

[13]张阳.大相国寺仪式音乐研究一以浴佛节和朝暮课诵仪式为例[D].天津:天津音乐学院,2013.

[14]李姣.峨眉山佛事梵呗探微—以伏虎寺为例[J].中央音乐学院学报,2007,(7):76-86.

[15]邹燕凌.论佛教音乐的宗教功能[J].求索,2006,(2):167.

猜你喜欢
音声调子基频
语音同一认定中音段长度对基频分析的影响
文化中的乐种研究
——评陈辉《浙东锣鼓:礼俗仪式的音声表达》
基于时域的基频感知语音分离方法∗
桥面铺装层对中小跨径桥梁基频影响分析
诗意远方
最具魅力
45000kHz基频晶体滤波器
论素描教学中的之一现象
画出一抹紫调子
呼和浩特大召寺音声的实地考察