性别、文本材料及母语方言对普通话长时平均言语频谱图的影响

2016-10-19 06:59胡旭君张巩李芳芳刘国益金晨洁
听力学及言语疾病杂志 2016年5期
关键词:轮廓母语普通话

胡旭君 张巩 李芳芳 刘国益 金晨洁



·临床研究·

性别、文本材料及母语方言对普通话长时平均言语频谱图的影响

胡旭君1张巩1李芳芳1刘国益1金晨洁1

目的探讨不同性别、文本材料、母语方言对普通话长时平均言语频谱图(long-term average speech spectrum, LTASS)的影响,为LTASS应用于临床听力学及科研提供参考。方法选择官话、吴话、湘语、赣语、客家话、闽北话、闽南话及粤语8大方言区的160例受试者,各方言地区10男10女,年龄16~30岁,平均22.3±3.25岁,每例受试者按要求在标准隔声室内用平稳语速与音量的普通话通过B&K(4192)麦克风朗读语音材料(包括新闻和小说两类),由实时频谱分析仪(B&K PULSE3560C)提取所需要的频率和强度并作记录,绘制出普通话LTASS并统计分析其在不同性别、文本材料及母语方言之间的差异。结果绘制得到普通话LTASS图,进行轮廓分析(α=0.05),语言材料对LTASS无影响,差异无统计学意义(F=2.52,P=0.11);性别(F=116.39,P=0.00)、母语方言(F=1.29,P=0.02)对LTASS有影响,男性在100、125、160、200 Hz频率发音强度高于女性,粤语区普通话LTASS整体输出强度低于其他方言普通话。结论普通话LTASS应用于临床及科研中需要考虑性别和不同地域因素的影响。

普通话;性别;方言;平均频谱

长时平均频谱是语音短时频谱的长时间平均[1]。正常人的言语声在强度和频率上都有一定的波动范围,记录一段长时间言语会话,稳定后分析其强度变化范围及其与频率的关系,称为长时平均言语频谱(long-term average speech spectrum,LTASS),将所得的各个频率LTASS值均增加12 dB和下降18 dB所获得的区间范围,代表长时言语的动态范围,将该言语范围投射于听力图中,便可估计不同听阈曲线对言语的可听度。助听器验配公式,如:期望感觉级(desired sensation level,DSL),便是利用LTASS数据来预估最佳增益,通过比较LTASS曲线与放大的目标曲线,可以直观地了解听障患者对助听器的声放大需求,以帮助患者在动态范围内获得良好的可听度、舒适度和清晰度[2]。

1994年Byrne等[3]关于多国语言LTASS的研究认为其差异性小,建议使用统一的LTASS图;现阶段我国采用的多为英文LTASS;但该研究也承认由于结果受到受试者、实验数据收集方法等因素影响,不能排除差异性的存在,且至今很多国家都已经找出了自己的言语平均频谱[4],例如:Heil Noh和Dong-Hee Lee(2012)[5]通过对比英语LTASS绘制出了符合韩国语音的LTASS。普通话是我国官方语言,应用广泛,而且我国幅员辽阔,有8大方言地区,不同方言区域的普通话LTASS有无一定差异,尚未见报道。故本研究拟通过分析不同性别、文本材料及不同方言区域等因素对普通话LTASS的影响,探讨汉语普通话LTASS的差异,绘制出以汉语普通话语音结构为基础的普通话LTASS,为我国临床听力学及科研提供参考。

1 资料与方法

1.1研究对象受试者为160例年龄16~30岁的正常青年人,平均年龄22.3±3.25岁,能流利使用汉语普通话,吐词清晰;分别来自汉语8大方言地区,分别为官话地区(以北京话为代表)、吴话地区(以苏州话和上海话为代表)、湘语地区(以长沙话为代表)、赣语地区(以南昌话为代表)、客家话地区(以梅州话为代表)、闽北话地区(以福州话为代表)、闽南话地区(以厦门话为代表)、粤语地区(以广州话为代表)[6],每地区20例,10男10女,无发音及智力障碍。

1.2文本材料从汉语普通话等级考试材料中选择一篇小说和新闻作为测试材料(见附录),文章内容相对容易阅读,普通话各声母、韵母都有涉及且分布相对均匀,无过多的重复[5];且文章长度对于大多数人大约需要120秒的朗读时间[7]。

1.3普通话LTASS测试测试前请受试者默读一遍文本材料。隔声室的噪声水平低于30 dB SPL,麦克风(B&K 4192)放置在朗读者正前方,距受试者30厘米[5];要求每位受试者以正常舒适的速度和音量用普通话朗读小说和新闻材料各两遍并分别记录,计时90 s后停止。受试者在朗读30 s左右时,LTASS的记录趋于稳定,由实时频谱分析仪(B&K PULSE3560C)提取所需要的频率和强度并作记录。记录参数设置:带宽为1/3倍频程,频率范围为100~10 000 Hz,平均时间为90 s,最大输入峰值为7.071 V[5,7]。在语音分析结束之后,绘制出以频率为横坐标、强度为纵坐标的普通话LATSS。

1.4统计学方法采用SPSS16.0统计软件,使用轮廓分析(profile analysis)[8]进行统计学分析,P<0.05为差异有统计学意义。

2

结果

2.1汉语普通话LTASS特征图1是根据160例8种母语方言受试者所得数据绘制出的汉语普通话LTASS图。根据LTASS定义,言语包络具有30 dB的变化范围,即每一频率LTASS强度向上延伸12 dB,向下延伸18 dB。语音信号中从250 Hz至4 000 Hz输出曲线平稳,低于250 Hz的低频输出降低了约20 dB,高于4 000 Hz的高频输出降低了约15 dB。

图1 160例8种母语方言者的汉语普通话LTASS图

2.2不同文本材料对普通话LTASS的影响160例受试者用普通话分别朗读小说和新闻稿时各频率的声强比较见表1,文本材料分别为新闻稿和小说的普通话LTASS图见图2;根据轮廓分析,两种文本材料的普通话LTASS差异无统计学意义(F=2.52,P=0.11),即不同语言材料不影响普通话LTASS。

2.3性别对普通话LTASS的影响160例不同性别受试者普通话LTASS各频率声强均值比较见表2,男、女普通话LTASS图见图3;通过轮廓分析中的水平轮廓检验和重合轮廓检验分析,男性和女性在100、125、160、200 Hz各频率比较差异有统计学意义(F=116.39,P=0.00),即性别对普通话LTASS有影响。

表1 普通话LTASS各频率不同文本材料的声强均值比较

图3 男女普通话LTASS图

表2 普通话LTASS各频率男性及女性的声强均值比较

注:*与女性比较,P<0.05

2.4不同母语方言对普通话LTASS的影响8个方言地域受试者的普通话LTASS各频率的声强均值见表3,绘制的不同母语方言者的普通话LTASS见图4;通过轮廓分析中的水平轮廓检验和重合轮廓检验,即:不同母语方言对普通话LTASS有影响(F=1.29,P=0.00),主要集中在官话区、湘语区、赣话区、闽北区、粤语区、闽南区之间(表4)。

图4 不同母语方言者的普通话LTASS

3 讨论

根据LTASS定义,言语包络具有30 dB的变化范围,即每一频率LTASS强度向上延伸12 dB,向下延伸18 dB。一般认为,这个范围可以覆盖大多数言语声,可以对一般强度的言语声在各频率所能听到的部分进行有效的描述[9],并且可以用于评估助听效果[2];对助听器的输出进行客观评估的真耳分析设备上,当输入55 dB SPL(小声)、65 dB SPL(中声)、75 dB SPL(大声)测试声时,助听器会对应地出现三条输出曲线,将这三条曲线与助听器处方公式(比如NAL-NL2)的目标输出曲线进行比较,就能了解助听器的实际工作情况。

本研究结果显示,不同母语方言者普通话阅读新闻和小说所绘制的普通话LTASS差异无统计学意义,即文本材料的选择对普通话LTASS无明显影响,这与Cox和Moore(1988)[7]和Heil Noh和Dong-Hee Lee(2012)[5]得出的研究结果一致,表明LTASS不受语言材料的限制[10]。

表3 各频率不同母语方言者普通话LTASS的声强均值比较(dB ±s)

表4 不同母语方言者普通话LTASS组合差值对比

注:*P<0.05

从性别对普通话LTASS的影响看,本组对象男性与女性在整体的LTASS数据分析中差异有统计学意义(F=116.39,P=0.00),与前期其他学者研究结果相一致[11,12]。黄昭鸣[13]等研究表明,国人成年男女的嗓音基频分别为125 Hz和230 Hz左右,男性比女性的基频低;而从本研究所绘制LTASS图中可以发现,在250 Hz以上各频率男、女性基本重合,而在250 Hz以下频率男女之间有较大的差异,故认为这一结果可能与与男女性发声的基频有关。因此,在临床应用中,对于不同性别助听器使用者,可以针对低频适当修改增益。

近年来,口音问题在语音识别领域受到越来越多的关注,地域性的带口音的普通话称之为方言普通话。受方言的影响,一般人的普通话或多或少都带有一定的地域特征[14]。我国有八大方言区,分为官话区、吴语区、湘语区、赣语区、客家话区、闽北话区、闽南话区、粤语区[6],因此,本研究纳入了这8大方言地域者,以探讨不同地域汉语普通话对LTASS是否有影响;从文中结果看,根据轮廓分析(平行轮廓检验和重合轮廓检验)得总体轮廓分析(F=1.29,P=0.02)绘制的普通话LTASS,差异有统计学意义,主要表现在200~4 000 Hz各频率强度有差异。同时行两两对比轮廓分析显示,大部分地域母语方言者普通话LTASS之间差异无统计学意义,只有官话区与闽北区、闽南区、粤语区,客家区与闽南区、粤语区,闽北区与粤语区母语方言者普通话LTASS之间有显著性差异。造成此现象的原因可能是方言带有一定的口音,我国幅员辽阔,不同方言在元音频率上的差异,造成了LTASS之间的差异性。有学者研究发现,不同语言会有不同的元音和频率(共振峰结构不同),从而会引起音素不同的变化[3]。另外,也可能与受试者的发音习惯有关。

综上所述,本文通过对汉语普通话LTASS的初步研究,绘制出普通话LTASS图谱,有助于临床工作者更好地理解和应用LTASS,为临床和科研提供参考。同时,临床工作者在向患者解释LTASS时,还需考虑性别和地域因素对LTASS的影响。

1王宏,向大威.基于长时平均频谱的“文本无关”话者识别[J].声学技术,2002,21:59.

2Brian CJ. The value of speech mapping in hearing aid fitting[EB/OL]. http://www.otometrics.com/,2008.

3Denis B, Harvey D, Khanh T, et al.An international comparison of long-term average speech spectra[J]. J Acoust Soc Am, 1994, 96:2108.

4杨伟,沈勇,刘紫赟. 汉语普通话平均频谱[J].南京大学学报,2012,48:40.

5Noh H, Lee DH. Cross-language identification of long-term average speech spectra in Korean and English: toward a better understanding of the quantitative difference between two languages[J]. Ear& Hearing, 2012, 33:441.

6熊正辉,张振兴.汉语方言的分区[M].北京:人民卫生出版社,2008.97~107.

7Cox RM, Moor JN. Composite speech spectrum for hearing aid gain prescriptions[J]. Journal of Speech and Hearing Research, 1988, 31:102.

8孙振求.医学统计学[M].第2版.北京:人民卫生出版社,2006.305~309.

9Katz J,著.韩德民,译.临床听力学[M] .北京:人民卫生出版社,2006.605~608.

10Benson RW, Hirsh IJ. Some variables in audio spectrometry[J]. Acoust Soc Am, 1953, 25: 499.

11Niemoller AE, McCormick I, Miller JD. On the spectrum of spoken English[J]. J Acoust Soc Am, 1974, 55:461.

12Mendoza E, Valencia N, Mufioz JD. Differences in voice quality between men and women: use of the long-term average spectrum (LTAS)[J]. Journal of Voice,1996,10:59.

13黄昭鸣,杜晓新,蔡红霞.平均言语基频的常模的制订及其相关研究[J].中国听力语言康复科学杂志,2005(2):26.

14刘林泉,郑方,吴文虎.基于小数据量的方言普通话语音识别声学建模[J] . 清华大学学报,2008,48:604.

(2015-11-30收稿)

(本文编辑周涛)

附录:

小说:一位访美中国女作家,在纽约遇到一位卖花的老太太。老太太穿着破旧,身体虚弱,但脸上的神情却是那样祥和兴奋。女作家挑了一朵花说:"看起来,你很高兴。"老太太面带微笑地说:"是的,一切都这么美好,我为什么不高兴呢?""对烦恼,你倒真能看得开。"女作家又说了一句。没料到,老太太的回答更令女作家大吃一惊:"耶稣在星期五被钉上十字架时,是全世界最糟糕的一天,可三天后就是复活节。所以,当我遇到不幸时,就会等待三天,这样一切就恢复正常了。"

"等待三天",多么富于哲理的话语,多么乐观的生活方式。它把烦恼和痛苦抛下,全力去收获快乐。

沈从文在"文革"期间,陷入了非人的境地。可他毫不在意,他在咸宁时给他的表侄、画家黄永玉写信说:"这里的荷花真好,你若来…"身陷苦难却仍为荷花的盛开欣喜赞叹不已,这是一种趋于澄明的境界,一种旷达洒脱的胸襟,一种面临磨难坦荡从容的气度,一种对生活童子般的热爱和对美好事物无限向往的生命情感。

由此可见,影响一个人快乐的,有时并不是困境及磨难,而是一个人的心态。如果把自己浸泡在积极、乐观、向上的心态中,快乐必然会占据你的每一天。

新闻:一年前,奥巴马受到多方批评,其支持率曾一度下降到40%左右,美国失业率也达到8.5%。奥巴马在这种情况下赢得连任即使不说空前绝后,也十分罕见。他是自富兰克林·罗斯福(Franklin D. Roosevelt)之后,首位在2次大选中赢得50%以上选票的民主党总统。

2011年12月,奥巴马签署医改法案面临最高法院的挑战,受到共和党的无情批判。此外,奥巴马还与保守派共和党就税率和开支问题展开激烈争论,一系列财政问题甚至在年初导致美国信用评级被下调。

尽管下令击毙本·拉登(Osama bin Laden)和完成伊拉克撤军曾为奥巴马赢得不少人的支持,但奥巴马2014年从阿富汗撤离战斗部队的计划依然受到许多人批评。而在大选中,各种辩论给了其他候选人质疑奥巴马的机会,他的诋毁者称他是个失败者,批评他领导下的美国经济恢复缓慢。

可是一年后,奥巴马连本带利获得丰厚回报。他在大选中通过赢下关键州获得连任。2011年末,美国经济状况有所改善,并在2012年持续好转,失业率11月份下降到7.7%。这种缓慢而稳定的增长为奥巴马反击共和党提供了帮助,美国经济稳定增长是奥巴马在总统大选中击败对手的主要原因。

此外,奥巴马在外交政策方面的表现也超过对手,毕竟罗姆尼几乎没有解决国际问题的经验。在大选最后一段时间,奥巴马继续将自己塑造成机会平等、贫富差距缩小的代表。他暂停驱逐年轻非法移民的做法也为其赢得西班牙裔选民的支持,结束"不问不说"政策则博得了年轻人的好感。

The Effects of Genders, Language Material and Region on the MandarinLong-term Average Speech Spectrum

Hu Xujun, Zhang Gong, Li Fangfang, Liu Guoyi, Jin Chenjie,

(Hearing and Speech Science Department, College of Medical Technology, Zhejiang Chinese Medical University, Hangzhou, 310053, China)

ObjectiveTo study the Mandarin long-term average speech spectrum (LTASS), the effects of gender, language and region material on LTASS were explored. This research would provide reference for clinical and academic use of Mandarin LTASS.MethodsOne hundred and sixty subjects from eight major dialectic regions of China, aging 16~30 (average 22.3±3.3), were asked to read two materials (storybook, newspaper) in Mandarin at a steady speed and conversational level inside a standard soundproof booth. Ten males and ten females were in each dialectic region. A microphone (B&K 4192) was used to monitor each subject's speech which was analyzed with a real-time spectrum analyzer to obtain the long-term spectrum (B&K PULSE 3560C).ResultsDifferent Mandarin LTASS spectra were obtained based on gender, material and regions. The spectra were tested with profile analysis. Language material had no significant effects on the Mandarin LTASS (F=2.52,P=0.11). There was, however, significant gender difference (F=116.39,P=0.00). Males had spoken with intensity levels higher than females at 100 Hz to 200 Hz. There was also a dialectic difference in the Mandarin LTASS (F=1.29,P=0.02). Speakers from Guangdong had the lowest intensity levels compared to those from other regions.ConclusionGenders and regions are factors that need to be considered when LTASS is used for clinical purpose and academic study.

Mandarin;Gender;Dialect;Average speech spectrum

1浙江中医药大学医学技术学院听力系(杭州310053)

胡旭军,女,浙江人,副教授,主要研究方向为听力学。

10.3969/j.issn.1006-7299.2016.05.002

H018.4

A

1006-7299(2016)05-0430-05

网络出版时间:2016-6-2916:14

网络出版地址:http://www.cnki.net/kcms/detail/42.1391.R.20160629.1614.054.html

猜你喜欢
轮廓母语普通话
母语
OPENCV轮廓识别研究与实践
基于实时轮廓误差估算的数控系统轮廓控制
我是中国娃爱讲普通话
母语教育:从美出发
高速公路主动发光轮廓标应用方案设计探讨
17
论《远大前程》的语言特色及其母语迁移翻译
广而告之推广普通话
创造早秋新轮廓