魏可晗, 裴正薇
(南京农业大学 外国语学院,南京 210095)
语音习得在二语习得中占据着重要的地位,然而在我国高校英语教学中,语音教学长期处于边缘化地位,鲜有研究系统探讨语音评测、质量评估、习得影响因素等议题。本文拟述评2010—2016年间国内外发表的有关语音测试和评估的高质量实证研究论文,以期梳理、总结国内外英语语音测试手段与评估方式,推进二语语音习得领域的研究进展,为我国英语语音教学实践提供参考和借鉴。
我们从SSCI数据库中选取语言、教育、测试等领域的18种期刊,如ModernLanguageJournal、AppliedLinguistics、JournalofPhonetics、LanguageLearning&Technology、LanguageTesting等,以speech、phonology/phonological、phonetic、pronunciation、accent、segment(al)、suprasegmental、phoneme、vowel、consonant、stress、intonation、rhythm为主题词收集到相关实证研究20篇;从CSSCI数据库中选取我国外语教学研究领域的9种期刊,如《外语教学与研究》《中国外语》《现代外语》《外语界》《外语电化教学》等,以语音、发音、音段、超音段、元音、辅音、重音、语调、节奏、口音为主题词收集到相关实证研究16篇。文献收集时仔细筛选,确保是实证研究,并以英语为习得的目标语。
根据测试内容,将研究分为接受性测试、产出性测试以及同时包含接受性和产出性的测试。如表1所示,国内外语音实证研究中测试最多的为产出性测试,其他两方面国外测试研究的比例高于国内。
表1 国内外英语语音测试内容统计
对各研究中英语语音测试使用的主要手段进行统计,并对使用测试手段的种类数量进行统计对比发现,国外研究在语音测试手段使用上较为多样化,国内语音测试手段不够丰富多样,比较单一。从占总篇数的比例来看,除AXB和段落朗读手段的使用外,国内的比例均小于国外。国外单篇研究所用测试手段的种类略多于国内研究,单篇研究使用3种手段的研究国外有4篇,国内0篇,使用4~5种手段的国内外各1篇,使用1~2种手段的国内外研究篇数持平。
常用的语音测试手段有听辨、听写、对话、模仿、朗读、独白等,以下选取代表性研究对主要的测试手段加以阐述。
AX可用于音段和超音段的接受性测试。国内学者李佳[1]探讨了中英两国学生对英语松紧元音的辨析情况,选用的对比实验语料针对紧、松元音/i-i:/和/u-u:/。每道辨音题由含对立松紧元音的单词所构成的最小对立体组成,还随机插入几道辅音和双元音辨识题作为干扰。听力语料由操标准英国发音的人士朗读,受试一边听一边在试卷上选择。欧燕[2]研究绕口令训练对非英语专业大学生语音的影响,前测使用了最小对立体辨音,涵盖了大部分易混淆的最小对立体。裴正薇、丁言仁[3]开展了音乐能力影响大学生英语语音能力的研究,重音测试主要考察受试对单词主重音以及单调群句中主重音位置的听辨能力。测试题项由一对拼写一致但主重音位置不同的单词或短句构成,如’applicant/a’pplicant、“I like ’blue ties.”/“I like blue ’ties.”。
国外学者Cebrian和Carlet[4]在研究二语习得者辨识目标语音素时所选刺激词涉及辅音/b-v/、/d-/和元音/-/、/i-i:/最小对立体。Lin等[5]考察了母语背景为普通话和韩语的英语学习者如何处理英语单语的重音,在序列回忆任务(a sequence recall task)中的重音对比测试涉及两个最小对立体假词(/’mipa-mi’pa/),键1和键2分别表示重音落在第一或第二个音节。受试会听到一串2~6个长度不等的假词序列,听到每个假词时,需按下相应键。Derwing等[6]对处在工作场所中的二语习得者进行短期发音训练,对某些音段、超音段的感知、口音等方面进行了训练前后的对比研究。
裴正薇、丁言仁[3]设计的音位测试使用了AXB测试手段。测试题项由对应于编号A、B、X的三个单词构成,A、B为音位最小对,受试需判断单词X的音位类型与A还是B相同。单词包含的音位数量相等,区别性音位的位置相同。吴诗玉、杨枫[7]将7个元音/i、i:、ei、e、、、/置于/b_d /中,2个元音/、/置于/k_d /中形成刺激词,再将刺激词放入承载句“I saw on the screen.”由英语本族语者读出,利用Praat语音分析软件截取保存刺激词。受试听到每组3个音,判断异同,可能完全相同,抑或是有一个音与其余的不同。
De Jong和Park[8]研究韩国的英语学习者对音段音位的识别。将10个阻塞音/p、b、f、v、θ、、t、d、s、z/分别置于音节首和音节尾,得到20个目标词,由本族语者朗读。音段辨识任务中,受试听到目标词后,选出题项中的3个包含相同辅音的词。Derwing 等[6]主要考察受试对起始、中间、末尾音段、辅音和辅音丛的感知,AXB测试词包括30个真词和假词,受试听取3个词,选出其中一个发音不同的词。
朗读是一种主要的产出性测试手段,包括单词朗读、句子朗读和段落朗读。单词朗读多针对易混淆、难发音的音素,具有很强的针对性。如Binghadeer[9]探究年龄和输入的增加对元音产出的影响,所选的测试词为沙特的英语学习者普遍感到发音困难的元音,针对6个单元音/i、i:、e、:、u、u:/和2个双元音/u、ei/,由16对发音相似的单词构成,如soup-soap、bought-boat、reach-rich,多数是语音教材中的常见词。
鉴于许多学习者发单个词尚可,一旦到语境中和其他词结合就容易读错,有些研究者把测试的目标音段承载词设置在承载句中。如曹瑞斓[10]考察英语学习者对音节首辅音丛的产出情况,选定了10个含有音节首辅音丛/kl、kr、pl、pr、sp、st、sk、spl、spr、skr/的单音节高频词,将被测单词置于语音环境不同的两个简单句“Read again.”和“Say again.”中。周卫京、宋会萍[11]将目标音段设计在音节首、中、尾三个语音环境中,将目标音段承载词放在“Speak twice.”和“Say again.”的承载句中。Han、Hwang和Choi[12]考察了韩语本族语者产出英语弱读元音的情况,测试的弱读元音分别出现在刺激词的词首、词中和词尾,并放在承载句“I said this time.”中。将包含目标音段的测试词设置在不同语音环境的承载句中,避免了受试在纯粹的单词朗读中过度注意单词的发音,表现不够自然。在Oh等人[13]调查习得年龄对母语和二语元音产出的影响研究中,由于受试包含儿童,测试选择由图片引出刺激,词汇难度考虑到初学者和儿童的英语水平,且要能够用图片表达出来。以图片引出刺激词的方法便于儿童受试理解,能达到测试效果。
句子和段落朗读涵盖了对重读、弱读、连读、节奏、弱化、省音、失去爆破和语调的测试,旨在测试语音语调,段落朗读更适合考察语音的流利度。Saito和Brajot[14]研究了在目标语国家居住期和习得年龄对英语发音的影响,在句子阅读任务中给出的目标句和干扰句都包含了目标词。蒋红柳[15]通过语音实验研究考察我国英语学习者的英语语调运用特征及习得效果。受试朗读英语母语语料库(IViE)中的文字材料,包括单句朗读和段落朗读,单句句型涉及简单句、陈述疑问句、一般疑问句、特殊疑问句和感叹句等,段落朗读内容是童话故事《灰姑娘》的片断。周卫京、宋会萍[11]的研究选取连续语流朗读材料“The Boy Who Cried Wolf”,是一篇国际语音学协会颁布的常规使用短文,涵盖公认的标准英语发音RP的全部音段。
自主言语大都以对话、话题陈述、图片描述等方式引出。许俊等[16]研究学习者英语韵律习得,收集语料时运用了简单回答和自由讲述。受试在简单回答部分回答测试者提出的几个简单问题,但录音不用于语料分析。这种简答对话的形式帮助缓解受试的紧张情绪,有利于接下来的测试。受试在自由讲述部分抽取话题卡进行1~2分钟即席讲话,这种自由讲述方式使受试有话可说,并最大限度地减少讲话过程中不必要的长时间停顿。童淑华[17]为调查英语产出中的音段发展特征,在一年半中对11名英语专业大一学生进行了3次口语测试。测试工具为一组描述校园餐厅故事的图片,受试需3次对图片进行口头叙述。Saito和Brajot[14]在研究中也使用了图片描述任务,受试在词汇提示下描述给出的图片。以独白方式进行的自主言语任务有助于引出受试的自发语流,看图说话则更易于理解和叙述。
研究发现,语音自评和他人评估之间存在较大的差异。Trofimovich等[18]通过两个实验调查了二语习得者在口音、可理解度方面自评和他评的关系。134名受试来自不同母语背景,实验一通过根据图片讲故事的任务引出受试的语料并录音,要求受试用9个维度来自评口音和可理解度,3名英语本族语者以同样的维度对受试口音和可理解度进行评估。分析表明说话者对自己实际表现的评估与本族语者的评估之间相关性很小。在口音和可理解度上表现较差的说话者会高估自己的实际表现,反之会低估。实验二由10名本族语者对实验一中的56份语料从音系学、流利度、词汇、语法和语篇方面进行评估,结果表明对口音、可理解度自评和他评的不同与语音的音段和超音段特征(音段的准确性、词重音、音调、节奏、语速)有关,与词汇、语法和语篇无关。
薛小姣[19]使用专业认知实验软件SuperLab对比了英语本族语者和中国英语学习者对外国口音的评价情况。20名英语学习者和10名本族语者分别对10名中国大学生的英语朗读短文语料进行评估,评分维度从1(完全没有外国口音)到9(外国口音非常浓重)。实验结果表明,中国英语学习者对口音的评分与本族语者的评分存在差异。前者比后者更包容英语中的中国口音,即二语水平低的学习者比二语水平高的学习者更包容中国腔,但与后者一致的是他们在评价口音时都明显依赖于音高变化范围。李景娜、王遥[20]对比了英汉本族语者对中国英语学习者的口音感知及言语理解度,发现英语本族语者认为说话人语音的韵律特征是影响其言语理解度最关键的因素,汉语本族语者认为说话人的口音对其言语理解度的影响显著,但并非决定性因素,这是英汉语音系统差异的体现。本族语者与非本族语者的评估差异如何,现有研究尚无定论,有Munro、Derwing和Morton[21]等国外研究发现母语背景对语音可理解度和口音评估的影响并不显著。
Isaacs和Thomson[22]以富有教学经验的教师作为专家评估代表,对比研究了20名有丰富教学和评估经验的教师与20名非语言学专业毕业的大学生对38名初学者语音可理解度、口音和流利度的评估。研究显示,有经验的评估者和新手评估者之间没有明显差异,虽然前者比后者在评分一致性上稍高,但定性数据反映出两者的一些群体差异。有经验的评估者表示二语语音教学经验有助于他们建立参照标准,对语音作出理解和评判;新手评估者则表示执行评估任务时感觉自己资历不够、缺乏经验,会通过回忆现实生活中所接触人群的发音或者大众文化中名人的发音来帮助评估。可见,有经验的评估者和新手评估者在语音评估过程中采用了利用经验或者因经验不足诉诸其他途径的不同策略。
Isaacs和Trofimovich[23]研究了音乐能力个体差异对语音评估的影响。评估者是60名英语本族语者,音乐专业和非音乐专业各一半,对法语本族语者的英语语音样本在口音、可理解度和流利度上进行评估。结果显示,音乐训练使音乐专业的评估者对语音的某些方面较为敏感,他们对口音的评分远低于非音乐专业评估者,尤其对水平较低的二语者,但是对可理解度和流利度的评估影响很小,且评估者在语音短时记忆力、注意控制力上的差异对二语语音评估没有大的影响。Isaacs和Trofimovich[24]对先前的研究作了补充分析,主要关注评分极端的评估者,探究二语语音评估与评估者的音乐能力是否有关。研究者将评估者分为高、低分组,发现音乐能力和语音评估间并无联系。但只看评分极端的评估者时,发现可理解度评分最低(认为最难理解)的评估者比评分最高(认为最容易理解)的评估者的音乐能力要高,可理解度评估严格者对音乐旋律有着更高的敏感性。鉴于音乐能力可能影响二语语音评估结果,培训评估者时,要使音乐敏感性强的评估者意识到对音乐的过度敏感性可能会致使其评分过于苛刻,从而在给分时作出适当调整。
William、Sangwan和Hansen[25]开发的口音自动评估程序利用加权有限状态转换器评估口音,维度从-1(不地道)到+1(地道),这项程序与人工评估口音得分更一致,准确率更高。Franco等[26]开发的SRI International’s EduSpeak®软件能够对整体发音质量给出反馈,反馈具体的发音失误。Koniaris、Salvi和Engwall[27]依据人类听觉外周系统模型对非本族语者的语音进行自动评估,并测试了不同语言背景的非本族语者,结果表明在分析语音信号方面,自动评估结果与人工评估结果一致。伍维平[28]设计出的英语跟读测试智能评价系统,能够在内容完整度、语音标准度和语速流利度方面对受试跟读示范语音的产出进行模糊评价。测试结果表明,该系统对不同英语水平受试的发音评估和人工评估保持了较好的一致性。
通过梳理与回顾2010—2016年间国内外两大知名数据库关于英语语音测试手段和评估的36篇实证研究文献,发现国内语音研究在测试手段上较为单一,国外研究所用的测试手段相对多样化,国内外研究者对语音质量评估采取了不同的方式。了解和对比国内外英语语音测评的研究现状与异同,有助于开发语音测试量具,增加语音评估信度,提高语音教学的有效性。
参考文献:
[1] 李佳.英语松紧元音的听觉对比实验研究:一项基于认知语言学范畴理论的分析[J].现代外语,2010(2):194-201.
[2] 欧燕.让学生发音不绕口的绕口令:大学英语语音教学改革认知心理学实践[J].中国外语,2014(4):61-68.
[3] 裴正薇,丁言仁.音乐能力影响中国大学生英语语音能力的实证研究[J].外语界,2013(1):36-44.
[4] CEBRIAN J,CARLET A.Second-language learners’ identification of target-language phonemes:a short-term phonetic training study[J].Canadian modern language review, 2014,70(4):474-499.
[5] LIN C Y,WANG M,WILLIAM I J,et al.Stress processing in mandarin and Korean second language learners of English[J].Bilingualism language & cognition,2014,17(2):316-346.
[6] DERWING T M,MUNRO M J,FOOTE J A,et al.Opening the window on comprehensible pronunciation after 19 years:a workplace training study[J].Language learning,2014,64(3):526-548.
[7] 吴诗玉,杨枫.中国英语学习者元音感知中的“范畴合并”现象研究[J].外语与外语教学,2016(3):75-84.
[8] DE JONG K,PARK H.Vowel epenthesis and segment identity in Korean learners of English[J].Studies in second language acquisition,2012,34(1):127-155.
[9] BINGHADEER N A.The effects of age and input enhancement on L2 vowel production: a longitudinal study[J].TESOL journal,2010(3):64-80.
[10] 曹瑞斓.基于标记区分假设的中国EFL学习者英语音节首辅音丛产出研究[J].外语与外语教学,2015(3):8-12.
[11] 周卫京,宋会萍.中国大学生产出性英语语音素质管窥[J].外语与外语教学,2015(3):1-7.
[12] HAN J I,HWANG J B,C T H.The acquisition of phonetic details:evidence from the production of English reduced vowels by Korean learners[J].Second language lesearch,2011,27(4):535-557.
[13] OH G E,GUION-ANDERSON S,AOYAMA K,et al.A one-year longitudinal study of English and Japanese vowel production by Japanese adults and children in an English-speaking setting[J].Journal of phonetics,2011,39(2):156-167.
[14] SAITO K,BRAJOT F.Scrutinizing the role of length of residence and age of acquisition in the interlanguage pronunciation development of English /□/ by late Japanese bilinguals[J].Bilingualism language & cognition,2013,16(4):847-863.
[15] 蒋红柳.大学英语专业学生语调学习效果探讨:语音实验案例研究[J].中国外语,2012(2):65-71.
[16] 许俊,刘正光,任韡.二语学习者英语韵律习得探究[J].外语界,2013(3):31-38.
[17] 童淑华.英语专业学生口语产出中音段音位的发展特征[J].外语教学,2010(1):78-81.
[18] TROFIMOVICH P,ISAACS T,KENNEDY S,et al.Flawed self-assessment:investigating self-and other-perception of second language speech[J].Bilingualism language & cognition,2016,19(1):122-140.
[19] 薛小姣.中国英语学习者和母语者评判英语外国口音的比较研究[J].现代外语,2016(5):647-657.
[20] 李景娜,王遥.英汉本族语者对中国英语学习者的口音感知及言语理解度的对比研究[J].外语教学理论与实践,2015(1):50-54.
[21] MUNRO M J,DERWING T M,MORTON S L.The mutual intelligibility of L2 speech[J]. Studies in second language acquisition,2006,28(1):111-132.
[22] ISAACS T,THOMSON R I.Rater experience,rating scale length,and judgments of L2 pronunciation:revisiting research conventions[J].Language assessment quarterly,2013,10(2):135-159.
[23] ISAACS T,TROFIMOVICH P.Phonological memory,attention control,and musical ability:effects of individual differences on rater judgments of second language speech[J].Applied psycholinguistics,2011,32(1):113-140.
[24] ISAACS T,TROFIMOVICH P.Falling on sensitive ears? The influence of musical ability on extreme raters’ judgments of L2 pronunciation[J].TESOL quarterly,2012,44(2):375-386.
[25] WILLIAM F,SANGWAN A,HANSEN J H L.Automatic accent assessment using phonetic mismatch and human perception[J].IEEE transactions on audio speech & language processing,2013,21(9):1818-1829.
[26] FRANCO H,BRATT H,ROSSIER R,et al.EduSpeak®:a speech recognition and pronunciation scoring toolkit for computer-aided language learning applications[J].Language testing,2010,27(3):401-418.
[27] KONIARIS C,SALVI G,ENGQALL O.On mispronunciation analysis of individual foreign speakers using auditory periphery models[J].Speech communication,2013,55(5):691-706.
[28] 伍维平.基于模糊理论的大学英语跟读测试智能评价系统研究[J].外语电化教学,2012(4):33-38.