商务英语专业标准参照性录音口试评分研究

2018-06-30 06:38梁娟

校园英语·中旬 2018年5期

【摘要】商务英语专业从通用走向专用的交叉学科特点及人才培养目标说明商务英语口语测试是评估商务英语专业语言能力的一个至关重要的环节。本文旨通过对现行商务英语专业口语评分模式，录音口试不可避免的问题，商务英语专业标准参照性录音口试的理论依据及模糊评分研究等方面的描述试图探索基于模糊数学原理的评分模式能够对商务英语专业教育教学起到正反拔效应，为今后商务英语专业口试的健康发展提供理论依据和实践经验，并促进我国商务英语专业测试的完善。

【关键词】商务英语；标准参照；模糊数学原理；录音口试评分

【作者简介】梁娟，陕西国际商贸学院。

引言

商务部和教育部发布的2011年人才需求信息指出：我国对具备外语能力过硬、商务知识丰富的国际贸易、国际投资、国际营销、国际冲裁、国际商务谈判等国际商務人才需求强烈；2010年《国家中长期教育改革和发展规划纲要（2010-2020）》和2013年教育部、国家发展改革委、财政部联合制定的《中西部高等教育振兴计划（2012-2020）》明确指出：坚持培养以就业为导向的适应市场需求的国际化复合人才。2014年APEC峰会在北京的召开仍说明了急需的人才是国际商务英语复合型人才。科学化的评估机制能够检测教育质量，对培养学生分析问题、解决问题等综合素质能力，并且规范和引导教师的教学行为，发挥着非常重要的鞭策作用。如何客观、科学地反映和评价每一位商务英语专业学生的商务理论水平和专业英语实际应用能力，定量分析比较不同教学模式、不同教师、不同院校的教学质量和效果，在参照国际检测标准上，充分发挥评分对改进教学的正反拔效应，目前是我国高等教育诸多亟待解决的一个重要课题。而口试测试作为商务英语专业语言能力评估的一个至关重要的环节，是众多反映应试者外语水平能力高低的最直接表现，得到外语界人士重视和广泛的推广。剑桥商务英语口试、全国国际商务英语口试分别于1993年、2007年考试实施以来，对我国商务英语专业口语教学起到了极大的促进作用。据统计2013年，全国已有216所高校开办了商务英语本科专业，但口试考点的设置不合理，为培养目标的真正实现而发挥的作用有限。以陕西省为例，只有西安外国语大学培训部和西北工业大学外语培训中心2所院校有条件参加剑桥商务英语口试、全国国际商务英语口试，而口试地点设置的不广泛普遍存在于浙江、福建、海南等多个省份。众多高校商务英语专业的口语教学、测试、评估都由任课教师（有时是外籍教师）自己设定，受试者的过程性成绩与终结性成绩也由任课教师面试来评定，受试者口语的真实水平因为口试方式、评分方法等的主观性和随意性无法直接反映。又由于我国商务英语专业正探索从通用走向专用交叉性跨学科特点，应在口语教学、测试和评估中强调“教考分离”尤为重要。

一、现行商务英语专业口试评分模式

目前大规模的商务英语口语测试从测评过程上分为两类，形成性评估和终结性评估；从测评的理论基础上可归为结构主义口语测评和交际性口语测评。结构主义测评以结构主义语言学为理论基础，强调不同的语言成分可以单独测评。而商务英语专业语言技能模块、商务专业知识模块及人文素养模块的交叉学科特点，及商务英语专业明确的培养目标---即精通英语和商务的国际化复合型英语人才，决定了其测评倾向于交际性口语测评，要求通过完成实际的交流任务时必须在真实或者接近真实的情景中来测量考试运用知识的能力。商务英语专业的学科特点决定了其测评重视语言的社会交际功能、专业语言的得体性和有效性。商务英语专业口试从测评的组织形式上主要分为三类，直接测试、半直接测试和录音测试（间接测试）。直接测试就是由测试员经过与受试者面对面交谈后，为受试者的口语表现直接进行评分，商务英语专业的形成性评估多采用这种形式。半直接测试是由测试员经过与受试者面对面交谈后，将录音磁带交由考试中心统一评分。间接测试即所谓的录音测试，借由录音设备（录音机或计算机）录下受试者的口语表现，交由考试中心和计算机统一评分。从客观性和公平、公正性角度来看，录音口试（间接测试）与前两种测试相比，较适合大规模的口试评分，从实践上真正做到了测试和评估中关注的“教考分离”。因此探索商务英语专业录音口试的评分方法，以便教师在口语教学实践中改进教学方法及合理选拔商务英语口语人才提供了理论依据，具有一定的现实意义。

商务英语专业口试评分模式主要有三种：题目分项评分（Item analytic marking）和能力分项评分（Ability analytic marking）、整体评分（holistic marking）. 分项评分法就是测试员依据分项等级量表按照评分标准，对受试者口语水平、口语能力逐项做出相应评价。整体评分也称为综合性评分，是测试员依据某一总体水平等级量表对受试者口语水平做出总体评价，俗称印象评分，在商务英语口语形成性评分中，整体评分是最常使用的一种评分方法。无论是题目分项评分法还是能力分项评分法，仍然避免不了每一项的主观评分；把语言能力分割成不同方面也是任意的，主观的；且分项评分很容易使得测试员产生光环效应（Halo Effect），还要制定各项分数的加权方法，耗时耗力。整体评分因为测试员的背景经历、包括BEC教学经历、口语测评与研究经历，以及个人认知标准的差异等因素使得评分过于随意，过于笼统，主观性较强。大规模商务英语口试中有时也采用记错减分法和加分法，会过度关注受试者的语用错误或亮点，忽略整体口语水平的考察，如何确定各个因素加分的比例，也是实际应用中难统一的问题。

二、现行商务英语专业录音口试的问题

以剑桥商务英语BEC Vantage（中级）口试为例。其口试属于录音测试，时间为14分钟。测试员多为中国国籍有商务英语专业课程教学经历的教师，接受过BEC口试培训，获得BEC考官证者，以口语测评与研究经历者为优先选择条件。录音测试完毕后，剑桥大学考试委员会ESOL为体现BEC口试公正性，对测试录音评估后抽样再检测。整个测试分为三个部分，第一部分Interview，测试员和受试者双向交流。由一位测试员对两位受试者轮流提问，另一位测试员记录成绩。考查受试者的语言沟通能力，总共约3分钟。第二部分Long turn，受试者在各自的三个商务话题中挑选一个话题，做一分钟陈述，期间，测试员会依次向两位受试者提问相关话题。考察受试者的语言组织能力，总共约6分钟。第三部分Collaborative Task，测试员向两位受试者提供一个商务话题或者相关的两个问题，两位受试者进行3分钟讨论，测试员再向两位受试者发问。考察受试者的思路是否清晰、专业用语是否准确、反应是否灵敏等。口试成绩采取3分以上包括3分整为合格分的 5分制评分方法。一位测试员打总体分，一位测试员分项打分。

从上述测试员评分的操作性上看，采用的是整体评分和分项评分相结合的方法。这样评定出来的分数虽然兼顾了综合评分的整体性和能力分项评分的细致性，但看似“精确”却过于武断和绝对，无论是综合评分标准还是分项评分标准都具有模糊性，但要求测试员在模糊的标准上即刻做出精确评估，从人类的生理机制和哲学上来说，不符合人们从事主观活动的心理变化，会给测试员施加很大的心理压力，且测试员之间对评分标准的阐释和应用多半存在差异性，而个别测试员在参照考试标准的基础上进行个人构建和再构建最终版的评分标准，使得测试员之间难以把握评分的一致性。测试员在评测受试者的过程中，一般采用假设—验证/修订的循环式初次印象评分到再评分方法，正因为呈现的是动态性和循环性评分过程，而不是恒定不变的评分方法，所以测试员容易被受试者的言談举证等一切外在因素影响，以至于“光环效应”严重影响评分的客观性和公平、公正性。李筱菊教授批评了分析评分混淆了“化合物”和“混合物”，各项评分简单相加，并等于受试者口试能力的综合表现。测试员在整个评分过程中扮演着三重身份：评判者、监察者、听众，完全起着中心主导作用，作为评判者，要对受试者言语和意义表达进行不断分析，依据再构建的评分标准对其做出评判；作为监察者，在监察受试者言语的理解和意义构建的基础上，还要进行自我监察再构建评分标准的过程以及分数决策的过程；作为听众，测试员必须集中一切注意力对受试者进行语音解码和意义构建，同时还要做到自我感同身受，从人类生理机制上来说，测试员的疲劳使得其内驱力和内省化从开始的测试到即将结束的测试即使时刻参照标准也无法保持一致性，谈何评分的客观性。

按照辩证法，不同质的矛盾需要不同质的方法才能解决。现行商务英语专业评分模式试图用精确的、静态的评分方法描述口语水平、口语能力这个模糊的、动态的事物，最多也是精确的模糊，反而难以精确。这也是现行商务英语专业评分模式的症结所在，同时也给商务英语研究者提出了一个难题。

三、商务英语专业标准参照性录音口试的理论依据

从Glaser、Klaus、张凯和Brown等文献中指出的常模和标准参照性口试的本质不同在于：常模参照性口试目的是以要测量出受试者在整个群体中的相对位置，以受试者为常模，以受试者组成的随机样本为单位，交由不同的测试者负责。当测试员在一天之内完成一个样本的口试时，测试员按照打分情况将整个样本内的受试者口试水平从好到差排个队，然后把每个受试者的名次按照常模规定的各等级分数比例转换成等级分数。标准参照性口试目的是要测量出受试者的口语能力达到哪一个等级，是以课程标准或教学大纲为参照标准，测试者根据受试者的口语表现给予相应分数，每个等级没有限制具体比例的人数。当编制商务英语标准参照性录音口试的试题时，应参照现行的《高等学校商务英语专业本科教学要求》（试行）（以下简称《教学要求》），并以此为准则，制定依据等级标准的试题编制原则和各项评分等级标准。针对目前尚无法参加商务英语专业全国国际商务英语口试的院校，以现行《教学要求》对商务英语专业二年级学生的口语（结合听力）要求（即全国国际商务英语专业四级要求）为准则，提出测量目标，并依据测量目标，制定评分标准。因此商务英语专业的标准参照性测试相比以常模为主的CET-SET体系，就提高商务英语专业受试者的口语能力而言，具有现实意义和更强的可操作性。

四、商务英语专业标准参照性录音口试的模糊评估研究

1.商务英语专业标准参照性录音口试是一种模糊现象。客观事物存在确定性和不确定性。当表现为确定性、精确性时，实际上是人类意识对事物运动相对静止状态的把握；当表现为不确定性时，实际上是人类意识对事物动态发展的连续性模糊的把握。模糊的把握造成意识的复杂性使人们认识、描述和界定事物的困难。例如生物界难以划定冬虫夏草，现代物理难以界定似固体又似液体的水结晶。语言学家因关注了存在于客观世界中的人文社会科学和行为科学范畴的模糊概念和模糊语言而受到启发，诞生了模糊语言学。20世界60年代，心理语言学家在他人运用成分分析法研究词汇意义时，提出了“原型”概念、“原型意义”（prototypical sense）。原型是某个给定范畴具备理想特征集的“理想的范例”，某个事物是否与该范畴的标准匹配，就要判定这个事物同原型之间是否有充分的相似性。这一匹配过程与本文探讨的商务英语专业标准参照性录音口试能力的评估有相似之处。与商务英语教学有观的模糊概念也很多，例如商务英语语言知识水平、商务知识与技能、跨文化交际与沟通能力、商务英语学能与技能、人文素养等，在测试员对它们的描述和判断无法做出客观的决策时，人们基于技术以厚望，尤其是期待计算机技术能够解决人类大脑难以解决的问题，这就需要对商务英语口语水平、口语能力等语言模糊现象进行科学的量化分析以及精确的描述。

2.商务英语专业标准参照性录音口试的模糊数学原理描述。模糊数学原理描述：模糊集合中的隶属关系的最后确定都带有很强的主观性，一般情况它是依据主体经验或者统计而最后确定，或者由某个权威给予，所以它总是带有约定俗成的性质，因此被测试者很容易接受，例如商务英语标准参照性录音口试的评分标准、评分细则或者评分指标。表1为商务英语标准参照性录音口试的“口头表达”内“口语基础”一项的评分细则。模糊集合本质就是主观依赖于随意性的东西，存在无法对任何事物、任何人都FIT的精确从属函数的方法。李柏年曾提到如果对不同人都FIT的确定方法早就知晓的话，那么“模糊性”就无法存在了。近年来，国内众多测试学研究者在对大规模的口试评分中尤其是英语专业口试评估体系中关注和借用了模糊数学评价方法。然而在商务英语专业标准参照性录音口试中尚无一人就此课题做过相关研究。作为商务英语教育工作者，为了培养王立非教授提出的具有扎实英语基本功、合理国际商务知识与技能、宽阔国际视野，掌握法学、管理、经济等相关学科的基本知识和理论，具备较高的跨文化交际与沟通能力、人文素养，能在国际环境下用英语从事经贸、商务、外事、金融、管理等工作的复合型英语人才，我们应该认真思考和关注相关的理论研究和应用研究，予以指导教学体系和改革商务英语标准参照性录音口试模式，使得商务英语学科日臻成熟，培养出的人才不只是纸上谈兵，能够与国际接轨，应付各种纷繁复杂的国际商务活动。

商务英语专业标准参照性录音口试评估根据模糊数学原理必须建立几个集合：

1.评测商务英语标准参照性录音口试工作的因素集合U=（U1，U2，…UN），所谓因素集合指影响评测商务英语标准参照性录音口试工作的各种各样的因素所组成的集合。因素如表一中的评分细则。

2.确定各评分细则的权重。A=（a1， a2…an）。权重分配集ai=（i=1， 2， …n）是因素集U上的一个模糊子集。这里分为三级评价细则，一级评分细则是最底部的细则，也是最基础的细则，以此到最高层。

3.评分等级V=（v1， v2， …vn）。一般情况下，优、良、中、差代表评语等级。就像BEC初级评定成绩Pass with Merit、Pass、Narrow Fail、Fail.

4.确定隶属关系，获得模糊评判矩阵R=（RIJ）n×m，其中RIJ=CIJ/C，其中C表示参加评测的总受试者人数，CIJ表示测试员对受试者的第I个因素UI作出VJ种结果的测试人数。

5.模糊矩阵合成运算，确定评定等级B=AR，期中AR按矩阵的乘法原理运算。

五、结语

鉴于此文章的应用研究还有待进一步实证分析。但运用模糊数学原理建立的模糊评分方法从减轻测试员的心理压力方面，更能保证测试员之间评分的一致性。这种评分方法对商务英语口语能力这一模糊现象的相对客观评价迈出了一大步。在实际操作中，评分方法简单，只需要在差、中、良、优的评分标准表上打√，之后工作交由计算机处理，不必因为环境、个人情绪等因素影响为了0.5分权重之差而压力过大，影响评分一致性。普通的自主学习语言实验室比如蓝鸽、Lab 100 STS 等都可以做到好的录音效果。商务英语标准参照性录音口试的模糊评分方法不仅能够保证口试自身效度和信度的基础上，而且还对大规模的口试有参照的作用，具有主观测试评分的客观性和一致性等优点。同时商务英语标准参照性录音口试对无法实现人机对话考试的高校来说有较强的借鉴作用。因此，加大录音口试的模糊评分方式实证研究，为今后商务英语专业口试的健康发展提供理论依据和实践经验，促进我国商务英语专业口语测试的完善具有现实意义。

參考文献：

[1]梁娟.基于两种参照测试视角下商务英语考试模式现状分[J].经济师，2015（06）：229-232.

[2]黄锐.标准参照性录音口试的模糊评分研究[J].外语测试与教学，2011（04）：51-55.

[3]王立非，叶兴国，严明，彭青龙，许德金.商务英语专业本科教学质量国家标准要点解读[J].外语教学与研究（外国语文双月刊），2015 （03）：297-302.

[4]王立非，李琳.基于可视化技术的国外商务英语研究进展考察[J].中国外语：中英文版，2014（02）：88-96.

[5]王盼盼.英语口语测试评分模式的比较研究[J].西南农业大学学报，2013（06）：142-145.

[6]文秋芳.英语口语测试与教学[M].上海：上海外语教育出版社，1999.

[7]王海贞.2007.Rater perceptions of factors that affect the rating of TEM-4 oral test[J].Teaching English in China 30：9-16.

[8]BEC英文官网.http：//www.cambridgeenglish.org/exams-and-qualifications//business-certificates/business-vantage/whats-in-the-exam/（2014-02-26）.

[9]李筱菊.语言测试科学与艺术[M].湖南：湖南教育出版社，1997.

[10]王海贞.英语录音口语评分过程研究[J].外语测试与教学，2011 （04）：42-49.

[11]张文忠，张姮.基于模糊数学原理的口语测试模糊评估框架[J].外语教学与研究（外国语文双月刊），2008（11）：433-439.

[12]Glaser R，Klaus D J.Proficiency measurement：Assessing human performance[M]//Gagne R M.（Ed）.Psychological principles in systems development.New York：Holt，Rinehart and Winston，1962：419-474.

[13]张凯.标准参照测验理论研究[M].北京：北京语言文化大学出版社，2002：27-48.

[14]Brown James，Hudson Thom.Criterion-referenced Language Testing[M].London：Cambridge University Press，2002：3-4.

[15]盛楠.英语标准参照性口试与常模参照性口试述略[J].南昌职业技术师范学院学报，2001（12）：129-130.

[16]伍铁平.模糊语言学[M].上海：上海外语教育出版社，1999.

[17]Labov，W.1973.The boundaries of words and their meanings[A].In J.Fishman（ed.）.New Ways of Analyzing Variation in English[C].Washington，DC：Georgetown University Press.340-373.

[18]Aitchison.J.1994.Words in the Mind：An Introduction to the Mental Lexicon（2nd edition）[M].Oxford：Blackwell.

[19]李柏年.模糊数学原理及其应用[M].合肥：合肥工业大学出版社，2007.

[20]金檀，王琰，宋春阳，郭曙纶.口语测试模糊评分方法设计及实验研究[J].现代外语，2008（05）：157-164-49.

[21]陈准民，王立非.解读《高等学校商务英语专业本科教学要求》（试行）[J].中国外语，2009（07）：4-21.

[22]王相玉.民办高校学生英语口语教学现状及提升策略[J].校园英语，2017（06）：8-9.

[23]刘筱.大学实用英语口语[M].安徽：安徽师范大学出版社，2017.