长春光华学院 张 健
语料库的发展历经三个主要阶段,一是20 世纪60 年代,以布朗语料库为代表的机读语料库。布朗语料库容量为100 万词,收集了20 世纪60 年代有代表性的美国英语语料,语料选自各种出版物,建库时照顾到了各种文体的平衡,严格按照随机原则抽样,是一个标准语料库,也是第一个现代语料库。1975 年,Jan Svartvik 开始创建伦敦—隆德语料库,这两个语料库奠定了现代语料库的基础。二是20 世纪80 年代,以计算机硬件技术为依托的数字语料库快速发展,相继如LOB语料库、COBUILD语料库、国际英语语料库(ICE)、赫尔辛基历史英语语料库及各不同语种、不同用途类型的语料库。三是20 世纪90 年代,语料库的发展进入了亿级词汇时代。语料库的种类体现了多元化趋势,先进的计算机文字处理技术广泛应用。对比数量繁多且日益成熟的文本语料库,口语语料库的发展相对滞后。国内较有影响力的口语语料库包括上海交大大学英语学习者口语语料库COLSEC(5万)、南京大学中国英语学习者口语语料库SECCL(100 万)。部分高校和机构则专注于双语平行语料库的研制,如北京外国语大学汉英平行语料库(PCCE)、东北大学英汉双语语料库(100 万)等。另有专门用途英语语料库和汉语语料库等其他领域的语料库相继建成。
汉英口语平行语料库的建设目前存在以下问题:首先,发展规模有限。受诸多客观因素影响,汉英口语语料库的建设推进缓慢,研究团队稀缺,意愿低迷。其次,资源开放性不足。语料库的建设会耗费巨大人力、物力、财力,资源利用率明显不足。各建设单位敝帚自珍,各自为战,消极分享研究成果,导致重复成果过多、资源严重浪费。最后,语料库容量尚需扩充。平行语料库语料采集数量缺乏,不能体现语言的完整性和系统性。语料标记和注释同样较为粗放,不利于成果的现实应用。
双语平行语料库的兴起,依托于快速发展的计算机应用技术,为语言研究、语言教学、辞书编纂等提供了一个广阔的平台,其应用前景不言而喻。平行语料库将两种迥然有异的语言“一肩挑”,不仅充当了交流的桥梁,更是文化的桥梁。双语平行语料库的语料是语言天然的对比资源库。源语言和目标语言的平行对应对外语学习而言更是稀缺的资源宝库。AI 机器翻译技术在双语平行语料库的加持之下,译文变得更为通畅、地道。汉英口语平行语料库聚焦口语语料文本的采集,其专注于语言本身的原生形态,强调语言的初始功能,可以更加如实、准确地体现出语言的本真与原貌,能为口语学习、口译教学、语言对比、语言演化甚至维系民族记忆等提供可靠的数据,增加上述研究的可信度,为语言翻译的共时和历时比较研究提供具备可行性的分析和研究平台。以教学为目的的自建口语平行语料库,对参与建设的教师团队而言,可以提升其专业技能,增强其科研实力,是自我提升、自我超越的良好契机;对参与语料采集的学生团队而言,可以提升其语言敏感度、扩充知识储备、探索自身语言学习的突破口。
现行英语口语类教材种类繁多,良莠不齐,全无系统性可言,各类英语等级考试的共存也对考生的口语能力提出了不同要求。因缺乏统一的指导和规范,市场上口语类教材往往只关注个别生活情境下的语言交际(如问候、道谢、致歉),语言输出维度过于单一,语料文本取样粗放,句式表达千篇一律。这种“管中窥豹”的学习方式割裂了语言本身的内在联系和语言逻辑,而且一来一往、一个回合的语言交互也并不能称之为一个完整的情境。一套优秀的口语教材至少应该涵盖基础语音、高频词汇、核心句式、主题演讲、自由表达、非语言交际等多个层面。
在听、说、读、写、译五项英语语言能力中,读、写、译技巧性和策略性较强。学生经过教师指导,有序进行强化性训练,教学过程易见成效,教师对该方向的研究意愿高涨,教学理念、方法不断革新。反观听、说教学,学生受语音差异、性格差异、知识内化水平差异、物理性口腔肌肉训练差异等诸多因素限制,个体学习效果难以保证,学习成果差异巨大,教学成果亦难以保证,教学探索难以为继。国内口语课堂多采用的任务型教学法尚处于初级阶段,即简单布置任务,小组合作完成。在教学过程中,教师对学生提供的语言指导缺乏有力支撑,多数学生领到任务后茫然无措,口语表达逻辑混乱,语体不分,词汇粗粝,语法杂糅。口语教学应该从生活中的细微入手,衣、食、住、行无所不至。要将“学以致用”“学而能用”贯彻到口语学习的始终,鼓励学生结交“语伴”,积极打造个人的微观语言生态系统,倡导“浸入”式体验。
众所周知,国内的英语口语教学起步较晚,不具备先天优势,口语课一直在各学科的“夹缝中生存”。除英语专业以外,其他专业罕有开设英语口语课程,多以选修课形式存在,这导致只有少量的非英语专业学生有机会接受英语口语的专门培训。显然,这种资源不均和现行英语教学的体制有关,偏于应试的教育模式必然导致基于能力导向的教学行为日趋式微。因此,适时调整略有偏倚的英语教学体系对口语教学意义重大。
汉英口语平行语料库与口语教学存在天然的契合,语料库可为教师、学生提供直接、有效的经验数据和情境支撑。借助平行语料库,学生不再单一依赖教材或教师有限的语言指导,而是依据个人需要在海量语料中自由检索、自主学习,将个人语言学习的潜能最大化,从而显著提升学习效度。在此过程中,学生的主观能动性占据学习活动的主流。对词句的检索和提取绝非简单、生硬地攫取信息,而是历经甄选、对比、反思后的成果产出。在任务型小组活动模式下,学生产出的成果可供课堂研讨和辩论,从而进一步激发学生学习兴趣。借助平行语料库,教师无限扩大对学生学习资源的补给,就教学内容提供针对性的指导,注重严谨工作作风和批判性思维能力的培养,重视学生自主学习能力的塑造,积极促成了语言学习的纵深和外延。教学形态的改变势必驱动教学理念的不断优化与革新。
语料不同于传统教材,语料形态对教学模式、教学环境提出了新要求。语料库资源辅助语言教学的教学模式,即数据驱动学习模式,是一种理论上可行的理想的英语学习方法,无论是功能强大的大型语料库,还是微观规模的自建语料库,就教学活动而言,其存在意义和长远影响不言而喻。数据驱动学习模式的基本原理是引导学生借助海量语料库数据,检索、对比、归纳词句的呈现方式与使用情境,自我发现、独立探索词汇意义表达和语用特征。在这种模式下,协作互助的师生关系让学生大大减轻了传统课堂的“压迫感”,在自由、放松的状态下探索新知。由此可见,数据驱动学习模式与“以学生为中心”的教学理念不谋而合。然而,数据驱动学习模式自身同样存在痼疾,如课堂约束力有所削减、课堂活动拖沓冗长、课堂研讨胶着耗时、自主学习缺乏后劲等。这表明,单一的数据驱动模式尽管优势显著,但必须与其他的教学方法、手段相结合才能发挥出最大功用。