FAO农业英语语料库的建设和应用

2014-10-08 02:57:13王敏李丽霞
考试周刊 2014年65期
关键词:语料库应用建设

王敏 李丽霞

摘 要: 近年来,专门用途语料库的研究与建设逐渐成为语料库语言学研究领域的一大热点,众多专门用途语料库都在纷纷筹建之中,为专门用途英语的发展及教学研究提供了帮助。然而,作为专门用途英语教学中的重要部分,农业英语教学却缺乏对应的语料库建设和研究。本文在简述建设FAO农业英语语料库的背景和意义的基础上,探讨了FAO农业英语语料库的创建思路和技术支撑,指出了其建设的可行性;并总结了其在教学中的应用价值及其建设的必要性。

关键词: 语料库 FAO农业英语语料库 建设 应用

1.概述

1.1语料库和语料库语言学。

语料库(corpus,复数为corpora)一词来源于拉丁语,本意为body。它是一个按照一定采样标准采集而来的、能够代表一种语言或者某语言的一种变体或文类的电子文本集。语料库是建立在计算机上的,必须以电子计算机为载体存放语料,且这些语料均在实际使用中出现过,因此可以真实地反映语言现象。语料库使大规模真实文本的自动处理得以实现,可以为语言研究提供更加丰富、更加详尽的语料,同时为语言研究提供另外一种客观的方法,即基于实验和统计的方法(谭键,2005)。它改变了传统的语言研究方法,有助于克服语言研究过程中的主观性和片面性。此外,语料库对于词典编纂、字频统计、词频统计、语法研究等具有巨大的推动作用。

语料库语言学(Corpus linguistics)是在语料库的基础上对语言进行分析和研究的科学(许家金,2003;卫乃兴,2009)。传统的语言学家收集资料的方法基本为手工收集,进而在此基础上进行分析与研究,最后得出结论。手工收集到的资料有限且主观性较强,具有很大局限性,而语料库语言学使大量地、详尽地收集语料成为可能,可以使我们更为深刻、更为全面地研究语言现象。总之,语料库语言学的产生,将改变语言研究的观念,使语言研究日趋深入、精细。

1.2专门用途英语语料库。

在语料库语言学中,专门用途语料库,是指出于某种特定研究目的需要,只收集某特定领域的语料样本建成的语料库(梁茂成,2010)。随着语料库在各领域研究的深入,通用语料库,尽管容量巨大,还是无法满足各专业领域研究的需要,如语言习得、语用语体、法律语言学研究等,这就要求研究者建立自己的专用语料库,以进行某个特殊领域的研究。在大型通用语料库不断扩建的同时,研制更多的小型专用语料库将是一大趋势(何中清,2011)。随着语料库语言学的发展和完善,语料资源将会越来越丰富,通用语料库的容量也会越来越大。此外,随着语料库研究在各个领域的纵深发展,小型的专门用途英语语料库必然会成为一种发展趋势,研究的越深入、专业性越强,专门用途英语语料库越必不可少。

近年来,专门用途语料库发展迅速,许多与专业相结合的专用英语语料库纷纷建设起来(黄大网,秦羿,许赛颖,2010),然而,作为专门用途英语教学的重要组成部分,农业英语教学仍然没有得到足够重视,缺乏对应的语料库建设和研究,不利于农业英语教学的发展与进步。目前,国内已经有建成的或建设中的众多与专业英语相结合的专门用途英语语料库,如航空航天英语语料库、医学英语语料库、学术英语语料库、商务英语语料库(梁燕,冯友程,良坤,2004;刘满堂,2004),这些语料库的建立及其研究成果,推动了专门用途英语教学(English for specific purpose,ESP)的发展,对提高国内专门英语教学水平有重要意义,同时为我们进一步完善建成农业英语语料库提供了宝贵借鉴。目前,国家农林院校拥有农学、林学、植物保护、动物科学和生命科学等优势学科和专业,如果这一优势能够和专门用途英语教学相结合,建立相应的农业英语语料库,则将大大推动农业英语教学,尤其是词汇教学,将迈向新的台阶,对解决目前农业院校外语教学中存在的诸多问题具有重要意义。同时,农业语料库的建成,也将丰富和完善语料库的类型,推动语料库语言学在农业词汇、短语及语篇等方面的发展。

2.研究意义

本研究力图建设FAO农业英语语料库,作为农业英语语料库下的一个子库,并在此基础之上进行农业英语语言特点方面的研究,这一研究将有助于填补学科专业语料库的空白,丰富专门用途语料库的研究内容,提高农林院校专业英语的教学水平,具有重要的现实意义和应用价值;为农业专业英语教学,特别是词汇教学,提供新途径,对探索围绕某一主题、以语义联想为中心的农业英语词汇学习有一定的帮助作用,对提高教学和学习的效率有重要意义;通过词汇范畴的分析,让专业学生及时把握农业热点领域,同时获得更多的扩展学习资源;探索解决目前农业专业英语教学中存在的问题,推广语料库驱动型教学模式,顺应专门用途英语(ESP)教学改革的热潮,对提高农林院校农业专业英语教学水平具有实用价值;通过对专业词汇的准确把握,提高各专业教师和学生的论文写作质量,进一步保障其在SCI等国际期刊中论文发表的成功率,提高学校的国际影响力,与建设世界一流农业大学的目标相呼应;有利于提高农林院校教师和学生的专业农业英语翻译水平,对服务于历年一次的国际农业高新技术博览会有重要意义,培养农业英语高水平人才,加快与世界农业科技接轨的步伐。

3.研究设计

3.1研究对象。

以联合国粮食及农业组织(Food and Agriculture Organization of the United Nations)官方网站上的涉农新闻报道为文本来源建设FAO农业英语语料库,文本选自于2008年至2013年的农业新闻报道,涉及农业、畜牧业、生物科技、食品安全等18个农业新闻主题,语料库总量为234696个形符,共423篇。

联合国粮食及农业组织是联合国系统内最早的常设专门机构,其宗旨是提高人民的营养水平和生活标准,改进农产品的生产和分配,改善农村和农民的经济状况,促进世界经济的发展并保证人类免于饥饿。其官方网站的新闻报道涉及面广,紧扣其工作重心,主要向全世界人民介绍当下的农业热点和粮食问题、对于向欠发达地区推广农业新技术和解决当地的粮食短缺问题起到重要的推动作用,如政府有关农业、农村、农民方面的政策;农业生产实践中的新发展、新发明、新成果;农业科研方面的新问题、新进展及新经验;农业科技战线上杰出的人物、事迹等;农业新技术推广的新办法、新途径、效果及社会效益等。

3.2技术支撑。

3.2.1清洁工具。借助PowerGrep等文本编辑工具中的查找功能,清洁收集到的语料,处理全角标点、全角字母和数字、全角空格、跳格、行尾和文中多余空格、多余空行等问题,保证语料文本由清洁文本构成,保证自动词性赋码的准确性,进而保证检索结果的准确性(梁茂成,李文中,许家金,2010)。以往的MicrosoftWord虽然也能清洁文本,但是只能处理单个文本,PowerGrep既可以处理单个文本,又可以进行批量处理。

3.2.2标注工具。一方面,可以通过BFSU Qualitative Coder1.1语料库软件进行元信息的批量标注,对每篇文本的标题、发表时间、来源、作者、期刊名称、发表时间、建库人和组织信息等信息进行标注,以便使用者清楚地知道文本信息的信息,也便于应用者单文本的查找。另一方面,为了对语料进行词性和句法结构等方面的深度研究,也为了对语料库数据分析能够更加系统精确,对特殊数据信息进行提取和处理,本研究拟对生文本语料进行词语切分和词性赋码标注。经过比选,本语料库的创建选用了比较成熟的Helmut Schmid设计的TreeTagger词性赋码软件,TreeTagger词性赋码软件可以根据概率的原则,用计算机进行自动化处理,是目前最权威的英语语料赋码软件之一。将清洁文本用Treetagger进行词性标注,标注后的文本可以进行微观的词汇研究,通过检索软件可以得到相应的形成名词词表、动词词表等。

3.2.3重命名工具。由于文本处理过程中运用到了词性标注软件,词性标注软件在对文本进行词性标注的同时,对文本的域名也进行了批量改写,域名从原来的“.txt”改为了“.txt.pos”。因此必须运用重命名软件将域名改回原来的“.txt”,才能被接下来的检索软件识别。因此,本研究可以利用Super Batch Renamer语料库软件进行批量改名。

3.2.4检索工具。日本早稻田大学Laurence Anthony设计的Antconc,许家金和贾云龙(2013)研制开发的PowerConc软件,英国利物浦大学Mike Barlow设计的Word smith Tools,北京外国语大学中国外语教育研究中心设计的PatCount等语料库软件,都可以进行单词或者多词的检索,包含词汇索引、词表生成、主题词计算等功能,这样就为农业科学学术英语的高频词进行量化分析提供了充分的技术保障,尤其是近来,许家金和贾云龙(2013)又研制开发了PowerConc软件,PowerConc对传统的词汇索引、词表生成、主题词计算等功能进行了重构、扩展和优化,正则表达式(regular expressions)的N元组(N-gram)为基础二者的有机结合,功能强大,为我们利用正则表达式检索被动语态和名物化的形式提供了强有力的技术支撑。此外,还有BFSUCollocator搭配分析软件,BFSUcolligator类连接分析专用工具,SPSS,Excel等统计分析工具,都具有免费使用、功能强大、准确率高等特点,都为本研究提供了技术支撑,能够保证本语料库的建设和研究顺利完成。

同时,国内已经有建成的众多与专业英语相结合的专门用途英语语料库和学术英语语料库,如航空航天英语语料库、医学英语语料库、旅游英语语料库、商务英语语料库,这些语料库的建立及其研究成果,都给建设农业科学学术英语语料库提供了研究方法上的宝贵借鉴。

4. FAO农业英语语料库在农业英语教学中的价值

4.1完善专门用途英语语料库的建设,促进教学改革。

建立国内首个FAO农业英语语料库,改变农业英语专用语料库发展滞后的现状,完善专门用途英语语料库的建设,为今后建立大规模农业英语语料库提供范例。语料库可以提供大量可靠性高的参照数据和新鲜实例,使语言研究更具概括性和说服力,将给以往的教学材料带来冲击,为今后农业英语教学提供直接的、可操作的、可靠性强的素材;FAO农业英语语料库将提供基于语料库的农业科技英语词典编撰、基于语料库和计算机的多媒体课件开发等,传统的编写方式比较固定,大多是依靠他人资料和个人经验编写而成,而自语料库出现之后,教材的编写处于新的形势,这将帮助教授农业英语的英语专业教师更好地向专门用途英语教师方向转变,促进专门用途英语教学改革(蔡基刚,2004)。

4.2改变教师的传统教学模式。

英语教师一旦掌握了语料库研究的使用技能,就可以通过语料库进行农业英语和通用英语词汇、句法等方面的比较,进行主题分析、例句援引、词语搭配、词素分析、话语分析等,从而在掌握学生语言学习情况的过程中,根据语料样本解决学生语言学习中遇到的问题,这种数据驱动学习的教学模式,把建成之后的FAO农业英语语料库直接应用于课堂教学,解决了英语教师缺乏农业专业知识和专业词汇,很难开展结合农业特色的英语教学的矛盾,缩小了实际使用与课堂教学的差距(程世禄,张国扬,1995)。如课前,教师可以根据课程需求和学生英语掌握水平,从FAO农业英语语料库中选取与课堂教学相关的语言信息,可以是短语,也可以是例句,建立微型文本,有针对性地为学生提供大量丰富的语例,有效解决普通教材语例复现率低的弊端,更符合英语学习规律;课中,教师可以指导学生观察更多语料,逐步修正完善规则,掌握目标知识。由于微型文本中所选的语例都是来源于FAO官方网站,语料真实、准确,不仅可以提高学生的语言实际运用水平,更有利于锻炼其探究型学习能力;课后,教师可以将微型文本共享,方便学生进行课后复习查阅,并依据学生课堂表现,从FAO农业英语语料库中抽取其他语例,编制测试题目,巩固课堂教学内容,很大程度上避免了出题过难、过偏或者脱离语言实际使用等情况。

4.3促进学生更有效地学习。

课中,学生可以以个体或者小组的形式,结合语料库驱动的方法,开展基于微型文本语言实例的自主学习或合作学习,让学生作为活动和研究的主体,探究学过文章的词块、语法及语篇特点,观察语言搭配,在阅读和搜索中获得专业知识。在这一过程中,学生运用语料库软件自主观察真实语料,从大量语料中观察某一语言现象的呈现规律,然后反思、讨论、分享这一过程中的发现,对某个语言现象的规则进行归纳;课后,语料库能让学习者在掌握了相关技术之后,根据自己的具体情况,利用已经建成的农业科学国际期刊论文语料库进行操练,在没有教师指导答疑的情况下,借助语料库的相关功能同样可以解决疑问,直到最终掌握相关的内容,这也体现了人本主义教育思想,值得国内农林院校大力探索和提倡。

5.结语

借助宏大的计算机数据库——语料库,FAO农业英语语料库的建成,为农业英语教学人员提供了一个分析、研究、描述和应用农业英语的载体,为农业英语教学、编写农业英语辞典、研究动物科学英语语言特点、各种论文写作教材编写提供了重要的语料源,而且为农业英语研究、农业英语教师发展和农业学生学习专业英语提供了全新途径。由于客观原因,FAO农业英语语料库的建设和应用仍然存在缺陷,主要表现在语料采集的深度和广度不够,但是语料库不是一次成品,相信在今后的研究中,FAO农业英语语料库会更加发展成熟完善,为农业专业其他学科的语料库建设打下基础,为国内同行的类似研究提供一定的启发。

参考文献:

[1]蔡基刚.ESP与我国大学英语教学发展方向[J].外语界,2004(2).

[2]程世禄,张国扬.ESP教学的理论和实践[J].外语教学与研究,1995(4).

[3]何中清,彭宣维,英语语料库研究综述:回顾、现状与展望[J].外语教学,2011(1).

[4]黄大网,秦羿,许赛颖.专门用途英语语料库:挑战、理据与愿景[J].宁波大学学报(人文科学版),2010(5).

[5]梁茂成,李文中,许家金.语料库应用教程[M].北京:外语教学与研究出版社,2010.

[6]梁燕,冯友程,良坤.近十年我国语料库实证研究综述[J].解放军外国语学院学报,2004(6).

[7]刘满堂.近40年英语语料库及语料库语言学研究的回顾与展望[J].陕西教育学院学报,2004(1).

[8]谭键.语料库及语料库语言学的发展与应用[J].西北工业大学学报:社会科学版,2005,25(1):61-63.

[9]卫乃兴.语料库语言学的方法论及相关理念.外语研究,2009:36-42.

[10]许家金.语料库语言学的理论解析[J].外语教学,2003(6).

基金项目:2013年西北农林科技大学人文社科重点项目资助(项目编号:2013RWZD05)

通讯作者:李丽霞

猜你喜欢
语料库应用建设
《语料库翻译文体学》评介
自贸区建设再出发
中国外汇(2019年18期)2019-11-25 01:41:56
基于IUV的4G承载网的模拟建设
电子制作(2018年14期)2018-08-21 01:38:28
《人大建设》伴我成长
人大建设(2017年10期)2018-01-23 03:10:17
保障房建设更快了
民生周刊(2017年19期)2017-10-25 10:29:03
把课文的优美表达存进语料库
GM(1,1)白化微分优化方程预测模型建模过程应用分析
科技视界(2016年20期)2016-09-29 12:03:12
煤矿井下坑道钻机人机工程学应用分析
科技视界(2016年20期)2016-09-29 11:47:01
气体分离提纯应用变压吸附技术的分析
科技视界(2016年20期)2016-09-29 11:02:20
会计与统计的比较研究