小型中国文化平行语料库的创建及应用

2016-03-16 12:41刘小燕
文山学院学报 2016年5期
关键词:语料平行语料库

刘小燕

(徐州工程学院 外国语学院,江苏 徐州221008)

小型中国文化平行语料库的创建及应用

刘小燕

(徐州工程学院 外国语学院,江苏 徐州221008)

当前,中国学习者面临中国文化失语和中国文化身份焦虑的现实,建立小型专用语料库,将语料库技术和资源引入到中国文化教学与研究中可以切实从教学实践方面改善这一现状。本文主要从建库原则、双语语料对齐和标注等方面介绍了建库方案和相关知识。建成后的平行语料库对中国传统文化教学、跨文化教学、中国文化翻译教学以及制定中国文化词表等都具有很好的辅助作用。

中国文化失语;中国文化身份焦虑;平行语料库;中国文化词表

随着全球化进程,英语逐步演变为一种国际语言,其所有权正处于一种“非国有化”进程中。[1]而随着各种英语变体地位的提高,这些“非标准”的英语变体已经和作母语或作为第一语言使用的英语一样,具有相同的政治力量并蕴藏着丰富的语言和文化研究素材。作为“世界英语”重要变体之一的中国英语也逐步受到国际英语研究者的关注。[2-3]自上世纪90年代初以来,学界开始对中国英语进行理论上的探讨,承认了中国英语的客观存在并确立其基本概念。[4-6]到了20世纪90年代末,随着语料库语言学在中国的兴起和发展,外语界建立起了中国英语学习者语料库,开始对中国学习者中介语进行系统的量化研究。事实上,中国英语包含两层涵义:其一是语言层面的特征;其二是文化层面的特征。以英语语言为载体表达中国文化不仅是跨文化交际能力的体现,也是中国英语教育的最终目的,即能够把自己的观念和文化介绍给他人,这也是中国人学习和运用外语的深层动机和目标。[7-8]然而,与此形成鲜明对比的是,当前外语教学的各个环节并未将中国文化英语纳入教学范围,中国文化英语资源严重匮乏,师生中国文化英语意识淡薄,中国英语学习者在语言和文化两个层面分别呈现出中国文化失语和中国文化身份焦虑的现象[9-11]。

另一方面,随着语料库语言学的不断发展,越来越多的学者开始研制各类双语语料库。和单语语料库相比,平行语料库具有双语对照、语言实例数量多、语域广、时效强、语境丰富等特点,受到业界越来越多的关注。目前已建成的平行语料库主要有大型通用平行语料库和小型专用平行语料库。前者一般依托团队力量和大规模课题基金建立,多用于翻译教学与翻译研究,如北外“汉英平行语料库”和厦门大学的“英汉双语对应语料库”。后者一般是研究者自建的小型平行语料库,主要包括两个方向,其一是以中国文化为核心的文化翻译平行语料库。如刘孔喜自建了《楚辞》小型平行语料库,借助语料库技术对《楚辞》进行系统化英译研究;黄立波建立约1千万字的中国现当代小说汉英平行语料库,可以对翻译文体、翻译共性、翻译语言特征、译者风格等进行系统研究;汪定明等从文化视野出发,选取了丰富的《老子》中英文译本,建立了《老子》平行语料库,全面反映了老学的文化思想内涵;胡筱颖自建了《唐诗三百首》小型平行语料库并对比了两个译本的不同翻译风格;汪晓莉等对自建的《长恨歌》平行语料库中程度副词进行研究。其二是其他专用平行语料库,如黄永新等自建了导游词平行语料库;秦平新自建了法律平行语料库并进行了增强语的语义属性和词语搭配研究;蒋丽平建立了IT文本平行语料库并对IT语料中的主题词进行了检索和分析[12-19]。

本地小型平行语料库不仅可以用于翻译研究与翻译教学,还可以结合教学实际进行各种课型的个性化、自主化的教与学,能够有效推动教学改革的具体实施。面对当前英语教育中存在的文化失语和文化焦虑现象以及中国文化英语教学资源匮乏的现状,自建小型中国文化平行语料库可以有效促进中国文化英语教学改革。基于此,本研究拟借助信息技术,充分利用语料库资源,面向EFL学习者,建设和应用中国文化平行语料库,为广大师生提供真实、具体的中国文化英语学习资源和平台;发挥语料库的技术和资源优势,辅助各种课型的中国文化英语教学,提高EFL学习者使用英语语言表达中国文化的能力,从而建构中国年轻一代的民族文化身份,以减轻文化身份焦虑,发挥中国文化在外语教学中的文化育人功能。

一、建库原则

语料库的设计原则与建库目的密切相关。语料库的总体设计或研制方案,是决定今后语料库研究和应用的关键。语料库如何选材、如何架构,会决定语料库的后续发展,甚至决定以后的研究成果。[20]在借鉴国内外已建成的双语平行语料库的基础上,参照北外通用汉英对应语料库,总体考虑以下十点:

(1)设计目的:主要应用于中国文化英语教学、研究与中国文化特色词汇表达研究;(2)语料规模:初步构建一个具有10万字词(以汉语计)以上的“小型中国文化汉英平行语料库”,以能够快速检索为宜。主要包括四大类,共19小类:社会规范类(民俗、宗教)、文化行为类(戏剧、名著、电影、饮食、服饰、中医、功夫、围棋、四大发明、丝绸之路、瓷器、民间艺术、书法)、语言类(普通话、方言)、价值观类(中国智慧、传统道德);(3)语料范围:上述建库目的决定了语料应具有经典性和针对性,能满足中国文化英语教学和中国文化词汇研究的需要;(4)代表性和均衡性:任何语料库的建设首先要考虑的问题就是语料的代表性,这是语料选择的最基本问题[21]。王克非也指出,语料的选取需要重点考虑翻译质量、语料平衡和取样问题[22]。目前市面上公开发行的中国文化平行语料数量有限且良莠不齐,语料的选取必须设定严格的标准。基于此,本语料库在选取中国文化语料时,首选正规出版的图书,尤其是权威出版社发行的书籍,并借助网络等其他途径搜集的语料予以补充。为了尽可能地兼顾语料的平衡,将单篇少于1000字或多于3000字的语料进行分层抽样;(5)双语比例:主要包括汉语原创文本和英语译本;(6)共时或历时性:以共时为主;(7)语言类型:只考虑汉、英双语的书面语文本,暂不考虑口语文本;(8)语言质量:挑选语言质量高的文本,力避太死板的直译和太活泛的意译;(9)取样策略:以抽样为主,各大类采样时要兼顾小类的均衡性;(10)标注加工:首先做到句级对齐并进行初步的分词处理和词性的标注,然后进行深层次标注,比如对语料库中包含的大量中国文化专有词汇和表达方式进行分类标注。

二、语料的整理加工

双语对应语料库的质量主要取决于语料对齐的质量和语料各类标注的质量[23]。语料对齐从上到下可以依次分为不同层次:篇章级、段落级、句子级、短语级等。考虑到中国文化教学和研究的实际需要,我们主要完成段落和句子级别的对齐。语料对齐后,再进行词性附码、篇头标注和深层标注。

1. 双语语料的对齐

平行语料库的对齐工作至关重要,否则无法用检索软件对语料进行处理和应用。目前可用于双语对齐的语料库工具(如Trados 和雪人CAT)都无法达到完全自动对齐,都需要后期进行人工核对。通过对测试文本对齐比较,我们选定雪人CAT作为对齐工具。该翻译软件界面简洁清晰,对齐功能强大,不仅能够分别导入中英双语文本,还可以同时导入双语混排文本,并允许用户对对齐后的双语文本进行编辑,是一款不可多得的对齐软件。我们首先使用Word工具人工完成段落之间的对齐,然后通过雪人CAT中的align完成句与句之间的自动对齐,最后经人工校对后完成句子层级的对齐,并通过反复检验,以确定全部文本达到句级对齐。

2. 语料的标注

语料的标注是构建语料库的一项重要工作,通过把语料中的有用信息用一组符号标注出来,可以使语料库发挥更大的作用,满足更多的教学与研究需要。本研究所指的标注不是人们通常所指的词性标注(tagging)和句法标注(parsing),而是根据建库目的和用途,对双语语料所作的关于背景信息、主题和中国文化专有词汇、表达方式等方面所作的创造性标注。

本研究使用两种标注方法,其一是在语篇篇头对语篇背景信息进行标注,如标题、语篇来源、语篇类型等。例如,一篇来自网络的关于老子哲学的语篇可以标注为 ,一篇来自出版书籍的中国茶文化语篇可以标注为 。另一种标注则是采用一整套的标签规划设计,即标注集,对中国文化专有词汇和专有表达方式进行深层标注,以方便语料库建成后对中国文化的研究。我们使用Word工具中的宏Visual Basic编辑器制作了半自动标注器,将中国文化特色词汇和表达标注为最新的主流模式XML型。如具有中国文化特色的词汇、成语:“性”“计”“气”“势”“生意”“衙门”“兵不厌诈”“学富五车”;专有表达:“头痛医头,脚痛医脚”“有朋自远方来,不亦乐乎”等。

三、小型中国文化平行语料库的应用

1. 跨文化教学

文化是语言的母体,语言是文化的载体,培养中国学习者用英语表达中国文化是传播中国文化的一项必要能力,也是中国人保持民族身份、顺利实现跨文化交流的必备条件。但目前的跨文化教学存在诸多问题:师生跨文化意识淡薄;偏重目的语文化,缺少中国文化的介入;教学理论与实践严重脱节——理论满天飞,实践无改观。在此背景下,自建小型中国文化平行语料库不仅能为各种课型的中国文化教学提供具体可行的资源和技术保障,而且能有力推动跨文化教学实践的深入实施。

将中国文化引入英语教学可以采用独立课型:如中国文化英语课、中西文化对比课,也可采用课内兼容课型,如在大学英语课、综合英语课、精读/泛读课中将中国文化作为补充引入。不同课型可以选择适当的方法和手段进行。常用的文化教学方法包括:(1)比较法——比较文化差异,尤其是调动学生去发现和理解文化差异,如大学英语新视野教材第三册第四单元Five Symbols of American Culture介绍了美国的五大文化标志,教师可以引导学生在自建的小型中国文化平行语料库中挑选出能够代表中国文化特色的标志,如中国功夫、围棋、汉字、旗袍、孔子,并能用英语大体介绍不同文化标志的历史渊源和典型文化特征;(2)体验法——注重体验式教学、活动或情景教学,创造文化情景让学生体验文化角色;(3)3C文化导入法——文化旁白(Cultural Aside)、文化包(Cultural Capsules)、文化丛(Cultural Clusters),可以挑选有关中国文化的某一篇,组织学生进行专题讨论。

2. 翻译教学

建成后的小型中国文化双语平行语料库属于专用语料库,与大型权威平行语料库及其他自建的平行语料库相比,具有针对性强和独具中国文化特色等特点,可以广泛应用于中国文化翻译教学。通过关键词检索可以查询双语转换中的疑难对等词,特别是具有浓厚中国文化特色的成语、习语、专有表达等。同时,其丰富的语境还有助于揭示和归纳双语转换中词语或句子的翻译规律,提高学习者翻译的灵活性和得体性。

(1)中国文化特色成语、习语、专有表达查询

中国文化双语平行语料库是为中国学习者了解和掌握中国文化英语而创建,和汉英词典相比,具有明显的优势:一是具有针对性,二是检索功能灵活方便,能检索到许多汉英词典无法提供的内容,因而能够为翻译教学和学生自主学习提供最直接的帮助。例如,老子认为世界上一切事物都有其“性”,显然此处的“性”并非我们通常所指的“性格”“性能”“性别”或“必要性、复杂性”等概念,而是中国传统哲学观的一个重要概念,要了解老子的哲学观才能准确表达出中国传统哲学的精髓。查阅汉英词典及网络在线词典我们都无法找到合适的英文翻译,但是使用自建的语料库则会发现此句的“性”可以翻译为:Everything in the world has its own way of being。同样,其它诸多中国文化习语或专有表达因在非固定词语且使用场合较少而为一般汉英词典所不收,却可以在我们自建的中国文化语料库中找到其对译。例如:

a.无为而无不为act through non-action;

b.大巧great ingenuity;

c.上善若水the greatest virtue is like water;

d.<易经>“生生之谓易”The book of Changes explains the continuous creation of life is change. the creation of life;

e.程颢说“万物之生意最可观”Life and its state of being is most worthy of appreciation。

(2)双语转换规律归纳

受英汉两种语言系统及具体语境的影响,双语转换往往灵活而丰富。汉语的词和句是靠本身语义的贯通及对语境的依赖来体现其逻辑关系的,是重意合的结构。而英语句子成分之间必须要由连词、介词或关系词相连接,语言间逻辑性较强,强调各成分间的从属、平行、修饰及对比关系,是一种重形合的结构。“汉语是意和(parataxis)语言,结构松弛,形散而神聚,用词简洁,英语是形和(hypotaxis)语言,结构严谨”。[24]中国文化语料库的英译,不仅涉及两种语言表征的符号转换,还具有传递中国文化内涵的功能,需要根据语言系统差异和语境特点进行灵活处理。例如,汉语的否定结构和否定意义英译时,可以使用有标记的否定词或结构如not,must not,也可以使用无标记的否定表达,如 free of;也可以转换为英语的肯定句(a句)。

a. 没有“无为”,也就没有“自然”。

“Non-action” is the guarantee of “naturalness”.

b. 婴儿的状态、无知、无欲、纯净、真实。

The state of the newborn is free of any knowledge,desire,impurity or falsehood.

c.“主不可以怒而兴师,将不可以愠而致战。

A head of state must not wage a war spurred by a momentary anger,and the commander and general must not wage a war spurred by a momentary bad mood.

在蕴涵中国文化因子的专有名词英译时,既要保护和宣传中国文化,又要确保不会让英文读者产生歧义,一般采用意译为主,音译加意译为辅的翻译策略。例如,人名:老子(Laozi)、孙子(Sunzi);专名:阴(Yin)、阳(Yang)、气(Qi)等已经固化为中国文化的特有符号,直接使用音译。对于那些不仅蕴涵中国文化因子,而且具有辨别功能的地点、场所、文学作品、服饰或其他文化现象,则可以使用意译或意译与拼音相结合的策略。如天坛the Temple of Heaven,旗袍Cheongsam,龙脉Contours of a Dragon,《聊斋志异》Strange Tales from Make-do Studio(Liao zhai zhi yi),《道德经》Vitue (Dao de jing)等。

3.制作精确的中国文化教学大纲和词表

在现行英语专业和非英语专业教学中,中国文化英语教学尚处于空缺或起步阶段,没有直接可以借鉴的教学大纲和词表。若要在不同课型中切实开展中国文化英语教学,亟需制定符合学生需求和水平的中国文化教学大纲和词表。语料库可以为确定教学大纲中的词汇范围和选取标准提供客观依据,可以克服经验或臆断等主观性。由于该语料库是中国文化专用语料库,我们按奈达相关理论,将文化教学分为五个方面:生态文化、物质文化、社会文化、宗教文化、语言文化等,并设计相关赋码确定这五个方面的典型中国文化词汇、习语和表达,从而制定出精确的中国文化教学词表。[25]按学生实际水平和兴趣,制定校本中国文化英语教学大纲。

四、结语

自建小型中国文化双语平行语料库可以弥补当前中国文化英语资源的匮乏,建成后可以根据需要应用于不同课型的中国文化教学,能够为开展中国文化教学提供具体有效的资源和途径,可以帮助教师制定中国文化教学词汇表,提高中国文化在当前英语教学中的地位,提高学生中国文化英语表达能力和翻译能力,最终实现中国文化的传播,具有广阔的使用前景和潜在的开发价值。当然,自建中国文化双语语料库不仅需要大量的人力和精力,还需要相关的建库理论和技术,需要全盘设计,团体配合,周密实施,对于文科出身的英语教师来说会是一个很大的挑战。

[1] Mckay, S. L. Teaching English as an International Language [J]. EL T Journa, 2003(2):145.

[2] Crystal, D. English as a Global Language [M]. Cambridge: Cambridge University Press, 1997 .

[3] Bolton,K.Chinese Englishes:A Sociolinguistic History[M] . Cambridge: CUP: 2003.

[4] Smith, L.(Ed.). Readings in English as an International Language [C] . Oxford: Oxford University Press, 1983.

[5] 李文中. 中国英语与中国式英语[J] . 外语教学与研究,1993(4):18 - 24.

[6] 汪榕培. 中国英语是客观存在[J] . 解放军外国语学院学报, 1991(1):1-8.

[7] 李文中. 英语全球化及其在中国本土化的人文影响[J].河南师范大学学报,2006(3):131-134.

[8] 肖龙福,肖笛,李岚,宋伊雯. 我国高校英语教育中的中国文化失语现状研究[J]. 外语教学理论与实践,2010(1):39-46.

[9] 郭佳. 英语专业教学中的中国文化意识培养——份基于使用《阅读中国》进行文化教学改革的报告[J]. 外语学刊,2011(3):148-150.

[10]兰军. 英语专业学生中国文化英语表达能力研究[J]. 宁夏大学学报,2010(2):190-193.

[11]韩海燕. 中国语境下EFL学习者文化身份焦虑研究[D].上海外国语大学,2014.

[12]刘孔喜. 小型《楚辞》汉英平行语料库的创建与应用[J]. 湖北民族学院学报,2012(1):122-125.

[13]黄立波. 中国现当代小说汉英平行语料库:研制与应用[J]. 外语教学,2013(6):104-109.

[14]汪定明,李清源. 《老子》汉英翻译平行语料库建设[J].上海翻译,2013(4):60-64.

[15]胡筱颖,基于语料库的《唐诗三百首》英译本研究[J].四川师范大学学报,2014(3):118-124.

[16]汪晓莉,李娇娇.基于语料库的《长恨歌》英译本中程度副词的强化研究[J]. 上海对外经贸大学学报,2015(5):81-89.

[17]黄永新.导游词平行语料库的构建及应用[J]. 吉首大学学报,2011(2):144-146.

[18]秦平新.法律英语增强语的语义属性及词语搭配调查——一项基于法律汉英平行语料库的研究[J].新疆大学学报, 2011(2):153-156.

[19]蒋丽平.IT文本英汉平行语料库的研制与应用[J].广州大学学报, 2013(8):88-93.

[20]Sinclair. J. Corpus, Concordance, Collocation[M]. London:Oxford University Press,1991.

[21]Biber, D. Representativeness in Corpus Design[J]. Literary and Linguistic Computing,1993(4): 243-257.

[22]王克非.双语对应语料库:研制与应用[M]. 北京:外语教学与研究出版社,2004.

[23]王克非.中国英汉平行语料库的设计与研制[J]. 中国外语,2012(6):23-27.

[24]马秉义,陈维祥.“看”的音译联想及其汉英比较研究[J]. 外语研究,2006(4):23-24.

[25]奈达.翻译科学探索[M]. 上海:上海外语教育出版,1964.

(责任编辑 查明华)

Construction and Application of Small-Scale Parallel Corpus of Chinese Culture

LIU Xiaoyan
(School of Foreign Languages, Xuzhou Enginerring University, Xuzhou Jiangsu 221008, China)

Faced with the Culture Aphasia and culture identity anxiety of Chinese EFL learners, the present research attempts to construct a specialized parallel corpus by introducing corpus technology, resources and means of teaching and studying Chinese culture. It fi rst elaborates on the general design and its related computing technology, focusing on the constructing principle, alignment and tagging of the corpus. With the completion the small-scale parallel corpus, it would help promote the teaching of Chinese traditional culture, cross culture communication, translation in Chinese culture and the developing of Chinese cultural lexicon.

Chinese cultural Aphasia; Chinese identity anxiety; parallel corpus; Chinese cultural lexicon

H085

A

1674 - 9200(2016)05 - 0092 - 05

2015 - 11 - 23

江苏高校哲社研究项目“面向EFL学习者文化身份建构的中国文化语料库建设与研究”(2015SJD476)阶段性成果。

刘小燕,女,江苏徐州人,徐州工程学院外国语学院副教授,主要从事语料库语言学与二语习得研究。

猜你喜欢
语料平行语料库
向量的平行与垂直
平行
逃离平行世界
《语料库翻译文体学》评介
基于语料调查的“连……都(也)……”出现的语义背景分析
基于COCA语料库的近义词辨析 ——以choose和select为例
再顶平行进口
基于JAVAEE的维吾尔中介语语料库开发与实现
《苗防备览》中的湘西语料
国内外语用学实证研究比较:语料类型与收集方法