张相明
摘要随着电子技术在社会上的广泛运用,电子词典正逐渐取代纸质词典,成为广大用户的首选。词典编纂过程中,各种电子工具的使用,极大地提高了编纂质量和效率。电子词典学也逐渐成为研究范围越来越广泛、学术影响越来越深远的词典学分支学科。文章分析了电子词典的发展和分类、电子词典学的定义和范围,重点评介了《电子词典学》一书,并介绍了电子词典学的最新研究成果。
关键词电子词典词典学电子词典学电子化
一、引言
无论是在国内还是国外,词典编纂历史源远流长,而严格意义上的词典学研究则是最近数十年的事。1971年,捷克词典学家Ladislav Zgusta的专著Manual of Lexicography(《词典学概论》)出版,标志着词典学已成为一门相对独立的学科;而在国内,对词典学的系统性、专门性研究则始于1979年创刊的《辞书研究》。经过三四十年的发展,词典学已逐渐发展成为一门研究范围广泛、兼具实践性和理论性的学科。词典学是“关于词典和其他工具书的专门行为和学科领域”,包括两个基本组成部分:“词典学实践(或词典编纂)和词典学理论(词典研究)。”(Hartmann & James 1998: 85)
词典和词典学的发展是与科学技术的进步息息相关的。千百年来,词典编纂出版的历史按照媒介和载体的不同大致分为四个阶段:以“手”与“纸”为工具的手工书写阶段,以“火”与“铅”为特色的印刷阶段,以“光”与“电”为标志的计算机时代,以“网”与“天”为特征的网络时代。(魏向清,张柏然 2001)其中,计算机时代和网络时代类属于广义上的电子时代。进入21世纪以来,词典编纂的电子化特征更加明显,以“五大词典”(Big Five)为代表的英语学习词典大多在发行纸质版的同时推出光盘版和网络版,在全球久负盛名的《牛津英语词典》(The Oxford English Dictionary)不久前宣布从第三版开始将不再推出纸质版,专注研发电子版词典。
二、21世纪的词典学与电子技术
作为20世纪最重要的科技发明之一的计算机,自问世不久就被应用于词典编纂。1974年出版的《牛津高阶英语词典》第三版(Oxford Advanced Learners Dictionary, 3rd edition, 简称OALD3)是第一部把计算机技术应用到词典编纂实践中的学习词典。1978年问世的《朗文当代英语辞典》第一版(Longman Dictionary of Contemporary English,1st edition, 简称LDOCE1)则首次采用数字技术对各类语言信息进行标注,使词典真正计算机化。而1987年推出的《柯林斯COBUILD英语词典》第一版(Collins COBUILD English Dictionary,1st edition,简称CCED1)在语料收集、词目选择、词条编辑等词典编纂的各个阶段均利用了计算机技术,标志着计算机辅助词典编纂取得了突破性的进展。另一方面,词典学界也很早就开始关注词典编纂中的计算机辅助作用。Aitken(1971)就撰文介绍了在历史词典编纂中使用计算机收集和分布语境材料的技术。Viks(1981)提出了使用计算机进行词条形态分类所存在的问题。Knowles(1983)在英国埃克塞特举行的国际词典学会议上发表题为Dictionaries and Computers的论文,分析了词典编纂中运用计算机的主要领域和方法,并展望该领域的未来发展前景。
基于电子技术的计算机语料具有强大的编辑统计功能,可以在许多方面为词典编纂提供巨大的便利,如确定词目及其义项、限词释义、提供例证、说明语法信息、描述语体特征、增补修订等,基本涵盖了词典编纂的各个阶段。电子化是未来词典和词典学的发展方向。在展望21世纪的词典发展前景时,电子化已经成为词典学界的普遍共识。现代西方词典学的主要开创者Ladislav Zgusta在1992年于菲律宾马尼拉举行的首届亚洲国际词典学研讨会上做了题为“21世纪的词典学”的报告,指出:“这些美好的前景是伴随着与词典学密切联系的两个领域的良好发展的,那就是语言学和计算机科学。”(Zgusta 1994:3)无独有偶,国内词典学的主要奠基者黄建华(1999)对21世纪的词典学发展前景进行展望时,认为词典学具有五个发展趋势,其中就包括“电子语料库研究”和“语言学研究”,并且呼吁词典学发展“亟须计算语言学的介入”。
进入21世纪以来,为了探析新时期词典学发展的脉络,词典学界展开了更加系统的论述。2009年,西方词典学界推出了两部反映词典学最新发展路径的著作:《21世纪的词典学》(Lexicography in the 21st century)和《十字路口的词典学》(Lexicography at a Crossroads)。两部著作均对词典学的电子化发展给予了特别关注。《21世纪的词典学》是向丹麦著名词典学家Henning Bergenholtz致敬的论文集,汇集了来自8个国家的14位词典学家的最新研究成果。该书分为五个部分,其中第四部分为“数据检索与语料库词典学”(Data Retrieval and Corpus Lexicography),探讨语料库在词典编纂中的应用以及电子词典的查询运用等。《十字路口的词典学》也是一部论文集,目的是“关注词典学的未来理论发展”(Bergenholtz et al.2009:9),收录了来自世界各地知名词典学家的15篇论文,其中有8篇是关于电子词典、网络词典、电子语料库、电子工具等方面的,因此该书的副标题即为“今天的词典和全书,明天的辞书编纂工具”,关注词典编纂的电子化趋向。
三、电子词典与电子词典学
现代科学技术的迅猛发展加速了社会信息化、网络化的进程,也促进了电子词典在20世纪末和21世纪初的飞速发展。电子词典是词典学与计算机科学相结合的产物。计算机具有海量的存贮介质、超高速的运算处理能力、便捷的信息提取路径和良好的显示界面,为电子词典的发展奠定了坚实的物质基础。电子词典(electronic dictionary)是基于计算机和计算语言学(computational linguistics)理论而开发的语言处理和识别系统,与印刷型(或纸质型)词典(print/paper dictionary)相对,是以光盘、磁盘及芯片等光电磁介质作载体,借助微型处理器及相关设备进行查询和检读的工具书,是存储在电子媒体上的语言知识库。Hartmann & James(1998: 47)把“电子词典”定义为“一种使用电脑和相关技术来呈现屏幕载体信息的工具书”。Nesi(2000: 839)认为“电子词典这个术语可以用来表示提供语词的拼写、语义、使用等信息并以电子形式存储的任何工具书。因此,文字处理系统里的拼写检查器、扫描翻译器、在线教学资源术语库或者著名纸质词典的电子版本都属于电子词典”。
早期的电子词典时代可以追溯到20世纪60年代末期,1963年出版的《韦氏新大学词典》(第七版)(Websters Seventh New Collegiate Dictionary,7th edition)从纸质文本形式转变成了电子文本形式,开启了电子词典新时代(Wilks et al. 1996: 81)。与传统的纸质词典相比,电子词典在容量、查询、携带、升级等多方面均具有无可比拟的优势。Sharpe (1995: 49)认为“电子词典的优点和现在的年轻人对电子设备的熟练使用将终究把纸质词典降到次要位置”。Nesi (1999:56)认为电子词典“具有信息量远远大于一本书及让用户几乎瞬间进入数据库等优点”。Liou (2000: 474)也主张“电子词典要优于与之相应的纸质版词典,因为前者具有更加广泛和具体的信息”。2011年6月23日,中国新闻出版研究院发布了《电子词典内容质量及版权状况检测报告》,显示电子词典具有轻薄小巧、方便携带和操作简单、存储量大等优点:被测产品中最轻的仅为102克,14款产品平均重量为207.6克,大大轻于平均超过1公斤的纸质词典;经过推算,实际每本电子词典重量仅为纸质词典的1/51;一款电子词典产品中通常包含多部词典内容,有9款被检测产品内置了15部以上辞书,最多的一款内置了42部。
电子词典还可以按照不同视角再分为不同类别。按照呈现载体的不同,电子词典可以分为储存于光电磁等介质上的词典、多语术语数据库、机器词典、词库或数据库、网络词典和文字处理平台拼写检查器等。Martin(1992: 193—194)按照使用对象把电子词典分为:1)人用词典(dictionaries for human users);2)基于计算机的词典(computerbased dictionaries);3)机读词典(machinereadable dictionaries);4)术语库(lexical/term banks);5)机器词典(machine dictionaries);6)词汇数据库(lexical databases);7)人工智能词库(artificial intelligence lexicons)等。Nesi(2000: 842)则把电子词典分为:网络词典(internet dictionary)、在线课件术语库(glossary for online courseware)、学习词典光盘版(learners dictionary on CDROM)、袖珍电子词典(pocket electronic dictionary)等。在词典学界产生广泛影响的电子词典分类应是Lehr (1996: 315)提出的二分分类法,详见图1。该分类法根据词典来源、信息呈现方式、在线状况、电子媒介等方面进行划分,具有较强的实用性。
电子词典得到越来越广泛的运用之后,电子词典学(electronic lexicography)便应运而生了。电子词典学一度被称为计算机词典学(computer lexicography)或计算词典学(computational lexicography),发轫于20世纪50年代末60年代初,当时作为研究对象的电子词典主要是机读词典(machinereadable dictionaries)。电子词典学有广义、狭义之分。以电子词典为研究对象的学科领域,是狭义上的电子词典学。Hartmann & James (1998: 48)认为电子词典学就是计算词典学(computational lexicography),而计算词典学是“关于电子词典的设计、编纂、使用和评价等的活动总称”(Hartmann & James 1998: 26)。Granger (2012: 2)也认为“电子词典学被用作有关电子词典的设计、使用和应用的涵盖性术语”。
而广义上的电子词典学除涵盖狭义外,还包括词典编纂中的电子技术运用。Logan (1991: 353)认为计算词典学(即电子词典学)的研究范围可被限定为“词典编纂中的计算机使用”。Kilgarriff (2010)也认为“电子词典学范围很广,包括:词典编纂中的技术使用,高科技运用中的词典使用,电子词典的编纂出版等”。电子词典学涵盖了词典编纂过程的各个主要阶段,如语料提取、词义辨别、文本输入、印刷技术使用等。
在科技日益发展的现代社会,电子词典学具有广阔的发展前景。“电子词典学的发展方向是这样的:规模更大,更加灵活,格式更加统一,更加注重用户友好,检索更加便捷,词典学内部和外部信息更加丰富。”(Sobkowiak 1999: 275)国外词典学越来越关注电子词典学的发展。Schryver(2003)详细分析了电子词典和纸质词典的利弊,重点展望了电子词典时代中词典编纂者的梦想。近年来,电子词典学国际研讨会(eLex)每两年举办一次,前两届分别于2009年在比利时的LouvainlaNeuve和2011年在斯洛文尼亚的 Bled举行,会后分别出版了论文集《21世纪的电子词典学:新挑战和新应用》
(eLexicography in the 21st Century: New Challenges, New Applications)和《21世纪的电子词典学:新用户和新应用》(Electronic Lexicography in the 21st Century: New Applications for New Users)。最新一届则于2013年10月在爱沙尼亚的Tallinn举行。
在学术界,为电子词典学获取广泛声誉、标志电子词典学逐渐独立发展的代表性成果是2012年牛津大学出版社推出的论文集《电子词典学》(Electronic Lexicography)。该书汇集了20篇论文,呈现了词典计划、编纂、出版等各个阶段的电子技术运用,囊括了电子词典的种类(如通用词典和专门词典、单语词典和多语词典、搭配词典、手语词典、合作词典等)、载体(如光盘词典、网络词典、掌上词典等)、词典编写系统和语料库运用等各个主要方面,展现了电子词典学的最新研究成果。以下将重点评介该书。
四、《电子词典学》内容评介
《电子词典学》由来自比利时鲁汶大学(Catholic University of Louvain)的英语语料库语言学研究中心的Sylviane Granger和Magali Paquot主编,作者为来自世界各地的29位知名词典学家、词典编纂家,如Michael Rundell, Robert Lew, Patrick Hanks, Sven Tarp, Hilary Nesi等。全书除导论外,分为三个部分,详见表1。
作为“导论”的“电子词典学:从挑战到机遇”一文是由主编之一的Sylviane Granger撰写的,在简要介绍电子词典的历史发展和基本概念后,从理论、方法和实证等三个视角依次探讨了在电子词典的发展过程中具有决定性作用的6个因素:即语料库运用(corpus integration)、更多更好的语料(more and better data)、输入效率(efficiency of access)、用户化(customization)、融合化(hybridization)和用户介入(user input)等。作者认为,电子词典是“对结构化电子数据进行的人本主义汇集,该数据描写了一门或多门语言中语词的形式、语义和使用,并储存于个人电脑、互联网、移动装置等载体中”(Granger 2012: 2)。此外,基于计算机技术的词库,如WordNet等,也属于电子词典学的研究范围。作者对电子词典学的现状和发展给予了高度评价,认为“今天的词典学在很大程度上跟电子词典学同义,并且许多专家预测纸质词典在不久的将来即将消失”(Granger 2012:2)。
该书第一部分主要介绍了电子词典学发展的理论和实践背景。该部分指出电子词典学出现的时期正是词典学的转折转型期,这与词典学界诸多专家的观点是不谋而合的。Bergenholtz et al. (2009:8)把他们主编的一部论文集命名为“十字路口的词典学”(Lexicography at a Crossroads),认为词典学“已经到达十字路口,若不进行深入反思,将很难再进一步发展”。本部分探索了计算机技术给词典学理论研究和词典编纂实践带来的重要变革,包括:新颖的理论范式,词典编纂过程中从业人员的角色重新定位,语料库和语料库处理工具不断增长的重要作用,描述和整合短语的新方法,以及词典编写系统的多重作用等。Michael Rundell的“编者视角的词典自动化编纂之路”指出词典编纂过程从人力向电脑的转向对于词典编纂业来说既是机遇也是挑战,并以大型词汇数据库DANTE(Database of Analysed Texts of English,英语分析文本数据库)项目为例说明了数据库在词典编纂中的运用。Adam Kilgarriff & Iztok Kosem的“词典编纂者的语料库工具”对常用的词典编纂工具进行了分类,并以词项素描引擎Sketch Engine为例说明了词典编纂工具的功能和运用。Patrick Hanks的“词义与词语使用:语料库证据和电子词典学”分析了词典学传统以及语料库在词典学中的影响,并以Wiktionary(维基词典)为例说明未来电子词典学的发展模式。Andrea Abel的“词典编写系统及其他”概述了DWS(Dictionary Writing System,词典编写系统)的发展历程,分析了DWS的主要功能和构成元素(编辑工具、数据库、项目管理工具等),对比分析了套装软件(offtheshelf software)和内部软件(inhouse software)的异同等。Sven Tarp的“词典编纂从纸面工作到电子工具转变中的理论挑战”一文,以功能理论为视角,认为词典学应类属于信息科学,词典是用以满足各种信息需求的实用工具,电子词典学的优势就在于能够通过提供全新的检索方式和经过过滤的语料满足用户的信息需求。Danie Prinsloo的“资源缺乏语言的电子词典学:以南非为例”一文,以南非使用的南非荷兰语(Afrikaans)和班图语(Bantu languages)的电子词典为例,以英语电子词典为参照物,探讨了资源缺乏语言电子词典的编纂技巧,认为词典应符合动态性(dynamic)、智能性(intelligent)和适应性(adaptive)等特点,并强调用户参与的重要性。
第二部分重点呈现了应用于当前电子化词典编纂的创新性词典工程。Serge Verlinde & Geert Peeters的“再论数据输入:交互式语言工具箱”以欧洲广泛运用的词典与学习工具ILT(Interactive Language Toolbox,交互式语言工具箱)为个案,分析在线词典的搜索功能,并指出用户友好的界面(interface)设计可以满足用户的解码、翻译、编码、词频分析等需求。Magali Paquot的“LEAD词典编写助手:一体化词典语料库工具”介绍了旨在帮助外语人士学术语篇写作的词典LEAD(Louvain English for Academic Purposes Dictionary,鲁汶学术英语词典),探索如何运用语料库来定制不同语域的用户需求,分析词典具有的语境相关和用户需求等两个特征。Natalie Kübler & Mojca Pecman的“ARTES特殊用途双语词典:从搭配到高阶短语”从双语视角探讨特殊用途语言(LSP)在线词典的编写,以法国巴黎研发的在线词典ARTES(Aide à la Rédaction de TExtes Scientifiques,Dictionaryassisted writing tool for scientific communication,词典辅助科学用途写作工具)为个案研究,重点分析搭配和高阶短语的处理。MarieClaude LHomme et al.的“DiCoInfo在线语料库的搭配解码:从常规呈现到用户友好呈现”介绍了在线三语(英、法、西)词汇库DiCoInfo(Dictionnaire fondamental de linformatique et de lInternet,Fundamental Dictionary of the Information and the Internet,信息与互联网基础词典),该词典提供了计算机和互联网领域里相关术语在英、法、西三语中的相应说法、词汇语义特征和相关搭配等。Toma Tasovac的“基于Wordnet的学习词典学的挑战:以Transpoetika词典为例”首先探讨了基于WordNet的双语学习型电子词典面临的机遇和挑战,再重点推介了基于WordNet编纂的塞尔维亚语—英语学习词典Transpoetika词典,并讨论了通过Flickr和Twitter等网络社交平台延伸词典适用范围的策略等。Christian Meyer & Iryna Gurevych的“维基词典:专家词典的新对手?”推介了交互式在线免费词典Wiktionary(维基词典),包括英、德、俄三种语言的不同版本,内容包括词汇、语义、跨语言等信息,形式包括术语、词位、义项、范畴、语域等。Jette H. Kristoffersen & Thomas Troelsgrd的“手语的电子词典处理:以丹麦手语词典为例”对比分析了手语词典和普通词典的异同,并以DSLD(Danish Sign Language Dictionary,丹麦手语词典)为个案,分析词典满足用户不同需求的多种渠道,最后展望手语电子词典未来将面临的挑战。
第三部分主要从用户视角审视电子词典在适应不同类型用户(尤其是学生和译者)的需求方面的有效性。Anna Dziemianko的“论纸质词典和电子词典的优点”一文通过近期的实证调查报告对比分析了纸质词典和电子词典在解码、编码、速度、查询频率、学习、欣赏等多重功能方面的异同,并指出未来词典调查的发展趋势。Robert Lew的“如何使电子词典更有效?”则从数据检索和新型数据等两方面探讨提高电子词典效率的途径,认为电子词典应充分利用音频、图片、动画、视频等多媒体工具作为词典呈现形式。Hilary Nesi的“备选电子词典:揭秘不为人所知的做法”把由非知名学术、出版机构编纂出版的电子词典称为AED(Alternative EDictionary,备选电子词典),指出这类词典的语料也许直接从网络上借用,可以与普通词典互补,但往往被学术界忽视,因此呼吁学术界和用户更多地关注、评判备选电子词典。Lynne Bowker的“在电子词典学时代适应译者需求:可行性探索”一文分析了翻译词典与内容和呈现两方面相关的各个词典要素,并呼吁加强词典编者和译者之间的交流。Pedro A. FuertesOlivera的“论商务英语教学中免费网络词典的可用性”分析了商务英语与词典学的关系,阐述了商务英语教学中的免费网络词典运用,然后实证对比分析了商务英语教学中纸质词典和网络词典的优劣等。Carolin MüllerSpitzer et al.的“在线词典使用:一项实证研究项目的重要发现”介绍了针对1000余名用户的在线词典使用调查,结果显示用户倾向于使用大屏幕词典,更熟悉与纸质词典相对应的电子词典信息类别,而相对忽视电子词典特有的信息元素,这是因为大多数用户对电子词典的许多内容设置是相对陌生的。
五、结语
《电子词典学》是迄今为止国际词典学界第一部对电子词典和电子词典学的发展进行全方位探讨的专门性论文集,是与当前电子词典的蓬勃发展相呼应的,也预示着新世纪词典学研究的电子化发展趋势。与传统的纸质词典相比,形式各异的电子词典受到更多用户,尤其是年轻一代用户的青睐,且大有超越之势。词典编纂过程中的电子工具运用,也已经常态化,很大程度上还决定着词典的整体质量。国内词典学界也对电子词典和电子词典学的发展进行了学术探讨。章宜华(2004)早在几年前就专题分析了计算词典学(即电子词典学)和新型词典(即电子词典)以及两者之间的关系。但整体而言,电子词典学研究明显落后于发展势头迅猛的电子词典。在技术元素越来越重要的未来日子里,电子化的词典学研究具有更加广阔的发展空间。
参考文献
1.黄建华,词典学的回首与前瞻.外语研究,1999(3).
2.魏向清,张柏然.新世纪词典学理论研究趋势展望.外语与外语教学,2001(4).
3.章宜华.计算词典学与新型词典.上海:上海辞书出版社,2004.
4.Aitken A J. Historical Dictionaries and the Computer.∥
Wisbey R A.(ed.) The Computer in Literary and Linguistic Research.Cambridge: Cambridge University Press, 1971.
5.Bergenholtz H, Nielsen S. Tarp S. (eds.) Lexicography at a Crossroads: Dictionaries and Encyclopedias Today, Lexicographical Tools Today.Bern, New York: P. Lang, 2009.
6.Granger S. Introduction: Electronic Lexicography—from Challenge to Opportunity.∥Granger S.Paquot M.(ed.)Electronic Lexicography. Oxford:Oxford University Press,2012:1—14.
7.Hartmann R R K,James G. Dictionary of Lexicography.London & New York: Routledge, 1998.
8.Kilgarriff A. How to Monetise a Web Presence (and Hoover a Moose).∥Granger S,Paquot M.(ed.) eLexicography in the 21st Century:New Challenges, New Applications.Proceedings of eLex 2009. LouvainlaNeuve:Louvain University Press,2010:45—62.
9.Knowles F E. Datastructuring Facilities and Lexicography.∥Hartmann R R K.(ed.) Lexicography:Principle and Practice.London:Academic Press,1983.
10.Kosem I, Kosem K.(eds.) Electronic Lexicography in the 21st Century:New Applications for New Users.∥Proceedings of eLex 2011. Ljubljana :Institute for Applied Slovene Studies,2011.
11.Lehr A. Zur neuen LexicographicaRubrik ‘Electronic Dictionaries.Lexicographica.International Annual for Lexicography,1996(12):310—317.
12.Liou H C.The Electronic Bilingual Dictionary as a Reading Aid to EFL Learners:Research Findings and Implications.Computer Assisted Language Learning,2000:13,467—476.
13.Logan H. Electronic Lexicography.Computers and the Humanities,1991(25):351—361.
14.Martin W. On the Organization of Semantic Data in Passive Bilingual Dictionaries.∥Ezquerra M A.(ed.)EURALEX90 Proceedings/Actas del IV Congreso Internacional/IV International Congress.Barcelona:Biblograf,1992:193—201.
15.Nesi H. A Users Guide to Electronic Dictionaries for Language Learners.International Journal of Lexicography,1999:12,55—66.
16.Nesi H. Electronic Dictionaries in Second Language Vocabulary Comprehension and Acquisition:The State of the Art.∥Heid U,Evert S,Lehmann E. (eds.)Proceedings of the Ninth Euralex International Congress.EURALEX 2000.Stuttgart:Universitt Stuttgart,2000:839—847.
17.Nielsen S, Tarp S. (eds.)Lexicography in the 21st Century:In Honour of Henning Bergenholtz.Amsterdam,Philadelphia:John Benjamins Pub. Co.,2009.
18.Schryver G M D. Lexicographers Dreams in the ElectronicDictionary Age. International Journal of Lexicography,2003(2):143—199.
19.Sharpe P A. Electronic Dictionaries with Particular Reference to the Design of an Electronic Bilingual Dictionary for Englishspeaking Learners of Japanese. International Journal of Lexicography, 1995(1):39—54.
20.Sobkowiak W. Pronunciaion in EFL MachineReadable Dictionaries. Poznan:Motivex,1999.
21.Viks V. Automatic Dictionaries of Estonian. Tallinn, Estonia: Keelja kirjandus, 1981.
22.Wilks Y A, Slator B M,Guthrie L M.Electric Words: Dictionaries, Computers and Meanings.Cambridge: The MIT Press, 1996.
23.Zgusta L. Lexicography for the TwentyFirst Century.∥Bonifacio S, Leonard E N. (eds.)Papers from the First Asia International Lexicography Conference.Manila: Linguistic Society of the Philippines. 1994: 3—15.
24.Zgusta L. Manual of Lexicography.The Hague: Mouton, 1971.
(广东财经大学外国语学院广州510320)
(华南师范大学外国语言文化学院广州510631)
(责任编辑李潇潇)