基于DPS词典编纂平台的《新世纪英汉大词典》出版的协同性

2017-03-07 19:29谢金霞
辞书研究 2017年1期
关键词:词条义项词典

谢金霞

摘要数字化不仅颠覆了词典的呈現形式,更革新了词典出版的方法。词典编纂平台便是应运而生的产物之一。在实际出版过程中,应如何运用这一平台以实现出版效益的最大化,则是值得词典出版人士及相关学者深思的问题。文章以基于DPS词典编纂平台的《新世纪英汉大词典》为例,从Entry Editor的加注功能入手,分析了中英出版社、译者、审订者、学科专家等各方编纂人员在内容上的实时交互式协同,从而提高了出版效率,保证了词典内容的规范性和权威性。

关键词词典出版协同性《新世纪英汉大词典》DPS词典编纂平台Entry Editor加注

一、 引言

词典出版是项巨大的工程。编者(有时还有译者)、审订者、学科专家等,所涉人员较多;词目、例证、发音、语法信息、文化知识等,编辑内容庞杂;更有字体、字号、标点等极其琐碎的排版问题需要考虑。仅凭体例,很难确保词典内容的规范统一性。另外编者、审订者等在编纂过程中遇到的一些问题很难与相关人士及时沟通,无法实现实时交互式协同,在一定程度上降低了编纂效率。这些问题都亟需通过一个成熟的词典编纂平台来解决,从而保证词典内容的规范性和权威性。随着计算机技术的迅猛发展,一系列面向词典出版的编纂平台应时而生。在国外,有DPS、TshwaneLex等广泛用于词典编纂的平台;在国内,教育部语言文字应用研究所开发了“基于语料库的数字化辞书编纂平台”,北京大学计算语言学研究所也研发了“基于语料库的双语词典编纂平台”,其他的词典编纂辅助系统更是不胜枚举。词典编纂平台的应用,将编辑从繁琐的机械性重复劳动中解放出来,大幅度提高编纂效率,保证了词典信息的可靠性和一致性(亢世勇2012: 6—14)。

二、 DPS词典编纂平台

DPS(全称Dictionary Production System)是法国IDM软件公司专门为词典编纂开发的平台。国外许多知名出版社,如朗文和柯林斯,很多年前就已经运用DPS平台编纂词典,可以说DPS平台是一个非常成熟的词典编纂平台。该平台由DPS网站和Entry Editor词典编辑器组成。前者面向项目负责人,主要服务于管理上的协同;后者则为所有参与词典编纂的人员使用,实现了内容上的协同。通过登录DPS网站,项目负责人可进入存储项目数据的存储器(repository),从而进行任务分配、流程把控、条目统搜等,将所有编纂人员协同起来。Entry Editor词典编纂器则是安装在个人计算机上的Windows应用,通过与DPS网站建立链接,词典编纂人员可以在本地的Entry Editor上下载任务,进行词条的编辑与上传,并将最新数据传回存储器。通过Entry Editor词典编纂器,编者、审订者、编辑、学科专家等对内容进行共同加工,并借助Entry Editor加注栏等功能实现内容上的实时交互式协同。DPS词典编纂平台的运行机制可用图1表示。

1. DPS网站

DPS网站具有强大的管理协同功能,如搜索、流程、处理、统计等,现对其中的条目搜索和流程把控两大功能加以介绍。

DPS网站的条目搜索不仅仅能够进行单词的查找,更能通过搜索将某一类别的条目、某一类型的问题统一分配给具体的编纂人员,从而实现条目的统一及问题的统一解决。例如在搜索框中输入检索式%

DPS网站的搜索功能,辐射词典内容的方方面面,通过统一搜索,省去了编纂过程中的反复核对和多次修改工作,极大提高了编辑效率,并且确保了词条的统一性、准确性和权威性。如输入检索式%

流程把控功能是DPS网站的另一大功能。一部大型的引进型英汉词典,大致要经过翻译、审订、编辑加工、一校、二校、三校、通读等多个阶段。在以往的词典出版中,项目负责人要花费大量时间去分发稿件,督促交稿,核对进度等。通过DPS网站,项目负责人只需点击鼠标,便能将任务分发给相关执行人,并设定任务截止日期,而任务执行者在Entry Editor上下载任务并将处理完成的词条上传至存储器。DPS网站的流程把控功能提高了出版效率,使得各方能够充分协调起来,实现无缝式协同工作。图3为F字头审订阶段的流程图,从中可以看出具体词条分别分给哪位审订者,项目开始分发时间、截止时间及实际完成时间。

2. Entry Editor词典编辑器

Entry Editor词典编辑器(以下简称Entry Editor)是为编辑词条专门开发的软件,主要面向编者、审订者、编辑、专家等项目执行人员。Entry Editor的界面布局非常清晰,由四部分构成,从左至右依次为导航栏,所见即所得栏,树形结构栏,属性及加注栏,参见图4。导航栏列出每批任务中的所有条目,所见即所得栏呈现词条出版后的格式,树形结构栏展示词条的层次结构,属性及加注栏可查看XML(Extensible Markup Language——可扩展标记语言)[1]的属性并给词条内容加注。

在实际操作中,编辑人员可在TRAN光标后输入义项或例句的对应翻译。若需在词条中加入新的成分(如例证等),可通过TEMPLATE完成;若需对词条在不同校次的处理情况进行对比,点击VERSIONS即可实现;还可通过CONFIG对Entry Editor的界面进行调整,如改变字体大小等。图5为在词条中添加例证的具体操作。

基于XML的Entry Editor可实现电子稿与纸质稿的对接,直接导出排版文件,实现内容与形式的协同。两部基于相同XML标签设计的词典,还可以实现词典与词典之间的匹配,实现多个词典项目之间的协同。同时XML强大的标识功能,使得一部大型英汉词典可以衍生出各种专项词典,例如短语动词词典、习语词典等,使各种碎片化信息得到充分利用,实现词典功能的协同。

三、 《新世纪英汉大词典》

《新世纪英汉大词典》(以下简称《大词典》)是由外语教学与研究出版社和英国柯林斯出版公司合作开发的大型英汉词典。该词典突破了以往单纯引进现成英语词典的被动性,是在中方对收词、例证、文化、百科等词典框架进行设计的基础上,依托外方强大的真实英语语料库而开发的,是面向中国读者的“定制型”英汉词典。

在这部大型词典的编纂过程中,协同性是最大的亮点之一,其中包括内容的协同、人员的协同、出版形式的协同、新媒体手段的协同等。通过Entry Editor,译者、审订者、编辑、专家、英方有关人员可就内容进行实时交互式协同;借助XML,词典出版实现了纸质、线上和APP产品的协同;依托互联网平台,使词条的编纂不再囿于出版社,实现了读者和出版者的协同。《大词典》收录词条24万,涵盖137个学科,在如此大部头词典的编纂中,依托DPS编纂平台的实时交互式协同大大提高了出版效率,保证了词典内容的规范性、统一性和权威性。

四、 Entry Editor加注功能

协同性体现在《大词典》出版的方方面面。以下从Entry Editor词典编辑器的加注功能这一点,具体介绍词典编纂、出版人员如何在DPS编纂平台上实现内容的协同。

加注栏位于Entry Editor的第四栏,由Topic(问题类型)、Status(问题状态)和Text(问题内容)三部分组成。编辑、审订者、译者、英方有关人员等均可在此栏加注,以提出问题,解决疑问,补充信息等。Entry Editor的加注功能除具有协同性外,还具备实时交互性。问题提出后,会实时面向所有编纂人员,相关人员便可及时进行解答;若提问者对答案存有疑虑,还可通过再次加注提问,直到问题充分解决。在以往引进版英汉词典的编纂过程中,编辑和译者的实时沟通性较差,中方编纂人员没有能与外方就具体细节内容进行交流的平台,Entry Editor的加注功能就是最灵活的问答通道,使所有与内容有关的问题在编校阶段能得到及时解决,保证词条内容的准确性和规范性。图7为Entry Editor中加注栏(ANNOTATION)操作演示。

如图7所示,加注是对具体tag进行操作。在Entry Editor树形结构栏中,词典中的所有要素,包括词目、发音、释义、翻译、例证等,都用不同的tag[2]表示,分别为HW、PRON、DEF、TRAN、EXMPL等。若对释义有疑问,即可点击DEF,在ANNOTATION中填上Topic和Status,并在Text中输入说明性文字,点击OK,便可实现加注。这里的Topic是要对所提问题进行性质上的界定,方便后期编辑人员在DPS网站上统一搜索并处理。Status则是对这一加注的状态进行描述,避免对已处理的注释进行重复处理。加注栏中的Topic和Status可依据项目需要自行设定。在《大词典》中,Status分为ForReview、Reviewd、ForInfo三种。前两个表示加注问题的处理状态,即问题待审核和问题已审核,最后一个则表示提供补充信息。Topic的情况则较为复杂,加注者的身份可能是词典编纂过程中的任何人,但加注的目的不外乎是为了在这个协同性的平台上提出问题,解答问题或者提供信息。现将《大词典》的加注情况按编校先后顺序予以介绍,从中可看出外方、译者、审订者、编辑、专家是如何通过加注这一基本功能实现内容上的实时交互式协同的。

1. 外方加注

最初分发的稿件中只有外方的加注,其Topic为adminidm,其功能主要是面向所有中方編纂者提供有关语法、语用、语体、文化知识、词源等各个方面的补充信息。外方的加注作为一种共享式信息,在后期的翻译、审订和编辑工作中协助词典译者、审订者、编辑和专家对词条进行更为全面的了解和把握。外方的加注信息大致可分为以下几种。

(1) 语体借助外方提供的语体加注信息,中方编纂者可对词条有更准确的认识,并在例证翻译中体现出来。如facetiousness词条的加注为often inappropriate or annoying;而短语动词fall back into与routine、habit等词搭配时的加注为often pej(即often pejorative)。

(2) 语用有关语用的加注信息使得中方编纂者对词的使用语境有更多的了解,从而更准确地理解义项和例句。例如the family表示“the family as an institution”时,外方的加注为often talked about by politicians and religious leaders。

(3) 语法外方会对某一条目下具体义项的语法进行标注,从而避免中方编纂者可能产生的异议和误解。例如faculty一词在表示“all the teaching staff at a university, college, school, etc; teachers”时外方的加注为often without article。

(4) 解释信息为了确保对例句或义项的正确理解,外方有时还提供一些解释信息。例如,对false move词条下例证One false move and I knew Sarah would be dead.的加注为If I/someone made a false move I knew Sarah would be killed/die.对于词条family room的义项a room for use by families in pub or hotel,外方的加注为with several beds。

(5) 出处有关例句或词条出处的加注会使中方编纂者对英文的理解更加贴合语境。例如对fall条中学科标签为【宗】的义项下的例证after Adam fell,外方的加注为This refers to the story of Adam in the Christian Bible.

这些加注信息作为释义之外的补充,为英语作为第二语言的中方编纂者提供了有关英美文化和英语用法的小贴士信息,以确保义项和例句的正确理解和忠实翻译。这种开放式、共享式的加注信息使得中方编纂者及英方人员在词条的具体处理中,真正实现了实时交互式协同,保证了词典内容的准确性。

2. 译者加注

进入翻译阶段,译者又会用到一些加注功能来及时提出翻译过程中出现的各种问题,英方人员及审订者、编辑、专家可对这些问题进行实时交互式处理并及时反馈。译者的加注从Topic上可分为translation,style,English,eg,pc和eng_struc六种。

(1) translation翻译内容方面的问题,如对译文意义不确定等。内容用中文表述。

(2) style体例方面的问题,如标点符号的使用,需统一处理的词条的翻译等。内容用中文表述。

(3) English对英文本身的疑问,如拼写错误,语法错误,知识性错误,tag标错,词条义项内结构的调整及和英文有关的任何疑问。内容用英文表述。

(4) eg对英文例证的疑问,如出现重复性例证或不必要的例证,例证过长等。内容用英文表述。

(5) pc有严重政治问题或意识形态问题(如露骨的性描写等)的词条、释义或例句。内容用中文表述。

(6) eng_struc涉及拆分和合并词条义项的改动。内容用英文表述。

上述六种加注,内容用中文表述的,由审订者、编辑和专家依次进行处理,而用英文表述的加注信息则提交外方修改。在DPS编纂平台上,无论是英方人员,还是中方编纂人员,都会及时对这些加注信息进行处理并上传存储器,译者将相关词条重新下载到Entry Editor,便能看到相应的反馈信息。这样便实现了真正意义上的实时交互式协同编辑。

可从图8所示具体的加注例子中了解实时交互式协同编辑是如何实现的。

译者对enter条目下的例句加注,Topic为eg,内容为This example can be deleted for there is a similar one following the phrase “to enter a room”(建议删除该例证,下文短语中已出现)。该加注的状态为Reviewed(已审核),外方的反馈为RESPONSE: suppressed(已隐去)。这些加注使得编纂过程中的任何改动有迹可循,有据可查,避免在之后的校次中出现反复改动的情况。

3. 审订者加注

进入审订阶段,审订者也可以对词典中的所有内容进行加注。审订者加注,其目的与译者非常相似,即提出问题。他/她所提出的问题,按照Topic也可以分为translation、style、English、eg、pc和eng_struc六类。其功能和译者加注相同,在此不予赘述。此外,审订者加注的另一功能就是解答问题,这里的问题是指在翻译阶段译者提出的各种用中文表述的问题。审订者可对这些问题进行解答,并将加注状态由ForReview(待审核)改为Reviewd(已审核)。对于审订者无法解决的问题,则需进入下一编校流程,由编辑或专家予以解答。

4. 编辑加注

进入社内编校(inhouse)阶段,编辑之间可利用DPS平台就词典内容进行深度协同,如有关圣经词汇、因特网域名、度量衡单位等专项条目的协同处理,数字条目、字母条目等的统查。对英文本身存在的细节问题,则需借助Entry Editor的加注功能与外方进行协同。也就是说,编辑加注的目的有两个,一是就英文内容向外方提出问题,二是解答译者和审订者提出的中文问题。

为了更准确地区分各个审次的加注,Inhouse阶段的加注常以标题1st read,2nd read, 3rd read等界定。其所标注问题,大多是英文体例上的问题,譬如多义项条目中没有标注indicator[3]、参见(crossreference)信息不对称、某些相关条目的学科标签漏加等。外方对这些问题进行及时处理,有时因为改动信息可能涉及译文的改变,外方也会对这些改动再次加注,请中方编辑重新核实译文。具体可见图11。

从图11可以看出编辑在一审和二审阶段的两条加注。一审阶段中,编辑的加注内容为“This sense has been divided into three, based on how ‘faunal and ‘faunist changed”,即编辑将該义项在原来英文的基础上,依照体例重新拆分为三个义项,并告知外方。外方对此的反馈内容则是RESPONSE:THERE IS INSUFFICENT INFORMATION TO SUPPLY DEFINITIONS AND INDICATORSPLEASE SUPPLY DRAFT DEFINITIONS FOR NEW SENSES,即要求中方对新增义项提供大致释义。编辑再次反馈,给出大致的英文释义,即RESPONSE FROM FLTRP: draft definition for sense 3of or relating to a writer of a descriptive list of all the animal life of a given place or time。英方在编辑最新反馈的基础上,给出了恰当而准确的英文释义,新增义项问题因此得以解决。但编辑发现外方并没有对新增义项补充indicator,遂在二审阶段加注,内容为pls add an indicator.(请加提示性信息),外方对这一问题进行处理,添加了“relating to fauna”的解释信息,并将加注问题状态改为reviewed(已审核)。

五、 结论

综上所述,基于DPS平台,《大词典》的译者、审订者、编辑和外方之间在内容上实现了实时、交互式的协同合作,保证了词典内容的规范性和权威性。DPS平台的开放性使得这一协同既有纵向的,如译者和审订者之间的协同,也有横向的,如编辑和编辑之间。在未来的辞书编纂中,我们应更多地利用这种开放性平台,将译者、审订者、编辑、专家、外方等紧密联系起来,使得各方编纂人员能够共同分享、共同交流、共同编纂出兼具规范性与权威性的高质量词典。

附注

[1]XML是标准通用标记语言的子集,可用于标记电子文件使其具有结构性。

[2]tag是基于XML的标注,使得词典在后期排版或生成衍生产品时能统一化操作。

[3]indicator即提示性信息,以区别不同义项,并为某一义项提供补充信息。《大词典》中的indicator大致分为collocate(搭配词)、synonym(同义词)、miscellaneous(解释信息)、subject field(学科)、register(语体)、region(地域)等。

参考文献

1. 亢世勇,王兴隆,谢晓燕.我国计算机辅助词典编纂系统初步调查研究.辞书研究,2012(3).

(外语教学与研究出版社北京100089)

(责任编辑李潇潇)

猜你喜欢
词条义项词典
米沃什词典
评《现代汉语词典》(第6版)
词典例证翻译标准探索
2016年4月中国直销网络热门词条榜
2016年3月中国直销网络热门词条榜
2016年9月中国直销网络热门词条榜
两用成语中的冷义项
大数据相关词条
《胡言词典》(合集版)刊行