三峡大学 田绪军
如果要消除专业译者对于机器翻译偏见和担忧,机器翻译系统需要一种新的形象,包括对其性能的现实看法。人们采用机器翻译的不同目的关系重大,因为这种多样性将保证机器翻译研究的继往开来。此外,一些大学,如卡内基梅隆大学、马里兰大学,京都大学、艾塞克斯大学,蒙特利尔大学和韩国高等科技学院等和一些私营公司,如美国电话电报公司、IBM、微软、日本电话电报公共公司、全录复印机、Systran和索尼等,一直都积极参与机器翻译研究。
但是,如我们所见,许多项目仍然处在起始或实验阶段,因此对大众的吸引力不强。由于系统很初始,其结构和翻译出来的作品只能供研究人员讨论、参考,目前还不能为大众服务。
当前,我们在一些翻译工作站或者是大公司内部网客户服务器系统上可以看到可操控性机器翻译系统。专业译者以及一般用户都能够使用机器翻译系统和在线机器翻译服务。但是在未来,带有翻译功能的集成商业翻译系统和在线机器翻译系统很会变得更为普遍。当前试验的交互式机器翻译系统经过发展,将成为商业翻译系统,这些商业翻译系统通过发展和演变,能够让译者完全控制其翻译过程。机器翻译系统翻译出来的作品通常需要大量的译后编辑才能出版,而这些系统将会让译者更加容易操控。(Macklovitch,Valderrabanos2001)。由于可以进行人机交互,译者可以在翻译过程中进行修改,因此,人机交互机器翻译系统可以减少译后编辑的工作量。另外,人们重新对机器翻译产生兴趣的背后的一个主要原因是人工翻译不能满足翻译市场的需要。这将缓解“翻译瓶颈”,同时为翻译市场提供了巨大的机会。(Macklovitch:2001)。
数据驱动法的诞生带动了自然语言处理领域的更多研究。目前可以通过像Google这样的搜索引擎从网络上检索信息。(Macklovitch:2001)但是,为了获得大量信息,我们需要更加强劲的跨语种的信息检索方法。其中一个叫做多语种信息检索(MLIR)。多语种信息检索是指通过输入一种语言查询,能够从网络或者是存储的数据库中检索相关多语种文本和非文本(例如,声音和图象)材料的能力。如果终端用户要阅读收集来的多语种材料,这些材料随即被翻译成终端用户所使用的语言。使用机器翻译系统就能达到这个目的。但是,它不能翻译所有语言。机器翻译系统依赖于语言,因为它是为了特定的某些语言和翻译方向所设计的。即使在线机器翻译系统也一样,虽然它们能翻译很多种语言,但是大多数仍然只能翻译几种常用的语言。因此,不是所有材料都能翻译成终端用户所使用的语言。而且,有些语言为了区别相似的词,而在词的前后、上下等作出各种各样不同的标记,来标示其差别、口音和音调,机器翻译系统在处理这些标记的时候特别容易犯错误。结果,也许翻译出来的译文反而对终端用户毫无用处。近年来,关于多语种信息检索和机器翻译系统作为翻译工具的研究和实验已经在进行。目前,虽然前景很可观,但是还有更多的工作要做---如何优选收集的材料,尤其是从网络上优选收集的材料;如何使用终端用户能理解的在线或者脱机系统提供足够的翻译。
对于机器翻译研究未来,Schaler,Way和Carl将翻译质量分为三个级别:高、中和低,对应三种不同的文本类型。最高级,采用人工翻译而不是机器翻译,通常翻译一些富含创作灵感的文本,比如,含有很多比喻的文本。广告和戏剧属于这种文本类型。中等级别,人工翻译和机器翻译相结合,用来翻译大量的不同领域的文本,对于这些文本,准确性和格式相当重要,尤其是图表。这类文本包括实验室报告和使用指南。最低级别,采用机器翻译而不是人工翻译来进行大致意思的翻译,通常花费很小甚至没有。譬如,那些在线机器翻译系统翻译的东西。Schaler,Way,Carl(2003)认为,像这样质量要求不高的文本包括一些产品、服务和一般信息网页。随着翻译技术研究与开发的不断进步和更加可靠的翻译系统的开发,预计机器翻译的作用将象表中箭头指示的那样逐步增加。
机器翻译的远景是乐观的,但同时不仅需要公众改变对翻译的困难和自动化局限方面的看法,而且要知道需要有不同类型的翻译(Macklovitch:2001)。此外,大多数机器翻译系统词汇量大,覆盖范围广,而且能生成较低或中等质量的翻译。为了生成优质翻译,机器翻译系统必须仅限于一个非常小的具体领域---词汇量和语法基于一种控制语言(住田和今村2002)。相应地,许多商业系统专门设计为某些主题领域或有具体要求用户服务(哈琼斯1994)。在十年前,分析复杂句子、选择最佳对等译文和生成惯用语译文等问题都待解决,哈琼斯(Hutchins:1994)指出,目前的情形和当时一样(Somers2003)。作为这个解决问题的进程一部份,研究人员们意识到翻译自动化决非易事。尽管拥有所需的知识、专家和技术,仍然有许多问题克服----处理那些经常用不同的方式表达同意一个事物的不同语言。我们将在本章节的最后部分看到,计算机是遵循人们设定的程序规则的重要设备,并且它们很难处理这些“不一致”。此外,语言分析、转化和综合、学习和常识推理等问题,特别是机器翻译系统,仍然需要充分解决。
我们可能还记得曾经企图用新一代基于语科库的机器翻译系统取代旧的基于规则的系统,但成效不是很显著。在这个问题上,有一点很重要,那就是基于语科库的方法不应该被当成另外一种选择,而是为对基于规则的方法的补充完善。虽然基于语科库的方法的优点是他们先前翻译的材料中生成新的翻译,但是要让基于语科库的机器翻译系统更加功能强大,仍然需要语言学知识。因而当前机器翻译的研究方向倾向于综合基于语科库的机器翻译系统和基于规则的方法,这就是“综合法”。结果,随着时间的推移,许多机器翻译系统改变了,有的改变了结构,有的变成了综合体,还有的继续保留他们各自不同的方法。
技术上的变化也引起了观点上的变化,甚至包括那些对机器翻译持怀疑态度的人,主要是因为经济方面的可行性和在某些方面使用机器翻译系统更有优势。实际上,一些专家指出:在一个多语种世界里,机器翻译是形形色色的多功能自然语言处理程序世界的一个重要的工具(Bell:2001)。
[1]Archer,J.(2002)’Internationalisation,Technology and Translation’,in Perspectives:Studies in Translatology,10(2):87-117.
[2]Bell,R.(1991)Translation and Translating:Theory and Practice,London:Longman.
[3]Baker,M.(2001)’Investigating the Language of Translation:A Corpus-based Approach’,in Patfmays of Translation Studies,P.Fernandez Nistal andJ.M.Bravo Gozalo(eds).Spain:Centre Buendia,Universidad de Valladolid.
[4]Catford,J.C.(1965)A Linguistic Theory of Translation.London:Oxford University Press.
[5]Gamper,J.and P.Dongilli(1999)’Primary Data Encoding of a Bilingual Corpus’,Proceedings of GLDV,Germany,http://www.inf.unibz.it/~dongilli/papers/gldv-99.pdf.November 2004.
[6]Godwin-Jones,B.(2001)’Emerging Technologies:Tools and Trends in Corpora use for Teaching and Learning’,Language Learning and Technology,55(3):7-12.
[7]Hutchins,W.J.and H.L.Somers(1994)An Introduction to Machine Translation.London:Academic Press Limited.
[8]Macklovitch,E.(1999)’Regional Survey:M(A)T in North America’,Proceedings of MT Summit VII,Singapore:73-9.
[9]Schaler,R.,A.Way and M.Carl(2003)’EBMT in a Controlled Environment’,in Recent Advances in Example-based Machine Translation:Text,Speech and Language Technology,Vol.21,M.Carl and A.Way(eds)(2003a).Dordrecht:Kluwer Academic:83-114.