邹常勇
(华南农业大学 珠江学院,广东 广州510900)
近年来,数字人文时代的到来和大数据的广泛应用对翻译学研究产生了深远的影响。大数据在翻译学科研究中的应用不仅体现在数据规模的处理上,更在于数据规模的变化引起了研究的质变,数据不再是翻译研究对象的数量表征,而带来了数据技术、研究思路和学术视野的剧变。
作为一个外来术语,安妮-伯迪克(Anne Burdick)、约翰娜-德鲁克(Johanna Druker)等认为数字人文是指充分“运用计算机技术开展的合作性、跨学科的研究、教学和出版的新型学术模式和组织形式”〔1〕。在他们看来,数字人文并非是某个特定的研究领域,而更像是一整套利用数字媒介和技术考察、探究人文课题的方法,与此同时,人文研究本身的研究范式又为探索数字媒介注入了新鲜的血液。徐力恒〔2〕、陈静〔3〕、樊文强、王志博、韩颖颖〔4〕、李点〔5〕等国内的学者也不约而同地持有相似的观点。与国外的同行一样,他们都不专门强调“数字”,也不单纯只关注“人文”,而是更加关注两者之间结合形成的新的研究对象以及所带来的机遇和挑战〔1〕。
数字人文既非简单的工具,也不是对传统人文的颠覆,而是“利用计算机和网络技术来更新和丰富传统人文研究”〔6〕。在国外,数字人文被学者视为探索人文课题的一种途径和方法论,他们纷纷从不同角度在不同学科与数字化技术建立紧密联系,以期突破原有研究范式。Jean-Gabriel Ganascia 采用软件自动发现和识别经典文学作品中部分内容的反复使用情况〔7〕;Lars Borin,Dana Danne'lls和Leif-Jo ran Olsson等学者利用数码技术,以图像的方式呈现了瑞典文学中一些地名的地理特征〔8〕;美国弗吉尼亚大学经典文学系的教授Courtney Evans和Ben Jasnow利用数码技术重现了《荷马史诗》中舰队所经过的地名目录,并绘制了地图〔9〕。通过数字技术的应用,将人文学科研究带入了崭新领域。
和国外同行一样,我国的翻译研究者也在翻译实践和翻译学研究中引入了计算机科学和数字化技术。在翻译实践方面,突出的表现在计算机辅助翻译、在线翻译、翻译软件及网络众包翻译等的使用,其技术辅助主要体现于“译前的编码处理、可译资源提取、字数统计、任务分析、术语提取等;译中的片段复用、搜索验证、术语识别、进度监控;译后的格式转换、模糊匹配、自动化质量保证、语言资产管理等”〔10〕。在翻译研究方面,胡开宝认为“数字化主要体现在语言数据库和文本挖掘之中”〔11〕。
尽管数字化技术、计算机科技已经成为翻译研究的必要手段之一,但我国的翻译人文研究数字化发展仍然处于初级阶段,即人文计算(Humanities Computing)阶段。在这一阶段,数字技术为人文研究服务,给人文研究提供了研究工具和方法论,具体到翻译研究中则是一种利用数据库和计算机技术对研究资料进行量化分析的途径,“数字化资料和数据库依然被认为是一种资料的提供方式而非知识本身”〔3〕。随着数字人文(Digital Humanities)逐渐取代人文计算(Humanities Computing),数字化思维渐渐嵌入人文学科的研究当中,庞大的数据和计算机技术不再仅仅是翻译研究的研究工具,而成为了一种方法论,有着与传统翻译研究泾渭分明的特点:既包含了主观性的思辨,又有客观性的数据;既能定量分析,又能定性分析;既观照研究的准确性,又能容纳研究的弹性和模糊性,是一个复合融通的多学科领域。可见,不同于人文计算时代,数字人文在翻译学研究中是一种创新型的研究范式,它颠覆了传统翻译学研究的思维方式和研究路径,极大地拓展了传统翻译学研究的领域。
在这个信息量呈几何倍数增长的时代,“各种数据产生速度之快,产生数量之大,已经远远超过人类可以控制的范围,‘数据爆炸’成为大数据时代的鲜明特征”〔12〕。在浩如烟海的数据面前,传统的翻译研究显得费时、低效以及缺乏逻辑性,其实证依据也存在很大的局限,虽然源源不绝的数字化资料给翻译研究带来极大的便利,但海量数据资料的选择、理解、鉴别以及在研究中的适用等问题成为了翻译研究的另一种困境,在这一困境之下大数据技术成为一种新型的研究工具。大数据是指“无法在一定时间内用常规机器和软硬件工具对其进行感知、获取、管理、处理和服务的数据集合”〔13〕。大数据技术则是“伴随大数据的采集、存储、分析和应用的相关技术,是一系列使用非传统的工具来对大量的结构化、半结构化和非结构化数据进行处理,从而获得分析和预测结果的一系列数据处理和分析技术”〔12〕。当人们论及大数据时,不单单涉及大数据本身,更是“数据和大数据技术二者的结合”〔12〕。研究者们利用与大数据技术紧密相关的数据库、互联网、云计算、可视化技术等获取信息、挖掘文本、对比译本、检索词频,逐渐成为翻译研究的一种新范式,也催生了崭新的学术理念和学术视野。大数据技术的运用对于时间和空间两个研究维度而言,都有重要的作用。在时间上大数据技术可以处理以年记甚至几十年上百年的数字文本资料,实现了大时间跨度研究的可能性;在空间上可以跨地区、跨国家、跨文化、跨语言,甚至可以在现实和虚拟空间之间自由穿行。这些特性对于完成一些宏观的、以往单纯依靠人力难以企及的研究,都非常有益。大数据为翻译学研究提供了新的方法、工具和视角,使翻译研究的逻辑性和科学性大幅提高,翻译学研究呈现出跨学科、定量化、大视野、实证性等特征。
虽然泾渭分明的分科研究提升了研究的效率和质量,但也给各自学科的进一步发展带来了困境,学科边界形成了诸多的真空区域,而大数据技术的运用则为翻译学研究的跨学科发展提供了机遇。
翻译学作为一门独立学科虽然历史不长,但大数据时代“翻译研究的跨学科态势已经形成,并在走向成熟”〔14〕。在大数据视域下,翻译学研究的跨学科化体现在两个方面:一是借助大数据技术实现了翻译学与其他如文学、历史学、社会学、传播学、哲学等人文社会学科研究相结合的跨学科化;二是翻译这门人文学科与计算机科学、大数据、数据视化、词频分析、人工智能等数字化技术相结合,形成了人文学科与自然学科结合的跨学科化发展。
作为一门相对较新的学科,翻译学研究有两次跨越式的发展。二十世纪六七十年代,翻译学研究与语言学结合产生了“翻译的科学”,形成了翻译学研究的第一次转向,即翻译学的语言学转向。第二次转向是翻译与文学、比较文学、还有文化研究结合,形成了翻译学的文化转向。除此之外,不少学者还致力于探索翻译学与其他学科的跨学科发展,但因为受到种种限制,效果并不理想。如吕俊在20 世纪90 年代即提出翻译是传播学的一个特殊领域〔15〕;孟伟根也提出过建立翻译传播学的构想〔16〕;谢柯认为,“翻译传播学是翻译研究的一种新范式,较以往的研究范式更能体现翻译的传播本质”〔17〕。以上几位学者的努力并未在学界掀起太大的波澜,相关的研究也比较少,原因就是缺乏必要的研究工具和数据资料,难以在研究中阐明翻译传播的机制、受众、传播效果等。传统的翻译研究多关注译者,研究的是译者的语言、译者主体性、译者与作者之间的互动关系、影响译者的外在因素等(包括社会的、经济的、文化等因素),很少关注译作的读者,即使有少数研究关注读者对译作的接受情况,也很少以确切的数据和数理统计的方式来证明读者对译本接受度的预设。而大数据技术通过对数据信息的梳理、提炼和归纳,使得翻译学的读者研究成为了可能,也使得翻译学与传播学的结合更加自然。大数据的运用能够极大地推进翻译学研究朝着更深、更广的多学科领域迈进,从而推进翻译学与其他人文社会学科交叉的跨学科发展。
描述性研究和定性分析是目前翻译学研究的主要方式。这样的研究方式注重研究对象的细微差异与个体特征,缺少对宏观规律和总体现象的研究,部分研究者甚至使用某个术语或某种理论来涵盖泛在的翻译现象,而没有充足的数据或实例来支撑自己的研究观点。在大数据视域下,翻译学研究的跨学科化弥补了传统研究方式的不足。大数据技术在数据库、信息检索、语音识别、自然语言处理、人工智能等方面都有专长之处,这些技术和思维助推了翻译研究,部分青年翻译学者已将统计学、应用数学等数理统计大量引入到翻译学研究当中,打破了学科间的距离,翻译研究的技术化和数字化倾向使翻译学研究的跨学科化具有了前所未有的高度。
传统翻译学研究侧重对翻译现象、翻译行为、影响翻译的要素等的理解和解析,研究方法上主要采用定性分析,通常经过理论预设、收集样本、归纳推理、得出结论等几个阶段,由点及面、由部分到整体地进行研究。在此过程中,研究者个人偏好、数据样本的采集、翻译研究中特例、翻译主体与客体的个体性都有可能导致研究的偏差,从而影响研究的结果。虽然部分研究者借助计算机科学和数据库作为辅助手段,对翻译进行量化研究,但仍不是当前翻译学研究的主流。
在大数据时代,定量分析则成为了翻译研究的有效途径。定量分析方法是指提取关于研究对象的数据,并对数据进行检验和分析,以测定关于研究对象特征的数值或求出因素间量的变化规律〔11〕。在大数据视域下的翻译研究中,海量的数据资料经过数据库统计、云计算处理之后能够直接呈现和总结研究中的规律和结果,从而避免了传统定性研究资料样本选取的偏差,各种数据的融合、重组、排列,有可能产生研究者事先没有预期、难以预料的研究成果。在大数据时代,传统思辨式、定性式的研究方法越来越受到数理统计的冲击,定量分析的研究方法被越来越广泛地使用在翻译学研究的各个领域,拓展了研究空间、开阔了研究者的学术视野,以往不可能实现的研究则慢慢变为了现实,如利用数据库对自译者创作语言和翻译语言进行对比研究、建设翻译多义词数据库、进行翻译词频的扫描等。
系统智能化,客户资源数字化已是酒店未来发展的必然趋势,在客户管理系统的科学化、智能化之后,设立各品牌酒店间的客户资源共享,通过信息系统对分享资源管理后的查询和数据开采功能管理客户,提供具有针对性的个性服务,也将成为酒店业未来维护、提高客户的忠实度、酒店的美誉度的必然需要,酒店的消费者更应是酒店品牌的推广者。
传统翻译研究多采用演绎式的思维,以一种自上而下的方式进行研究,其特点是研究者在宏观翻译理论的框架上提出假设,然后通过文本、数据等支持、验证假设,研究者因为资料收集和学科专业所限,收集的数据多集中于其个人的学术视野之内。因此,传统翻译研究多是对有限的数据进行精密分析,多“凭借直觉、顿悟和思辨,在分析个别翻译现象或翻译事实的基础上,依据相关理论对相关翻译问题进行研究”〔11〕。翻译批评也多为“‘感悟式’的经验点评,传统文论观照下的词语译评、佳译鉴赏、误译评判、译作比较等方式依然为主要的翻译批评方式”〔18〕。这些研究是对传统经典理论小范围、小剂量的抽样验证,由于数据样本的规模较小,无法对复杂和宏观的翻译理论进行宏观、全面的检视,这也是传统翻译研究的缺陷与不足。
大数据以客观、翔实的数据为研究对象,利用计算机科学和数理统计的方法,最大限度地减少了传统研究中的不确定性,可以全面、客观、准确地描述被研究对象。依托大数据技术,诸如西方翻译理论在中国的适应性研究、中西方翻译理论的宏观对比研究、翻译理论在多文本转换之间的普适性研究等以往翻译中的系统性、宏观性问题得到了突破。因此,大数据的视域对于拓展传统翻译经典理论的验证空间具有划时代的意义。
自20 世纪70 年代起,实证主义哲学思想被引入翻译研究,从而产生了实证翻译研究这一特殊领域。不同于一般的语文学、语言学或文化翻译研究路径,实证翻译研究不再聚焦于译本、也不关注源文本,而是把更多的注意力投注到翻译的过程研究上,采用实验形式来破译翻译者的认知途径、思维活动和神经机制。在探讨翻译过程的实践中,研究者进一步引入有声思维报告、键盘追踪、屏幕录制、眼动追踪等方式研究翻译过程中翻译者的认知心理与认知行为。翻译过程的实证研究对于各种数据具有天然的依赖性,大数据技术就顺应了这种需要,助推了传统的实证研究,为翻译研究“科学化”的发展发挥了重要的作用。海量的数据也催生了各类语料库研究,并使其具有了翻译学研究的范式意义。黄立波认为用语料库方法来研究翻译“开辟了翻译实证研究的新阶段”〔19〕。语料库的运用及翻译过程研究的深入,为翻译的实证研究提供了海量的大数据资源。黄立波将实证翻译中的大数据分为文本数据(Textual Data)、多模态数据(Multimodel Data)和实验/诱导数据(Experimental/Elicited Data)三种〔19〕,这些数据不仅能够将源文本、译本以及一切与翻译活动相关联的显性化文本作为一个整体进行研究,形成了数据化的“宏文本”,而且能从各个维度、不同方面对翻译过程进行详尽的描述,研究者通过建立数据模型,采用定量分析的方法,能够厘清译者认知心理的线索和探究翻译行为的规律,从而“真正达到对翻译现象的全面描写、解释甚至预测”〔19〕。
在大数据时代,翻译学研究者拥有了海量的数字化研究资料,为翻译学的数字人文研究提供了基础和实现条件,带来了远距离阅读、空间转向、媒介融通等新的研究前景。当然,我们也应注意一些可能的负面影响和后果。
1.翻译研究由“近距阅读”向“远距阅读”转变
在传统的人文研究中,研究者往往通过对文本的“精耕细作”来关注单个文本的具体特点,伯迪克等人将此种阅读方法称为“近距阅读”〔1〕。而在数字人文研究中,研究者则跳出单个文本的藩篱,用数据库与计量技术关注整个“数字化的“宏文本”〔20〕,借以考察研究对象的趋势与发展。这种研究方式被伯迪克称为“远距阅读”。于他而言,远距阅读“是一种新的研究方式,通过运用计算方法,提出关于思想历史、语言使用、文化价值和宣传以及文化生成过程等创新问题”〔1〕。在思维方法和研究模式方面,人文学科的数字人文研究将会给翻译学研究带来巨大的启发。在翻译研究中,“远距阅读”通过文本建模、关键词抽取等进行数理统计、提取关键信息并对其进行排列和组合,“从而使研究者发现大范围趋势、模式和关系,而这些是无法从单个文本或细节分析中发现的”〔1〕。远距阅读和近距阅读分别代表着翻译研究中的全局视角与微观视角,也体现了知识和信息联结的不同方式。研究者不应在两种研究方式之中取舍,而应将其有机地结合起来。在数字化信息时代,在研究中只有将技术手段与传统方法、文本细读与大数据技术相互融通,才能进一步扩大研究优势。
传统翻译学研究的历时性范式忽略了翻译研究的空间表征和形象性,不能完美契合人文学科的“空间转向”〔21〕,也无法揭示翻译中的空间再现功能与翻译空间建构的内在机制。随着数字化浪潮的兴起和数字化工具的应用,人们的兴趣逐渐从“阅读”图像拓展至“制作”图像,即用图像方式传达抽象概念〔1〕,图像思维在翻译学研究中发挥了越来越大的作用,其直观、形象、交互式的呈现方式,能够帮助研究者便捷、有效地展示复杂的信息和描述研究的结果。在翻译学研究中,可视化的知识图谱被大量使用,越来越多的学者用图形化的方式呈现各自所研究的课题。随着可视化技术的进一步发展,我们可以憧憬图片、视频、流媒体等视觉化要素在翻译学研究中更广泛的使用。
除了图像思维的应用之外,翻译学数字人文研究的空间特征在物理空间和虚拟空间都有所体现。在物理空间方面,跨地区、跨国家、跨文化的协同性研究正在以惊人的数量快速上升,来自不同国家、不同地域、不同语言和文化的学者利用数字技术和文本挖掘的方式进行合作式的翻译研究。此外,翻译研究的数字人文介入,使研究者们可以充分利用文字、视频、图片或其他的数字化档案和资料构建翻译研究的虚拟空间,打破文化疆域和感官局限,还原作者和翻译者的叙事声音。例如,当对译者进行研究时,研究者可以通过搜集该译者工作和生活的影像资料或其他档案,通过数字技术还原其生活轨迹、模拟其创作历程,让译者研究“活”起来,从而更好地理解该译者的心路历程以及译作与原作品之间的互动关系。随着空间思维在翻译研究中的应用,翻译学研究在这种多层次无缝连接的高速互联网时代会更加快速的发展。
3.翻译学数字人文研究的媒介融通
数字技术让多种媒介和文本资料的融通成为现实。目前流行的“拍照翻译”“语音翻译”等看似是单纯的数字技术和信息呈现方式的转换,其实是异质媒介之间的自由融通。信息以异质的形态在全新的环境中流通、再现及自由转化,意味着作为研究客体的“文本”数字化和流动性大大增强。文本和声音可以被转换成数字代码,在多种平台上以多种不同的方式被获取、分享和处理,以图形、视频或其他形式呈现,这种信息在异质媒介间的自由转换可以被视为另一种形式的翻译。除此之外,原生网络数字对象,如照片、视频、网页、流媒体、博客等都可能成为第一手研究资料,从而促生了翻译研究的新方式。Michael Cronin 援引多维希的观点,认为“数字人文再次把翻译置于核心的地位,这主要是因为需要重新思考文化、社会和技术的方法离不开可转换性这一与翻译密不可分的概念〔22〕”。可见,翻译研究的对象被极大地扩大化了,在不同媒介自由融通的环境中,万事万物都具备了“可翻译性”,数字人文研究范式极大地扩展了翻译研究的场域。
大数据技术和数字化研究固然能扫清翻译研究中的“死角”,触及传统翻译研究未曾到达的疆域和边界,但仍然存在局限。首先,过于数字化的翻译研究缺乏人文学科必要的丰富意蕴和人文关怀,翻译学的数字人文研究甚至有变成数据库研究附庸的风险;其次,翻译研究的大数据仍然难以囊括研究中的变量。尽管翻译研究中文本数据、多模态数据和实验/诱导数据〔19〕基本涵盖了翻译学研究中的大数据样本,但是翻译学中研究对象的某些特质依然没法完全用数据进行衡量。政治时势、诗学意识、赞助人及译者的个人学养、翻译态度、价值观甚至经济状况等都无时无刻不在影响着翻译过程和结果,但是这些因素却无法用显性的数据和数字化资料予以呈现。因此,如果不能有效控制变量,看似不偏不倚的数据化研究也难免失之偏颇。
大数据时代给翻译研究带来了深刻的变化,海量的研究资料、新的知识呈现和组织方式对翻译研究提出了更高的要求,使研究者对大数据技术和数字化的研究手段有了更大的需求。数字化研究和大数据技术所具有的跨学科、定量化、大视野和实证性研究特点契合了翻译学研究“科学化”发展的愿景。作为新的学术突破口,数字人文研究范式为翻译学研究带来了新的学术理念和学术方向,使得翻译学研究在远距阅读、空间转向以及媒介融通等方面研究前景广阔。同时,我们也应该注意过于依赖大数据和数字化技术可能带来的问题。
西南交通大学学报(社会科学版)2020年1期