海峡两岸数字人文领域重要术语的对比分析及其差异研究

2024-10-11 00:00王逍晴淳靖
中国科技术语 2024年4期

摘要:数字人文领域的术语互通是海峡两岸学术交流和知识共享的重要桥梁。文章以期刊论文作为术语收集的数据源,构建起海峡两岸数字人文术语对照表。根据两岸术语表达的差异情况对术语进行分类,这些差异产生的原因可以总结为历史习惯、内涵界定、翻译习惯及文字表达习惯不同四个方面。研究形成的术语表可以作为数字人文术语库的建设基础,旨在深化数字人文理论研究,为建设数字人文学术共同体提供助力。

关键词:数字人文;术语表;学术共同体;海峡两岸;术语

中图分类号:G250.7;H083文献标识码:ADOI:10.12339/j.issn.1673-8578.2024.04.007

Abstract:The mutual understanding of terminologies in the field of digital humanities serves as an significant bridge for academic exchange and knowledge sharing between the two sides of the Taiwan Strait. This article takes journal papers as the data source for terminology collection and constructs a comparative table of digital humanities terminologies across the Taiwan Strait. The terms are categorized according to the differences in their expressions across the strait, which can be attributed to four aspects: historical habits, connotations, translation habits, and textual expression habits. The glossary of terms resulting from the research can serve as the foundation for the construction of a digital humanities terminology database, aiming to deepen the theoretical research of digital humanities and provide assistance for the construction of a digital humanities academic community.

Keywords:digital humanities; terminology list; academic community; across the Taiwan Strait;terminology

0引言

数字人文①(台湾地区称为“数位人文”,以下统称为“数字人文”)作为一个新兴的跨学科领域,已经吸引了众多学者的关注,他们将数字技术、工具和方法应用于人文研究过程,围绕着数字人文的本地化实践和研究进行了批判性思考和持续探索[1]。在跨学科知识的碰撞与交叉融合中,一些崭新的术语也随之出现。一系列表达多样、语义丰富的术语既体现了数字人文作为新生事物的生命力,也为研究者在进行跨学科研究时厘清术语内涵、准确传达信息、促进知识传播方面提出了新命题。

我国台湾地区的数字人文工作可以追溯至20世纪80年代开始的数位典藏工程[2],引入数字化手段,将传统类型的典藏品转化为数位典藏资料库,积累起数量丰富的数字史料[3]。以第一届“数位典藏与数位人文国际研讨会”为起点,伴随着资讯科技的迅速发展,台湾数字人文经历了从数位典藏到数位人文的转向,聚焦于数位人文研究工具开发和数位技术的应用,DocuSky数位人文学术研究平台汇集了30多种研究工具,是最具影响力的成果之一。2017年,《数位典藏与数位人文》作为台湾地区第一本数字人文学术刊物,正式创刊并出版,进一步提升了台湾地区数字人文研究的影响力。与此同时,大陆的数字人文研究也取得了显著进展。自2009年中国学者引进“数字人文”这一概念后,从数字人文研究的理论建构、数字人文中心与数字人文学会等研究机构的成立到数字人文学术期刊与论文发表规模的迅速扩大,中国数字人文研究的话语体系快速形成,呈现出蓬勃发展的大好前景[4]。然而,在海峡两岸数字人文学术共同体的形成过程中,学者们对数字人文研究术语具有不同的表述和理解,这在一定程度上阻碍了两岸的学术交流。在数字人文领域的术语研究尚未形成规模和体系时,从海峡两岸数字人文术语翻译对比的视角进行研究颇为重要。为此,本文收集了海峡两岸数字人文领域的术语,形成一个大致描述数字人文领域整体研究内容的术语表,进一步整理,并对海峡两岸数字人文术语的表述方式、概念内涵进行对比分析。这是数字人文领域术语研究的初步探索,期待为后续研究提供可能的研究方法和路径。

1海峡两岸数字人文术语的收集与分类

1.1收集方法

期刊论文作为知识传播的代表性途径,研究者借此可以快速收集学科领域内的专业术语[5]。本文对台湾地区数字人文研究类专业期刊及其他创设数字人文专栏的核心期刊进行了详细调研,参考各期刊所发论文的数量、质量等数据,选取台湾地区数字人文领域权威性和专业性均位于前列的期刊《数位典藏与数位人文》作为研究对象。

2017年台湾大学数位人文学会设立者项洁创办《数位典藏与数位人文》,其研究团队开展了“docusky数位人文学术研究平台”等项目,并研发了多种文本数字化处理、标注和分析工具,在数位科技与人文研究中具有深远影响力。项洁在该期刊的发刊词中强调了数字人文领域期刊“作为数字人文研究者发表和出版的正式管道”[6],能够为学科聚焦和学科认同提供专门场域。此外,历届台湾地区数位典藏与数位人文国际研讨会的论文集作为补充数据源也纳入到我们的研究范围。

数据收集与处理过程分为以下四个步骤:(1)初步探索:了解并归纳不同学者对数字人文领域术语内涵的界定和阐释,尝试利用词频统计器等工具进行初步检索和筛选。(2)台湾地区数字人文术语提取:对期刊自创刊以来发布的59篇学术论文进行了详尽的阅读和分析,从中提取了专业术语和专有名词。以文献的关键词为主,辅以论文内容分析,通过人工审核、专家咨询,去除重复项后,共收集了66个术语及其相应的英文翻译。(3)大陆对应数字人文术语检索:以论文篇名和关键词中包含这些术语的英译词或词组为检索条件,在中国知网数据库中进行检索,寻找这些术语在大陆的对应表达方式。汇集并整理所有检索结果,形成本文的数据基础,然后利用专业软件进行词条的对比分析。(4)术语对照:根据台湾地区与大陆数字人文术语名称的相似情况进行分类,形成包含“英文表达-台湾术语表达-大陆术语表达”的术语对照表。

1.2海峡两岸数字人文术语的分类

目前海峡两岸术语对比研究的学术成果中,单宇等学者将两岸化学工程术语完全相同和仅有繁简字差异的都归为“相同”这一类别,存在差异的术语分为“用语习惯的不同”“译法不同”和“其他”三类[7]。刘金婷等学者将两岸大气科学领域的术语分为“完全一致术语”和“不一致术语”两大类,其中“不一致术语”又细分为“部分一致术语”和“完全不一致术语”两类[8]。借鉴已有的分类方法,本文根据海峡两岸数字人文使用术语的差异情况分别汇总,两岸术语表达基本一致(仅存在繁简字体区别或较小的用字差别)的术语有29个(详见表1),台湾地区与大陆术语译名有明显差异的术语有37个(详见表2)。

1.2.1表达基本一致的术语表

海峡两岸在数字人文研究中表达基本一致的术语主要分为如下几类:(1)从群体传记学、文学、计算机等其他学科引入的术语保留了原有的学科特色,如计算机领域“字符识别模型”“语言预训练模型”等科技术语,体现了计算机专业和人文学科融合的特点;“版面分析”则体现了古籍OCR识别与版本识别的技术融合。(2)在数字人文研究中开发的数据库成果,例如“中国历代人物传记资料库”“台湾历史人物传记资料库”“台湾客语语料库”等,作为专有名词,它们具有统一且唯一的表达方式。(3)台湾数字人文研究形成的新词汇,大陆在介绍和引入时也保留了原有的术语译法。例如,“轻造字”是台湾学者在古籍数字化整理时针对缺字问题提出的解决方法,造字是基于聚类校对根据新出现的异体字图形识别字类、分配编码并录入造字管理系统的过程,“轻”则体现在造字成本低、速度快和易管理三个方面;“词夹子”是台湾数位人文学术研究平台开发团队研发的半自动工具,能够从文本中提取特定类别的词汇;此外还有“僧侣游方资料库”“AT分类法”等新出现的术语。

1.2.2表达有明显差异的术语表

在台湾地区数字人文研究的发展历程中,文献典藏的数字化处理和数字典藏数据库的建设是其初步探索的重要方面。为推动实践项目深入发展,人文学者主导并开发了符合人文研究需求的计算机技术和工具,推动了本地区数字人文研究范式的转型,并在东亚乃至全球范围内倡导区域性数字人文研究等议题中发挥了引领作用。同时,台湾地区的这些研究也对大陆数字人文学科的蓬勃发展产生了强有力的带动和辐射作用,成为大陆开展数字人文研究的重要引介[9]。与航空科学等领域的术语差异情况不同,数字人文学科本身具有开放多元的特质,加之借助互联网的即时、快速、高效的沟通优势,海峡两岸数字人文研究人员的学术沟通、交流与合作十分密切。因此,多数术语在两岸间并没有本质区别。这些术语对照情况见表2, 本文第2部分将详细分析这些差异产生的原因。

2海峡两岸数字人文典型术语内涵差异与分析

术语是词汇体系的重要组成,汉语术语中四字格结构最为常见,还有五字格、六字格等更长的术语[10]。相较于整词分析,术语中关键语素的拆分和解读对揭示术语内涵的差异更为直接。两岸数字人文研究对metadata、data、line等关键语素具有不同理解。一个术语的差异可能是由单一语素引起,也可能是多个语素差异的共同作用[11]。本文将数字人文领域的术语构词中出现的关键语素汇总见表3。

在两岸的数字人文研究中,术语翻译和其涵盖的范围有不同的界定标准。单个术语中往往包含多个关键语素,因而影响两岸术语差异的因素也不可能是单一的,而应该是多方面的。本文将从以下几个方面探讨这些差异产生的主要原因。

2.1延续历史惯用表述

梳理早期术语的演变对于把握台湾地区数字人文术语的内涵大有裨益,有助于我们更深刻地理解台湾地区与“计算”“人文”紧密联系的各术语流行和转变的缘由,以此厘清台湾地区与大陆数字人文领域的不同特点,更准确地判断其互通交流的方式[12]。以“information”为例,20世纪八九十年代台湾电子工业飞速发展,台湾媒体将电脑、电话、电讯融合而成的新型工业形态称为“资讯工业”,并随之派生出“资讯”“资讯技术”等词语,而大陆在报道台湾的资讯活动时采用了“信息工业”一词。经过长时间的发展,台湾学者仍然沿用“资讯”一词,大陆将“information”翻译为信息、情报。“digital”一词也并非数字人文领域的专有词汇,我国台湾地区译为“数位”,由日本引入因而借鉴了日语翻译方式,而大陆译为“数字”。这些词汇在数字人文这一新兴学科中仍然延续了海峡两岸在历史上形成的各自的表达习惯。

2.2术语内涵界定不同

术语的内涵丰富多样,对术语内涵理解的侧重点不同往往导致术语表达方式的差异。以“computational linguistics”为例,以文本分析为导向的词语索引以及词频统计等方法在计算人文出现伊始便成为研究热点,随着计算技术的升级,该研究领域理论与实践成果不断丰富。台湾学者将“语文分析”视作计算语言学领域所倡导的文本分析技术或方法,语文分析技术主张从汉字构字、词汇、语义、语音和语法分析等多个角度开展人文研究[13]。相比之下,大陆在术语表达上更明确地体现了计算在人文学科中的理论属性,将其译为“计算语言学”。还有,台湾地区将“data”和“text”都译为“资料”,大陆则分别译为“数据”和“文本”。对照国外对这两个术语的定义以及我国海峡两岸对术语内涵的理解可以发现,我国台湾地区对“资料”的界定更为宽泛,不限于纸质载体与数字载体等多种形式,无论是文本或是数据,更加强调资料的内容价值。围绕资料的管理与利用,海峡两岸对“data curation”的翻译与解读也各有侧重,台湾地区将其译为“资料庋用”,其中“庋”意为“置放、收藏”,而“用”则包含了“使用、管理”等多重含义,这种翻译方式体现了庋藏和使用的融合[14]。大陆对“curation”的翻译则更为多样,常见的有“监督”“管理”“策划”等。翻译结果虽有明显差异,但两岸学者对“data curation”在文献数据库建设与管理中的作用却有着共识,都强调资料的维护、保存和增值。然而,现有的翻译方式并没有完全体现出“data curation”促进数据增值的内涵。王海宁等学者梳理了国内外“digital/data curation”概念的内涵和翻译方式,针对现有译法指代模糊、以偏概全等问题,提出“数据理用”的新译法[15]。尽管海峡两岸对数字人文术语内涵的理解各有侧重,但对研究者而言,这并没有成为他们之间交流互鉴的障碍。相反,多角度、多层次地解读术语内涵更有助于研究者以全面的视角把握数字人文的发展,系统建设数字人文学科的知识体系。

2.3翻译方式的差异

台湾地区与大陆在直译与意译的翻译习惯方面常有差异。以“index”和“metadata”为例,“index”是西方目录学传入中国的研究工具,是一种以归纳的逻辑整理文献的方法[16],新修改的索引编制规则(总则)中对“index(索引)”有以下定义:由一系列索引款目及参照组成,指向文献中的概念、语词及其他项目的检索工具,按照异于文献自身次序的排序法进行排序或存储[17]。台湾地区在翻译时直译为“资源参照”,而大陆则采用意译方式,将其翻译为“索引”。类似地,对于“metadata”这一术语,可以定义为“说明数据的数据”,用于识别、描述、定位和管理数据资源,台湾地区采用意译方式译为“诠释资料”,而大陆则直译为“元数据”。同样地,海峡两岸对“term clip”的翻译也体现了不同的翻译习惯,台湾地区将其直译为“词夹子”,既指代专门的研究工具,也指代利用该工具提取出的词汇集合;而大陆则意译为“术语集”,并将“term extractor”译为“术语提取器”,这样的翻译结果更直接地体现了“词夹子”的功能。

2.4文字表达习惯不同

多年隔绝使海峡两岸形成了各自的语言特色。在文字表达习惯上,大陆是从左到右的横排与竖排并用,以横排为主;而台湾地区则是竖排与从左到右的横排并用,以竖排为主的书写和阅读习惯[18]。这种差异在术语表达中也有所体现,以“行识别模型”为例,台湾地区的“行”通常指的是大陆的“列”,这种术语使用的不同反映了两岸在文字书写和排版习惯上的差异。目前学术研究对此已经达成了共识,文本的列(行)指若干汉字沿直线方向排列所形成的连续文字区域[19]。

3海峡两岸数字人文术语互通的探索与思考

3.1为建设数字人文术语库奠定基础

术语库是数字人文基础设施的组成部分。术语表是收集特定领域术语及相关信息的列表,不仅是专业领域知识的载体,也是确保术语使用一致性和准确性的重要工具。与其他学科相比,数字人文是一个新兴的跨学科研究领域,学科之间的交流与沟通尤为频繁,术语表的建设和完善有助于数字人文领域知识的系统化和标准化。通过收集、整理和规范专业术语,术语表为学者提供权威可靠的术语资源。

本文形成的术语对照表作为检索工具,帮助研究者在应用文献综述作为研究方法时可以完整地检索并搜索到相关文献,关注海峡两岸数字人文术语的对照差异并提高检索查全率和查准率[20]。同时,文章探索应用的术语库建设方法可以为后续深入研究提供研究路径,通过开展规范化的术语库建设,为海峡两岸建设共同的数字人文语料库奠定基础,促进语料的统一。

3.2为深化数字人文理论研究提供助力

术语的内涵解读对于理解和深化学科理论至关重要。通过对“数位资讯”“计算人文”“data curation”等核心术语的深入剖析,研究者能够更准确地把握学科的基本概念和发展脉络。这不仅为学科话语体系的构建提供了理论基础,而且有助于避免因术语使用不当而引发误解和混淆,确保学术交流的顺畅和有效。

另外,理解海峡两岸数字人文术语本身对研究者来说并非难事,认识两岸数字人文术语的不同翻译方式和界定方式能够帮助读者深入理解术语内涵,我们追求的并不是两岸数字人文术语的完全一致和严格统一,而是借助术语来开展更深层次的理论研究。

3.3以建设数字人文学术共同体为长远目标

从数字人文学科建设的内在立场来看,专业术语、论著语篇等作为学科话语的具体表现形式,是数字人文学科的有机组成部分。术语研究作为学术话语体系建设的基础,“既包括术语概念的规范控制和内涵研究,也涉及研究论著的翻译交流等内容”[21],术语概念和标准化、规范化以及体现数字人文学科特色的术语表的形成不仅是学科专业性和成熟度的体现,而且有助于跨学科交流和国际传播。加强海峡两岸数字人文术语研究,必须以推进两岸数字人文研究的互动交流、推进学术协作共通为前提,并以建设中国境内数字人文学术共同体为长远目标,以此推动学科内部话语的沟通和学术交流的深化。

注释

① 文中涉及台湾地区数字人文领域的一些专有名词,比如台湾数位人文学会、docusky数位人文学术研究平台等 保留原有称呼不变。

参考文献

[1] 大卫·M.贝里. 数字人文 数字时代的知识与批判[M].王晓光,译. 沈阳:东北财经大学出版社, 2019.

[2]罗珮瑄,陈雅琳. 滴水空明数位人文空间.文本标记与数位阅读:从“疾病感觉地图”“叶德辉藏书阁”与“游方”谈起[J].数字人文研究, 2022,2(3):21-38.

[3]张衍,贾诗威. 我国台湾地区图书资讯与档案学研究进展(2009-2018)[J].图书馆论坛,2020,40(4):50-65.

[4]夏翠娟. 数字人文的理论沿革和范式转向:从“人文研究的数字方法”到“后数字时代的人文研究”[J/OL].中国图书馆学报:1-24[2024-06-24].http://kns.cnki.net/kcms/detail/11.2746.G2.20240506.1825.002.html.

[5]赵柯然,王延飞.“情报”术语争议对学术交流与学科建设的影响反思[J].图书情报工作, 2018,62(2): 35-39. DOI:10.13266/j.issn.0252-3116.2018.02.006.

[6]項潔. 發刊詞:從數位典藏到數位人文[J].數位典藏與數位人文, 2018(1): i-v.

[7]单宇,项艳艳. 海峡两岸化学工程术语的差异及成因初探[J].中国科技术语, 2016,18(5): 42-46,52.

[8]刘金婷,韦沁,代晓明. 基于Gephi的海峡两岸科技术语差异可视化研究:以大气科学术语为例[J].中国科技术语, 2023,25(3): 33-43.

[9]肖鹏. 把“专题数据库”作为方法:数字人文的重新认识及其在AI时代的发展趋势[J].图书情报知识, 2023, 40(5): 16-27.

[10]张晖.术语的生成与解析初论[J].中国科技术语, 2016,18(1): 19-21, 35.

[11]张晖.两岸术语词之微差异语素:类型、分布及成因[J].宁夏大学学报(人文社会科学版), 2020,42(4):28-37.

[12]黄水清,刘浏,王东波.国内外数字人文研究进展[J].情报学进展,2022,14:50-84.

[13]劉昭麟. 從《數位人文研究》展望資料開放、工具協同與議題網絡[J].數位典藏與數位人文, 2018(1),11-50. https://doi.org/10.6853/DADH.201804_1.0002.

[14]黃千珮,蕭頌主,黃芮盈. 資料庋用之前:軍歌資料庫的數位建檔歷程[J].數位典藏與數位人文, 2022(10), 165-209. https://doi.org/10.6853/DADH.202210_(10).0006.

[15]王海宁,丁家友,聂云霞. Digital/Data Curation的概念与翻译研究[J].图书馆杂志,2018,37(1):8-18. DOI:10.13663/j.cnki.lj.2018.01.002.

[16]熊静.索引运动与索引学说的建立[J].图书情报知识,2016(4):27-36.

[17]国家市场监督管理总局,国家标准化管理委员会. 索引编制规则(总则):GB/T 22466-2023[S/OL].(2023-05-23)[2024-06-29].https://www.guifanku.com/qitaguifan/822889.html.

[18]郑启五. 海峡两岸用语差异[M].福州:福建人民出版社,1989.

[19]釋賢超. 一種多模型融合的中文古籍OCR後處理方法[J].數位典藏與數位人文, 2023(11),83-104. https://doi.org/10.6853/DADH.202304_(11).0003.

[20]肖鹏. 中国图情领域的翻译与引介传统及其实践反思:以“译介谱系”为落足点[J].图书馆建设, 2020(3):6-11,27.DOI:10.19764/j.cnki.tsgjs.20200911.

[21]易凌,龚蛟腾,陶成煦,等.言以成事:中国图书馆学话语研究综述[J].图书情报工作, 2024, 68(6): 142-151. DOI:10.13266/j.issn.0252-3116.2024.06.013.

作者简介:王逍晴,女,中山大学信息管理学院在读硕士研究生。主要研究方向为数字人文、文化遗产保护。通信方式:wangxq85@mail2.sysu.edu.cn。

淳靖,女,中山大学信息管理学院在读硕士研究生。主要研究方向为图书情报、公共文化服务与管理。通信方式:chunj3@mail2.sysu.edu.cn。

收稿日期:2024-07-23 修回日期:2024-08-16

基金项目:2022年度全国科学技术名词审定委员会一般项目“数字人文高频术语及其在国家人文数据基础设施中的应用研究”(YB2022020)阶段性成果