国外濒危语言建档保护实践与启示

2020-12-08 03:06黄玉婧南昌大学人文学院周耀林姬荣伟武汉大学信息管理学院
浙江档案 2020年6期
关键词:建档档案馆语言

黄玉婧/南昌大学人文学院 周耀林 姬荣伟/武汉大学信息管理学院

濒危语言问题已经引起了越来越多的关注。1992年,第15届世界语言学家代表大会将濒危语言列入两大主题之一;1993年,联合国大会正式通过“濒危语言方案”,并将该年定为抢救濒危语言年;为了保护世界语言的多样性,联合国将每年的2月21日定为“国际母语日”,以唤醒人们尤其是少数人对自己语言保护的意识。2011年10月,我国政府在十七届六中全会中提出要“科学保护各民族语言文字”。各种针对抢救濒危语言的保护项目也在世界各地纷纷启动,国外对濒危语言的保护项目主要是就“语言建档”(Languages Documentation)(注:documentation原意为文件、文档,此处表达的是对濒危语言进行记录然后建立档案保存,故在此处将Language Documentation译为语言建档)和“语言振兴”(Language Devitalization )两个目标而开展[1][2]。联合国教科文组织和我国政府于2018年在长沙举办世界语言资源保护大会时发布的《岳麓宣言》中明确指出,信息、记忆、档案和文化组织,无论是实体的还是虚拟的,都将对保护和促进语言多样性发挥积极作用[3]。

可见,对濒危语言建档不仅能够为语言振兴提供基础,同样也是保护语言多样性的重要方式之一,对濒危语言建档保护已经成为了信息时代的必然选择。为此,本文主要从档案学视角出发,对国外典型濒危语言保护案例进行梳理和分析,以期能从中窥见当前国外濒危语言建档保护的进展和特点,对我国濒危语言保护提供一定的参考。

1 国外濒危语言建档保护实践概述

1.1 语言建档与保存计划

语言建档与保存计划(Language Documentation &Conservation,LD&C)[4]隶属于夏威夷大学语言学系。夏威夷大学是目前美国唯一一家开设语言建档和保存研究生课程的学校,其语言学系自1963年成立以来,一直致力于对世界各地濒危语言开展实地考察与研究教学工作,旨在解决由于语言濒危对人类语言和文化多样性造成的威胁,是全球记录、保存和振兴世界各地濒危语言的领头羊。

该项目主要包含以下6个部分的内容:①濒危语言目录(ELCat),目录涵盖3422种濒危语言共7023条濒危语言数字资源,是全世界最权威、更新最快的濒危语言数字资源库,为学术研究提供了丰富的参考信息。②夏威夷语言学习评估项目(HALA),主要采用心理语言学技术对说话者的语言活动进行评估,可以反映出不同类型的双语地区的语言磨蚀和恢复情况。③语言记录和保存国际会议(ICLDC),成立于于2009年3月,定期召集世界各地科学家、学生和社区成员共同探讨新技术环境下濒危语言的建档和保存问题。④同名在线期刊(LD&C)。《Language Documentation & Conservation》(ISSN:1934-5275)于2007年6月首次出版,是由国家外语资源中心赞助并由夏威夷大学出版社发行的电子期刊,主要收录数据管理、数据收集、实地调研方法、语言活力评估等有关语言建档和保存的所有主题的论文。⑤语言建档培训中心(LTDC),由研究生发起和管理,旨在帮助指导濒危语言族群提升建档技巧和管理能力,并鼓励他们向大众宣传语言多样性的重要性和语言濒危的严重性。⑥ Kaipuleohone数字档案馆,成立于2008年,是开放语言档案联盟(OLAC)的主要成员之一,馆内藏有大量的照片、笔记、词典、转录内容和其他濒危语言数字材料。

1.2 欧洲濒危语言建档计划

欧洲濒危语言建档计划(Endangered Languages Documentation Programme,ELDP)[5]成立于2002年,属于汉斯·拉斯濒危语言记录项目的一部分,其启动资金来源于Arcadia基金会向英国伦敦大学亚非学院提供的2000万英镑捐赠,旨在为个人管理的濒危语言建档项目提供资助,支持受助者使用这些资金进行实地考察、音视频录制,濒危语言纪录片集制作等建档保护活动的顺利开展。

该项目主要包含以下4个部分的内容:①建立濒危语言地图,在濒危语言地图中可以全面清晰地了解到世界范围内所有的濒危语言点,用户可以通过点击地图上具体位置和具体语言了解其简介、语言系属、使用人口和使用区域等详细信息。②濒危语言项目目录,涵盖2003年至今已完成的350多个濒危语言保护项目。用户在主页的搜索界面通过搜索国家、机构、语言和个人4项基本信息搜索自己想了解的濒危语言项目信息,项目信息包括:项目受资助人、项目结构、项目细节和项目简介。③开设濒危语言画廊,画廊是一系列濒危语言项目照片的展示,用户通过照片中展示的发音人、调查人以及调查过程可以更加直观清楚地了解到当地的语言和传统文化。④建立濒危语言档案馆,一个保存和发布来自世界各地的濒危语言文档资料的数字资源库。截至目前已收录并免费开放来自非洲、中东、亚洲、澳大利亚等地区共450多种语言的文档资料、音频和视频。

1.3 DoBeS 计划

DoBeS 计划(Dokumentation bedrohter Sprachen)[6]由大众汽车基金会于2000年启动,以记录在几年内可能面临灭绝的濒危语言。自成立以来,DoBeS对整个濒危语言建档保存理论、实践、技术工具和标准方面都产生了重大影响。在对濒危语言建档的过程中,DoBeS除了考虑到对各种类型的音频和视频数据的收集、对元数据的描述以及各项标准外,还注重对数字材料的长期保存。为此,DoBeS计划从一开始就利用最先进的技术以满足建档保存工作的需要。

该项目主要包含以下5个部分的内容:①制定指导文件,包括:“概述”(描述所有文件状态和用途的概述性文件)、“行为守则”(指导文件编制及存档工作各方面的守则)、“数据访问及保护规则”(指导档案馆员工作的文档)、“存放者·档案馆员协议”(描述存放者所提供的数据在何种条件下可供他人使用的条款)。②建立语言咨询委员会,应档案馆员的要求以及在大众汽车基金会的充分支持和鼓励下,DoBeS成立了一个由在语言建档方面经验充足的研究人员组成的独立国际语言咨询委员会,为有关濒危语言建档领域的专业知识问题提供指导,包括档案馆的访问和使用权、社区和伦理问题、培训需求、软件工具、语言问题等。③开展DoBeS会议,组织一些重要会议(包括DoBeS研讨会、咨询委员会会议、DoBeS团队组织的国际会议以及与TLA合办的国际会议)。DoBeS研讨会从2000年开始每年召开一次,内容主要以介绍濒危语言对人类重要性,宣传语言多样性为主。④开设濒危语言存档训练课程,在DoBeS计划中开展一些培训和教育活动,所有活动中使用过的材料都是公开的可供公众免费使用。到目前为止,DoBeS建档团队一共举办过23次培训课程,地点主要设在奈梅亨。⑤建立DoBeS档案馆,其中包含来自世界各地有可能灭绝的各种语言文档数据,是属于Nijmegen的Max Planck心理语言学研究所的语言档案馆(TLA)的一部分。TLA专门从事语言记录和其他类型数据的归档和保存,以及对语言工具和归档工具的开发。

2 国外濒危语言建档保护项目的特点

2.1 以深入的实地调研为基本前提

随着在实地调研中记录保存濒危语言的方式受到越来越多专家学者的推崇,一门新兴的交叉学科“语档语言学”(Documentary Linguistics)也应运而生[7],其中包含了计算机技术、多媒体技术、音视频录制技术等。国外濒危语言建档保护项目都强调要在基于实地调研之上利用现代化技术进行多媒体记录与建档保存。在LD&C项目的田野调查过程中,研究者们使用心理语言学技术来评估说话者的语言活动,以此来检测语言濒危的程度和不同语言族群之间的语言差异;在ELDP项目中,濒危语言画廊里所展示出来的所有图片与音频皆为ELDP受助者和培训机构的校友们在实地调研期间所拍摄。通过照片中所展示出来的发音人、调查人以及调查过程可以更加直观清楚地了解到当地的语言与传统文化。在濒危语言画廊中展示的俄罗斯东部汉特人的照片,2003年普查中还有30%的汉特人保持着一定程度的母语水平,而到了2010年的普查显示该地区718个汉特人中说汉特语的人不超过10人。由此可见,全面加强濒危语言实地调研的力度和范围,及时记录语言活力较弱的濒危语言显得尤为重要。而项目调查人在调查过程中学习该地区的濒危语言,会使其逐步明白其中内涵的深刻寓意与巨大价值,该濒危语言族群又在接受调查的过程中宣传自己本族语言,从而进一步激发民族认同感与自豪感。这种双方互赢的模式为濒危语言保护项目的持续开展打下了良好的基础。

除此之外,美国加利福尼亚大学圣塔芭芭拉分校2008年主办的第一届、在美国俄勒冈大学主办的第二届“田野调查实践研习会”都得到了美国国家科学基金会、美国国家人文基金会濒危语言建档项目的资助,证明了国外对于田野调查的支持与重视程度[8]。国外的濒危语言建档保护工作都坚持贯彻深入实地调研的思想,为后期的保护工作打下了坚实基础。

2.2 以多元主体协同为关键助力

国外濒危语言建档保护项目非常重视多元主体协同参与。LD&C、ELDP、DoBeS三个项目都通过组织国际会议、开展宣讲会等形式定期将来自世界各地的语言族群成员、语言研究者、档案工作者以及技术开发人员聚集在一起,分享濒危语言记录与建档的最新进展,并探讨如何更好的开展濒危语言保护工作。例如:LD&C两年一度的语言存档和保护国际会议(ICLDC)主要以如何使用数字工具和更多的技术加快濒危语言保护工作为主题召开,目前已有435位学者与社区成员加入;DoBeS自2000年发起第一届濒危语言建档的研讨会后,每年定期举办相关会议,内容包括“制定存档协议”“介绍语言存档和保护的网站和书籍”“濒危语言研究进展”“使用语言档案资源”“语言档案:它在语言学、人类学和语言维护中的作用”“记录语言学的进步”“语言档案:过去—现在—未来”等;ELAP举办的“濒危语言:我们现在在做什么”“语言资料建档”国际会议也引起了各界的广泛关注,会议内容主要以向公众宣传语言濒危的危害和人类多样性对我们的重要性为主,同时对语言建档理论和方法进行介绍。各类学术会议的广泛召开旨在提升公众对濒危语言的认识,同时给各相关行业的专业人士一个交流沟通的机会,为保护濒危语言贡献自己的一份力量。

除了通过召开国际会议凝聚各专家学者和语言工作者之外,国外濒危语言保护项目还尤其重视加入语言族群的力量,充分调动他们的积极性,保证他们与研究人员以及保护团队进行有效的配合。数据的收集、档案的整理和使用等方面都必须要有语言组群的参与[9],从协调能力、人力资源分配、互通性的标准、权益和反馈5个维度来加强濒危语言建档的协调性和互通能力[10]。国外濒危语言建档保护项目如此积极地召开国际会议并加强与语言族群之间的合作,反映出濒危语言建档保护仅依靠某一方力量的支撑是远远不够的,需要联合各专业学者、工作人员及语言族群等多方力量共同推进。

2.3 以多维的资源呈现为核心内容

濒危语言建档保存项目大都建立了庞大的濒危语言档案馆用以保存数量巨大形式多样的濒危语言数字资源,以便日后的多维度呈现。ELDP项目建立的数字语言档案馆ELAR目前已经已经收录了来自非洲、中东、亚洲、澳大利亚等地区500多种语言的文档资料,包括录音、录像、笔记、转录、翻译/或注释、照片、图表、扫描图像等;而LD&C项目的“Kaipuleohone数字档案馆”目前已经收录在“开放语言档案社区(OLAC)”中,收藏了由语言学家、人类学家和民族音乐学家等从世界各地搜集的文字、图像、音频和视频,藏品包含大量的照片、笔记、词典、转录内容和其他与少数民族濒危语言相关的数字材料,共有199种不同语言组成的4785个条目;DoBeS项目所建立的“DoBeS档案馆”则包含来自世界各地有可能灭绝的各种语言文档数据,是位于Nijmegen的Max Planck心理语言学研究所的语言档案馆(TLA)的一部分。TLA专门从事语言记录和其他类型数据的归档和保存,同时在语言归档工具的开发领域也颇有造诣。而如何对海量且形式丰富的濒危语言数字资源进行组织以及呈现,同样是研究探讨的核心所在。

除此之外,国外还有很多收录了形式多样濒危语言数字资料的数字档案馆,同样也是以多元化的资源呈现作为他们的核心内容。比如:澳大利亚原住民和托雷斯海峡岛民研究会的“原住民研究电子资源档案馆(ASEDA)”[11]收藏有数百种澳洲土著语言研究文献和音像记录资料;“美国阿拉斯加本土语言档案馆(ANLA)”[12],收录有阿拉斯加主要以印第安人濒危语言为主的共20种本土语言文献、音像和数字资源,其中还有20世纪初印第安语言的蜡筒录音转录资料;墨尔本大学、澳大利亚国立大学、悉尼大学、戈罗卡大学与国家档案馆联合建立的“太平洋和区域濒危文化数字化资源档案馆(PARADISEC)”[13],保存了100多种本土语言数字音视频资料[14];斯夸米什人语档案馆(ASNC)中保存了加拿大大不列颠哥伦比亚省的北美印第安人(斯夸米什人)的语言资源;拉丁美洲的土著语言档案馆(AILLA)中保存着所有来自中美洲和南美洲的濒危语言;澳大利亚的环太平洋地区濒危文化数字化资源档案馆(PARADISEC)中也拥有数量庞大的濒危语言资料。这些濒危语言档案馆中数字资源种类丰富多样,以多维的角度再现了语言族群的文化特色。

2.4 以充足的资金投入为重要保障

作为一项长期的系统工程,国外濒危语言建档项目都有充足的资金做保障。例如,ELDP获Arcadia基金为期10年共计1700万英镑的资助,是目前世界上濒危语言建档研究最大的基金来源。自成立以来,ELDP已资助全球400多个濒危语言建档项目,资金投入用于支持世界各地学者的实地调研、开展培训、宣传和推广等各种工作;DoBeS目前已资助超过50个研究项目,金额超过3000万欧元。资金用于组织包括DOBES研讨会、咨询委员会会议、DOBES团队组织的国际会议等一系列重要会议,还被用以开展一些培训与教育活动,并在每次培训之后将教育材料总结后传上网站供大众免费使用;LD&C投入大量资金用于进行濒危语言评估、自闭症儿童语言熟练度评估及开展国际会议。

除此之外,其他机构也为濒危语言建档提供了充足的资金支持。美国国家科学基金会濒危语言存档项目由国家科学基金和国家人文科学基金组成资助合作伙伴,预计每年提供约480万美元的资金供濒危语言档建实地工作、研究生和本科生的奖学金和举办会议所使用[15]。拉丁美洲的土著语言档案馆(AILLA)获得国家人文基金会(NEH)和国家科学学会(NSF)的资助,共计140万美元;2005年,美国政府出资440万美元对26个机构和13名学者提供支持,帮助他们对全球约70种濒危语言进行现状调查[16]。

国外大量实践显示,充足的资金能够调动研究人员和项目参与者的积极性,为建档工作中各项活动的展开提供有效的保障。

3 对我国濒危语言建档的启示

3.1 加大宣传力度,提高我国濒危语言自救的深层觉悟

国外濒危语言建档保护十分重视对语言多样性重要性的宣传工作并努力提高濒危语言族群自救深层觉悟,通过各种各种方式让濒危语言族群意识到保护自己语言的重要性并且增强自己的文化认同感,让他们自发地参与到濒危语言建档保护实践中,以抢救即将面临灭绝的濒危语言。当下,我国部分人持有“濒危语言消亡是必然趋势”“弱势语言定然会被强势语言所取代,不需要进行保护”“保护濒危语言与推广普通话相互矛盾”等论调。鉴于此,需要通过各种途径对保护濒危语言的重要性加以宣传,增强社会公众对濒危语言保护意识,认同每种语言存在的合理性,尊重濒危语言,坚决抵制各种形式的歧视。濒危语言建档保护主体主要由政府、语言群体和专家构成,而政府的行政效力只能从外围进行扶持,专家在建档保护中所发挥的作用也仅限于专业技术上的指导。这就意味着语言族群在整个建档保护过程中发挥着至关重要的作用[17]。

3.2 推出评估指标,制定针对性濒危语言建档保护策略

准确对语言活力进行划分是采取不同保护策略措施的前提,因此必须深入开展濒危语言活力评估研究[18]。国外濒危语言保护项目都十分强调对语言活力的评估,对评估指标的研究起步较早,已有了一系列的成果,以不同的等级来划分语言濒危的程度与语言活力。如Fishman的分级代际干扰量表[19](GIDS)、联合国教科文组织《语言活力与语言濒危》文件、语言危害指数(LEI)等。目前国内学者所提出的濒危语言活力评估指标缺乏体系,并没有某一个评估指标被用于权威机构的濒危语言等级划分中,且整体缺乏系统客观的统计分析。学术界对语言活力的评估缺乏严谨的评估标准,许多少数民族语言和方言存在“被濒危”的现象。部分学者使用自己主观理解的评估标准直接定义濒危语言,部分学者通过参考联合国教科文组织《语言活力与语言濒危》文件给濒危语言定级,但文件中的许多指标,有些是普遍适用,有些仍有待完善[20]。我国目前开展濒危语言建档保护的当务之急是应该结合我国基本国情,在该文件的基础上建立适合中国的濒危语言活力评估指标体系。

3.3 积极开展培训,加强濒危语言建档人才队伍建设

尽管从《总体规划》中可以看出我国已经迈出濒危语言建档保护的步伐,但步伐并不稳,采集资源还在沿用以往非濒危语言田野调查的方式,工作路线和思维方式都未转向;使用现代化技术手段的技能明显普遍不足;对语言资源加工、处理、开发利用的技能还比较陌生;跨学科的合作和支持也没有形成普遍的学术行为。无论是创建濒危语言有声语档、建设濒危语言多媒体语料库或者是开发有声数据库,都面临语料采集和录制,分析、加工和处理,资料永久保存、服务和利用等问题,这些问题都需要有规范的理论做指导。而国外基本上所有的建档保护项目都开办了以濒危语言有声资源采集、记录、加工和存档等内容为主的假期培训班和技术实训班。面对我国复杂多样且类型迥异的语言类型,只有拥有具有完备濒危语言建档技能的人才队伍,才能够满足我国濒危语言建档保护的需求。通过开展濒危语言建档培训,从建档理论方面和实践方面都进行深入系统的学习,为濒危语言建档保护起到科学的保障。培训内容可以包括濒危语言记录方法、濒危语言存档工具学习、濒危语言语料库建设以及维护等。

3.4 严控语档质量,实现濒危语言数字资源共建共享

国内之前有很多语言学者个人收藏的一些濒危语言录音材料,由于在建档之初未对语档质量进行严格控制,使得这些材料无法进行共建共享,造成资源的极大浪费。为了实现日后濒危语言数字资源的共建共享,在整个建档过程中从规划到实施,包括语档的采集、摄录、转写、注释、数字化、保存等等,都应遵循工作规范和技术标准,保证语档的质量,最大程度提高语档的可利用价值,使之发挥最大效益。濒危语言建档保护务必坚持规范和标准先行的工作思路,严格控制语档质量。濒危语言建档的规范和标准主要是濒危语言语料的采集和记录用表、濒危语言有声语档的数据规范和标准。濒危语言采集和记录用表应包括词汇表、句子表(日常用句和语法例句)以及话语提纲。其中,既要有和其他汉语方言相同的通用调查内容,也要有适用于不同濒危语言的扩充内容。例如,词汇调查表应包括音系词、基本词汇和扩充词汇,并对词汇按照常用度分级。话语提纲应体现题材的代表性和多样性。濒危语言语档的数据规范和标准是语档资源的质量及资源共建共享的保证,包括语档的架构、数据模式、元数据,音视频数据的采集和加工规范,数据质量评估标准,建档流程规范,设备和工具的技术指标等等。必须从源头上以及整个建档过程的方方面面严格控制,以确保后期濒危语言数字资源的共建共享。

本文系国家社科基金重大项目“边疆民族地区濒危少数民族档案文献遗产保护及数据库建设”(项目编号:17ZDA294)研究成果之一。

猜你喜欢
建档档案馆语言
记录历史,传承文明
——数字化测绘建档技术助力历史建筑保护
太原市档案馆牵手百年胡氏荣茶共寻文化脉络
“红心向党·创新报国”建档100周年主题征文活动
云南省档案馆馆藏《东巴经》
语言是刀
友谊医院通州院区能建档生娃了
让语言描写摇曳多姿
我有我语言
when与while档案馆
有趣的语言