王 锋
(中国社会科学院 民族学与人类学研究所,北京 100081)
中国是世界上语言资源最为丰富的国家之一。为响应党和国家关于科学保护各民族语言文字、传承弘扬中华优秀传统文化的指导精神,2015年启动的中国语言资源保护工程,是继1956年开展全国汉语方言和少数民族语言普查以来,中华人民共和国历史上第二次全国性的语言调研工作,也是当前全世界规模最大的语言资源保护工程,在国内外都产生了广泛的影响。2019年,中国语言资源保护工程进入了五年计划最后一年的实施阶段,有必要对以往工作进行反思,总结经验,为新时期科学保护各民族语言文字事业进行理念梳理和工作拓展。以下主要着眼于少数民族语言资源保护工作,探讨语保工程的理念、目标和策略的科学性及工作经验①。
2015年5月,教育部、国家语委印发了《关于启动中国语言资源保护工程的通知》,并组织开展了全国范围内的语言资源调查工作。这一工程是继中华人民共和国成立初期党和政府开展汉语方言与少数民族语言普查后的又一次全国性的语言调查工作。2016年5月,国家语委与国家民委办公厅共同发布《关于推进中国语言资源保护工程少数民族语言调查的通知》,并颁布了2015—2019年在全国少数民族中展开310个一般点、110个濒危点调查的总体规划表。
目前,语保项目已经进入第五个年头。项目总体上进展顺利,成效明显,社会反响良好。就少数民族语言保护而言,到2018年,已完成的调研点涵盖了大陆和台湾55个少数民族117种语言的若干方言及土语,其中也包括数种特殊类型的语言,如混合语等。
根据最新的统计,2015—2018年,少数民族语言资源保护共完成总规划任务的78.3%,已完成329个语言点的调研,其中一般点254个,濒危语言点75个。加上2019年的拟设新点,到2019年,拟完成总规划任务的97.85%,共完成411个点,其中323个一般点,88个濒危点。
根据中央民族大学中国少数民族语言资源保护研究中心提供的数据,2015年至2018年各语族设点和完成的情况如下:藏缅语族133个点,约占已完成任务的40.30%,其中一般点95个,濒危点38个;侗台语族60个点,约占18.20%,其中一般点51个,濒危点9个;苗瑶语族35个点,约占10.60%,其中一般点33个,濒危点2个;突厥语族29个点,约占8.80%,其中一般点24个,濒危点5个;蒙古语族30个点,约占9.10%,其中一般点27个,濒危点3个;满通古斯语族9个点,约占1.8%,其中一般点5个,濒危点4个;孟高棉语族19个点,约占5.80%,其中一般点12个,濒危点7个;其他(包括台湾语群、回辉话、印欧语系、朝鲜语、混合语等)15个点,约占4.5%,其中一般点8个,濒危点7个。
纵观2015—2018年的少数民族语言资源保护项目进展情况,可以看到以下几个特点。
第一,工作积极性高。在中国语言资源保护工程少数民族语言调查工作中,由于各方面的原因,个别语族也有不愿意承担语保项目的情况,但总体上积极性比较高,特别是藏羌语、彝缅语的项目申报和实施都非常踊跃。其中,彝缅语言数量众多,方言、土语情况复杂,调查任务十分艰巨,但可喜的是大多数课题承担人工作主动性、积极性、责任心都比较强,课题项目完成质量较好。
第二,语言资源保护工作扩展到非传统学科高校。长期以来,少数民族语言的研究一直限于中国社会科学院民族研究所和以中央民族大学为代表的民族类院校,以及个别内地高校和科研机构。语言资源保护工程开展以来,来自内地高校的专家学者、青年学生也纷纷参加课题研究,如青岛大学、大同大学、华文学院等,这与前期少数民族语言学科人才的培养和扩展有关。通过语言资源保护项目,这些学科人才又凝聚起来,带动了相关高校关注并支持民族语言研究学科。
第三,语言资源保护产生积极社会效应。语言资源保护工程的宣传、实施以及在民族地区的调研工作,引起了积极的社会反响。语言资源保护工程的实施,正好与新时期民族地区全球化、城镇化、信息化进程中民族语言文化传承发展的新形势、新问题密切相关,各民族干部群众也高度关注本民族的语言文化传承问题,契合了新时期国家和民族地区语言文化建设的新需要。同时,中国语言资源保护工程的影响还扩展到国际上,受到世界各国以及联合国等国际组织的高度关注,显示中国的语言文化保护工作已经在全世界发挥了示范性影响。
理念决定行动,科学的理念才能保证实践工作沿着正确的道路前进。语言资源保护工程的顺利推进,在很大程度上归功于理念科学性。语言资源保护工程的设立和实施,是中华人民共和国70年来语言观不断发展的结果,在当代世界也具有示范价值。
中国55个少数民族中,54个民族有自己的语言,少数民族语言数量超过130种。2009年9月27日国务院新闻办发表的《中国的民族政策与各民族共同繁荣发展》白皮书指出:“目前,我国少数民族约有6 000万人使用本民族语言,占少数民族总人口的60%以上;约有3 000万人使用本民族文字。”[1]作为统一的多民族的国家,我国在马克思恩格斯语言观以及列宁斯大林民族语言平等观的基础上,结合中国民族以及民族语言的发展实际,不断探索和推进马克思主义民族语言平等观中国化的进程,并用其指导民族语文工作实践,取得了举世瞩目的成就,充分彰显了民族语言文字事业的道路自信、理论自信、制度自信和文化自信。按照马克思主义语言平等观,各民族的语言在地位上一律平等,只是功能有别。这是构建功能互补、双语(多语)和谐语言生活的理论基础,也是同等重视并大力保护各民族语言资源的思想源泉。
“科学保护各民族语言文字”的指导方针是民族语言文字工作首次被写进中央决议文件,意义极其深远,也是语言资源保护工程设立的依据。这一方针的思想内涵十分丰富。党和国家提出这一主导方针,凸显了工作的政府主体性。“各民族语言文字”,既包括汉语,也包括少数民族语言,同时也包括汉语和少数民族语言的丰富多彩的方言和土语。“科学保护”如何实现?统一、规范的纪录语言学调查无疑是各民族语言文字传承发展的基础性工作。可以说,语言资源保护工程从各个层面体现了“科学保护各民族语言文字”方针的要求,这是值得高度肯定的。
语言文化多样性理念,在全球范围内方兴未艾,已经成为世界共识。因此,语言资源保护工程的设立和实施恰逢其时,是在全球化、城镇化和信息化大潮中对语言文化多样性的宣传和贯彻,也是对具体工作实践中一些理念偏差的纠正。
在语言资源保护工程的具体实施进程中,充分贯彻了语言文化多样性的理念。首先,对中国语言数量的认定,项目接受中国社会科学院《中国的语言》的观点,在项目立项论证时,将中国的语言数量确定为至少130种。其次,在具体项目工作中,尽可能将20世纪80年代以来的新发现语言都纳入项目设点和调研。其三,对近年来新发现的语言,虽然前期没有研究成果刊布,但总体上采取了鼓励和支持态度,在严格把关的前提下,经过专家组讨论,并经教育部语信司批准,也进行了设点。
当前,使用人口较少、文化影响力较小的语言普遍面临传承压力,语言濒危已经成为世界性课题。“语言多样性是人类最重要的遗产,每一种语言都蕴藏着一个民族独特的文化智慧,任何一种语言的消亡都将是整个人类的损失。”[2]中国政府成功实施中国语言资源保护工程,在语言保护方面走在了世界前列。在新时期,语言资源保护工作将为促进世界语言多样性、构建人类命运共同体发挥中国的引领作用。
近20年来,对语言价值认识的深化,集中体现在语言资源观的形成和发展上。这一理念从学术界扩展到社会层面,最终被政府所认可,形成社会共识。语言资源观的扩展和深化,是对中国各民族语言价值的再认识,是语言强国战略的思想基础。语言资源观内涵丰富,本文认为可以从以下几个方面来认识。
1.政治资源。民族语言文字是体现我国各民族平等团结、共同繁荣的重要标志。做好民族语言文字工作,对民族团结进步事业可以起到事半功倍的作用。此外,我国少数民族集中分布在边疆地区甚至跨国境分布,因此,民族语言文字是维护国家安全和边疆稳定的战略资源和重要抓手。各少数民族语言特别是人口较少的民族语言纳入国家重大语言文化工程,兼有体现语言平等、促进中华民族共有精神家园建设、增强边疆文化安全的政治意义和现实价值。
2.文化资源。语言是最重要的文化和信息资源,学界已经有较多的阐释,但仍有继续深化和丰富的必要性。语言文字是人类的伟大创造,是文化的重要组成部分。同时,语言文字不仅只是文化成果,它还在历史的进程中塑造了人。语言首先是文化发展的载体,一切文化活动都需要通过语言或以语言为基础的思维能力进行。语言又是文化的凝聚体,一个文化信息系统,一个知识体系。各民族认知世界的各具特色的文化成果,就沉淀在语言中,构成多样性的人类知识宝库。
3.社会资源。语言是构成人类社会属性的关键,使用同一种语言或方言的人们构成最基本的人类社会群体,人们以语言为媒介,构建社会关系并形成特定的语言社区。这在多民族杂居地区十分常见,在新时期多民族流动人口较多的城镇地区也有突出表现。同时,不同语言群体之间双向的语言学习,对于促进新时期民族交往交流交融具有重要的抓手性作用。汉语方言区群众、少数民族群众对国家通用语言文字的学习,民族地区汉族干部群众、外来移民以及旅游者对少数民族语言文字的学习等,都具有重要的社会作用。语保工程首期项目对此已有一定的关注,但尚未纳入具体研究工作中。一期调研资料如何转化成为促进各民族交往交流交融的社会资源,值得进一步研究。
4.经济资源。最近十年来语言产业蓬勃发展,随着各民族地区文化产业、旅游业等服务产业的兴起,少数民族的语言也越来越受到关注,与之相关的民族语言学习、翻译、出版、影视等产业已有一定的发展,只是产业化程度仍处于较低水平,绝大多数语言的产业价值尚未得到规模性开发,市场尚未得到有效培育,但发展前景十分广阔。
在语言资源保护工作推进过程中,教育部、国家语委发布《国家语言文字事业发展“十三五”规划》,明确指出“语言文字事业具有基础性、全局性、社会性和全民性的特点,是国家综合实力的重要支撑力量,事关国民素质提高和人的全面发展,事关国家统一和民族团结,事关历史文化传承和经济社会发展,在国家发展战略中具有重要地位和作用,强国必先强语,强语助力强国”[3],“语言强国”理念把语言在国家发展中的地位提升到一个极高的位置。这就需要考虑一个问题,即中国语言资源如何更好地进行建设、保护和利用,以服务于新时期国家语言发展战略和民族地区语言能力提升和语言服务事业?不少专家指出,目前语言资源保护项目的调研总体上属于普惠性质,强调了语种保护的覆盖性,也可在一定程度上满足语言科普和简单语言学习的社会需要,但从语料特别是长篇语料搜集、整理和标注的数量和质量看,标准都比较低,尚无法满足民族地区语言教育和语言服务的现实需要。因此,首要的工作是把原来只要求部分标注的话语语料全部进行标注整理,今后有进一步的工作机会,再扩展词汇、语法和话语内容。话语和口头文化方面,与第一期偏重于故事性不同,要特别强调日常生活实际会话,兼顾语言的活态应用。
语保工程的立项经过了系统深入的论证,也得到了国家层面的高度认可,从而实施了这一投入巨大、动员全国力量、覆盖1 500个语言点(包括1 000多个汉语方言点,400多个少数民族语言点)的重大国家文化工程。工程的目标是利用现代化技术手段,收集记录汉语方言、少数民族语言和口头文化的实态语料进行科学整理和加工,建成大规模、可持续增长的多媒体语言资源库,并开展语言资源保护研究工作,形成系统的基础性成果,进而进行深度开发应用,全面提升我国语言资源保护和利用的水平,为传承中华优秀传统文化、促进民族团结、维护国家安全服务[4]。这个目标具有科学性和宏观性。鉴于中国语言、方言数量众多,各地区、各民族语言情况复杂,语言资源保护工程的目标和规划同时又具有探索性意义。总体看,语保工程较好地处理了几对关系,保证了工程按照既定的轨道推进。
我国语言种类众多,根据学界最新认识,独立语言种类在130种以上;汉语和大多数少数民族语言都有数量极为庞大的方言、土语。鉴于这样的语言国情,语言资源保护工程必然要面临如何兼顾普遍性和特殊性的问题。在这个方面,工程的首期目标和规划实现了较好的统筹,也就是基于普惠性原则,应保尽保;同时突出濒危语言保护,抢救优先。
根据《中国语言资源保护工程少数民族语言调查点》总体规划(2015—2019年),基于我国少数民族语言的分布、差异以及各语种研究力量,原则上使用人口在10万人以上的语种,各主要方言均设一般调查点,使用人口较少的方言酌情设为濒危语言点;使用人口在10万人以下、1万人以上的语种,选择一种方言设濒危调查点,其他主要方言设一般调查点;使用人口在1万人以下的语种,设为濒危语言调查点。上述的设点安排,综合考虑了普遍性保护和突出重点的关系。另外,在调研内容上,一般语言点和濒危语言点的要求也有区别,濒危语言调查点除了完成一般调查点的相关研究外,还需要撰写濒危语言志,这就适应了濒危语言保护的特殊要求。
自2017年起,语保工程进行了项目调整,虽然仍然设立濒危语言调查点,但是课题经费、工作要求都和一般语言点相同,不再要求撰写濒危语言志。这一工作调整显然是基于学界对严格意义上的濒危语言的认定,同时也考虑到了工程的可行性,但在客观上确实模糊了普遍性保护和重点保护濒危语言的关系,导致后期的一些使用人口较少的语言和方言没有进行深入系统的调研,未能形成语言志。
语保项目是中国各民族语言,特别是中国少数民族语言保护和传承的“兜底工程”。第一期项目覆盖了1000多个汉语方言点,400多个民族语言点,可以说从大面上把具有代表性的语种和方言都进行了调研。鉴于中国之大,发展之不均衡,很多工作不能一蹴而就,因此,和“最低生活保障”“城乡医疗保险”一样,全国覆盖性的工程起点不一定高,但系统性保障制度的建立意义极其深远。就语保工程而言,尽管对具体方案、词条、语法条目的设计等等还有各种的意见,但对于各少数民族语种特别是濒危语种,它是极其可贵的最低保障,不能过于苛求。
正如前文所言,语言资源本身具有多层次性。首先,语言本身作为文化成果,它是人类创造的具有独特价值的符号体系,因此,语言资源保护的首要目标是语言符号系统本身,也就是对语音、词汇、语法系统的抢救性纪录。其次,为了体现语言作为文化载体的价值,语保工程也设计了口头文化的调研内容,但总体上要求不高。其三,语言作为一个文化信息系统和知识体系,这一方面的价值在语保工程中尚未得到充分的体现。
长远看,语言资源保护要以纪录语言学的方法,进一步彰显语言作为文化信息系统和知识体系的价值,并提供多方面的应用。纪录语言学最主要的方法就是利用现代数码技术和手段对某一语言或方言土语进行全方位、全面的纪录,除了纪录语音、词汇、语法、口传长篇语料外,还要纪录直接观察到的语言在村落中的使用情况,包括语言的社会信息、使用现状、流利母语人人数、双语程度及双语人人数、母语教学与非母语教学等语言的社会功能和应用功能。在收集和纪录语言语料的过程中,着重收集和纪录自然话语,同时还要纪录社会文化实践中的语言活动。语言纪录的核心是同步标音、多层级注解、翻译成交际范围更广的语言,建立视听材料的语料库。这一语料库具有多用途性,对它的利用和研究可以随着研究目的的不同以及研究进程的推进而不断改变和发展,描写和分析只是语言纪录的副产品[5]。
按照工作性质的不同,语言资源保护工程的目标还可以分为战略性、社会性、学术性三个不同的层次和类型。
战略性目标,即基于国家和民族地区发展需要的目标要求,也就是为传承中华优秀传统文化、促进民族团结、维护国家安全服务。基于语言强国战略,也可以为全面提升国家语言能力奠定资源基础。此外,还要积极发挥工程的国际性影响。随着语保工程的持续推进,中国对语言文化特别是弱势语言文化的保护已经做出了令世界瞩目的成就,为全球化、信息化、城镇化背景下的语言文化保护提供了中国方案,以《岳麓宣言》为标志,语言资源保护工程已经树立起中国作为语言文化多样性积极倡导者和引领者的新形象,初步实现了中国语言资源保护工程的战略性目标,既有文化意义,又有政治意义。
社会性目标。主要是面向社会的语言资源宣传、科普和应用,其中又包括多个方面。一是语言资源观的宣传和科学普及。很长时间以来,由于强调语言文字的工具性,忽略了文化性,汉语方言和少数民族语言的功能不同程度弱化,传承出现困难,而没有实践依托的理论宣传又难以产生广泛的社会效应,影响只限于学术范围。语保工程实施5年来,在政府、学界、民间都形成了广泛的工作影响,语言资源观在全社会日益成为共识。其二,工程还极大地加深了全社会对中国语言多样性的认知,从实践上推动了不同语言群体之间的相互了解。中国语言多样性长期以来停留在学术层面,从未真正扎根于社会认知。经过语保工程的实施及其延伸性、后续性的多方位、多渠道展示,中国语言多样性已经获得日益广泛的认知,为构建功能互补、多语和谐的中国语言生活奠定了社会基础。其三,语言的社会性应用,即多方面的语言服务方兴未艾,语言资源保护工程首期着力于建设大规模、可持续增长的多媒体语言资源库,并探索后期的深度开发应用,目标就是提供语言服务。这一工作是分阶段、可持续、可扩展的。
学术性目标。语言资源保护工程着眼于语言保护,基础的工作是语言材料的搜集整理,经过调研得到的语言材料可以应用于学术研究。基于工程的支持,以往很少被学界关注或因缺乏经费和专业人才而一直没有得到调查的语言点,都被纳入到语言资源保护项目中,并获得了第一手的调研材料,为学术研究提供了丰富资源。通过语保工程的系统性推进,少数民族语言研究的专业队伍得到了锻炼,研究能力得到了提升,并吸引了一大批青年人才加入到民族语言研究工作中来,极大地夯实了民族语言研究的基础。
中国语言资源保护工程兼有多层次、多方面的工作目标,本质上,这些目标是统一的而不是矛盾的,但在具体工作中,统筹这些不同层次和性质的目标是十分必要的。汉语方言是由各省区语委部门具体推进实施的,工作目标的统筹有组织保证;而少数民族语言资源的保护是在语保中心的指导下由专家具体实施。基于传统的学术背景,加上对工程性质的认识不尽一致,不少专家倾向于强调研究的学术性质,因此常常对语保项目词汇、语法调研条目的不足以及严格的技术规范等有所抱怨。基于传统语言学的研究范式,这样的抱怨可以理解,但是也必须要指出其认识的偏差。首先语言资源保护工程并非传统的描写语言学研究,而是具有综合性目标的工程性项目。此外,语言资源保护工程具有阶段性、可持续性和扩展性,初期研究必须把抢救性保护放在优先位置,深入全面的语言学研究留待今后进行。甚至有少数专家学者没有认识到语保工程目标的多层次性,因而认为语言资源保护工程是低层次、学术含量低的官方工程,这样的认识有失偏颇,是不符合实际情况的。
我国语言国情十分复杂。不仅语言和方言数量众多,各民族、各地区的语言和方言传承情况也往往因为特定的社会、历史和文化背景而千差万别。但语言资源保护工程项目又是一个有着统一要求和规范的工程性项目,这就造成了项目实施过程中的系统性矛盾。在以往的语言文字工作中,常常存在简单化、“一刀切”的弊端,造成工作中的一系列深层次问题。如何基于复杂的语言国情,避免工程性项目的一刀切现象?总体上,语保工程项目较好地处理了这一矛盾,在探讨符合不同民族、不同地区特点的“科学保护”方面作了积极的努力。
语保工程是由教育部、国家语委具体组织实施的国家重大文化工程。政府部门具体组织的工程性项目不可避免地带有行政管理的某些弊端,但在语保工程论证和推进的重要环节,都高度强调了科学性和学术性。具体的表现是设立语保工程咨询委员会和核心专家组并赋予其学术权威,涉及重要事项都认真听取专家、学者意见并反复酝酿,确保语保工程的科学性和规范性。以民族语言保护为例,民语中心成立了少数民族语言资源保护研究专家咨询委员会,定期召开碰头会,分别就立项、一般点与濒危点工作重点、调研工作启动与前期材料审核、语料标注统一规范、中期检查、预验收、验收等工作内容进行讨论与决议。语保工程推进5年来,最重要的经验就是咨询委员会和核心专家组切实发挥了学术把关作用,这是语保工程项目得以顺利推进的重要前提。
统一的技术性规范是语保工程的生命线。为避免这一国家重大文化工程因技术瑕疵而导致失败,语保项目严格技术规范标准,并在执行过程中坚决贯彻标准要求。为了达到技术规范,首先是开展多种形式的工程培训。每年分别组织三类“中国语言资源保护工程民族语言调查培训与交流活动”:第一类为一般培训,主要围绕工程意义、要求、技术规范、数据采集质量等内容进行针对性的讲解、经验交流,并重点进行了实际操作演练观摩等活动;第二类为专项培训,分别涉及到濒危语言点的调研培训与交流、濒危语言志撰写、语料整理等内容;第三类为试点观摩活动,通过指导和监督课题人员完成各个实际操作环节,确保各调查点工程质量达标。其次是严把中期检查和结项验收关,确保工程实施的科学性和有效性。
根据语言资源保护工程的工作实践,可以认为“统一规范,分类指导”是总的工作原则。这一原则在确保语保工程规范性的同时,又具备一定的灵活性,以适应复杂多样的语言国情,确保调研工作保质保量地有效推进。
1.根据不同语言类型特点分别编制不同的调研方案。首先是根据汉语方言和少数民族语言的区别编制不同的调研方案和工作规范。其次,针对少数民族语言分属于不同语言类型、历史文化特点有明显差异的语言实际,在原有的《中国语言资源调查手册》基础上制作了主要针对不同语系的不同语族的语言包括某些特殊类型语言的8种调查手册,其中:汉藏语系藏缅语族、壮侗语族、苗瑶语族三个语族各1本、阿尔泰语系突厥语族、蒙古语族、满通古斯语族各1本,印欧语系俄罗斯语1本,朝鲜语1本。调查手册分别增补了1 800条扩展词、50条句子等内容。考虑到一些语言的具体情况,规定印欧语系伊朗语族的塔吉克语可使用突厥语族语言调查手册,而南亚语系、南岛语系及混合语等语言可视具体语言的情况分别参考上述不同语族的调查手册。在语法标注和语料整理方面,我国130余种少数民族语言错综复杂,在类型上分属于孤立、粘着、屈折等不同类型,尤其是粘着语类型的阿尔泰语系语言、屈折语类型的俄罗斯语等情况更为特殊,汉藏语系藏缅语族的语言在形态特征上不仅和壮侗语族、苗瑶语族有诸多不同,即便就是语族内部也有很大的差异性,因此,语料整理规范也需要分类培训和指导。
2.调整工作机构,强化少数民族语言资源保护组织和协调力度。在2015年启动少数民族语言资源80个点的调查试点工作的基础上,鉴于少数民族语言资源保护工作的复杂性及在整个工程整体建设中的特殊地位,国家语委、教育部语信司、中国语言资源保护研究中心(简称“语保中心”)委托中央民族大学专设“中国少数民族语言资源保护研究中心”(简称“民语中心”),全面负责协调和调动全国民族语言学界的力量来推进少数语言资源保护工作。这一组织调整是在总结2015年工作经验并对少数民族语言特殊性认识深化的基础上作出的,极大地加强了少数民族语言资源保护工作的组织性和针对性,有效地提高了工作效率。
3.设置“重大事项变更”环节,以应对语言资源保护工程中复杂多样的特殊情况。除了语言结构本身的复杂性之外,由于民族地区特定的社会、经济和文化特点,少数民族语言的传承情况也是各不相同,因此,少数民族语言保护项目在进行过程中往往会遇到各种意想不到的情况,特别是濒危语言点的情况更为复杂,最常见的困难是无法按照规范要求找到合适的发音合作人。一般而言,由于使用人口少,在数千乃至数百的使用人口中找到55—65岁的男性发音人难度非常大。一些濒危点的口语发音人能够完成词汇和语法例句调研,但难以在镜头前自由讲述长篇话语。有的濒危语言口头文化形态较少,体现不出民族文化的多样性。针对这些调研中出现的复杂问题,语保工程设置了“重大事项变更”条款,在保证采集语料真实性的前提下,允许课题组根据濒危点的实际情况寻找最合适的发音合作人,年龄、职业、文化程度、甚至性别等方面可适度变通;某些语言点的主要发音合作人无法独立完成全部摄录任务,允许增加1个人完成规定任务;针对有些语言点的主要发音人无法直接采录到规定时长话语材料的特殊情况,允许采用设专题对话聊天的形式完成规定任务;等等。
4.语言事实调研和音像摄录调研合理分工。总体上,语保项目可以分为两大部分,一部分是语言事实的调查、搜集和整理、标注,另一部分是音像摄录调研。前者体现语言调研的学术性,后者体现音像数据收集的技术性。由于语保工程在音像摄录方面制定了严格的标准,这给很多负责项目调研的专家造成了极大的技术压力。2015年的调研在音像摄录方面出现了较多的问题,导致中期检查和预结项环节都在音像质量方面大规模进行整改,在一定程度上挫伤了专家学者开展项目的积极性。语言资源保护中心敏锐地觉察到这个问题并认真听取了专家学者的意见,从2016年起设立专门音像摄录团队,实现学术任务和技术任务的合理分工,专家学者得以集中力量于学术性调研,技术性的音像摄录工作由摄录团队负责,在有效提升音像数据质量的同时减轻了专家学者的负担。当然由摄录团队全程负责一批语保项目的摄录,也有一定的弊端,有“为摄录而摄录”的倾向,但总体上利大于弊。
第一期语言资源保护工作,计划完成包括汉语方言和少数民族语言的共1 500个点的调研工作,其中少数民族语言计划完成400多个,力求覆盖全国130种少数民族语言。设置语言调查点是少数民族语言资源保护工作的关键,设点科学与否,直接关系到工程的质量。汉语方言设点较多,总体上已经覆盖了各主要方言、土语,加上对汉语方言的研究历史悠久,基础深厚,无人才缺乏问题;但130种少数民族语言只有400多个调研点且人才队伍和研究基础薄弱,有的语言点此前既没有被调研过也缺乏专业人才,如何设点是一个棘手问题。
1.统筹语言点和研究人才关系,“以语找人”和“以人找语”相结合。由于少数民族语言结构复杂,如果没有前期的研究基础,新调查一门少数民族语言是非常困难的。如果不能找到合适的调查人,项目的质量无法保证。通过语保工程,民语中心对少数民族语言的人才队伍和研究基础进行了系统梳理,首先是基于民族语言的研究现状,选择有前期研究基础的专业人才负责特定语言点,兼有专业背景、研究基础的母语学者优先考虑。对于没有前期研究基础的语言点,优先选择对该语言的其他方言有研究的专家承担,对同语支、同语族语言有研究的专家依次作为候选对象。实践证明,通过“以语找人”“以人找语”相结合的方式,最大程度地避免了“拉郎配”现象,减少了项目调研的不确定性。
2.客观认识语言差异的不平衡性,统筹主要语种以及同一语种内部不同方言的设点。中国语言情况复杂,除了语言数量多、语言传承发展情况多样之外,还表现在语言和方言的内部差异呈现突出的不均衡性。例如,汉语北方方言分布地域辽阔,使用人口众多,但是内部差异小,方言差别不大;而南方汉语,如吴方言的温州话,内部差异就相当大。少数民族语言的情况更加复杂,如彝语的北部、东部、中部、南部、西部和东南部六大方言之间差别巨大,如何安排不同方言的调研点是一个难题。根据彝语方言情况,民语中心有意识地引导安排彝语东部和西部方言的设点。对于一些存在语言岛的语言,如白语,除了剑川、大理、怒江三个滇西主要聚居区以外,在滇中、滇东的文山丘北、玉溪元江、昆明西山等地还有语言岛分布,地位重要,对这些语言岛也予以了统筹支持。
3.有针对性地支持重点区域语言设点。语言资源保护工程对于重点区域的语言进行了支持。首先是对跨境语言予以了高度重视,除了语言资源和文化多样性保护的目的之外,还综合考虑了边疆民族地区文化安全和社会稳定因素。其次是对一些具有战略意义的区域语言予以特别支持,如喜马拉雅区域的语言,不仅对设点方面进行支持,还鼓励进一步的深入研究。此外,台湾的南岛语系语言,地位极其重要,但缺乏调研的基础条件。民语中心在相关部门支持下,通过一位在大陆高校任职的台湾学者对台湾南岛语群的一种濒危语言进行了调研,实现了语保工程对我国五大语系的覆盖,特别是实现了调查区域的国土覆盖,意义深远。
根据语言资源保护工程的各项目标以及实施进程中的一些问题,中国少数民族语言资源保护研究中心也在有关方面指导下,积极谋划思考,不少专家学者积极提出建议、意见,以期继续推进中国少数民族语言资源保护,为实现国家语言文字事业中长期目标进一步夯实基础,准备条件,并力求在一些重要工作中有新的拓展。
1.在已有调查点基础上,继续补充重点语言调查。着眼于濒危语言、跨境语言以及涉及到国家安全和边疆稳定的语言进行重点调查研究。从中华优秀传统文化传承发展角度,对基于民族语言的特色优秀文化进行系统纪录、整理。
2.对已有调研资料进行整理、汇编和刊布。进一步完善民族语言语料标注规范,完成对语料(特别是长篇语料)的校对和完整标注。基于一期语保项目所收集的材料,规范整理音系、词汇、语法例句,并对收集的20分钟(或以上)时长的篇章语料进行全部转写标注。
经过5年的大规模调研,语保工程将积累下大规模的资源数据,这些数据的开发和利用,是服务于语言强国战略的重要工作。主要的工作建议简单列举如下。
1.编制国家通用语言文字和民族语言或多民族语言对照文本。工程可编制民族语言和国家通用语言文字的对照翻译文本,并以此为蓝本开发相应语言教材,帮助和促进少数民族群众更加科学系统地学习国家通用语言文字,同时促进汉族群众了解多姿多彩的民族语言。多民族语言的对照文本,可以促进各民族群众之间的语言学习。
2.建设跨语言词汇、语法例句数据库。该数据库基于已有工程性数据,开发难度不大。该数据库可以开放给语言研究者,服务于科学研究。
3.电子词典(有声)编纂与开发。利用已收集到的音视频同步语料和数据,辅以必要的补充调查,编纂和开发汉语方言和少数民族语言有声电子词典。
4.建设语言文化博物馆。根据不同层次的社会需要,在语言资源保护工程项目中有针对性地建设不同类型的语言文化博物馆,并优先发展线上博物馆。
5.搭建民族语言资源智能收集平台。对语言资源进行短期工程性调研,目前看还存在很多不足。对活态口语的常态化智能收集,应该作为重要的工作补充。建议着力搭建语言资源收集平台,开发远程调查程序和手机调查APP,大规模的语言资源数据通过日常化、活态化、智能化收集,实时传输到平台服务器并在后期整理入库,为党和国家语言强国战略、边疆民族地区安全稳定和文化建设做好语言资源的准备。