岳朋雪
(海南热带海洋学院 人文社会科学学院,海南·三亚 572022)
整理和分析少数民族语言文字使用情况调查文献和相关国情数据,不仅可以全面了解我国少数民族语言文字使用情况调查研究的历时发展脉络和共时现状,总结现有调查研究的经验教训,还有助于建立少数民族语言文字使用情况调查规范,制订科学的语言政策规划,指导相关调查工作科学、有序地开展,了解我国语言国情,提升国家语言能力。
为此,笔者在中国国家图书馆网上图书馆检索整理了1949—2017年包含少数民族语言文字使用情况一手调查数据的文献,提取文献中反映少数民族语言文字使用情况的国情数据,将少数民族语言文字使用情况的国情数据与调查的民族、地点、语言、群体和时间等关联,形成反映不同地域、语言、群体和时间的少数民族语言文字使用情况数据库。本文基于数据库中的国情数据及其属性信息,从历时和共时的角度总结我国少数民族语言文字使用情况调查的经验,进一步提出新时期我国少数民族语言文字使用情况调查的建议。
1949 年以前,我国缺少系统的、全国性的语言国情调查。20世纪50年代开始,国家开展过几次大规模的全国语言文字状况调查。戴庆厦、张天伟、瞿霭堂、黄行等比较全面地介绍了几次少数民族语言文字国情调查的基本情况。虽然不同历史时期的语言调查工作重点和目标不同,但它们在了解我国少数民族语言文字使用情况和把握少数民族语言文字活力等方面发挥了重大作用。
为更好地了解相关调查的历时发展脉络,依据年度数据量将我国少数民族语言文字使用情况调查分为四个发展阶段,各阶段数据量如表1所示:
新中国成立初期,我国语言调查的主要任务是摸清境内少数民族语言文字的基本情况和描写少数民族语言的本体结构。1956年底,全国组织了7 个工作队,分赴17个省区,调查了42个民族使用的50多种语言,描写了59种少数民族语言的基本情况。此后,国内陆续补充调查了一些少数民族语言,截至1966年,共调查64种少数民族语言,积累了1600多个少数民族语言调查点的资料[1]。虽然这次调查没有提供具体的语言文字使用情况数据,但基本摸清了我国少数民族语言文字的分布区域和少数民族使用语言文字的整体情况,为下一阶段调查工作的开展奠定了基础。
20 世纪80年代,我国开展了第一次全国范围的少数民族语言文字使用情况调查。这次调查制定了科学、具体的调研计划,设计了统一的调查问卷,以“户”为单位选择调查对象。调查组分赴全国5个自治区、30个自治州和113个自治县,调查了63种少数民族语言的使用人口数量、使用范围和方言差别,各民族兼用和转用语言情况,新旧文字使用情况,掌握汉语的人口,本族语言使用的功能和范围,涉及教学、媒体、出版、电影、翻译、文艺、行政和日常生活等各个方面。这次调查大体摸清了20世纪80年代我国大陆地区少数民族语言文字使用的基本情况,是我们掌握当时少数民族语言文字生态活力和普通话推广情况最早的一手调查数据,这些数据可以作为初始参考点观察我国少数民族语言文字使用情况的历时演变。然而,此次调查不同语言文字的调查程度和范围有所差别,个别调查点语言文字使用情况采用文字描述,未呈现客观数据。
表1 我国少数民族语言文字使用情况调查数据量统计表
进入新世纪,我国出现了第一次全国范围的语言文字使用情况调查——中国语言文字使用情况调查项目。此次调查“作为国情调查的一部分,对中国的语言状况进行一次分背景的摸底式调查。目的是了解中国的语言状况、尤其是国家通用语言推广情况,分析我国的语言使用特征、规律及趋势”[2]。此项目调查了65种少数民族语言和34种民族文字。这次调查积累的经验和数据对此后的调查研究具有指导作用,但对数据的后续分析不够深入,且调查机构发布的少数民族语言文字使用情况数据均为整体数据,虽结合社会变量作了差异分析,却未单独分析各地区不同民族语言文字的使用情况,没有提供具体的以调查点为基础的数据。如使用本民族语言的人数比例没有具体的调查点和样本信息,不清楚调查对象的位置、年龄、性别、居住地、职业或受教育程度等,无法准确了解少数民族语言文字使用情况。
这一时期出现了少数民族语言文字使用情况专项调查课题。如中央民族大学“985”工程课题“中国少数民族语言国情调查研究”,通过田野调查获得某一地区少数民族语言文字使用情况的第一手材料。
这一时期少数民族语言文字使用情况调查逐步增多,各级各类调查课题大量涌现。本文统计了国家哲学社会科学基金和国家语委科研项目中相关调查课题的数量。两大科研基金都有完备的、可供检索的数据库,前者的研究具有前沿性和代表性,其数据库包含了1994—2017年立项的课题;后者作为语言学研究的专项基金项目,更加关注语言现状和少数民族语言研究,其数据库包含了2001—2017 年立项的课题。笔者以“语言使用”“语言生态”“语言调查”“语言生活”“社会语言学”“濒危语言保护”“普通话”“国家通用语言文字”为检索词在两大数据库中检索,以研究内容为少数民族语言文字使用情况和民族地区语言生活为标准,筛选出84组相关调查课题,其中国家社科基金项目53项,国家语委科研项目31项。
图1 两大科研基金中少数民族语言文字使用情况课题年度立项情况
图1显示,2010—2017年课题数量占总量的77.4%,课题立项数量自2011年有明显增长,2011年4 月,国家语委发布“十二五”规划,指出要加强语言国情研究。《国家语委“十二五”科研规划2011 年度项目指南》将“少数民族地区国家通用语言文字使用情况调研”作为重点项目招标。
民族分布上,现有调查几乎囊括了国内所有少数民族,其中蒙古、哈尼、彝、苗、藏、土家、布依、达斡尔、维吾尔和傣等人口数量较多民族的调查数据量位列前十,占数据总量的57.6%;地域分布上,现有调查点几乎覆盖了国内所有的少数民族聚居区和杂居区,云南、新疆、内蒙古、贵州、四川、广西和湖南等调查数据占总量的81.5%,其中云南的数据最多,占总量的35.5%;城乡分布上,农村是我国少数民族语言文字调查研究的重点地区,现有调查中92.2%的调查点位于乡村,7.8%的调查点位于城市(城镇);居住形态上,71.9%的调查点为少数民族聚居区,26.6%的调查点为少数民族散居区,1.5%的调查点为少数民族杂居区;群体分布上,学生、教师和公务员等民族群体的数据占总量的16.0%,其中少数民族学生的调查最多,占专项调查数据总量的72.0%。
高校是我国少数民族语言文字使用情况调查研究的主要实施机构,数据库中收录的485位调查员主要来自于高校。从数据库中的文献类型看,现有35.2%的调查文献属于学校的学位论文。
随着城市少数民族移民的不断增加,其在城市生活中的国家通用语言文字使用和本民族语言文字传承发展问题成为城市少数民族语言文字使用情况调查的重要内容。现有调查主要集中在少数民族地区的行政区域中心,如少数民族移民目的地城市。
此外,跨境语言调查研究的学术价值和现实意义凸显,跨境少数民族语言文字使用情况也成为新的语言调查热点。如今,国内已经对泰国、哈萨克斯坦、蒙古、老挝和吉尔吉斯斯坦等国家的10 多个跨境少数民族开展了语言文字使用情况调查。
语言能力是语言教学和语言测试领域的重要研究内容之一。目前,国内对少数民族语言文字能力的考察还没有统一的量化标准,不同调查员判定标准有所不同。
1. 语言能力判定标准
现有调查通常以少数民族使用语言的熟练程度表示语言能力。语言熟练程度又有“三分法、四分法、五分法和六分法”等不同划分标准。其中“四分法”比较常见,将掌握语言的熟练程度划分为“熟练、一般、略懂和不会”四个等级,或采用“熟练、一般、不太好、不会”或“熟练、一般、不太好、能听懂但不会”等说法。“三分法”多见于早期的语言调查,将语言熟练程度划分为“熟练、略懂、不会”三个等级。“五分法”通常将语言能力划分为“很熟练、熟练、一般熟练、会一点、不会”或“非常流利、比较流利、会说简单的(一般)、能听懂不会说、听不懂”等不同熟练等级。“六分法”是现有调查中最详细的一种语言能力划分方法,以《语言田野调查实录》系列调查为例,调查员将语言“听”的能力划分为“完全能听懂、大部分能听懂、基本能听懂、能听懂简单的日常用语、基本听不懂、完全听不懂”6个等级;“说”的能力划分为“能熟练交谈、没有障碍,能熟练交谈、个别时候有障碍,基本能交谈,会说简单的日常用语,基本不会说,完全不会说”6个等级。
2. 文字能力判定标准
文字能力的判定标准比较少,这与现有文字调查较少有关。20世纪80年代的调查曾考查了少数民族掌握文字的情况,以“脱盲、半文盲、文盲”区分出不同等级,现有调查考查少数民族文字能力时,通常将文字的“读”“写”能力分开考查,并以读写文字内容的多少划出不同的能力等级。
1. 调查对象的年龄范围
不同类型的语言文字使用情况调查,选择调查对象的年龄范围存在差异,分析调查数据时划分的年龄段也不同。社会语言学的语言文字使用情况调查通常要求调查对象具有一定的语言听说能力和阅读理解文字能力,选择调查对象时需要设置一定的年龄限制,以确保获得真实可靠的国情数据。但是,现有调查中调查对象的起止年龄范围没有一个统一的标准。不同调查中调查对象的最低年龄和最高年龄均差别较大,这与人们对成熟语言能力的认知和调查对象的年龄结构有关。现有调查中调查对象的年龄起点大体有两种选择标准,一种以入学年龄为起点标准,即以6岁或7岁为最低年龄限制,认为这一年龄以上的人具备比较成熟的语言听说能力;另一种以15岁或16 岁为年龄起点选择调查对象,认为15岁以下的儿童语言能力和语言认知尚未完全成熟[3]。此外,调查对象的年龄还受调查点实际人口结构的限制。如果调查点某一年龄段的人口较少,为保证足够的样本数量,调查员通常会适当扩大年龄范围。
2. 调查样本年龄段的划分
不同年龄段的语言能力存在差异,可根据不同地区的特点划分年龄段[4]。语言文字使用情况的代际差异分析是少数民族语言文字使用情况调查的重要内容之一,其结果可以帮助我们更好地预测少数民族语言文字的发展趋势和了解国家通用语言文字推广情况。现有调查在分析语言文字使用情况的代际差异时将调查对象分出老年、中年和青年三个年龄段,起始年龄较低的调查还会划分出少年组年龄段。虽然学界对老中青三代年龄群体的划分基本达成共识,但每个年龄段之间没有明确的年龄界限,需要综合考虑调查内容、调查对象的结构类型、调查地实际情况等因素。如,调查少数民族公务员群体,需要根据国家机关公务人员的年龄结构特点和调查单位的实际情况划分不同年龄段。整体来看,影响调查对象年龄段选择与划分的主要因素有两个方面。
(1) 样本量的大小
通常来说,样本量较大的调查划分年龄段更加细致,也多会作代际差异分析。样本量较小的个案调查因具体到各年龄段的样本有限,多无法作代际差异分析。据统计,现有调查中34.5%的调查点作代际差异分析,这些调查中,67.1%的调查样本量在100人以上。
(2) 人口结构的变化
随着我国人均寿命的普遍延长,人们对老年、中年、青年和少年的认识发生变化,各群体之间的年龄界限越来越模糊。如,一名50岁的调查对象在几十年前可能被归为老年群体,在现在可能被归为中年群体。而且,“老中青”的概念往往是相对的,需要视当次调查样本的具体情况而定。
语言使用情况调查是一个定量到定性研究的过程。现有调查普遍采用问卷调查的方法获得国情数据。但是,不同调查的样本量差异较大,关于每次调查的样本数量多少还没有统一的规定。
表2 现有调查样本量分布及占比情况
表2显示样本量为31~150人的调查数据最多,占数据总量的55.9%,这既保证了样本分析的科学性,又便于调查的组织开展。
新时期的少数民族语言文字使用情况调查既要“宏观把握”又要“微观入手”[5]。
我国民族众多,语言使用情况复杂,目前还未形成统一、定期、大规模的语言文字使用情况普查机制,一些科研院校和机构组织的短期个案调查仍是了解我国少数民族语言文字使用情况的主要途径。为此,应当设立专门的语言文字使用情况调查机构,负责制订科学、统一、可持续的调查规划,保障调查工作有步骤、有计划地开展,具体包括调查时间、对哪些地区和民族进行调查、如何开展调查以及调查成果的形式、调查队伍的建设和调查数据的管理等方面内容。
应制订科学、全面、统一的调查规范标准,指导相关调查工作的有效开展,保证调查数据真实可靠地反映少数民族的语言生活和语言能力。统一的调查规范标准可以保证调查数据格式一致,避免因调查员不同造成的数据可比性差,便于比较分析同一地区不同民族或者同一民族不同时期和地区的语言文字使用情况。同时,我国少数民族居住环境复杂,不同地区国家通用语言文字的推广普及程度差别较大,少数民族语言活力差异明显,影响少数民族语言文字使用的因素复杂。因此,相关调查规范的建立既要保证规范标准的全面性和通用性,也要考虑个别性,兼顾不同地区、民族和语言的差异。
应充分调动多方力量,有计划地开展不同规模的调查。具体包括将语言文字使用情况调查纳入我国人口普查,形成10年一次的大规模周期性调查;在少数民族聚居区进行短周期的调查,如可以尝试在两次人口普查的间隙,在少数民族聚居区开展5年一次的专项调查,及时跟踪少数民族语言文字使用的变化。在少数民族迁移目的地开展城市少数民族移民专项调查,充分发挥民族院校和地方高校的人才优势和区位优势,开展个案调查研究,如我国边疆地区高校和研究机构可以开展跨境少数民族和濒危少数民族语言文字使用情况调查研究。此外,还可以在全国少数民族地区开展国家通用语言文字使用情况专项调查,提升少数民族的国家通用语言文字能力,推动民族地区经济发展。
少数民族语言文字使用情况调查数据是我国语言国情数据的一部分,现有调查数据分布零散,未有相关机构对其变化进行系统的监测和管理。采用现代技术手段研发在线语言地图等数据库,实现对相关数据的有效管理与开发利用,利于及时跟踪和监测少数民族语言文字使用情况的变化,形成动态的语言文字使用情况和语言国情监测体系,为相关调查工作的开展和语言文字政策规划的制订提供参考。
随着少数民族地区全球化、城镇化和信息化水平的提升,少数民族语言文字使用环境发生变化,少数民族语言生活出现新的特点。在总结现有调查经验教训的基础上,科学、有针对性地开展少数民族语言文字使用情况调查,及时把握我国语言国情变化,提高各民族使用国家通用语言文字和传承优秀民族语言文化的能力,保障国家通用语言文字普及攻坚工程和国家语言资源保护工作的有效推进,是新时期少数民族语言文字工作的重要内容。