张天伟
(北京外国语大学中国外语与教育研究中心,国家语言能力发展研究中心,北京 100089)
国家语言能力指数是围绕国家语言能力的核心概念和理论体系,将文献研究、专家知识和客观数据有机结合,构建衡量指标系统,通过主观赋权和客观赋权相比较和结合的方法,确定指标权重,进而对国家语言能力进行国别量化研究。近年来,国内外学者已经开始关注语言能力的评价研究,如Chan(2016)探讨了世界主要语言能力指数;文秋芳(2016)探讨了国家语言能力的构成要素和评价指标,从管理、掌控、创造、开发和拓展能力等角度将国家语言能力分为5个一级指标和12个二级指标;沈骑和陆珏璇(2022)聚焦与国家语言能力相关的城市外语能力,从外语资源、外语服务和外语战略角度构建了全球城市外语能力指标体系;李霞(2022)从应急外语资源、应急外语管理和应急外语战略三个一级指标出发构建了城市应急外语能力评价指标体系。但上述研究都是思辨性地提出指标框架,尚未进行实证研究。张天伟(2021)采取多指标综合评价方法对国别国家语言能力进行了量化研究,首次发布了国家语言能力指数排名,但在研究和实践中也发现了一些问题。一是一级指标不够简洁,五个一级指标体系之间的逻辑关系和具体内涵不够清晰。二是缺乏一些关联性较强的指标,未吸纳某些重要数据,数据收集面有待进一步扩充。三是语言与教育、经济的关系体现不够明显。语言教育在国家语言能力中应是重要环节,教育经费投入,尤其是外语教育和国家通用语教育,与语言文字工作密切相关,应当纳入指数评价体系。四是数据采集和评价的方法相对单一,未进行综合比较。由于疫情的原因,2021年的国家语言能力指数主要采取的是客观赋权的方式,未结合各种方法进行多角度验证。
指数研究是学术研究与对策性研究相结合、文理相结合的综合性研究,具有跨学科和超学科的性质。因此在以问题和需求为导向的基础上,本研究对原有指标体系进行了修改与完善,力图构建一个更为科学和有效的指数体系,以更好地反映世界各国国家语言能力的真实情况和动态变化。
国家语言能力是语言与国家关系的历时发展的产物,这一发展主要经历了三个阶段。
第一个阶段是从远古时期一直到地理大发现之前,国家语言能力处于萌芽阶段,语言与国家之间是内向凝聚关系,语言助力国家或民族身份认同的形成。语言随着人类的迁徙而不断分化,不同地域的语言隔阂使得同一语言成为同一群体的显著标志,在群体内部助力部落、民族认同或国家认同的形成。如中国的书同文政策奠定了中华民族大统一的语言文化基础,欧洲也随着语言的分化而形成不同的民族和国家。这一时期,语言与部落、民族和领土等相关,主要面向国家内部事务,而很少参与国际交流,因为当时世界各国的交流沟通不多,疆域相隔甚远,人们来往较少,不需要大规模的语言交流。
第二个阶段是伴随着资本主义发展的殖民时代,国家语言能力进入形成阶段,特别是地理大发现时期,随着新航路的开辟,语言和国家处于共生状态,互相助力,在对外扩张道路上相互支持。一方面,一些国家的殖民者通过军事手段抢夺殖民地,杀戮原住民,攫取巨大利益;另一方面,传教士通过宗教传播、语言教育等不同手段从文化上征服殖民地,这一过程中殖民者的通用语言也伴随着殖民扩张不断推广和传播,语言与国家的政治军事力量相互借力,共同为殖民行为服务。
第三个阶段是二战以来,尤其是全球化时代,国家语言能力开始全面发展,语言与国家是外向关系,语言成为国家软实力的重要一环,是国家软实力的基础,语言问题的处理直接影响国家对内对外各项事务。一方面,英语作为全球通用语为英美等国带来巨大的经济利益,也助力其文化霸权的建立;另一方面,越来越多的国家意识到国家语言权利和世界语言多样性的重要性,重视研究和规划本国的语言政策与生活。
语言与国家的关系随着社会历史的演进而不断变化发展,国家语言能力在此过程中逐渐产生并发挥作用。在此背景下,越来越多的国内外学者意识到国家语言能力研究的重要性,修补其内涵和外延,探索国家语言能力与国家外语能力、个人语言能力等的区别和联系(Brecht & Rivers 2005;文秋芳,张天伟2018;李宇明2021等)。国家语言能力指数是国家语言能力研究发展到一定阶段的产物,现有研究多是文献研究和思辨性研究,在大数据时代,如何将国家语言能力理论体系与客观数据有机结合,顺应跨学科的发展趋势,用量化、客观数据来认知和评价复杂社会语言生活,是我们亟需解决的问题。指数研究一方面是数据的知识化,另一方面是知识的数据化,能够帮助人们更好更快地认识世界(杨丹2021)。在此背景下,国家语言能力指数研究应运而生。
指数可以按照指标数量、结果形式和发布频率等维度分为不同的类别,国家语言能力指数属于综合指数,张天伟(2021)已在业内首次发布面向世界各国的国家语言能力指数体系,详见杨丹等(2021)的介绍。但指数评价需要考虑学界评价、媒体评价、社会评价和用户评价等不同维度,需要主客观相结合,根据实际情况动态调整。有鉴于此,研究团队于2021年12月16日召开了国家语言能力指数研究专家咨询会,邀请国内国家语言能力相关研究领域的知名专家参加,并根据专家建议,针对前期研究的不足,将一、二级指标进行了简化和调整,按照已有、在用和扩展三个角度构建了新的指标体系。具体调整情况如图1所示。
图1 :国家语言能力指数一、二级指标调整示意图
此次调整主要依据以下原则:简洁性、包容性、代表性和可复制性。简洁性指依据奥卡姆剃刀原理,在确保评价指标之间逻辑关系的基础上,用最简化的指标体系来反映尽可能全面的数据信息。包容性指指标尽可能包含国家语言能力体系中的主要构成要素,并能覆盖绝大多数相关数据。代表性指指标之间相对独立,每个指标可以涵盖一个领域,避免不同指标之间信息重复。可复制性指数据来源真实可靠,数据可溯源,后续研究可复制和验证。此外本研究以数据为基本出发点,根据真实收集的数据来修补三级指标。据此,本研究完善和修订的指标体系主要包括3个一级指标,10个二级指标和32个三级指标。
InSAR干涉测量中,得到的包裹的相位函数为φi,j,取值范围为-π≤φi,j≤π,其真实相位为φi,j,并有
国家语言能力指国家围绕国家利益、国家安全、国家需求、国家意识等维度,运用语言及其各种手段,处理一切相关事务的能力(张天伟2021)。国家语言能力涵盖的范围比较广,现有指标并不能覆盖国家语言能力的所有方面,主要原因是指标设计不仅要考虑理论层面,还要考虑操作层面。一旦操作层面收集不到数据,只好舍弃某些指标。有鉴于此,我们构建的一级指标包括管理能力、发展能力和传播能力。管理能力是对已有语言资源的管理、掌握和规划,是国家已经具有的语言能力的体现,包括组织力、规划力和通晓力3个二级指标。发展能力是国家通过语言开展相关工作的能力,包括教育、研究、服务、技术4个方面的二级指标。传播能力指国家语言能力向外扩散影响的能力,包括推广力、影响力和话语权3个方面。管理能力是国家语言能力的基础,在此基础上国家开展与语言相关的各种工作并产生影响;发展能力是国家语言能力的具体实践,教育、研究等方面都是语言能力发挥作用的重要领域;传播能力是国家语言能力的外向拓展,是国家语言软实力的重要一环。
三级指标的调整主要体现在如下方面:在管理能力的规划力中增补了有无手语立法和语言多样性规划2个指标,如手语立法以世界聋人联合会(the World Federation of the Deaf)官方网站公布的手语立法国家名单为数据来源,发现共有66个国家和地区在国家层面有手语立法,表明手语的应用正越来越被世界各国所重视。在发展能力的教育力中增补了教育经费占国家GDP比例和民众识字率两个指标。教育经费直接影响语言教育的发展情况,本研究暂时以世界银行发布的教育总经费报告来衡量各国语言教育经费的投入情况。识字率能反映出一个国家教育的普及程度,以及印刷术和出版物的发展程度,就语言文字而言,识字率能反映出语言教育的发展程度。本研究以世界银行发布的15岁以上成年人识字率统计数据为依据。新指标体系将原体系中应急力拓展为服务力,具体指标包括语言服务社团数量、语言服务从业人数、语言服务岗位语种数量、应急语言服务语种数量。其中语言服务社团数量继续采用CSA2021年发布的数据,其余三项指标数据来源于国家翻译能力指数报告。技术力在原有基础上,增补了自然语言处理和语言技术统计两个典型个案。研究以2021年国际语义评测大赛(SemEval)作为自然语言处理的典型个案,依据其官方发布的最佳奖项结果对获奖国进行赋分与排名;以Nimdzi发布的语言技术图集(Language Technology Atlas)和全球语言服务提供商百强榜单(Language Service Providers Top100)作为语言技术统计的典型个案,分析各国在语言技术方面的发展情况。传播能力中话语权部分增补世界主要媒体排名。媒体是现代社会传播信息的主要途径,语言在传播过程中起到重要作用。研究通过世界媒体实验室(World Media Lab)发布的世界主要媒体排名,观察各国语言在话语传播中的不同表现。
指数研究的三个核心要素是指标设定、数据收集和权重赋值。在构建完指标体系后,数据收集和权重赋值是研究过程中的重要环节。本研究各项指标数据通过自动收集和人工收集相结合的方法进行,与2021年相比,更加全面和准确,并随时间动态更新。各指标采用的数据主要源自各国政府官网、相关研究已公开的数据、主流搜索引擎、主流媒体等,尽量做到权威、真实、可靠、数据可复制和验证。在收集数据的基础上,本研究对数据进行了预处理,如数据的清理、插补、转换、标准化等。关于数据处理的具体措施,本研究采用最大最小值(max-min)标准化方法,结合Zscore标准化进行处理,以剔除量纲和单位的影响。假设x1,...,xn为原始数据序列,则经标准化处理后的新数据序列y1,...,yn可通过如下公式计算得到:
例如原始数据中,“民众识字率”等指标为比率形式,而“语言学术研究文章数量”和“语言服务社团数量”等指标为较大的具体数值。经max-min标准化后,各个指标的取值落在[0,1]之间,避免了不同指标量纲和单位的差异带来的不可比,以便于后续计算。
指标赋权是指数研究中的重要一环。国内外综合评价研究中所用到的赋权方法主要可分为客观赋权法和主观赋权法。常见的主观赋权法,有德尔菲法、层次分析法等;客观赋权法,有变异系数法、熵值法、因子分析法等;主客观结合赋权法,有线性综合法等。客观赋权法是指从原始数据研究指标出发,从样本中提取信息,通过一定的数学方法来计算权重。其优点在于分析过程完全基于客观数据,但有较强的统计学理论依据,可避免人为因素造成的结果偏差,能反映出众多评价指标真实信息含量差异。主观赋权法是指专业的研究人员依靠自身的知识和经验,通过其主观判断确定指标,对指标进行综合评价。其优势在于操作简单,在对复杂的概念进行评定时可以集思广益、结合专家的建议从多角度考虑各种因素,并具有较强的时效性。然而,主观判断在某些情况下与客观事实存在偏差。主观赋权法对专家的能力要求较高,不同专家对于评价指标的认识不完全一致可能导致分析结果不准确,专家选取要考虑跨国别、跨学科等背景,收集专家观点所耗的时间成本和人力成本较高。
2021年我们采用的是主成分分析法。本年度研究中,我们应用层次分析法、因子分析法、主成分分析法和CRITIC(Criteria Importance Through Inter-criteria Correlation)权重法四种方法进行了数据处理和分析。从初步结果来看,各指标在数值特征和必要性上存在较大差距,特别是在层次分析法中不同专家对不同指标的重要性评分存在较大差异,加上现有主观评价专家中缺失外国评价专家,因此为了提高研究的科学性,通过比较分析,本研究采用主观确定指标和客观赋权相结合,以客观赋权中的CRITIC权重法为主进行权重赋值。一方面通过访谈,了解专家对各级指标重要性的判断,动态调整和确定指标;另一方面,分析指标的取值范围、方差和相关性特征,最终选择CRITIC权重法进行客观赋权。CRITIC权重法一方面具有客观赋权法的普遍优势,即客观公正,成本低,另一方面,与其他客观赋权法相比,其赋权原理涉及信息量维度更多,更能真实反映指标的信息含量。CRITIC赋权法的原理是通过确定指标内的变异性与指标间的冲突性,从而对各个指标的客观权重进行综合衡量。若一个指标自身的变异性越强,并且与其他指标之间的冲突性越大,则意味着该指标包含的信息量越大,其重要性程度越高,因此应为其分配更多的权重。
假设共有m个样本,n个指标,经标准化处理后的多指标数据矩阵X如下:
其中,xij为第i个样本在第j个指标的取值。
其次,计算指标间的冲突性Rj。具体通过相关系数来表示,一个指标与其他指标的相关性越强,意味着这个指标与其他指标有着越小的冲突性,反映出的重复信息越多,因此应为该指标分配更少的权重。计算公式如下:
其中,rij为第i个指标和第j个指标的相关系数。
综上,第j个指标的信息量为该指标变异性与冲突性的乘积:
最后,第j个指标的客观权重Wj为:
例如,对二级指标“规划力”所包含的5个三级指标“有无国家层面语言文字事业规划”“有无手语立法”“有无语言多样性相关规划”“有无国家层面教育规划”和“有无语言文字法律法规”的权重设定过程如下。首先,考虑单个指标的波动性。比如,指标“有无国家层面语言文字事业规划”的标准差为0.3552,而指标“有无手语立法”的标准差为0.4714。前者的标准差更小,因此,认为该指标的信息含量更少,应给予指标“有无国家层面语言文字事业规划”更低的权重。其次,考虑多个指标之间的相关性。比如,指标“有无国家层面语言文字事业规划”与其他4个指标的相关系数高于指标“有无手语立法”与其他指标的相关系数。由此可见,指标“有无国家层面语言文字事业规划”与其他指标相关性更强,应赋予更低的权重。综上,将指标“有无国家层面语言文字事业规划”和“有无手语立法”相比较,可以看出,应赋予前者更低的权重。将以上思路拓展至全部5个三级指标,即可完成二级指标“规划力”所包含的三级指标的赋权。
根据上述调整和统计,我们对世界上197个国家①的国家语言能力分项指标和数据进行了计算,得出了2022年国家语言能力指数指标权重和排名总表,如表1和表2所示。
表1 :2022年国家语言能力指数指标体系及权重
表2 :国家语言能力排名前20名和后20名
通过对指数结果的分析,我们可以从下述三个方面对2022国家语言能力指数进行解读。
?
新指标体系更科学,逻辑性更强。一级指标调整为管理、发展和传播能力,是基于国家语言能力由历史形成的现状、目前的建设实践和面向未来的发展三个维度进行的分析。从数据上来看,管理能力权重是32.98%,发展能力是32.65%,传播能力是34.37%,三个指标基本持平,说明在整个国家语言能力体系内,这三个方面相对均衡,互相影响,重要性基本相当,能大致反映国家语言能力的全貌。
对一个国家而言,语言管理能力是基础,只有具备了一定的组织机构,在了解本国语言国情的基础上进行语言规划和管理,才能形成基本的国家语言能力。目前世界上绝大多数国家对国家语言能力都非常重视。基本上都设立了语言文字工作管理部门,只有极少数国家由于战乱等原因无暇顾及。在一级指标各分项能力中,管理能力的平均得分也是最高的,达到0.4817,说明这是国家语言能力的基础能力。发展能力是在管理的基础上进行研究、服务和开发,是一个国家语言教育水平、语言科研能力、语言服务产业发展的综合体现,也是国家语言能力影响和服务于国家与社会的主要途径。世界上不少国家具备一定的语言管理能力,但是并不能很好地将管理能力落实到语言实践和语言生活中,在三个一级指标中,这一能力的平均得分最低,只有0.1136,有93个国家得分在0.1以下,说明这一能力是不少国家的短板。传播能力相比管理和发展能力来说,是向外的能力。从语言与国家关系的历时发展,可以看出国家语言能力是从内向到外向,不断扩大影响。家形成了一定的语言能力,达到了一定的水平,才能对外进行推广和传播,在世界范围内产生影响。目前,世界上语言霸权、语言帝国主义的倾向和趋势已经被广泛认知,但是从数据来看,指标平均得分0.2645,国家语言能力影响力集中在少数国家的局面尚未改变。
二、三级指标分别反映各方面的不同工作和方向,并不是平等关系,通过计算得出的指标权重也体现了这一点,即在同一能力内部,不同指标之间呈现层级性特征。以传播能力下的3个二级指标为例,推广力、影响力和话语权中,影响力权重只有24.9%,话语权和推广力分别为40.12%和34.98%。可见,在传播能力内部,影响力是基础指标,话语权和推广力是高阶指标。从具体指标分析,影响力是本国官方语言与世界国际组织的官方语言的契合程度,而推广力是国家语言传播机构的分布和数量,话语权是世界媒体、学术语言使用、语言文字国际标准。这些指标的比较中,影响力是被动的、基础的,国际组织的官方语言虽然有本国语言在世界语言系统中地位的影响,但与各国的政治、经济等软硬实力关系更大。而推广力各指标与语言传播机构有关,它的创建与推广国有关,但接受要受到所在国政府及民众的影响。话语权对于传播能力的影响更大,基本上是该语言在世界传播体系中地位的直观反映。如媒体排名中,语种的影响极大。世界主要媒体基本都使用英语,即使是非英语国家的媒体,在对外传播时也用英语进行播报。因此,这一指标体现了英语为官方语言国家的巨大优势。
三级指标的比较我们以规划力为例。规划力有5个三级指标,其中“有无手语立法”“有无语言多样性相关规划”占比高于其他3个,在21%以上,其他“有无语言文字法律法规”“有无国家层面教育规划”“有无国家层面语言文字事业规划”都在19%左右。因此手语规划和语言多样性规划相比较其他指标更为重要。因为一般来说,一个国家如果已经对手语和语言多样性进行了立法和规划,则必定已经在更基本的语言文字事业、语言教育和语言立法层面打下了基础,但是有这些基本规划的国家不一定关注到了手语和语言多样性。
总体上来看,国家语言能力与国家经济实力紧密相连(同上)。但是国家经济实力虽是制约国家语言能力发展的主要因素,却不是决定性因素,国家语言能力还受多维因素影响。
从具体国家来看,国家语言能力与该国经济发展水平并不一致,国家之间的差距较大。我们以2020年世界GDP排名靠前的30个国家和他们的国家语言能力指数排名进行比较,如图2所示,可以发现二者之间呈现两极分化的趋势,完全符合的国家只占少数。国家语言能力强于其GDP排名的如新加坡、南非,国家语言能力低于其GDP排名的如伊朗、以色列等。甚至伊朗的国家语言能力排名比GDP排名要低161位,差距极大。
图2 :国家语言能力排名与国家GDP排名(世界前30名)对比
从分项指标的得分排名来看,同一国家不同能力之间也差别较大,往往受到本国的历史地理因素、国家战略方向的影响。如管理能力前20名中,中东欧国家占了一半。从指标数据分析,这些国家因地理历史原因都很注重语言政策与规划,管理能力普遍较强,尤其是对国语、官方语言和语言多样性的重视,体现了语言文字问题在这些国家历史发展和现实生活中的重要地位。但这些国家的发展能力和传播能力得分较低,因而整体语言能力排名相对于管理能力来说比较靠后。
又如影响力排名中,许多国家的官方语言并不是本国主体民族的语言,而是殖民时代殖民者留下的语言,如非洲多数国家以法语、英语为官方语言,拉丁美洲以西班牙语为官方语言。这样在计算本国通用语言与国际组织语言的契合程度时,很容易将这些多种官方语言的国家与英美等实际影响力强大的国家赋予同样分值,造成数据与实际情况不符。为此,本次研究区分了官方语言中的原生语言、次生语言和殖民者语言。原生语言指的是原住民的语言,如英国的英语,中国的汉语等。次生语言是指该地区在殖民时代被欧洲殖民者统治,并且原住民人数少于殖民者人数,殖民者占据该地区并将殖民语言确立为官方语言,如美国的英语、巴西的葡萄牙语等。殖民者语言是指该地区曾受到殖民统治,在民族解放后,殖民者虽不占据该国人口的主要部分,但该殖民者的语言仍被确认为官方语言。对于这三种语言,本次研究在影响力的计算中,将原生语言和次生语言同等对待,都赋1分,对殖民者语言赋0.5分,以区分不同情况下该国通用语言的实际影响力。即使如此,亚非拉部分国家的影响力得分也较高,与其经济地位不一定相符,这也从侧面反映了该国在语言政策制定时的实际考量。因此,从每个国家的具体情况来看,国家语言能力与各因素之间呈现复杂关系,需要具体问题具体分析,持续观测和研究。
中国的国家语言能力排名与去年一样,处于世界第2位,总体较强。从分项指标看,我们的优势在于发展能力,短板在管理能力中的规划力和传播能力的话语权方面。
中国的管理能力排名第30位,主要是因为组织力和规划力的制约。组织力名列第5,但规划力只排第56位。中国有专门的语言文字国家管理机构,但是在语言类智库建设方面尚需向美英等国家学习。中国从新中国成立以来就非常重视语言文字工作,50年代的三大任务为我国的教育事业和社会主义建设打下了坚实基础,可以说这是语言文字工作对国家的重大贡献。改革开放四十多年来,我们在语言规划、语言标准上成果诸多,但是在语言多样性和手语立法上尚有不足,因而整体管理能力得分不够。而中国的发展能力较强,无论是语言教育、语言研究还是语言服务,都仅次于美国,体现了我国语言文字工作与信息化、人工智能等技术结合发展的良好趋势。传播能力中,中国话语权只排第12位,落后于许多英语国家,可见英语在目前世界语言生态中的重要地位。
综上所述,在今后的国家语言能力建设中,我们应该着重提升管理能力中的组织力和规划力。组织力制约着规划力和通晓力,只有组织力建设到位,才能有效实施规划力和通晓力;规划力又能对发展能力产生促进作用,反作用于整体的国家语言能力。我们还要提升发展能力中的教育力,国家语言能力的核心是语言资源,关键是语言教育(文秋芳,张天伟2018),教育力的提升决定了发展能力中的研究力、服务力和技术力。传播能力中的推广力和话语权建设是我国国家语言能力向外的重要抓手,是争夺国际话语权的基础。我们要在保持影响力的基础上,通过国际中文教育本土化和信息化建设发展推广力,通过国家传播能力建设提高话语权。
构建国家语言能力指数体系是提升国家语言能力建设效率和有效性的重要一环。目前国家语言能力指数体系还处于不断修补和完善阶段,随着其建设的日益成熟,未来能够为国家语言能力领域的研究和实践提供更多参考,为深入探究国家语言能力的内涵和外延,明晰其核心因素等,提供更多的案例和数据支撑。今后我们将广泛关注世界各种与语言有关的研究,尽可能掌握最新最全的数据;继续完善指标体系,更好地反映国家语言能力实际情况;从数据结果中更好地挖掘国家语言能力的内涵,分析国家语言能力的变化趋势;研究国家语言能力与国家政治、经济、文化等各方面的深层关系,修补和提炼国家语言能力理论体系。鉴于后疫情时代全球发展的不确定性、数据收集的动态性等主客观因素,本研究还存在一些不足,如对象国留学生学习对象国语言的数据、各种主要国语或官方语言进入各国国民教育体系的数据等未能搜集,这些我们都需要在今后的研究中不断完善。
注释:
①具体国家名单来源于外交部官网列出的197个国家。