苏 剑,葛加国
(1.山东大学 经济研究院,济南 250100;2.复旦大学 经济学院,上海 230000)
世界上约有7000多种语言,较多的分布在亚洲和非洲。目前有473种语言几乎消亡(Lewis,2009),而且语种的消亡速度远远快于物种的消亡速度(Andrew John,2012)。据有关学者预计,到21世纪末将会有90%的语言消亡或者濒危。此外,占世界97%的人口所说的语言占世界语言种类的4%。是什么原因导致了语言趋同?濒危语言是否需要保护?许多学者把经济与语言的关系结合起来研究这一问题。那么经济因素在多大程度上导致语言趋同?导致语言趋同的其他因素有哪些?经济学者和语言学者还没有给出清晰的答案,这是本文研究的主要目的。本文首先定量了语言趋同的函数,提出了语言趋同的三个假说,并采用经济学的工具对理论假说进行验证。
为了更细致和完整的研究语言趋同的原因,本文实证研究的被解释变量分别使用语言种类的绝对数量以及格林伯格多样化指数。
本文采用经济学的理论与工具,对语言趋同的影响因素进行深入探讨,对语言趋同的原因提出了三个假说。
(1)经济发展是语言趋同的重要原因。一国经济发展,为了降低交易成本或者获得更高的收益,人们较常使用大语种语言进行交易,从而导致说本民族语言的人数会萎缩,本国语言有趋同之势,但是不同主体的经济互动和语言演化的关系应该是一个长期的过程。
(2)国土面积尤其是本国山地和水域所占比例是影响语言趋同的重要因素。国土面积越大以及山地和水域面积所占比例越高,影响了本国交通便利程度。交通不便利,把人们分割在不同的地域,提高了两地的运输成本,形成多种不同的语言,从而影响了语言趋同的速度。从表1,我们可以直观的看到,亚洲和非洲面积最大,两个州的语言种类较多。我们根据Lewis(2009)统计的数据,可以发现一个有趣的事实,由岛群组成的国家,该国的语言种类和语言多样化指数是偏高的。印度尼西亚和巴布亚新几内亚是典型的岛国,他们的语言种类的绝对数量722、830,语言多样化指数也分别为0.8、0.99。后文会就国土面积变量和地形来验证这一结论。
(3)本国的对外开放程度是影响本国语言趋同的重要原因。本国对外开放 程度越高,与世界上他国交流越频繁,会使本国更倾向使用世界主流语言作为本民族第二语言,这很可能会弱化本民族语言的吸引力。本文我们采用了经济自由度指数衡量对外开放程度。
语言趋同是一个长期的过程,语言趋同可能还与一些文化、政治以及历史上的因素有关。基于这些因素的考虑,文章引入虚拟变量进行控制。
为了验证以上各种因子在影响语言多样化指数的强度,我们设定了计量模型为:
我们首先采用最小二乘法,运用STATA软件,回归得到如下结果,见表1所示。
表1 被解释变量为语言种类时的OLS估计
从实证结果来看,当被解释变量为语言种类时,人均收入与语言种类呈现着负相关的关系。随着引进多个控制变量,拟合优度上升,人均收入对语言趋同的影响程度降低,由最初的-0.0006到-0.0002。从总体上说,影响系数是很小的,但是与语言种类呈现了负相关,基本上验证了我们的假说。此外,一个国家的国土面积越大,那么本国的语言种类就会越多,系数通过显著性检验。遗憾的是,一个国家山地占比与语言种类呈现了反相关,经济自由度虽然呈现了负相关,但是没有通过显著性检验。我们初步认为是解释变量和被解释变量出现了互为因果关系以及解释变量之间的相关,导致了方程的内生性,我们将对模型做进一步修正。
当我们以语言多样化指数为被解释变量,得到的结果和表1的结果基本相符,拟合优度得到了提高,说明语言多样化指数和多控制变量之间的相关程度。人均收入水平、国土面积分别与语言多样化指数反相关、正相关,这与前述假说基本一致。
表2 被解释变量为语言多样化指数的OLS估计
表1和表2的结果还不能充分验证文中提出的假说,我们认为原因如下:
(1)人均收入与语言种类以及语言多样化指数存在互为因果的关系,这导致了模型的内生性。Grauve(2006)认为人均收入提高是语言趋同的原因,但是本国语言种类少,降低了交易的成本,促进了经济的增长,进而导致人均收入水平的提高。Andrew John(2012)也有相应的观点。因此需要寻找工具变量来解决这一问题。
(2)模型中的解释变量出现了相关性,导致了模型某些变量解释力不足,回归结果出现了偏误。为了充分的验证文中假说,我们选取了全球竞争力指数作为人均收入水平的工具变量。所谓全球竞争力指数,由萨拉·伊·马丁教授为世界经济论坛设计,旨在衡量一国在中长期取得经济持续增长的能力,并与2004年首次使用。它综合了经济稳定性,市场效率等指标编制而成。通过对工具变量以及方程的内生性检验,我们发现全球竞争力指数与人均收入存在较强的相关关系,因此用全球竞争力指数作为工具变量,可以较好的解决模型的内生性问题。
我们采用了TSLS方法,用STATA软件进行回归估计,得出表3和表4。
当被解释变量是语言种类的绝对数量时,我们发现假说基本成立,拟合优度也较OLS有了提高。人均收入水平与语言种类呈现负相关,系数在10%的显著性水平通过检验。但我们注意到人均收入水平的影响系数较小,可能性的解释就是,语言演化是一个长期的过程,经济发展水平很难在短期影响语言趋同的速度。国土面积和本国的地形是一个固定的量,他与语言种类分别呈现了正相关和反相关。一国国土面积越大以及山地占比较高,提高了交易成本,降低了人们交流的概率,延滞了语言趋同的速度。一国的经济自由度也与语言种类呈反相关关系,说明一国宽松国内外贸易政策,增加了交流的频率,并且更容易使交易的两个主体倾向选择大语种语言作为通用语言,从长期上看,会弱化本民族语言的吸引力。
表3 被解释变量为语言多样化指数的IV估计
表4 被解释变量为语言多样化指数的IV估计
当被解释变量为是语言多样化指数,拟合优度较高,人均收入、国土面积、地形以及经济自由度与语言趋同都得了验证。引入的虚拟变量基本上都通过了显著性检验,显示了区位影响语言收敛的效应。政治、战争等其他因素影响非洲语言多样化指数较为明显,其次是亚洲,这一结论与非洲的历史以及文化背景相吻合。
通过定量化语言趋同,并进行实证,文章得出了以下结论:
(1)经济发展导致了语言趋同。无论是简单的OLS估计还是TSLS估计都显示了这一结果:经济发展与语言种类的关系呈反向相关。虽然经济发展影响语言趋同的系数较小,这主要是由于截面数据造成的,并不能忽略经济发展是语言趋同的一个因素。根据这个结果,我们似乎可以得出,语言趋同是语言演化的规律,保护消亡语言是没有必要的。但是黄少安、苏剑(2011)认为语言既具有信息意义,又具有文化意义。我们认同这一观点,认为,基于语言的文化价值考虑,保护濒危语言是必要的。
(2)由于国土面积和山地占比在短期内是不变的,截面数据更好的表达了国土面积以及山地占比是语言趋同的最主要的因素。但是在OLS估计中,我们发现山地占比与语言种类以及多样化指数呈现了正相关。考虑到解释变量与被解释变量的互为因果关系所导致的方程的内生性,我们把全球竞争力指数作为人均收入的工具变量,进行TSLS回归,纠正这一偏误。回归结果证实了我们提出的假说二。这一假说背后的经济学机理也较为简单。我们认为一国国土越大,山地占比越大,增大了交易成本,降低交流的频率,很难实现语言的趋同或者使用某一种通用的语言。从统计数据来看,在土地较为广阔以及地形比较复杂的非洲,语言可谓大洲之最,世界上的岛国所呈现的高语言多样化指数,都很清楚的表达了这一理论假说。
(3)经济自由度越高,语言收敛的速度越快。文中的经济自由度变量主要代表宽松的贸易政策。在引入工具变量之后,经济自由度与语言种类以及语言多样化指数负相关,且通过显著性检验,这就验证了假说三,其背后的经济学机理在于自由宽松的贸易政策,增加了人们交往的频率,从降低交易成本的角度考虑,人们往往会选择通用语言,促进了语言收敛。即使不选择使用通用语言,在长期的交易中,也会提高两种语言的相似度或者产生混杂语言。词源学家所认为的“pidgin”(洋泾浜)可能就是主体间交易的结果。
实证结果还说明一个重要的结论,其他因素诸如区位、政治等因素,也影响了语言趋同。
[1]Church J,King I.Bilingualism and Network Externalities[J].Canadian Journal of Eco-nomics,1993,26(2).
[2]Grin F.The Economics of Language:Survey,Assessment and Prospects[J].International Journal of the Sociology of Language,1996,121.
[3]Lang K.A Language Theory of Discrimination[J].Quarterly Journal of Economics,1986,101(2).
[4]黄少安,苏剑.语言经济学的几个基本命题[J].学术月刊,2011,(9).