李 艳
摘要:众多西方学者将目光聚焦于汉语系属问题,各种假说应运而生。东亚的语言通常归入:南亚语系、南岛语系、阿尔泰语系、汉藏语系。另有日语、朝鲜语等系属不明,本文对此作了论述。
关键词:东亚语言南亚语系南岛语系阿尔泰语系汉藏语系
最早进行语言系属研究的是西方学者对印欧语系的研究。由于印欧语系的研究趋于成熟。很多西方学者都把眼光转向世界各地的语言,其中东亚一带由于语言资料丰富。语言类型繁复而引起他们的关注。随着西方学者将目光聚焦于汉语系属问题。各种假说应运而生。东亚的语言通常归入南亚语系(Austroasiatic family)、南岛语系(Austronesian familv)、阿尔泰语系(Altalc family)、汉藏语系(Sino-Tibetanfamily),另有日语、朝鲜语等系属不明。
一、南亚语系
南亚语系是由德国人类学家施密特(W.Schmidt,1906)首先提出来的。南亚语系大约有150种语言,但是只有3种语育有文字历史,它们是孟语、越南语和高棉语。施密特的分类是:1,越南语;2,色蛮一色诺伊语(Semang-3enoi。后来他效仿F.N.Fmck,改称为大马六甲语族(altere Malakka-Gruppe,1926));3,卡西语、崩龙语、佤语、日旺语、尼科巴语(Nicobarese),后来叫做中部语族;4,蒙达语、盂高棉语,称作东南和西北双翅语族;5,东南混合语,如拉岱语(Radai)、加莱语(Jarai)、色当语(Sedang)、拉格莱语(Raglai)和占语。他的占语分类明显是错误的。占语应属于南岛语。后来他(1926)受马伯乐的影响,把越南语放到汉藏语系的汉台语支里。中国学者李道勇(1985)把南亚语系分为三大语族:孟高棉语族、扣达语族和石芒沙孟语族。颜其香、周植志(1995)将南亚语系分为四大语族:孟高棉语族、越芒语族、蒙达语族和尼科巴语族。其他学者或者用三分的观点,或者四分,名称也不尽相同。这一语群没有声调,词干通常为单音节,用前缀和中缀派生新词,正常语序是SVO。
二、南岛语系
南岛语系可以分为两大次语系(EthnologuerLan—guages of the World(民族语)网站,2004),一个叫做“台湾南岛语”(Formosan languages),另一个是“马来~波里尼西亚语”。前者有23种语言,可以再分成泰雅语(Atayal—ic)、排湾语(Paiwanic)和邹语(Tsouic)三大系统。后者则有1239种语言,可以再分成“中东部马来一波里尼西亚语”(Central-Eastern Malayo-Polynesian)、“西部马来一波里尼西亚语”(Western Malayo-Polynesian)和两种尚无法归类的语言。使用南岛语系的区域包括台湾、菲律宾、婆罗洲、印尼、马达加斯加、新几内亚、新西兰、夏威夷、密克罗尼西亚、美拉尼西亚、波里尼西亚等各地岛屿的语言,外加马来半岛上的马来语、中南半岛上越南与高棉的占语和泰国的莫肯语(Moken/Moklen)。
关于南岛语和马来一波里尼西亚语的关系,除了上面说法外,还有其他的说法。戴孟德(M.J.Diamond,2000)认为南岛语系有10种次语系,其中有9种是在台湾,最后1种则是马来一波里尼西亚语。台湾多数的相关文献,却将马来一波里尼西亚语等同于南岛语系。比如台湾中央研究院(1996)就有以下的陈述:南岛语系又称马来一波利尼西亚语系,是世界上唯一主要分布在岛屿上的一个大语系。中央研究院平埔文化资讯网也说,生活在台湾的土著民族,即平埔族和高山族,他们所使用的语言,不仅自己相互之间有很深的关系,而且跟太平洋、印度洋岛屿上的多种语言都有亲属关系,形成学术界所称的南岛语族或称马来一波里尼西亚语族。
南岛语言属粘着型语言,主要构词和构形手段是词根添上附加成分和词根的重叠或部分重叠。常用词大多为双音节,音节构造较简单。大多数词根既能作名词,又能作动词。人名、普通名词、方位名词分别用不同的冠词。代词第一人称有“我们”和“咱们”的区别。数词有十进位的,还有五进位甚至四进位的。动词有式、时、体、态的范畴。词序往往随谓语的性质而变动,有的语言动词出现在主语之后,有的语言动词出现在句首。
三、阿尔泰语系
阿尔泰语系的语言分布于中国境内的新疆、蒙古和东北。向南延伸到小亚细亚,向东北延伸到西伯利亚、北极海岸。阿尔泰语系包括突厥语(Turkish)、蒙古语(Mongolian)和满一通古斯语(Manchu-Tungus)。这三个语族的语言结构、句法、词汇都很相似。在词汇和句法中都专门使用后缀,词干总在开头,后缀按固定次序一个个连接。
四、汉藏语系
汉藏语系的范围,东起东北地区,西至新疆、西藏,经黄河流域、长江流域,直至东南沿海区域,包括台湾和海南岛,并且延伸到东南亚地区。李方桂(1937)提出汉语、侗傣、苗瑶、藏缅四语族说。藏缅语言的动词在宾语之后,而其他三种语言的动词在宾语之前。由于它们地理上接近、结构上相似、有共同的词汇核心,所以假定有亲属关系。
侗傣语族是就国内的一群语言而言,而“侗台语族”(Kam-Taibranch)则指分布在中国南部和东南亚的70种语言,也称“壮侗语族”、“黔台语族”、“台语族”等(覃国生,1998;梁敏、张均如,1996)。西方学者一般称其为“台—卡岱语族”(Tai-KadaiFamily)。泰籍华ASF-家平(WeeraOstapira t)在《原始卡岱语》(Proto-Kra)中指出,西方人普遍使用的名称Tal-Kadai不太恰当,因为在泰语中Kadai有“梯子”之义,建议用“Kra-Dai”取代“Tai-Kadai”,这个“Kra”正是白保罗(1941)所称的“卡岱”(布央语、仡佬语等)。
李方桂将侗台语族归入汉藏语系的理由,是这个语族具有汉藏语系的共同特征:1,单音节趋势,一个单独的音节是一个重要的语音单位,并且往往是一个词素的单位,用来作为构成词、词组和句子的基础。2,形成声调系统的趋势。声调受声母性质的影响。这被认为是共同起源的最有力证据。3,除了汉语里的吴语和湘语外,浊声母消失。4,有一些共同的词汇,但是严格的语音对应规律还没有归纳出来。李方桂的侗台语族,包括台语和侗水语。最早的文字记录是13世纪的暹罗碑文。大多数没有文字,只有云南的德宏傣语用从缅甸文演变来的掸文字母,西双版纳傣语用跟南部台文字母有关的一种字母,都是从印度字母演变来的。
苗瑶语族的苗语群,流行于湖南西部和贵州大部分地区的山居人民中,在广西北部、四川南部、云南、印度支那和泰国也有零星分布。苗瑶语族的瑶语群,流行于广东西北部山区和贵州南部,在广西、云南、印度支那和泰国也有零星分布。在历史、地理、文化上,侗台语、苗瑶语与汉语都有深远的关系和密切接触。施密特(1906)将苗瑶语列入台语族语言,马伯乐(1926)主张苗瑶语自成语族,而戴维斯(1909)列入孟高棉语,白保罗(1966)列入澳泰语。
藏缅语的数量现在难以确定,不仅因为语言和方言的区别没有分清,大量的语言没有发现或描述,而且大量语言名称混杂,同样的语言有不同的称呼。根据现有知识,藏缅语大概有250种语言(J.Matisoff,2003)。根据格莱姆,斯(BF.Grimes,1996;J.Matisoff,1991a)提供的数据:超过100万人口的语言有9种(缅、藏、白、彝、克伦、梅特尔、土家、哈尼、景颇),超过10万人口的语言共有50种。另有123种语言只有不到1万人使用,有些已消亡。(J.Matisoff,1991b)根据国家来近似地划分:印度107种,缅甸75种,尼泊尔69种,中国50种,泰国16种,孟加拉16种,不丹9种,老挝8种。越南8种,巴基斯坦1种。孙宏开等主编的《藏缅语语音和词汇》(1991),研究了52种语言和方言的1004个同义词对;戴庆厦和黄不凡的《藏缅语族语言词汇》(1992),研究了50种语言和方言的1822个同义词对。
藏缅语存在前缀、后缀、浊辅音和清辅音交替,声调由声母的清浊决定,语序为SOV。李方桂(1937)提出包括四个语群:1,藏语群,主要分布在西藏自治区和青海、四川、甘肃、云南省的部分地区。2,博多-纳嘎-克钦语群的景颇语,主要分布在云南西北边境。3,缅语群的缅-库基-钦语、老库基语等,大部分分布在缅甸和阿萨姆。4,彝语群的彝语及各方言,分布在云南大部分地区、贵州西北部、四川和西康的西南部地区,并延伸到印度和泰国。么些语(即纳西语)使用于云南西北部并延伸到西康。这个语群语音体系简化,辅音韵尾全部消失,复元音极少,一般有五或六个声调。语序跟藏语相似。白语(或民家语)可能属于这个语群,但在词汇和语序上受到汉语的影响。