吴建明,李葆嘉
文字是人类社会通过可视符号进行信息交流的方式。从古老的泥板刻字,到现今的电子文本,文字与人类社会相伴相随的历史已经有数千年之久。文字既记载过去,也塑造未来。作为人类社会最古老的技术发明之一,文字不仅从未过时,其重要性反而日益凸显,在政治、经济、军事、文化、教育等领域,承担着越来越重要的功能。从文字所记载信息的数量和质量上看,它早已不是一种不如言谈的次要交流方式。一个社会的语言文字水平恰恰是这个社会文明程度的体现。
世界上的文字类型多样,传统上可以分为表音文字和表意文字。表音文字和表意文字都是语言的媒介,但二者在类型学上有着很大的差异:表音文字依赖有声言语,其基本文字符号用于记录语言系统中的音素、音节等单位;表意文字具有因义构形的特点,其基本文字符号用于表示语言中的语义概念。当今世界上大多数语言都采用表音文字系统,如希腊字母、拉丁字母、西里尔字母、阿拉伯字母、希伯来字母、婆罗米字母、藏文字母、泰语字母、朝鲜字母等,基于这种文字类型的文字观在学术界影响力巨大,是一种优势文字观。历史上的自源文字系统,如两河流域的楔形文字、古埃及的象形文字、中部美洲的玛雅文字、小亚细亚的象形文字以及中国的甲骨文,大致都属于表意文字系统,其中从甲骨文发展而来的现代汉字是唯一没有消亡,依然被广泛使用,并持续在现代经济社会生活中发挥重要作用的文字系统。相对于在数量上占绝对优势的表音文字系统,以汉字为代表的文字系统在当今世界上是一种孤立、独有的文字体系。
本文认为文字类型差异背后必然存在着文字观的差异,世界上没有唯一绝对的语言文字观。以汉字为代表的文字系统需要正确认识自身的文字类型,树立独立自主的文字观,才能在全球语言文化竞争中长盛不衰。这些将是本文所要讨论的内容。
所谓的表音文字,在文字类型学上一般称为“音符文字”(phonographs)。这类文字系统中的基本符号对应语言中的元音、辅音或音节。音符文字是世界上最为普遍的文字类型,主要包括音素文字/字母文字、辅音文字、元音附标文字、音节文字等。拉丁字母(如英语、法语、西班牙语等)、西里尔字母(如俄语、乌克兰语、塞尔维亚语等)、朝鲜字母(朝鲜语)、希腊字母(希腊语)等都属于音素文字系统,其字母表包含各自语言中的辅音和元音,是一种相对精细的文字系统;阿拉伯字母(阿拉伯语、波斯语、普什图语等)、希伯来字母(希伯来语、意第绪语)等都属于辅音文字系统,其字母表主要涉及语言中的辅音,读者需要在阅读中自行增补或通过标记提示获得元音信息;婆罗米字母(印地语、梵语、尼泊尔语等)、藏文字母(藏语、不丹语、锡金语等)、泰语字母(泰语、巴戴语等)等都是元音附标文字系统,其文字符号以辅音字母为主体,并以附加符号形式标出元音。此外,非洲的瓦伊语、北美的切诺基语,还有日语假名都是属于音节文字系统,其字符代表语言中的一个音节,且不能分离出辅音和元音。这种文字系统和用汉字表示音译外来词时相类似,即每个字符仅代表一个音节,通过音节组合来表词义,如“芭蕾”(ballet)、“奥林匹克”(Olympic)、沙发(sofa)等。
大多数音符文字系统都可以追溯到三千多年前的腓尼基字母。腓尼基人出于在地中海各地贸易的需要,在埃及圣书体基础上,改造部分象形字,组成辅音字母表。这种字母表在记录有声言语方面颇为便利,是当时人类社会一项了不起的技术发明,并在后来成为希腊字母、拉丁字母、西里尔字母、阿拉伯字母、希伯来字母、婆罗米字母等文字系统的源头。音符文字属于借源文字系统,是借助或参照其他文字符号而建立起来的文字系统。它们依赖有声言语中的语音,一旦失去语音这个参照,就没有独立存在的必要。与音符文字不同,更为古老的埃及象形文字(约公元前3200年—公元400年)、两河流域的楔形文字(约公元前3100年—公元200年)以及中国的甲骨文和汉字(约公元前3300年—)等都属于独立自主发展起来的自源文字系统,其文字符号大都经历文字画(pictographs)阶段,通过符号的重复再利用、组合再利用,发展出一定的示音功能(如埃及圣书体的辅音象形字、汉字的声旁等),但这些文字从来都不是专门用来记音或标音的音符文字。
古希腊哲学家亚里士多德是最早谈论语言和文字关系的学者之一。在《解释篇》中,亚里士多德谈到:“言语(words spoken)是情感或灵魂印象的象征;文字(words written)是言说的象征。正如人们(所用的)字母不尽相同,人们(所发的)声音也不一样,但通过这些象征,所表达的情感对每一个人都是一样,这些印象所代表的事物也是一样”。[1]115
亚里士多德的《解释篇》主要讨论的是逻辑学问题,之所以涉及语言和文字的关系,是因为语言中的逻辑必须借助言语和文字这两种媒介进行表达。亚里士多德认为言语是内心思绪的直接表征,而文字又是对言语的表征,并且只有内心思绪具有人际的普遍性,而语音和文字都具有多样性。这段论述可以理解为一种基于“先于”关系的单向序列,即思想>言说>文字(思想先于言说,言说先于文字),这符合音符文字的特点。
现代语言学的奠基人索绪尔,进一步发展了亚里士多德以来的文字观。在《普通语言学教程》中,索绪尔认为语言只能理解为一个整体,即包含自身结构或内部编排的整体和部分关系,并且语言单位的定义取决于系统内部各个单位之间的区别关系,而不是依靠其物质属性。在谈及语言和文字的关系时,索绪尔认为:
“语言和文字是两个截然不同的符号系统(two distinct system of signs);第二类系统存在的唯一目的是表征第一类系统。语言学(研究的)对象不是书面语和口语形式;唯有口语形式(spoken forms)才是语言学(研究的)对象”。[2]23-24
“语言符号(linguistic sign)将一个概念和一个声音的形象统一在一起。后者不是物质的声音、一种纯粹的物质事物,而是声音的心理印记,它对我们的感官产生的印象”。[2]65-66
“文字模糊了语言;文字不是语言的化身,而是一种伪装”“(文字)没能记录语言画面的任何部分”。[2]29-30
不难看出,索绪尔的文字观和亚里士多德的文字观是一脉相承的,即有声言语先于或优于书面文字。不同在于,索绪尔把语言视作一套符号系统,并且语言符号是直接和某种抽象的声音捆绑在一起的,通过声音关联某个概念或意义。据此,有声言语或口语被认为是最直接的语言符号,通过语音差异产生意义,言语也因此是语言学首要的研究对象,而文字则被视作较为低级或次要的记录工具。
索绪尔的文字观可归纳为“言语至上”(speech primacy)和反对“文字暴政”(tyranny of writings)[2]30-31。这种文字观对现代语言学影响巨大,甚至一度成为语言学常识或公理编入教科书。美国结构主义语言学家大多秉承索绪尔的观点。比如,BLOOMFIELD认为,“对语言学家来说,除了某些细节问题外,文字只是一种外部装置,就像留声机的使用一样”[3]282;GLEASON认为“语言学必须从对口语的彻底调查开始,其后才是书面语”[4];HOCKETT认为,“文字不是语言学家最关心的,但任何受过教育的人当然对它感兴趣”[5]539;HALL认为,“言说是根本的,而文字(尽管它在现代生活有不可否认的重要性)只是言说次要的衍生物和(部分的)表征”。[6]33
应该说,从公元前4世纪开始的希腊化运动,到横跨欧亚非大陆的罗马帝国(拉丁语、希腊语),再到17~19世纪印欧语系的逐步确立,西方语言学界在以希腊字母、拉丁字母、梵文字母等音符文字所记载的语音语法知识的基础上,逐步形成以印欧语为视角中心的语言学框架,并产生相应的语言文字观。这种文字观是以数量占优势且具有亲缘关系的音符文字系统为背景和原型的,存在一定的语音中心主义倾向。文字学先驱、美国学者GELB甚至认为所有文字系统均朝着向字母文字的方向演变,“一旦人类发现一种用书面符号表达确切言语形式(speech forms)的方法,文字失去了独立性,并很大程度上成为口语的书面替代品”①与之不同,我国学者李葆嘉认为埃及人的象形文字、苏美尔人的楔形文字以及沿用至今的汉字等“都没有且不可能发展为拼音文字”。[8]76-80。[7]11-12
从20世纪初开始,基于拉丁字母(如英语)和基里尔字母(如俄语)等音素文字的优势文字观就对我国学界产生重大的影响。胡适、鲁迅、钱玄同、刘半农、瞿秋白等文化人士主张对中国文学和文字进行改革,并大致基于以下三个推论:第一,既然口语是语言最直接的表征,汉语者应该提倡以现代口语为基础的“白话文”“大众语”,反对自古以来言文脱节、格式束缚的文言文;第二,既然文字模糊语言,文字扭曲语言,且字符(或字母表)本身没有什么语言学价值,现代语言学应当和以文字或训诂为主要研究对象的语文学区分开来,从古代转向现代,从文字转向语言;第三,由于汉字在语音和语义关联上不如字母文字清晰,应该改用更为高效的拉丁字母来拼写汉字。[9-10]
上述推论中的每一项都已经或正在对中国的语言文字事业产生重大影响。的确,音符文字系统中的字母数量有限,相互间除了书写字体差异外,本身没有多大语言学研究价值,但是汉字是一种具有五千多年历史的自源文字,其构形、构意承载着丰富的字理和语理。汉字的特点不能简单地套用音符文字理论,必然要求适合自身的语言文字观。
时至今日,已经有不少语言学家对索绪尔的语言文字观提出不同看法,认为索绪尔“言语至上”的理论假设脱离语言学实际。比如,HALLIDAY认为言语和文字都是语言的媒介,只不过它们的分工、用途不同而已,在使用文字的场合其含义不会被直说,而有些口语交际,也不适合用文字表达[11]92;LYONS认为有声言语借助语音这个物理媒介,而文字是一种图形媒介,口语可以被书写,书面语可以被朗读,二者具有相互转换的特征[12]5;COULMAS认为言语具有“连续、即时、情境、转瞬即逝、可听、语音”的特征,书写文字具有“离散、非即时、自主独立、永久、可见、手写”的特征,究竟哪一个更基本、哪一个更接近现实,这个问题不仅无法回答,也没有意义[13]11;LINELL认为,BLOOMFIELD这一代结构主义学者的文字观暴露出他们对书面语在人类历史、文化和个人发展中所起的作用的无知,忽视了书面语所具有的认知和交际特性[14];李宇明认为,“如果考虑到书面语,文字也应当是语言的载体,也可以看作语言的一个子系统”[15]。上述学者的观点对于重新认识汉字,纠正所谓“言语至上”“文字低劣”的语言文字观具有重大的意义。
本文从汉字符号并非都是言语符号、汉字是一种形素文字和汉字具有独立于言语的语言属性三个角度来理解汉语者为什么要有自主的文字观。
文字学家GELB把文字定义为“借助常规可视标记的人际交流系统”[7];SAMPSON把文字定义为“通过永久、可见标记来交流相对具体思想”的方式[16]26。在这两个著名的文字定义中,文字最显著的特征是有形可见,而不是表音或记音,即通过视觉上的可见符号来表征语言是所有文字的本质属性。
SAMPSON把文字符号区分为意符(semasiographs)和言符(glottographs):意符是直接表达概念意义(“indicate ideas directly”)的符号,而言符则是代表有声言语(“spoken-language utterances”)的可视符号[16]26。在言符之中,SAMPSON进一步区分了词符文字(logographs)和音符文字(phonographs)[16]32:词符文字不仅匹配语音,而且还直接代表语言系统中的语素或词,如汉语“人”(rén)、“天”(tiān)等;音符文字则纯粹表音,通过字母或音节的组合,间接表达语言系统中的语素或词,如英文cat、dog。HARRIS持有同样看法,认为要避免索绪尔对文字符号先验性的分类,把文字等同于两个说者之间的言语符号的交流[17]4,文字是“通过符号来实现人类活动的情境整合(integration)”,言符和意符(后者包括数学符号、音乐符号等)都属于文字,“汉字符号学具有西方完全缺乏的图形维度(pictorial dimension)”。[18]227
事实上,早在一千多年前,东汉许慎在《说文解字》里就写道,“仓颉之初作书,盖依类象形,故谓之文。其后形声相益,即谓之字”。这两句话很好地概况了古人对汉字的理解,即汉字其实包含两个集合概念:一个是依照象似性原理而创造的“文”,另一个是被赋予读音,可重复使用的,叫作“字”。本文认为“文”就是意符,而“字”就是言符,我们经常说汉字是“形、音、义”的结合体,其实就是说汉字是意符和言符的结合体。
汉字符号并非都是言语符号,汉字中的意符和言符也不是截然对立,而是可以相互转换的。比如,甲骨文的“”代表高脚盘的器物,是个象似性(即具有明显构形动机,所画即所指)的意符,后来它演变为更为抽象的“豆”,也有了“四升为一豆”的说法。此时,“豆”的笔画结构更为抽象,其象似性特征被弱化,转变为具有象征性(即根据社会共同约定而达成的形义关联)的言符。根据文字符号普遍存在的“再利用原则”(rebus principle),这个言符在用作部首时,又转化为不可直接言说意符,如“豇、豉、豌、登、丰”等;类似还有“灬(火)”“扌(手)”“忄(心)”“牜(牛)”等部首,它们都是由独体字再利用或转换为意符的例子。
本文认为语言符号的内涵要远远大于言语符号。若语言系统是个符号集合,那么它至少包含语音系统、文字系统和手语系统三个子集,其中文字系统的集合既包含言符,也包含意符,二者都是这个集合的外延,都是语言符号。汉字符号并非都是言语符号,这是音符文字的字母表或音节表所不具备的特征,也使得汉字有了独立于言语或口语的客观基础。
一般来说,每个汉字都匹配一个带调音节,但不管是整字,还是内部的构件,都不能被解释为表示辅音、元音或音节的符号,因此汉字不是音符文字。汉字也不能简单称为“表意文字”(ideograms),因为不仅每个汉字都匹配一个读音,而且许多形声字的声旁仅具有示音功能,并不表意义;汉字也不能简单地称为词符文字(logograms),因为并非每个汉字都代表一个语素(如窈窕、琵琶、奥林匹克、坦克)或一个独立的词(辉、煌、惶、惑、骆等)。换句话说,以单个汉字来定位汉字类型是存在一定困难的。当然,汉字是词符文字是目前最流行的看法,但这里有一个长期被忽视的问题:在音符文字系统中,判断一种文字是音素文字,还是音节文字,或者辅音文字,其比较基准是一个个字母或音节,它们是语素或词的基础构件,且不能被进一步拆分,如英文:h-o-p-e、泰文:(mi)、日文假名:く(ku)等,但为什么在汉字类型上,西方语言学要把一个个有可能被拆分的整字或全字作为比较基准呢?本文认为这和索绪尔等人的理论假设有关,即只有表示有声言语的单位符号才是语言学研究的对象,符合这个条件当然只有汉字整字(大致代表音节、语素或词),其内部非表音的构件则被排除在外,但这是一种不对等的比较。
我们知道一个汉字可以分为笔画、构件和整字。笔画通常是指书写过程中的点或线,它们一般都不表音,和语言或言语没有关系;构件(或部件)用于组配汉字,是“具有独立组字能力的构字单位,它大于或等于笔画,小于或等于整字”[19]。以“湖”字为例。该字包含四个基础构件:氵、十、口、月,其中“氵”表水意,“十”表多意,“口”表言说,“月”表肉。这四个构件原本都是独体字,在用作构件时又从言符转变为意符,失去示音功能。它们在二维空间上下左右整合起来,就形成“湖”字,并被赋予新的字音和意义①“胡”是“湖”的直接构件,而“氵、十、口、月”是“湖”的基础构件;直接构件“胡”也是“湖”的示音符号,即声旁。这类形声字是汉字最能产的造字方式。在“眺、逃、挑、洮、珧、桃”中,“兆”虽然是一个声旁,具有示音功能,但它不是个音素或音符,本质上是个来自独体字的形素构件(“兆”:兆纹或征兆)。再如“氧”和“养(養)”,其声旁都是“羊”,但除了表示这些字的读音外,依然具有“滋养”的示源意义,而其他音素文字,如英语的单个字母是没有这个功能的[20]。。这个过程极其类似数学、化学或逻辑领域的符号组合,如1010、102、5!、O2、p<=>q,它们都不是记录言说的符号,而是允许通过言说来解读,且自成体系的意合结构。
王宁把上述汉字中的基础构件称为“形素”[20]79-80。形素是在形体上相对独立,并且大都能够体现构意的构件。据此,在词义相同的情况下,汉语“湖”②汉字由于书写原因,一些构件产生了“构件变体”,但通过溯源,仍具有与正体相同的构意。的四个构件,“氵、十、口、月”,大致对应英语l-a-k-e的字母构件、希伯来语g-)的辅音构件,日语みずうみ(mi-zu-u-mi音节构件。这些构件要么表示语义概念,要么表示语音片段,但在文字符号的构形地位上是相等、可比的。因此,判断音符文字类型的音素或音节,对应的不是汉字整字,而是汉字内部的基础构件。汉字最合理的类型学定位应该是建立在基础构件之上的“形素文字”。汉字的形素代表语言中的各种本体概念,是和思维认知直接相关的意符,这就使得汉字在很大程度上独立于言语,也使得“文字记录言语,文字模糊语言”的说法失去了客观基础。
二重性(duality)是人类语言最重要的定义属性之一,指的是人类语言在结构上同时存在形式和意义两个相匹配的层次[21]。比如,英文s、t、o、p四个字母可以通过不同线性组合,形成stop或pots两个有意义的词;同样,汉字的“一”和“木”两个意符构件,可以通过上下的位置组合,形成“本”和“末”两个指事字,分别表示“树根”(在“木”下标示)、和“树梢”(在“木”上标示)。值得关注的是,英文的形式层是音符组合,属于记录言语的言符范畴;汉字的形式层是形素组合,属于表示语言概念的意符范畴。只有当“本”和“末”用拉丁字母拼写时,即ben和mo,汉语和英语的文字编码策略才一样。换句话说,同为语言二重性,唯有汉字系统可以采用独立于有声言语的编码策略③日本语言学家桥本万太郎等甚至认为汉字系统不是文字,而是一种类似通用语的语言。[22]26-32。
我们以“语素”这个概念来理解汉字独立于言语的属性。在后布龙菲尔德时代,美国结构主义的代表人物HOCKETT把语素定义为“一种语言的言语中最小单独有意义的元素”[5]。这个定义是西方语言学的主流定义,语素也因此只是个言符概念,代表最小有意义的音段形式。我国语言学界通常所说的“语素是最小的音义结合体”,也是吸收、借鉴了这类定义的思想。[23]15-18,[24]15
语素是音义结合体,代表是言语中的音段形式,这其实是音符文字类型的特点。比如,英语中代表语素的音段形式多种多样,可以通过增加一个辅音音素(sing-sings)、增加一个非词的(黏着)音节(print-printer)、增加 音 节复杂 度(CCCVCCC:strengths)等方式,来改变或形成新的形义匹配。不难想象,英语对音节数量需求极高,目前已经达到4 400-7 000个[25]309,[26],其音节结构也属于高度复杂的类型[27]。与之不同,汉语普通音节数只有1 200-2 100个[26][28]83,有限的音节数对于庞大的汉语概念表达来说,是远远不够的,只能依赖汉字中的形素来区别意义。换句话说,汉语需要同时在言语和文字两个层面考虑语言二重性的问题,仅仅从言语层面谈最小音义结合体,走有声言语优先的路线是脱离汉语实际的。举例来说,汉语jùn这个音节在特定言语环境中存在不同的语素义解读,但这种单音节语素义的获取,仅靠音段或超音段是不够的,往往要靠增加音节数来消除歧义,如jùn mǎ(骏马),yīng jùn(英俊),xiǎn jùn(险峻)等。然而,在汉字层面,始终存在形素编码的策略,不仅“骏/俊/峻”可以通过不同表义形旁区别意义,而且所谓的双音节语素,如“鹦鹉、骆驼、玛瑙、彷徨”等,其实在汉字层面也是通过形旁结合在一起的,如鸟字旁、马字旁、斜玉旁(珠宝义)、双人旁(十字路口义)。换句话说,由于形素的存在,不仅每个汉字都可能是有意义的,而且两个汉字可以靠共同形素或逻辑相关的形素意合在一起(如“吃饭”:口-飠/饣)。形素本质上不能用于言谈,它们和言符没有直接关系,因此汉字的构件中没有语素,只有形素,这也意味着汉字必然存在独立于言语的二重性结构①当然,在言语层面,汉语存在语素或音节组合构词的现象,如连读轻声:重叠轻声(“哥哥”)、词缀轻声(“桌子”);连读变调:“野草”(野214→35);声母类化:铺(p°ou54)→“床铺”(ts°K22 mou21)(闽方言),以及双声(“玲珑”)、叠韵(“彷徨”)等,即谓音系词或韵律词,但与形素的意合不同。。
由此可见,一旦忽视音素文字和形素文字的类型差异,汉字很快就沦为“有缺陷”的记录有声言语的工具,这是受到优势的音符文字理论影响的结果。汉字不能等同于言语符号,汉字是一种形素文字,汉字具有独特的二重性编码策略,这些是建立汉字自主文字观的立论基础,并不能用借源文字中的“言符中心主义”来定义或评价。当然,这也意味着汉字书写者必须具备更为复杂的言符和意符两种编码能力,后者和数学符号一样都属于意符范畴。
以索绪尔为代表的文字观一方面宣称“言语至上”,轻视文字,但大量的语言研究实践中却不得不依靠文字来建立各种理论模型(如音系学、词汇学、语法学等)。事实上,文字是一种趋于抽象、形式化的语言表征,只有文字才能精确、高效地刻画或把握复杂精密的语言系统,并从中进行更为复杂的推演运算(如计算语言学、形式/功能语言学、大数据语言学等研究)。现代智人出现距今有四五万年的历史,而文字只是近五千年才出现的事物,这不是因为言语更能代表语言,而是因为只有高度发展的文明社会才能运用文字来表征复杂的概念体系。言语和文字都是人类思维的表达方式,它们不是谁优谁劣的关系,而是既相辅相成,又各自独立的关系。
世界上的自源文字系统大多数都已经消亡,唯有汉字历经数千年一直没有中断,并持续在现代社会生活中发挥不可替代的重要作用,显示出强大生命力。这不得不说是一个文明奇迹。当然,我们要充分学习、借鉴音符文字由音及义的便捷性[29],但同时更要重视汉字自身的类型学特征,特别是汉字在文化传承、文化认同和思维认知等方面独有的潜力和能力。唯有如此,汉语、汉字和中华文明才能更好地为人类社会作出应有的贡献。