张学新
(香港中文大学 心理学系,中国 香港)
【编者按】语言是人类智力和理性的核心标志。文字使语言超越了时间和空间的局限性,将其能力发挥到极致,也因此成为文明的基石。对汉字本质的认识,长期以来众说纷纭,缺乏突破性进展。张学新博士提出的汉字拼义理论超越了以往理论囿于单字的局限性,指出汉字词汇在经历了单字创制和单字拼合两个阶段的历史发展之后,才真正形成了一个完备而科学的符号系统。该理论彻底否定了汉字拼音化的可能性,认为拼音与拼义文字植根于不同的感官通道,构成成熟文字仅有的两个逻辑类型,不能互相转换。语言文字不仅与社会人文科学密切相关,也是人脑信息加工等自然科学的一个中心课题。希望这个理论能带来对汉字和汉语的新讨论和新认识,促进相关学科的发展,使中文研究为理解语言的普遍性本质、揭示人类智力和理性的奥秘做出独特的贡献。
汉字拼义理论:心理学对汉字本质的新定性
张学新
(香港中文大学 心理学系,中国 香港)
当今世界上所有的文字都是拼音文字,使用几十个字母来拼写所有的词汇。唯一的例外,就是使用数以万计个方块字的汉字。中文能否拼音化,即废除汉字,改用一般通用的字母来书写呢?这个问题虽经百年纷争,至今仍未解决。本文提出汉字拼义理论,指出汉字系统在词汇水平上是世界上独一无二的拼义文字,它切合了认知心理学和脑科学中根本性的语义网络原理,具有稳固的科学基础。汉字充分利用了人脑的视觉加工能力,与拼音文字相比,是一种更为彻底的视觉文字。拼音和拼义文字是成熟、高效的人类文字仅有的两个逻辑类型,不能相互转换。汉字超越了记录口语的工具性,在极大程度上塑造了汉语,使得成熟的现代汉语,必须以汉字为其书面语言,这是汉语不能使用拼音文字的根本原因。
拼义文字 义基 汉字 视觉语言 语义网络 汉字拼音化 拼音文字 词素
当今世界数千种语言,以汉语的使用人数为最多。除汉语外,这些语言中,凡有文字的,都采用以字母为基础的拼音文字。二战后独立的一百多个国家,选用或新造官方文字,都采用拉丁字母。历史上属于汉文化圈的主要国家中,朝鲜弃用汉字,日本和韩国去汉字化,仅保留少量汉字,越南曾使用汉字长达两千多年,也在1945年放弃了汉字,转向字母文字。汉字是目前世界上唯一没有拼音化的文字。通过总结世界文字的发展历史,文字研究中的一个主要观点认为原始文字,经意音文字,进化为字母文字,达到了文字发展的最高阶段。汉字处于意音阶段,应该、也最终能够拼音化[1]。
拼音文字是不是所有文字的终点?汉字是不是应该拼音化?自辛亥革命后,曾发生过三次大的论辩,众多的知识分子和社会精英,对这个问题做过深入思考和探讨[2,3]。五四时期,汉字被认为是中国文化落后的原因,人们进行了很多汉字拼音化的尝试。新中国成立后,进一步探索用拼音文字取代汉字,实施了推广普通话、简化汉字、采用汉语拼音方案三大语文改革。但拼音化的实践出现了很多问题,理论上的反复争鸣,也一直无法达成共识。很多人强调汉字的优点,反对拼音化。1986年的全国文字改革会议,是在国家层面对这个问题的最近一次讨论[4]。会议认为,汉字的前途暂时不宜定论。汉字拼音化的讨论此后基本处于搁置状态。汉字在华夏文明的继承、传播和发展中扮演着关键的角色。汉字的命运如何,是中华民族的一件大事。汉字的本质是什么,是个世界性的学术问题,需要一个科学的回答。
本文阐述一个新的学术理论,第一次提出汉字作为汉语的书面语言系统,在词汇水平上是拼义文字。拼义文字同拼音文字两极对立,都是文字发展的最高阶段。在保持交流效率的前提下,两者不能互相转化,也不存在兼顾拼音、拼义优点的第三种文字。汉字根本没有必要,也完全没有可能拼音化。这个论述吸收了前人对汉字的认识,其新颖之处,来自对当代心理学和脑科学研究成果的充分借鉴。语言和文字作为沟通客观现实与主观心理的工具,是以人脑信息加工为生理基础的。心理学和脑科学为认识汉字本质提供了一个崭新的视角。
人类拥有共同的发音器官,所有语言中,语音的基本单位都是单个的音节。单音节通常包括一个核心元音或复合元音,其前后可以添加辅音或辅音组合。语言中最古老的词汇都是单音节的,用来指称自然现象,如汉语中的“日”、“树”,英文中的 sun,tree等。要指称不同的现象,就要使用不同的音节。同一个音节也可用来代表几种不同的事物,但会引起意义混淆。为表达更多的事物,单音节的数目不断增多,结构也越来越复杂,或通过采用更多元音和辅音的组合方式,或通过给音节添加声调。但是,单音节的数目有生理、心理上的局限,超过一定的数量,音节彼此过于相似,不易发准,听觉上也难以分辨。国际音标描述了人类所有可能的发音,但一个特定的语言仅使用其一小部分构造单音节,总数有限,其中常用单音节数目更少。如汉语普通话,大约包含1 200个音节,常用音节仅1 000个左右。韩语原则上可以构造出上万个音节,但常用音节仅2 000个左右。日语没有声调,音节数目很少,大约120个[5]。虽然需要进一步确证,有理由估计一般语言常用单音节的上限应该在3 000个左右。显然,单音节能表达的概念不够丰富,需要把单音节组合起来,构造多音节。比如,1 000个单音节,可组合出一百万个双音节,十亿个三音节。
多音节化给所有语言都带来两个根本性的后果。首先,一个单音节会反复出现在不同的多音节组合里,用于表达互不相关的概念,这个音节会逐渐失去明确、固定的意义,简称为单音节表意的不明确性。其次,多音节能够表达丰富的语义,却需要多次发音,有冗长低效的缺点。
人类说话是一个音节一个音节发出来的。如果给每个音节规定一个符号,只要把听到的音节用对应的符号顺序写下来,就可以记录口语,形成音节文字。音节文字属于拼音文字的一种,适合如日语等单音节总数不多的语言。大多数语言需要把音节继续分解成更简单的音素(元音和辅音)。音素数目不多,用少量字母符号就可以表示。用字母记录音素,进而记录音节,进而记录口语。这样,采用合适的字母表,任何一种人类语言都可以用字母记录下来,形成拼音文字。像用五线谱记录乐音一样,拼音文字实际上是用视觉符号对听觉信号进行转写,这个简单的转写过程并不改变信号的本质。
与所有的古典文字一样,汉字最初也是用象形、会意等方式构造一些视觉符号代表事物。这些符号的形态跟语音无关,称为意符,即表达意义的符号。但抽象、复杂的事物很难这样表达,这就导致了假借字或通假字的出现。比如一个人不会写“忠诚”,就写别字成“中成”,念出来后就理解了。这里借用的符号“中”或“成”仅仅是记音,不表意义,所以称为音符。这时的汉字处于意音阶段,既有意符,也有音符。假借用多了,一音多义,会引发混淆。随后出现的形声字,组合表意的形符和表音的声符,提供了一个简单、高效的造字方法,从根本上完善了这种意音文字。汉字早期为国家控制,由少数人专职负责,一旦发现了形声原则,就能够系统性地运用到造字实践中。所以汉字单字此后的发展,仅仅是数量的累积,没有质变。甲骨文中形声字大约占26%,到东汉已迅速增加到80%[6]。
形声字发音跟随其声符,继续保持“一字一音”,使其成为汉字一个永久性的核心特征。在一定时期内,由于形声原则通过造字就能有效表达新事物,不需要增加新的音节。但增字不增音,有两个后果,一是字形越来越繁复,二是同音字大量积累。普通话不计声调,总音节仅400多个,古汉语音节更多些,但单字数目在甲骨文时期已达到约4 500个,东汉更增加到一万多个,一字多音是不可避免的。文字初期,使用者均以文字为职业,人数不多,师徒相传,难学难写不是问题,反而有助于保持文字的神秘和高贵。到秦朝,为统治庞大的帝国,大量官吏需要使用文字,书写法律、公文、档案等。用小篆去规范字形,再从篆书走向隶书,都是为了简化汉字,克服字形繁复的缺点。随着文字的广泛使用,有越来越多的场合需要把文字念给不识字的人听,同音字带来的一音多义,会导致严重的理解困难。同音字反映的根本问题是,此时的汉语主要使用单音节词汇,而如前所述,单音节的数目有限,无法表达文化快速发展时期大量涌现的新事物、新概念。要彻底解决这个问题,所有的语言都要走向采用多音节表意的构词,汉语也不例外。
当汉语中出现双音节词汇时,受已有的“一字一音”规律的约束,对应的文字也会被书写为双字组合。比如,野外看到一个动物,样子像牛,汉语要组合两个音节来表达这个新概念的时候,可能一些民众口语中任意给它个称呼,叫 ka mu。但一般人无权制造文字,这个口语词汇要转换为书面词汇,必须经过国家。掌管文字的人记录这个词的时候,可能随意用两个同音汉字,比如“卡亩”,来标记其发音。但是,可能有其他民众用ye niu来称呼这个动物,并解释说,ye就是代表荒原的ye,niu就是代表耕地的niu。掌管文字的人理解了这个意思,就会选择“野牛”两个字,来记录这个双音节词。两者比较,他们会发现,同样是使用两个字代表一个新事物,“野牛”这种拼合,比“卡亩”这种随意规定两个音节的拼合,更有意义。
古人并不知道,“野牛”更有意义,并非偶然,而是因为它契合了语义网络这个心理学和脑科学的基本规律。语义网络由美国心理学家奎廉1968年首先提出,现在普遍被认为是人脑表达世界知识的最基本的原理[7]。按照这个原理,人脑中的概念不是孤立的,而是跟其他的概念相互关联,构成一个复杂的网络。一个概念,可以用其他相关概念的组合或复合来表达。如用“马”和“车”这两个概念,就可以构造出“马车”这个与马和车两个概念相关,但又有所不同的概念。两个单字组合形成的新概念,可以同其他概念进一步复合,构建更复杂的概念,发展到三字、四字等多字词汇,具备几近无限的表达能力。所以,概念组合反映了世界的一个本质规律。少数负责文字的人一旦捕捉到这个规律,意识到它的巨大威力,就有可能把它系统性地应用到文字创制的实践中去,用两个汉字的拼合去表示大量的新事物。完成了这个理论突破,汉字词汇作为一个符号系统,就突破了单字的瓶颈,奠定了其未来词汇增长的根基,走上了文字发展的坦途。双字词在甲骨文中数量很少,到战国末年,已增加到总词汇的20%左右。到隋末,这个比例是50%。最重要的是,这些词汇中的95%,都是可以从概念组合角度去理解的复合词[8,9]。这一压倒性的比例充分证明,这些汉语词汇是在概念组合原理的明确指导下,有意识、有规律地创造出来的,很难用其他偶然因素解释。在现代汉语常用词中,复合词比例高达95%,占据绝对的主导地位。
以上分析表明,作为成熟的汉语书面语言,汉字本质上是一个“拼义文字”。这个文字系统的发展,基于两个基本的原理。一个是形声造字原理,通过形音组合制造大量的单字,表达众多较为基本的概念。一个单字代表一个意义的基本单位,简称为“义基”。另一个原理是基于语义网络的拼义原理,通过拼合汉字,构建新的词形,利用两个义基代表的旧概念,表达新概念。相对于拼义原理,形声原理的重要性要弱一些,因为它的一个主要作用是使得造字更容易、更系统。理论上是否存在其他的造字原理,可以达到同样的目的,还需要进一步探索。这两个原理的发现和有意识应用,分别标志着汉字发展的两个历史阶段,可称为“义基积累”阶段和“义基拼合”阶段。拼音文字以字母为基本单位,字母的音是预先定义的,不是拼合而来的,“拼音”是指字母跟字母的拼合。相应地,汉字这个拼义文字以单字为基本单位,单字的义是预先定义的,不是拼出来的,“拼义”是指通过单字跟单字的拼合,形成新的意义。
两个概念组合出一个新概念,是个十分复杂的心理过程。其复杂性的根源,在于世界的概念系统具有无限的丰富性,用数学公式不能组合、推导出关于世界的一切知识。语义比语音复杂得多,拼义过程也比拼音过程复杂得多,不是两个意义简单相加而成。“拼义”这个名称的好处是,它指出了汉字由单字词汇到多字词汇发展过程的核心特点是概念复合,体现了汉字构词在形式上是用单字去拼写多字,通过单字对应的语义,用基本的语义单位去形成更复杂的语义单位。这就跟拼音用较小的语音单元去拼写较大的语音单位相对应,通俗易懂。要注意,概念之间不能比大小,基本概念和复杂概念的区分,是相对的,取决于人们的认识历程。一般可以认为,先形成的概念比较基本,后形成的概念比较复杂,用基本概念组合出来的概念更为复杂。还要强调的是,拼音文字和拼义文字的区分是针对词汇的构造方式而言的。在词汇层次之上,所有语言都是把词汇组合成句子,从词汇的意义形成句子的意义。此外,自然语言从来不是纯粹的。汉语有少量拼音的成份,英语也有少量拼义的成分,确定文字的本质属性,要看主流。
这里对汉字的定性,同以往的理论都有所不同[10]。过去一个观点是,汉字是象形文字。其实,从甲骨文起,汉字就已经高度抽象化了。虽然象形的说法被学术界否定,但它有残留的影响。比如,还有很多人觉得中国人因为使用汉字太久,思维受到禁锢,无法从根本上超脱形象思维。汉字的拼义理论表明,这是一个极大的误解。中国人几千年前就领悟了语义网络这一根本规律,能够有意识地抽取事物的概念属性,通过灵活复杂的概念组合揭示事物间的本质联系,具备了很强的抽象思维和逻辑思维能力。另一个观点说,汉字是意音文字。其实,意音的特点主要体现在单字上。还有人说汉字形声字多,是形音文字。形声作为创制单字的手段,表达概念的能力有限,不结合后续的拼义原理,无法适应文明的高度发展。还有观点认为汉字是表意文字。其实,所有文字都表意,汉字在这一点上并不特殊。这些观点局限于汉字单字,对多字词汇这一汉字系统的另一个核心特质关注不够。
目前多数人接受的观点是,汉字是词素或语素文字[11]。这两个词都译自英文的 morpheme,但morpheme从英文直译过来应该是“形态的基本单位”,不包含“词”或“语”的意思,仅指有意义的最小符号单位。语素或词素两个译法,都没有把意义单位这一点明确表达出来。中文口语中的大多数单音节意义非常不明确,不符合morpheme的定义。一个常见的错误说法是,一个单音节代表多个 morpheme,其实是混淆了morpheme和概念。Morpheme是一个符号,一个形态单元,是可以被感官知觉的物理实体。意义的基本单位是概念,概念不是物理实体。一个音节本身是一个符号,一个物理实体,它可以代表多个意义,表达多个概念,但说它代表多个morpheme,就是说它代表多个其他的物理符号,是讲不通的。单音节下一层的语音单位,包括声母、韵母和声调,单独使用时更不具备表达意义的能力,不能充当morpheme。两个单音节的组合是有意义的,形式上符合morpheme的定义。但是,morpheme概念的引入,主要目的是用少量的基本符号形态(如non,support,ive)去分析大量的复杂符号形态(如,nonsupportive)。汉语口语中绝大多数词汇是双音节组合。把这些组合定义为morpheme,既不能用来分析更短更简单的单音节词汇,也不能用来分析更长更复杂的三音节、五音节等奇数音节的词汇,仅仅可以用来分析一些由若干双音节组合构成的四、六等偶数音节的词汇。所以,在中文口语中引入morpheme概念是没有实际意义的。这里面的深层原因后面会提到。注意这里关注的是社会一般成人使用的汉语口语。对社会的个别群体,如不识字的儿童、文盲等使用的口语,词素的问题要另加分析。
文字中,汉字是基本的视觉单位,通常具有相当明确的意义。少数复合词,如“葡萄”等,其中的单个汉字没有意义,属于例外,不在理论考虑范围之内。汉字是否是morpheme,要看它能否进一步做意义分解。绝大多数汉字是形声字,如“樱”,声旁是“婴”,本身有意义,还可以分解为“贝”、“贝”,“女”三个更小的意义单位,但都同整字意义无关。形旁(或义旁),如这里的“木”,不少情况下能够提示整字的意义,但作用有限。所以,机械地根据 morpheme的定义,可以把比汉字更小的部件定义为morpheme,但从这些morpheme意义的组合,并不能获得整字的意义。这就违背了引入morpheme进行语义分析的基本目的,缼乏理念上的价值。所以,在中文书面语言中,汉字就是morpheme。汉字词素理论的一种表述是,汉字代表汉语口语里的 morpheme。由以上分析可知,汉语口语中没有 morpheme,所以这个表述是不合适的。由于汉字本身就是morpheme,说汉字代表morpheme也存在逻辑问题。词素理论还可以表述为,汉字是morpheme。这个表述虽然正确,但人们仅仅根据morpheme的定义就可以知道这一点,所以这个表述在理论上的贡献是有限的。
从拼义的角度看,morpheme的合理译法应该是义基,而不是词素。舍弃词素这个说法,词素理论就可以重新表述为,字是义基,字和字的组合表达新的意义。这跟拼义理论是吻合的。所以,拼义理论其实是吸收了词素理论的合理内容,也吸收了与之对立的“字本位”理论对字的强调[12],将古汉字和现代汉字融入一个系统,较全面地表达了汉字的本质。
那么,拼音和拼义文字能否相互转换呢?
理论上,拼音文字也可以拼义化。目前国家通用汉字的数目在7 000个左右。这就是说,亿万人民千百年来的社会实践表明,一个成熟有效的拼义系统,至少需要7 000个义基,才能基本表达纷繁复杂的世界。这7 000个汉字,代表了沙里淘金、反复筛选出来的核心概念,称得上是华夏文明的结晶。以此为参照,可以证明任何口语都不能有效拼义。口语的基本单位是单音节。前面提到,语音学研究表明,由于发音器官和听觉器官存在根本的生理和心理局限性,估计人类能有效使用的常用音节不超过3 000个。所以,单音节数量太少,无法达到7 000个,无法用来构建充足的义基。如果使用两个单音节的组合来构建义基,两个义基再次组合拼义的时候,词汇的音节数目就会达到4个,大大长于以双音节为主的汉语词汇,效率太低。拼音文字通过对语音的机械转写,把听觉符号变成了视觉符号,但并没有改变语音信号一维线性和基本单元数目有限这两个最本质的特点:一个个音素的顺序排列构成了语音,一个个字母的顺序排列构成了拼音文字。拼音文字对语音的忠实摹写,注定它无法超越语音信号固有的局限性,同样不能成为一个有效率的拼义系统。也就是说,任何一个拼音文字对应的口语,如果试图去构建拼义系统,其效率一定不如拼义文字(汉字)对应的口语(汉语)。汉语不同于其他口语,其独特性会在后面论述。成熟的文字,都同其口语相互对应。由于口语的效率相对容易界定,这里的论证是以口语为中介,反推到其对应的文字。
汉字不重表音,就摆脱了一维线性和基本单元数目有限这两项根本束缚,可以充分发挥视觉的能力,在二维空间里构造出结构丰富的字形,用来表达大量的义基。人类视觉的信息处理功能远远超出听觉,主要在于它强大的二维图形识别能力[13]。拼音文字虽然形式上是视觉符号,但它仅仅需要阅读者分辨几十个简单的字母符号,并没有充分发挥视觉系统的信息加工能力,与汉字相比,不能算真正的视觉语言。这就意味着,西方语言学和心理语言学强调对语音和对听觉加工的研究,中文研究不能照搬,而应该强调对字形和视觉加工的研究。如果这个观点是正确的,中文研究将为语言学和心理语言学开辟一个全新的领域,而拼义理论将为这个新领域提供一个基础性的支撑。
理论上,汉字也可以拼音化。汉语拼音方案能准确记录汉语语音,只要把每个汉字替换成拼音,中文就立刻字母化了。但由于同音字的问题,纯拼音的汉语文章读起来很大程度上要靠根据上下文猜测,费时费力,效率很低。即使大量练习,拼音的歧义问题也无法在词汇层次上解决。通常认为这是汉字拼音化的最大障碍。相比南方语系的闽南话、粤语,普通话声韵少、音调少、同音字多。有人说,如果全国改说粤语,同音字的问题就大大减轻,有利于汉字拼音化。但放弃普通话,改用相对复杂的粤语,实际上是把文字的问题转嫁给口语,阅读清楚了,说话却费力了,不太可取。最重要的是,同音字的问题,其实只是汉字不能拼音化的一个表面原因,真正的原因将在后面讨论。
那么,是否存在既拼音又拼义的文字呢?语言和文字,都是表达意义的符号系统。人类知觉符号,只能利用视觉、听觉,触觉、味觉、和嗅觉这五个感官系统。味觉和嗅觉只能感受信号,不能产生信号,无法形成语言。触觉分辨能力差,感知速度慢,其对应的盲文实质上是字母文字,在词汇丰富性和沟通效率上无法比拟口语或文字。手语利用空间知觉,依靠手型、位置等,结合一些运动方式表达意义。其编码复杂度在空间维度上远远低于文字,在时间维度上远远低于语音,很难胜过文字和口语。所以,拼义..文字充分利用了人类信息加工能力最强的视觉系统,而有声语言和它对应的拼音文字充分利用了位列第二的听觉系统,对人类而言,从逻辑类型上不会再有第三种更丰富、更有效率的文字符号系统了。
总结来说,一种文字,如果注重刻画语音,就不能实现有效率的语义拼合,如果注重语义拼合,就必须放弃对语音的摹写,二者不能兼顾。文字要想拼义,还必须充分利用视觉系统的信息处理能力。视觉信号本质上比听觉信号更适合表达世界的丰富意义,这不是偶然的。由于人类的视觉功能最强,我们关于世界的概念,主要来自于视觉。换言之,我们头脑中的知识,在很大程度上是视觉知识,所以也最适宜于用视觉符号来表达。从人脑信息加工这个角度,反观历史,可以认识到,古典意音文字的进一步发展,原则上只有两条路,一是拼音,一是拼义。拼音文字抓住了所有语言的语音共性,发展了一套完整记录语音的手段,成为记录所有语言的有力工具。而汉字抓住了世界概念系统的结构,用大量义基的集合,构建了一个拼义系统。这两个文字体系切合了不同的科学规律,代表了人类文字发展的两个本质迥异但同样光彩的最高阶段。
如前所述,世界上所有其他语言,都可以用拼音字母记录其语音,而这个语音的记录就能成为该语言有效的文字。但是,汉语拼音虽然能准确记录汉语语音,却根本无法成为有效的文字。通常认为,这是由于汉语的同音字多,同音歧义十分严重。但为什么在几千种语言里,偏偏汉语的同音歧义如此严重?
导致汉语同音歧义的根本原因是汉语的音节数目较少。按照信息论基本定理,在没有歧义的情况下,编码复杂度与编码长度成反比[14]。一个语言的单音节数目越少,它就越需要在表达一个概念时,使用更多个单音节来避免同音歧义。比如,日语音节数比汉语少,只有120个,它的词汇就相对较长。如,“必须性”这个词,汉语仅3个音节,日语中的词长却多达9个音节。汉语音节数目少,按照这个定理,汉语词汇应该包含较多的音节。但事实恰恰相反,常用汉语词汇基本上都是1到2个音节,几乎简短到了人类语言的极限。汉语既简单又高效,某种程度上可以说达到了有声语言的一个理想境界。
但是,信息论的基本原理是不可违背的,有得必有失。汉语这个超越性的简洁性,也给它带来了比所有语言更为严重的歧义性。一般觉得这只是单音节的问题,其实对双音节问题同样存在[15]。比如,tóng shēng,这个发音,至少对应四个不同的词,同声、童声、同生、童生。英文词汇总数以百万计,仅有约1 000个同音词,歧义度很低。汉语每个单音节平均有7到8个意义,而多音节同音词数目在一万五千个左右。有意思的是,如此严重的同音歧义,对口语影响却不太大。一是因为口头交流的场景信息能帮助消解歧义,二是如著名语言学家赵元任指出的,口语倾向使用简单的、同音歧义少的词汇。比如上述同生、童生两个词,日常就很少使用。由于这些原因,即使汉语从类似粤语、具有复杂语音系统的古汉语简化为当今的普通话,同音字、词进一步增加,也并没有导致口语沟通困难。所以,汉语和汉字的巧妙分工,分别适应了日常交流和书面表达两种不同的需求。
这样看来,其他口语在保持语义清晰性的前提下,在语音简单性和词汇长度间做了权衡,而汉语口语由于同时保持了语音简单和词汇简短,就失去了部分语义清晰性。汉语为什么会采用这样一种独特的权衡方式?拼义理论认为,答案在汉字身上。在汉语以单音节词为主的阶段,汉字同其他文字一样,也主要是作为工具记录汉语。不过,由于形声法造字增字不增音,约束了单音节数目的增加,导致汉语口语的语音结构比较简单。而在汉语词汇量爆发性增长,从单音节发展为双音节的时候,汉字系统性地使用拼义原理来构造新词汇。双字组合的威力非常巨大,能表达十分丰富的概念,所以,汉字书面词汇......主要停留在双字的形式,不需要大量发展三字或更多字的词汇。一字一音的基本规律就迫使汉语口语的词汇保持在以双音节为主,非常简短高效,而没有像其他语言那样,走进一步增加音节数的道路。汉字对汉语的反作用,是通过对已经存在的口语词汇进行淘汰和筛选而实现的,并不意味着人们先造出书面词汇,然后再产生对应的口语词汇(虽然这种回流现象也是存在的)。在实践中产生的口语词汇,只有在经过国家认可、并用汉字书写下来以后,才有可能成为全民族的共同书面语言,得到大范围的流传和长期的保存。而未经过国家认可的词汇,只能游离于主流文化之外,或者保存在区域性的口语里,或者自生自灭,被逐渐淘汰。
汉语词汇受到汉字的制约,存在严重的歧义性,说明它作为一个沟通系统,相对于其他口语,是有缺陷的(这也导致morpheme或义基这个概念在汉语中没有实际意义)。由于这个缺陷性,汉语语音的准确记录无法成为有效的文字。不依托汉字,汉语的表达能力存在很大的局限性。成熟的现代汉语,必须以汉字为其书面语言系统。这是汉语不能使用拼音文字,汉字不能拼音化的根本原因。
根据前面的论述,任何有声语言都不能有效拼义。汉语作为有声语言的一种,也不例外。汉语虽不是一个拼义系统,但受汉字影响,其词汇具有“析义”的特点。使用汉字,第一次看到“野牛”这个词,“野”和“牛”都能激活明确的意义,有效帮助猜测、理解这个词的意思,显著降低词汇的学习、记忆难度。但是,如果第一次听到ye niu这个双音节则很难猜测两个音节各代表什么意思。只有当别人告诉你这个词指“野牛”后,才可以理解,ye对应“野”,而niu对应“牛”。这个事后的语义可分析性,简称“析义性”,也能帮助学习、记忆这个词,但跟汉字词汇的拼义性相比,显然要低一个层次了。拼音文字的很多词汇,学习前、后都没有语义可分析性。比如morning,即使知道了是“早晨”的意思,也仍然不明白mor是什么意思,ning是什么意思,因为这个词原本就不是拼义合成的,所以两个音节单独都没有意义。显然,汉语的这个析义性,来自汉字的拼义性。汉字是唯一仅有的拼义文字,这就意味着,理论上所....有口语中,汉语是唯一具有析义性的。汉语的这一特性,同其他有声语言形成对比,为跨语言研究提供了新的视角,将有助于揭示有声语言的普遍性原理。
西方语言学的一个基本定理认为,文字是记录语言、为语言服务的工具。显然,这个定理在中文上失效了:汉字超越了工具性,在极大程度上塑造了汉语。其实,西方语言学应用到中文,一百多年来一直存在很大困难。比如,它的核心概念“词”或“句子”,在中文中一直很难定义;它根据印欧语言总结出来的语法,在中文中也找不到对应的结构[16]。一定程度上,这些问题可能是汉字拼义性的结果。拼义系统强调义基和概念。以字为基本单元,用字和字的组合,就能充分表达概念,完成传达语义的根本功能,“词”这个单位对语义的理解并不太关键。
按照拼义理论,词应该是个心理字,而不是语言学的核心研究课题。一个多字组合,如果它的意思能够由其各个单字意思简单组合而成,如红花,就是红色的花,它就适合叫做词组。如果一个组合的意思不能由其各个单字意义简单组合而成,它就适合叫做词。比如,“马车”,它的意思并不能简单由“马”的意思和“车”的意思相加而来,因为可能存在“运马的车”,“形状像马的车”,“姓马人家的车”等其他可能的解释,说“马车”代表“马拉的车”是约定俗成的,存在一个历史文化的构建过程。拼义理论区分组义和构义,认为两者间没有绝对的界限。一个字组,适合叫做词还是词组,要看它是组义的成分大,还是构义的成分大。此外,如“蓝天”,“白云”这些词,虽然组义性较强,但高频度的使用,使得人们把它们当做一个整体去理解,通过心理学的“组块化”(chunking)过程,形成了一个词条化的大脑表征[17],感觉上就更像是词。所以,“词”这个概念,对中文语言学是否是一个必需的概念,值得进一步探讨。如果最终的答案是否定性的,西方语言学中认为词是人类所有语言核心概念的观点,将不再成立。目前,研究者至少要注意英文词和中文词的对应问题。从拼义的观点看,在符号系统这个层次上,英文的字母对应中文的单字,英文的字母组合形成词汇,对应中文的单字组合成词汇(由于数量众多,不少中文单字本身也是词汇);在词汇这个层次上,核心的概念是义基,英文中的单纯词,如 cat,dog,对应中文的字,即“猫”、“狗”;英文中的复杂词包括复合词,如 nonsupportive,postoffice翻译为“不支持的”,“邮寄办公室”,看来更像是通过morpheme语义组合而成的,对应中文的词组;而中文中的主体词汇,如“马车”,“红尘”,是通过拼义方式构建而成的,在英文中基本上没有对应的形态。
要注意的是,英文的morpheme虽然从定义上对应中文的义基,但其morpheme表达的意义相对单一、明确,而中文的义基,相比较而言,很多时候意义更为多样、微妙,不能简单把两者等同起来。如果归并到一起看,morpheme或义基作为意义单元结合起来构成词汇,可以按单元与词汇之间意义关联的明晰性,由高到低分成四个等级类型,包括组义、拼义、析义、定义。英文的morpheme结合以组义为主,书面中文的义基结合以拼义为主。汉语口语词汇和英文缩略语如VIP属于析义,即需要在知道VIP的意思后,才能分析出V,I,P的意思。中文中很多音译词,如“和尚”,应看做人为定义的词汇,其整体意义跟“和”与“尚”的意义完全无关。汉字词汇拼合单字,形式上非常简单,但概念间的复合却十分复杂。认识基本汉字后,学习汉语词汇,实际上要学习各种各样的概念复合方式。语法的基本功能,也是为了标明概念意义的整合方式。显然,中文在词汇水平实现了一部分语法功能。学会了词汇内的意义整合,也能够借鉴到词汇间、句子间的意义整合,因为本质上这些心理过程所涉及的都是概念的意义整合。相应地,汉语语法简单,很少使用外显的语法标记,从词汇、句子、到篇章,都强调意合性。可以设想,汉语词汇层次上的特点给这个语言的其他水平带来了深刻的影响。另一方面,以拼义文字为参照,也可以对拼音文字的一些语言现象提供新的视角。比如,英文中的过去式,绝大多数规则动词加后缀ed,但有很多高频常用动词为不规则的,有其特殊形式,如take的过去式为took,需要额外记忆。这可能是因为如果take也按规由动词和后缀组义而成,变成taked,就会需要两个音节的发音,效率不如仅包含一个音节的took。这本质上还是拼音文字不能实现有效率拼义的一个表现。
越南、韩国、日本早期使用汉字为官方文字,都从汉语中借用了大量的双字(双音节)词。但汉字词汇同汉语口语对应,作为书面文字,同他们的口头语言长期无法融合,最后这几个国家都不得不转变到拼音文字。越南语音节较为丰富,同音字问题仍然存在,但不是十分严重,全部实现了拉丁化。日文音节较少,不用汉字,同音歧义现象严重,至今仍假名和汉字混用,很难彻底废弃汉字。朝鲜语音节也较丰富,朝鲜类似越南,彻底弃用汉字,韩国类似日本,继续保留基本汉字[18]。这三种文字成为拼音和拼义的混合体,基本上是出于历史原因,吸收了大量汉语复合词,一旦全面拼音化,阅读效率的损失不可避免。比如,韩国去汉字化运动几经反复,至今仍然难以获得成功。以这三种文字为例可以看到,混合文字并不能兼得拼音和拼义的长处,在逻辑上也不构成一个新的文字类型。
拼音文字的优点没有争议。对理想的拼音文字,记住少量的字母及其发音,就能见词读音,听音写词。会说一个语言,就能阅读该语言的文字。拼音的方法能风靡全球,要归功于它实现语音转写的纯工具特性。相应地,一个词的意义是什么,就难以从它的音节上推断,词的音义联系,需要记忆。汉字系统以几千个方块字形为核心单位,这些字形书写复杂,该怎么发音,是什么意思,规律性也不强,需要记忆。儿童记忆力强,问题不是很大,外国人学汉字,成人居多,会感到特别困难。拼音和拼义文字词汇的不同特点,对中英文的第二外语学习有一定的指导意义。比如,英文本质是拼音性的,是一个听觉语言,记忆单词要强调对其声音的感知,多听、多念,反复书写帮助作用较小;而中文本质是拼义性的,是一个视觉语言,记忆单词要强调对单字形状的感知,多看、多写,注重单字与单字的意义复合,还有单字意义在构词过程中的细微变化。我国对外汉语教学界新近提出的“组合汉语教学法”试图突破西方语言学的“语言三要素”理论,重视汉字在汉语学习中的关键作用,强调汉字词汇通过单字拼合构建新概念的本质特点,更为切近中文特性,跟拼义理论的思路是一致的[19]。
汉字采用方块结构,能更好地利用人类的视觉功能。方块符号这个形式虽很重要,但并不独特。字母文字,如韩语谚文,也可以是方块形状。英文字母线性书写,是出于历史原因,理论上也能写成方块形状。说汉字能见形知义,有些夸张,但也有合理之处。汉字字形虽然无法提供准确的字义,但形旁还是有一定的提示作用。同样,声旁的表音作用不尽准确,但也不能低估。汉语语音简单,不考虑声调,任何一个汉字的读音都不出乎400个发音。声旁提供近似的发音,可以显著减少形音联系的任意性,增加学习效率。汉字虽多,但都是由几百个偏旁部首构造而成。总之,汉字需要记忆,但是其中包含相当的规律性,有效降低了学习难度,事实上不是死记几千个毫无关联的符号。古音随时代变化,跟今天的音不完全相同,这是所有文字都要面对的问题。对拼音文字来说,如果调整拼法,同一个意思,古今就是两个写法,今人就不易看懂古代的文献。如果不调整拼法,词形和词音就不能完全对应,拼音文字形音一致的好处就要打折扣。汉字保持字形不变,不管音的变化,坏处是见字不易知音,好处是古今文字一致性强,文化继承性强,不同方言口头不能沟通,但可以通过使用一个共同文字,达到书面沟通[20]。
除了简洁之外,汉字的优势,来自用拼义原则构建的复合词。一个优点是造词比较容易,造出词来,自然有音,不必额外造音。更重要的是,词汇学习比较容易。有人称之为“生词熟字”,或“见词知义”,这很大程度上是对的,但不能绝对化。世界是非常复杂的,概念跟概念间的关系也是非常复杂的。把两个字放到一起,理论上可以形成很多种意义。比如,“马车”对于不认识的人来说,可以有几种不同的理解。但“马”和“车”两个字已经提供了非常丰富的线索,排除了数十万种无关的可能性,剩下为数不多的几种选择,容易学习和记忆,常常是一点就明、一教就会。心理学和脑科学研究表明,人类有丰富的语义加工能力,人脑最擅长通过联想发现意义。此外,阅读中有上下文信息,可以帮助限定一个词的解释。很多时候,拼义规律足以提供大致意思,使得不必中断阅读去查阅词典,有利于自学。
据估计,当今主要语种日常使用的词,大致在五万个上下,所以拼音文字的学习者要去记五万个词形符号。但汉字的学习者需要识记的仅为四到五千个单字符号,大大减轻了记忆负荷。这样看来,对于个人来说,初级语文学习,拼音文字较占优势,但高级语文学习,需要学习大量词汇时,拼义文字较占优势。对于社会来说,如果大多数人只需达到初级语文水平,采用拼音文字较占优势,如果大多数人要达到高级语文水平,拼义文字较占优势。从语文的历史发展来看,拼义系统难在最初的义基积累与对拼义原理的认识和采用,一旦完成,就有较大的空间创造新词,同时还不失简短。拼音系统,不需要这个艰难的早期过程,但随着新概念的不断增加,想在保持拼音优点和词汇简短之间求得平衡,就有些问题。大量缩略语的出现,都是为了求得简短,但缩略语拼义性很弱,词形上更像一个无意义的规定,需要记忆。缩略语越多,这个问题会越严重。总体看来,拼音文字有相对的先发优势,而拼义文字有相对的后发优势。
最后,一个复合词的创制,不仅仅记录了一个概念的发音和词形,还蕴含了造词者对这个概念的认识,特别是它跟世界上其他概念的关系。相应地,学习一个复合词,也不仅仅是学习一个概念的名称,同时也是在学习关于这个概念的知识和关于世界的知识。学习者从语言中看到的,不是一个混沌的世界,而是一个积聚民族智慧,进行过精致概念分析之后的条理清楚的世界。这样,学习语言的同时,也是在认识世界。所以,使用汉字可能会对使用者的思维有一定影响,使其不同于拼音文字的使用者,这值得进一步探究。比如,作为思维一个核心成分的智力因素,在英文中常常以使用者所掌握的词汇量来衡量,如GRE考试和韦氏智力量表中的词汇测试部分。目前中国的智力测验,也主要从英文翻译而来。但中文词汇量的大小,是否适宜于用来区分中文使用者的智力水平,是一个值得考虑的问题。
为什么其他的古典意音文字走上了拼音,而中文却走上了拼义的道路呢?西方文字史的研究表明,拼音文字是不同文化相互碰撞、融合的结果[21]。而拼义文字看来却是一个自足的文化稳定发展的结果。没有一个强大的中央集权,来掌控和规范文字的创制和使用,就很难实现巨量义基的稳定积累,也很难做到系统性地运用语义网络原理去构建词汇的主体,形成完善的拼义文字。世界上所有其他的古代文明,都在外族入侵下消亡了,他们的文字也随之消亡了。唯一的绵亘不断的华夏文明,产生了唯一的拼义文字,其历史进程,值得进一步探究。
拼音字母作为西方文明的一个象征,是极其伟大的发明。汉字同样是极其伟大的发明,但它遵循了完全不同的拼义原理,去刻画世界的概念结构,把对万事万物意义的认识,拼织到语言里。它捕捉的规律是如此的深刻、有力,以至于汉字作为文字,极大地影响了汉语的发展,并在表达能力上大大超过汉语,改写了文字是记录口语的工具这个西方语言学的基本定理。作为拼义文字,汉字本质上与拼音文字不同,根本不需要、也完全不可能拼音化。汉字远远超越了拼音文字的工具性,同中华民族的语言和文化紧密相连。汉语存在多久,汉字就将存在多久。
[1]周有光.汉字改革概论(第三版).北京:文字改革出版社,1979.
[2]杜子劲.一九四九年中国文字改革论文集. :大众书店,1950.
[3]语言文字应用研究所.汉字问题学术讨论会论文集.北京:语文出版社,1988.
[4]苏培成.当代中国的语文改革和语文规范.北京:商务印书馆,2010.
[5]赫钟祥.汉语、英语、日语音节比较.大连海事大学学报:社会科学版,2003(1).
[6]李梵.汉字简史.北京:中国友谊出版公司,2005.
[7][美]加洛蒂(K.M.Galotti).认知心理学(第三版).吴国宏,等,译.西安:陕西师范大学出版社,2005.
[8]李仕春.从复音词数据看上古汉语构词法的发展.北京化工大学学报:社会科学版,2007(1).
[9]李仕春.从复音词数据看中古汉语构词法的发展.宁夏大学学报:人文社会科学版,2007(3).
[10]岑运强.语言学基础理论(修订版).北京:北京师范大学出版社,2005.
[11]苏培成.现代汉字学纲要(增订本).北京:北京大学出版社,2001.
[12]徐通锵.基础语言学教程.北京:北京大学出版社,2001.
[13]S.Ullman.High - level Vision.Object Recognition and Visual Cognition.Cambridge:MIT Press,2000.
[14]傅祖芸,赵建中.信息论与编码.北京:电子工业出版社,2006.
[15]周勇翔,周聪,周宏.现代汉语同音词词典.北京:商务印书馆,2009.
[16]邢福义.汉语语法学.长春:东北师范大学出版社,1997.
[17]F.Gobet,P.C.R.Lane,S.Croker,P.C.H.Cheng,G.Jones,I.Oliver,& J.M.Pine.Chunking mechanisms in human learning.Trends in Cognitive Sciences,2001(5):236-243.
[18][俄]伊斯特林.文字的产生和发展.左少兴,译.北京:北京大学出版社,2002.
[19]吕必松.二合的生成机制和组合汉语.数字化汉语教学的研究与应用.北京:语文出版社,2006.
[20]刘又辛,方有国.汉字发展史纲要.北京:中国大百科全书出版社,2000.
[21]周有光.世界文字发展史.上海:上海教育出版社,1997.
Meaning-spelling Theory of the Chinese Characters:Insight into the Nature of Written Chinese from the Perspective of Cognitive Psychology
(by ZHANG Xue-xin)
Thousands of written languages in the world are all alphabetic except written Chinese,which uses a large number of characters.There has been a debate for over hundred years as to whether Chinese characters can be replaced with Roman alphabetic system of writing.This paper presents a new theory which points out that written Chinese at the vocabulary level is a meaning-spelling or pinyi system.This view is consistent with the semantic network principle in cognitive psychology and neural science and has solid scientific basis.Chinese characters have made full use of the visual processing capacity of human brain and this language,in comparison with alphabetic writing,is much more visual.This theory also holds that alphabetic writing and Chinese meaning-spelling writing represent two and the only two matures and efficient logical forms of human writing and they can not be substituted with each other.Far from being simply a tool for recording spoken Chinese,written Chinese has shaped the evolution of spoken Chinese to such an extent that modern spoken Chinese cannot live without Chinese characters,which is the fundamental reason why written Chinese cannot be romanized.
meaning-spelling writing;meaning basis;Chinese characters;visual language;semantic network;Romanization;alphabetic script;morpheme.
张学新(1969—),男,河南平顶山人,心理学博士,香港中文大学心理学系助理教授。
国家自然科学基金项目“汉语视听觉词汇加工神经机制化的比较和认知发展研究”(30670702);教育部人文社科重点研究基地重大课题“课堂教学与中小学生创造力的发展与培养”(07JJD7LX262)
2011-05-10
H1-01
A
1000-5455(2011)04-0005-09
【责任编辑:王建平】