潘 泰 曲抒浩
(武汉大学国际教育学院,中国 武汉 430070;华中师范大学国际文化交流学院,中国 武汉 430079)
在对外汉语教学中的“字本位”教学法理论[1]的代表性人物,是法国的汉学家白乐桑(Joёl Bellassen)先生。“字本位”教学法在法国经历了实践的考验,取得了显著的成绩,在法国乃至欧洲的影响甚大,也得到了我们国内一些专家学者的支持,比如张朋朋(1992)、王若江(2000)等。陆俭明先生(2011)说:“白乐桑先生提出的‘字本位’汉语教学模式,是一项成功的创举。”
汉语教学中的“字本位”,白乐桑先生(2018)称之为“相对字本位”,将“字”作为汉语教学的出发点,包括以下要点:
第一,“字”向下关联笔画、偏旁,符合认知规律,更有助于了解汉字文化;
第二,“字”向上关联词、句,应该先选字,由字而词,由词而句、篇;
第三,有必要在汉语学习当中设置学习和评估的汉字“门槛”,区分主动汉字和被动汉字。
本文主要针对前面两个问题,谈一谈“字本位”教学法在理论和实践中可能面临的困难和突破的方法。
众所周知,汉字可以向下拆分为偏旁和笔画,有一种直观的看法是偏旁部首的分析能够加速汉字的学习,让汉字学习更具经济性:《说文解字》(以下简称《说文》)有部首540多个,收字过万;《现代汉语词典》(第7版)(以下简称《现汉》)共有部首201个,收字13000多个。汉字和部首的比率如此之大,答案看似非常明显。
可能正是基于这样的考虑,法国基础教育阶段(小学至高中)的汉语教学大纲在制定了“汉字门槛”(共805个汉字,其中初中300个)的同时,也设置了一个“偏旁门槛”,一共列举了105个偏旁(实际上是104个,其中初中95个)作为汉字以下组成部分的学习目标。然而汉字向下部分的利用却并非如词典的部首一般,还有诸多问题值得讨论。
首先,我们检查了“法纲”汉字的科学性。我们将“法纲”中这805个汉字与《汉语国际教育用音节汉字词汇等级划分》中一级的900个汉字进行了对照,结果发现二者重合率高达93.5%,仅有52字在前者当中而不在后者当中。说明这两种字表都是有效的,能够代表汉语二语学习的最初要求。
接着,我们试图对这805个汉字逐个进行传统的字源分析,参考的标准是《说文》系统(包括段注),因为根据“法纲”偏旁表列出来的偏旁意义,可以知道它采用的绝大部分是《说文》系统的释义。
汉字的分析异常复杂,的确不敢保证每个汉字的拆分都是确切无疑的,但应该能够得出一些倾向性的结论。如果只做一次切分,这805个汉字共能分解成1470个一级偏旁,其中不同的偏旁共564个,汉字与偏旁的比值为1.43。为了将这种优势“最大化”,我们决心继续再来一次彻底的切分,一直分到不能分的象形字(和指事字)为止。因为只经过一次切分,比如“水”作为一级偏旁一共出现了30次,它们是“法、海、汉、河、湖、活、济、江、酒、渴、浪、满、没、漂、汽、清、深、水、温、洗、消、演、油、治、洲、注”等26个没有问题的,以及“决、况、凉、准”这4个有问题的,其中被切分出来的“去、每、可、胡、曷、青、昷、台、兄”等偏旁当中,显然还包含更小的、可重复利用的汉字组成部分。
然而,在做了上述的艰苦尝试之后,我们最终还是不得不得出一个非常悲观的结论:仅以字源作为标准,对现行汉字进行传统意义上的偏旁部首分析,在对外汉语教学的应用环境下显得并无太大必要,而且还是一个基本上不可能完成的任务。
1.传统的偏旁分析难度大
表1是我们统计出的在经过了彻底的切分之后,“法纲”805个汉字中最常用的50个偏旁:
表1 传统字源标准切分出的最常用偏旁
还是以“水”为例,它从一级偏旁30次扩展到了上表中的42次,新增加的汉字及其传统偏旁分析如下:
表2 新增的12例偏旁“水”
看来,字源方面的探讨并不一定能很好地起到辨认(recognize)和复写(reform)现行汉字的作用,有时甚至还会产生反作用。不仅如此,字源的探索事实上是无止境的,对研究者的要求非常高,几乎不可能全部完成。比如:
部分汉字需要掌握其传统字形。根据我们的观察,这805个汉字中至少有217个需要掌握其传统字形,才能将字源的分析进行下去,比如“办、层、导、妇、顾、环、乐、闹、时、虽”等,必须回到简化字之前才可能找到它们所包含的传统形旁或声旁。
2.尊重汉字的符号性特征
其实,最大的麻烦还不在于汉字字形分析难度这一“技术”问题,更大的问题来自于对文字这种“符号的符号”的本质特征的认识这一理论问题。
再比如“这”是怎么来的,段玉裁也老老实实地说:“凡俗语云‘者个、者般、者回’皆取别事之意,不知何时以‘迎這’之‘這’代之。”意思是告诉我们“這”本是“迎迓”中“迓”的古字,毛晃、段玉裁等人都无法说清它是何时和“者”产生了语音上的偶然联系,进而记录了“者个、者般、者回”等口语词汇,最终定格为“这个、这般、这回”。
说到底,关于汉字问题的核心关键就是,到底书写符号是约定俗成的,还是有语言世界和客观世界支持的,到底承认还是不承认语言符号的任意性这个结构主义的第一原则。大量的常用汉字根本无法从字形分析中得出其音、义(语素),比如“尽、的、亚、头、旧、买、农、义、呆、关、以、由、于、总”等,例子不少。这是个不得不承认的现实问题。文字符号能指和语言世界、客观世界所指之间的差距在汉语中,和在其他语言中一样,早就已经大到了无法承受的程度了。
不仅我们现代人应该有这样的认识,从中国传统小学的发展历程来看,许慎之后专注于音、义的学者也远远要多于关注字形的。比如“体例精密,考证赅洽,诚字学之源薮,艺苑之津梁”(王引之语)的《康熙字典》对字形的分析就比较少,引用的范围也多是音义分析。退一步说,就算是在许慎的那个时代,甚至比他还早一些,事实上也存在着另外一种专注音义的传统。比如张滌华先生(1962)就认为在《说文》之外,还有以义为核心(以《尔雅》为代表)和以音为核心(从《仓颉篇》到《切韵》等),只求音义,不求字形的字书传统。再退一步说,起码我们现在出版的通用字词典已经绝少分析字形的了,这总是可以肯定的。
总而言之,汉字与汉语之间关系的疏离是一种趋势,这种趋势使得通过汉字字形直接推求最小的语言单位——作为音义结合体的语素——这种尝试面临着来自理论和实际操作的双重困境,尤其是在汉语教学的环境当中。
那么,在我们的汉语学习当中,是否就可以不考虑汉字的下级单位,放弃部件对汉字学习的益处呢?答案当然也是否定的。一个直观的理由就是上面的统计数据告诉我们,汉字以下的确包含可重复利用的更小部件;现在的问题关键是这些部件到底有哪些,到底该如何加以利用。
1.以简化字为对象,加强对汉字及其部件的研究
到目前为止,关于现行汉字部件拆分的最重要的文献应该是1997年颁布的《信息处理用GB13000.1字符集汉字部件规范》和2009年颁布的《现代常用字部件及部件名称规范》。我们用这两个规范对“法纲”805个汉字再次进行了部件切分,结果是用前者的标准可以切分出381个不同的部件,用后者的标准可以切分出324个不同部件,和上文用传统字源方法切分出335个不同偏旁在数量上差别不大,但是在具体内容上差别明显:
表3 “信息处理用规范”切分出的最常用部件
表4 “常用字规范”切分出的最常用部件
还有更多的问题,我们这里也无法展开讨论。只能先说明以简化字为对象,深入开展汉字及其构成部件研究的重要性。
2.以普通话为范围,重新探索汉字的音义规律
我们不必拘泥于传统说法,而应该以汉语教学为直接目的,重新分析汉字的部件及其与整字的互动关系,这样做不仅没问题,而且很有必要,甚至是非此不可。在“算、好、章”等传统字形和现行字形较为一致的汉字之外,还有一些现在通行的汉字很难找到或者根本就找不到历史根源,不重新分析还能怎么办?比如把“咱”分析成会意兼形声字,意思就是“口语中的自己”,其中“自”还能提示整字的读音;“杂”原来是形声字(雜),现在我们就说这个字表示“九种木头混合在一起,这就是杂乱”;“穷”由“穴”和“力”组成,在洞穴里努力工作,自然就是贫穷、不顺利的意思,不必一定要分析成“穴”和“躬”;“获”本来是以“犭”为义符,“蒦”为声符,“蒦”又和用手(又)抓住鸟(萑huán,鸱属,据《说文》)有关,到了如今,我们就不妨说“获”由“艹、犭、犬”这三个义符组成,意思是带着狗(犬)在草里(艹)抓住了动物(犭)。
对于包含语音信息的汉字,同样应该不计古音韵,只以普通话为标准分析字音。比如“且”这个部件,在现行汉字中大致可以分为四种情况(这里没有办法,对805门槛有点儿突破),分别是“且、姐、叠、趄”这一组,“组、租、阻、祖、粗、助、诅、俎”这一组,“蛆、咀(jǔ)、狙、疽”这一组和“县、悬”这一组(未考虑不太常用的字)。前三组中“且”都是音符,没有做义符的;在第四组中“县”的本字是“首”倒过来,是义符。那么从教学的角度出发,我们可以得到如下提示:
第一,“且”的本义(“荐席”)可以不予介绍,不如说“且”主要表音,比如第一至第三组的汉字。
第二,“且”在表音时有ie、u、ü这三种可能,至于这三组之间的读音音转关系,在以汉语为二语的教学环境下完全可以不予考虑。
第三,“且”表义时和“首”(这个字会用在“首都”这个常用词里)有关,是倒过来的脑袋,所以第四组和前三组读音不同。“县”和“悬”本是一个字,“悬”是会意兼形声的。
最后,再举一个例子来说明我们的困窘和做出改变的紧迫性:试想如果一个汉语教师在面对英语学生时说不清“英”是怎么回事,在面对法国学生时说不清“法”是怎样的构成,我们到底该怎么办?
上面我们讨论的是汉字及其下级单位,现在让我们换个方向,看看汉字作为语素(音义结合体)向上联系词的情况。
同样,先观察数量的问题。
首先,我们将“法纲”的805个汉字和新HSK六级考试的词汇表进行了碰撞,看看这805个汉字能构成多少个词,“词字比”有多高。
利用计算机,我们拿这805个汉字和新HSK六级考试5000词汇中的单音节词进行匹配,共得到了334个单音节词;然后再让这805个汉字任意互相搭配组成“双音节词”,共得到805×805= 648025个可能存在的词(包括AA式的词),接着再把这些可能存在的词和5000个真实的词进行匹配,总共得到了1708个合法的、实际存在的词;最后,我们人工比对了三音节和四音节的词语,总共找到111个三音节或四音节的词语是完全由这805个汉字组成的。这样,我们就说这805个汉字的“词字比”是(334+1708+111)∶805=2.67,这意味着“法纲”的805个汉字中每一个平均都能组成2.67个新HSK六级词。我们的统计方法和王若江(2000)有所不同,我们得到“法纲”基础汉字的“词字比”并没有那么“严峻”地高(3.97)。
与此同时,我们很容易得到HSK词汇的词字比,情况如表5、表6所示:
表5 新HSK的词字比
表6 老HSK的词字比
观察上面的两个表格,我们可以发现,在新HSK中,当词汇量低于1000时,词字比甚至都达不到1,也就是1个汉字还不能组成1个词,这说明新HSK中有很多汉字暂时只用在少量词语里面,成为词语的一部分。
当词汇量扩大到5000左右时,不论是老HSK还是新HSK,词字比大约都在2左右;而且从趋势看,词量越大,词字比就越大。当老HSK的词汇量达到8000左右时,词字比会达到或超过“法纲”的2.67。
这种现象可以从两个方面来看,其一可以说,词汇量和词字比是正相关关系,也就是你学习的词汇越多,你认识的汉字也就越多,这叫先词后字的“词本位”;第二,也可以说汉字的选择的确会影响词的学习,起码在碰到新词的时候能够认出其中的汉字,这是先字后词的“字本位”。
那么,问题就来了。
第一,先词后字和先字后词两种思路究竟孰优孰劣?仅从简单直观的角度来看,前者在学习书面语的起始时期可能要困难一些,要同时面对大量无法和音、义直接建立起联系的汉字;后者可能开始时容易一些,核心的汉字不断重复出现,能加强书面汉字的视觉记忆效果。我们认为,这两种方案可以根据教学对象的不同来进行选择。HSK,特别是老HSK主要是针对来华留学生的,他们学习期限比较长,学习动机更为强烈,口语环境更好,优先发展口语既是可能的,也是在华学习生活必需的,也许更适合采取“词本位”的方案;“法纲”针对的是在法国的汉语学习者,他们学习时间有限,口语练习机会少,汉语和其他外语语种存在竞争关系,迫切需要入手快的教学方式,也许就更需要采取第二种方法。这也许是“字本位”的思路在法国能够成功的原因之一。
其次,统计数据还迫使我们必须追问:构词能力强是不是就一定有助于汉字的记忆?词字比高的汉字是不是一定就更常用?“词字比”到底意味着什么?
构词能力和汉字记忆的问题,有人(江新,2006)用心理学实验的方法做过研究,结果发现构词能力的强弱和该汉字的记忆效果之间没有明显关联。第二个问题同样也并非不证自明,举个例子:“妈”和“奶”分别有3个和5个义项,用“妈”构词很有限,以其开头和结尾的只有2+5个词(据《现汉》和李菁民,2011。下同),“妈”的构词力是7∶3=2.3;而“奶”的构词能力显著强大,以其开头和结尾的词有24+11个,“奶”的构词力是35∶5=7。这是不是就能说明“奶”比“妈”更常用?那以后我们的汉语教材一开始就不应该设计孩子和妈妈的对话,而是应该设计孙子、孙女和奶奶的对话了,这有道理吗?
再比如“快”和“慢”,它们都在“法纲”805汉字的范围内,在老HSK里都是甲级词汇用字,在新HSK里都是2级词汇用字。“快”有9个义项,能组44+21个词;“慢”只有5个义项(包括同音词),能组25+10个词。从义项和词汇的比率来看,我们可以说有9个“快”,总共能组65个词;有5个“慢”,总共能组35个词,二者的构词能力不相上下。但是,语感强烈地提示我们“快”比“慢”更常用,这是为什么?我们也找到了白乐桑先生(2018)引用的笪骏《现代汉语单字频率列表》,用以验证我们的语言感觉,结果和我们的想法一样,它们的频率排位差距明显:“妈”在750位,“奶”在1278位;“快”在366位,“慢”在822位。这说明汉字的构词能力强弱,和其常用度不一定是有正相关的关系的。构词能力反映的是汉字的语言或语法能力,而不一定是使用频率。
最后,“词字比”究竟意味着什么?先学常用汉字就一定有助于汉语能力的提高吗?这看起来是个愚蠢的问题,但我们却同样有话要说。还是以“快”和“慢”为例,它们俩在现代汉语中的基本义是相对的,都是关于运动速度的,学习起来难度相当;当本义学完了,字形与基础音义之间的联系建立起来了,汉字的学习就结束了。但是,对这两个词的学习就结束了吗?学生的语言能力就得到提高了吗?答案显然都是否定的。除了基础义之外,“快”这个汉字还是“愉悦”“敏捷”“锋利”等语素或词的书面符号形式,而对这些语素或词进行学习的复杂程度远远超过了“慢”;“快”还有“快看”“快送医院”“快放假了”“快四十年了”这些用法,都不能换成“慢”,和“快”有关的语言能力的提高和言语技能的发展都还有很长的路要走。
所以,词字比高,充其量只是意味着某个汉字所记录的语素更多,这个汉字的语言学知识更为丰富。更进一步说就是,必须认识到,汉字能力当然与汉语能力有联系,但汉字和汉语本就不应该划等号,二者有显著不同的侧重点。没有必要将“字本位”和“词本位”对立起来:“字本位”教学法着重先解决的应该是在汉字与其基础音义之间建立起联系,这种基础性的关系一旦得以建立,如何提高汉字与其音义联系的质量,就必须交给“词本位”的汉语教学来推进。这是我们设想的汉语学习的两个步骤,其中的后者,即提高汉字与其音义联系质量的任务,则可能是伴随汉语习得全时段的艰辛过程,不仅对二语学习者,对母语学习者而言也是如此。
事实上,我们不仅不能反对“字本位”,还应该大力倡导“字本位”,深入研究“字本位”,努力发展“字本位”的理论和方法。这样选择的原因是汉语教学的实践告诉我们,对于来华留学生而言,最大的困难就是汉字,不会读、不会写常常比不会听、不会说要严重得多;对于海外汉语学习者、特别是孔子学院的学习者而言,受语言环境和学习要素的限制,听说应该、也不得不和读写分开,“语”“文”分步走。这就是我们认识到的最大的现实。所以,不管怎样强调汉字的重要性都是必要的,汉字的确应该成为初中级阶段汉语学习的核心,要突出汉字学习的极端重要性。只不过同时我们也认为,现行惯常的汉字学习方法还有很多的具体的做法需要改进,关于字词关系的语言理论问题需要重新认识,部分地方要推陈出新,直至完全革新。
和印欧语的书面字符相比,汉字最大的难点在于字形与语素(音、义)之间的联系是不直接的,无法做到听音写字、见字读音;但是,汉字也有自己的优势,我们应该在教学当中扬长避短,把汉字的优势充分发挥出来,实现“汉字利益”的最大化。
白乐桑先生(2018)曾用198个“最高频字”(根据笔者的统计,事实上只用了189个不同的汉字)编写了一篇共652字的“滚雪球”短文,我们以此为例,从汉语教学的角度,简要分析一下汉语中字与词的关系。
从字来看词,字无词不成语素,字需要词。不结合词、句,汉字就无法与语素建立联系,更无法提升这种联系的质量,不能形成实际的语言能力。
第一,一字多义需要词来进行明确。有很多汉字都是一字多义、一字多用、一字多音的,学完了汉字的基础形、音、义,并不意味着就掌握了语言点,提高了语言能力。比如“好”在这篇短文里一共出现了6次,分别是“你好”“好久”“身体好吗”“不好意思”“好听”和“不知怎么好”,结合《现汉》,我们知道这6个“好”都是不同的义项,学会了“好”这个汉字,并不足以把这6个“好”都弄清楚。类似的例子还有很多,比如“讲课……讲得很有水平”和“讲成语”“讲知心话”“讲信用”等中的“讲”,“天天在想你”和“一……就想起你”“想跟你在一起”等中的“想”,“讲得很有水平”和“高兴得不知怎么好”“我得了学位”等中的“得”。
第二,字词界限不清的语言片段(这是汉语书面语理解的一个难点)需要词、句予以确认。在这篇短文里至少有3例这种情况,“有点儿心疼你”和“有点儿黑龙江口音”中的“有点儿”不同,前者是一个副词,后者是“动+数+量”;“最近”用在“你最近怎么样”和“在大城市中,天津离北京最近”(这一句不是白文中的)不同;“以前”用在“三年以前”和“18岁以前不准喝酒”(这一句不是白文中的)也略有不同。
第三,成语、习语、隐喻距离较大等“1+1≠2”(整体不等于部分的简单相加)的情况,都不能只学习汉字,不考虑词、句。比如“不好意思”“三心二意”“(不知)怎的”“动人”“心疼”“意中人”等,都是这种情况,每个汉字都认识也不一定能够准确地知道这些词语的意思。
从词来看字,没有字就没有丰富多彩的词,词需要字。比如和印欧语相比,汉语有一个重大的特点就是“未登录词”特别多,汉字形成或组成词语的能力比印欧语显著强很多;所以对于新生事物,我们常常不需要创造新字,而是利用已有的字形成新的组合,这也是汉字效率高超、永葆生命力的核心秘密之一。
比如在白文中有“门口、民歌、难忘、问题、唱片、钱包、药房、机场”等词,如果仅将这些词翻译成“doorway、ballad、unforgettable、question、record、wallet、pharmacy、airport”等外语单词,而不向下学习汉字,不弄清楚“口、歌、难、题、片、包、房、场”等汉字的意思,我们马上就会在教学中面对“街口、村口、名歌、烂歌、难办、难做、真题、坑题、港片、泪片、菜包、卡包、水房、马场、谷场”这些在《现汉》里都查不到的词语,它们给汉语学习者们造成的障碍非常明显,解决之途当然在于汉字及其基础语义。
当然,我们在这里所说的都只是问题的“冰山一角”,还需要对字与词的互动关系进行更为深入的研究。事实上,不论是汉语母语者还是非母语者,只有充分认识到字与词互相促进、互相影响,平衡好二者之间的关系,才有可能成为水平高超的语言使用者。
综上,我们认为,“字本位”教学法的出发点是好的,是很值得尊重和提倡的,但是正如每种理论都必须不断发展,才会拥有生命力一样,我们需要在“字本位”的旗帜下再多做一些切实的工作,提升相关理论水平,完善教学操作模式,为切实提高汉语教学效果而不断努力。
注释:
[1] 关于“字本位”这一术语,我们采用了陆俭明先生(2011)的观点,“学术界目前实际存在着两种不同性质的‘字本位’之说:一是指徐通锵先生1991年起所提出的‘字本位’之说(徐通锵,1991,1994,1997,2004,2008),一是指白乐桑先生1989年在他与张朋朋合写的法文本汉语教材里所提出的‘字本位’之说(Bellassen & Zhang,1989)。二者其实只是术语相同,实质有别。”本文主要的讨论对象是后者。
[2] 《说文解字注》第198页:“算,数也,从竹具。”第104页:“具,共置也,从廾贝省。古以贝为货。”审稿专家指出“具”当从“鼎”,并非从“贝”,在金文才发生讹变。此亦可见字源分析之难。