秦 冕
(渤海大学 文学院,辽宁 锦州 121013)
汉字的表意特征使得汉字自产生之日起,异体现象就不可避免地存在。异体字从汉字使用角度来讲是一种赘余,给汉字使用带来了极大的困扰,但是在析字、古籍研究等方面又有很大价值,所以对异体字的研究和整理一直是历代汉字学学者的重要工作。
新中国成立后,异体字的整理工作取得了前所未有的进展,其定义、分类等问题也得到了深化研究,但与此同时,也产生了不少分歧,如异体字定义的广狭之争、异体字分类的宽严之分、异写字和异构字的定义及相关问题等,这些分歧产生的根源在于各家对于异体字认识和整理的角度不同。本文将异体字研究工作中经常出现的问题整理出来,以时间为脉络,选取一些具有代表性的观点进行综述,并提出个人观点,力图呈现出新中国成立以来学者们对异体字研究的多元化成果。
异体字究竟如何界定一直是学界探讨的焦点问题。需要注意的是,关于异体字的界定不是一蹴而就的,而是在学界长时间的理论研究和整理工作中不断发展的。到目前为止,学界对异体字的定义不仅没能达到完全一致,而且在某些观点上还存在着不小的分歧。本文着眼于各家具有代表性的观点进行讨论,对从不同角度所形成的异体字的定义进行梳理、归类,并探讨这些定义存在的合理性和局限性问题。目前学界为异体字所下的诸多定义大致可分成广义和狭义两种,这主要是由于学者们在“音义相同”这一标准上存在宽严之分造成的。
对于异体字的界定,有的学者从词的角度出发,有的学者从字的角度出发,因此产生了“一字异形”与“一词异形”之争。“一字异形”是以字为研究对象来界定异体字;而“一词异形”则是将字完全看作是记录词的一种符号,从文字符号的记词职能来界定和划分异体字。但后者模糊了字和词之间的界限,并不能真正地描绘出异体字的特点,也不能将异体关系和其他字际关系如假借关系、古今关系等区分开来,故而“一词异形”存在不合理性,这反而证明了“一字异形”的合理性。
关于“异体”一词是从何时开始被用来概括汉字之异体关系的,这件事一直没有定论。早在汉代《汉书·艺文志》中就出现了“异体”的说法,但它指的是书体之间的差别,和现在人们所理解的异体字相去甚远。东汉许慎《说文解字》中所说的“重文”包含了字的异体关系,后人也多用重文、或体等词来指代异体关系。可以确定的是清代的学者已经在用“异体”一词来指称具有异体关系的字了。
1950年,丁西林先生将异体字定义为“音同义同而形不同的字”[1],这是从“一字异形”的角度第一次对异体字进行界定。
1954年、1955年,《拟废除的400个异体字表草案》(以下简称《草案》)和《第一批异体字整理表》(以下简称《一异表》)分别公布,使得“异体字”这一术语逐渐被大家所接受,学界对于异体字的研究开始兴起。《草案》中说:“一般出版物或手写文字中,有不少音同义同而写法不同的字(异体字)。”[2]与丁西林先生的定义相同,这是从“一字异形”的角度正式为异体字下的定义。但是这一概念过于笼统,既没有对“音义相同”作出明确限定,也没有指出“写法不同”具体包括哪些情况,不足以解决在异体字整理过程中出现的所有问题。于是一些学者开始超越这一基本概念,从词的角度来定义异体字。
刘又辛一开始从字的层面来定义异体字,将目光放在字形、字音和字义上面[3]。之后他超越了这一定义,转而从词的层面来定义异体字:“从文字符号和词语的关系来看,用两个或多个文字符号记录同一个词,这一组字都叫异体字。”[4]对于异体字定义的前后变化,体现了刘又辛先生对“一字异形”和“一词异形”的思考。
蒋善国认为一字多形就是多形字,多形字普遍叫异体字。他以汉语中的复音单纯词、音译外来词、拟声词的不同写法为例,将这些字符运用不同的方式进行组合构词。这实际上是从词的角度出发,用不同的字符组合来记录同一个词,并把这些字符都看成是异体字,如联绵词“逶迤”有二十多种不同的写法“逶迤、委蛇、委移、委它……”[5]。因此,蒋善国先生在定义中所说的“一字多形”其实是“一词多形”。
其实,这些字符在词中只是一个发挥记音作用的不成词语素,并没有实际意义,而且多具有临时性,它们之间往往不具备真正的异体关系。因此,这种从词的角度为异体字下定义,将组成一个词的不同形体的字符都归为异体字的方法显然是不合理的。正如刘延玲所说:“从‘一词异形’的角度出发,混淆了‘字’与‘词’的界限,不是文字学的立场,不能作为考察异体字的出发点。‘一字异形’才是真正的异体字。”[6]当然,那些专为同一复音单纯词的同一个音节所造的不同的字,如果都没有其他用法,是可以把它们看成异体字的。如:“峋”“”二字,除用作联绵词“嶙峋”“磷”外再无其他用法,就可以认同为异体关系。
王力对异体字的定义既继承了“一字异形”观点,又弥补了以往定义过于笼统的不足,对异体字作出了严格的限定。他认为异体字就是“两个(或两个以上)字的音义完全相同,在任何情况下都可以互相代替”[7]155。这就从字而非词的角度对异体字进行了严格的限制,也划清了异体关系与其他字际关系的界限,并且明确了“音义相同”的程度,体现了从“一字异形”的角度定义异体字的合理性。因此这种严格地定义异体字的方法现在在学界中被广泛认同。
可是王力等人所说的“读音完全相同”“字义完全相同”“在任何情况下都可以互相代替”的严格的限定,运用到异体字的实际整理工作中,会碰到不少麻烦。
首先,从读音的角度看,异体字的读音本应是一致的,但仅仅从字书的注音来看,它们的读音有时又可以不同。章琼先生将这种情况分为三类。①有些字存在着不别意义的“又读”现象。字书在注音时未能做通盘考虑,而注了不同的音。如在《广韵》中“猱”音奴刀切,“”音而沼切。两字看似读音不同,但是在《宋本广韵》中,“”除了而沼切外,又读为诺高切,与音奴刀切完全相同,故二字应为同音字。②有些字的实际读音有了一些变化,而字书注音记录了这种变化,导致原本读音相同的字,注了不同的音。如在《广韵》中“娟”“”二字音均为於缘切,读yuan,后“娟”字读音发展为juan,而“”字早已成为死字,读音不变,故二字在共时层面上读音是相同的。③由于一些其他原因而造成异体字之间读音的差别[8]89-91。
其次,从字义的角度看,章琼先生提出“由于种种条件的限制,字书对单字义项的分立很难做到完全符合实际,许多字义项的分立都或多或少地存在一些问题”。如“睹”和“覩”二字。“覩”字下有三个义项,“睹”字下有四个义项,两字仅有一个义项“看见”相同,其他义项都不相同,不符合“字义完全相同”这一限定。但是,若结合历史文献对这些义项进行分析归类,会发现两字的义项都属于相同的意义系列,应该属于异体字[8]91。实际上,字书中这样的情况很多,义项完全一一对应的字是很少的,如此界定会将本来存在异体关系的字排除出去。
再次,“在任何情况下都可以互相代替”这一角度也是存在问题的。这一限定实际上是在强调异体字在使用中其功能不可以分化,但是很多功能未分化的异体字也是不可以互相代替的。如地域方言和社会方言中存在一部分异体字,正是为了满足因地域差异或使用人群不同所产生的特殊需要,一般情况下,这些字是不能被其他与之读音和意义相同的异体字所代替的。
正是由于上述种种情况,一些学者认为对异体字的界定过于严格会将很多本来存在异体关系的字遗漏,使异体字的整理结果缺少可信性。那些读音和字义部分重合、不能在任何情况下都可以互相代替的字也应该认同其异体关系,因而提出了部分异体字和广义异体字的概念。异体字的广义与狭义之争由此展开。
吕叔湘曾说:“有些字只在用于某一意义的时候才有另一种写法,用于另一意义的时候就不能那样写。……麻烦的是这种部分异体字。”[9]32这里所说的部分异体字指的是一组意义部分相同的字。
裘锡圭将用法(音义)完全相同的字称为狭义异体字,将用法(音义)部分相同的字称为部分异体字,两者合在一起称为广义异体字[10]198。但裘先生所定义的广义异体字将真正异体字的范围扩大了,这为异体字的研究整理工作带来了难度。
高更生在《谈异体字整理》中认同了部分异体字存在的合理性,认为在整理部分异体字时为它们添加标注,使其能够与狭义异体字区别开就可以了。实际上部分异体字概念的出现与《一异表》有很大关系。新中国成立初期,由于对异体字理论的认识不够深入,致使《一异表》中收录了大量音义部分相同甚至音义完全不同的字,在此基础上学界对异体字进行了界定与分类,将本没有异体关系的字整理为异体字,甚至很多学者虽然意识到这种现象,但出于对《一异表》的保护,并不赞同对其进行大幅度修正。
然而部分异体字的存在模糊了异体字与其他字际关系的界限,分化字、通假字等字际关系中也包含着音义部分相同的字,这些字际关系若互相重叠交叉,会使汉字的整理工作难以进行。与此同时,部分异体字使异体字整理范围扩大,给异体字的整理工作增加了不必要的麻烦。有些学者甚至将属于其他字际关系的字通通并入到异体字当中,如邵世强曾指出古今字、繁简字、讹变字和一些笔形字形微异的字都属于异体字;郭锡良主编的《古代汉语》一书也将异体字整理过程中出现的假借字和古今字归并到广义异体字范围当中[11]。这些做法使异体字丧失了独立性,与其他字际关系混淆不清,是不可取的。
在界定异体字时必须要明确一点:异体字这一字际关系下所包含的一类字应该与其他字有本质区别或者有明确界限,是可以被独立研究的。若异体字中又混杂着其他字际关系的字,那么它就没有独立成类的必要,且会增加汉字整理的难度。因此笔者认同狭义异体字的定义,只有对字的音义关系以及使用功能作出严格的限定,才能整理出区别于其他字际关系的真正的异体字。
但是上文已经提到,那种严格意义上的异体字的定义其实是很少的,那么究竟该怎样定义,才能使其在异体字的整理工作中真正发挥作用,将具有异体关系的字全部认同出来呢?章琼先生对此给出了可借鉴的方案。
首先,章琼先生将异体字定义为:“异体字是记录语言中相同的语词、在使用中功能没有差别的一组字。”[8]40这一定义其实包含了“音义完全相同”的内涵。但他在定义中所强调的并非音义,他认为音和义只是异体字的表层层面,汉字异体的本质实际上是异体字所记录的词,能够记录语言中相同词语的一组字,才符合异体字的标准。这一定义指向了异体字的功能。判断两个字是否存在异体关系实际要看它们是否记录了相同的语词、功能是否有差别,而不是拘泥于音义层面。其次,在这一定义的指引下,章琼先生提出:在认同异体字的过程中,对于那些读音和释义有出入的字,要进行细致分析,在字音层面,如果符合上文提到的三类不同读音的字,经过分析它们的原本读音都是相同的,应该属于异体字;在字义层面,由于字书对于单字义项的分立很难完全符合实际,那么就不能完全根据字书所立的义项来认同异体关系,必须结合其他材料对有关字书的义项、文例进行认真分析,对单个字的意义系列进行整理,只要功能未分化,属于同一意义系列,便可以进行异体字认同[8]91-95。这一观点对于异体字的整理来说是非常具有合理性和可操作性的。
章琼先生的定义和整理方法既排除掉了“宽派”的部分异体字所带来的字际关系混同的难题,又为“严派”所强调的“音义完全相同”的限制松了绑。以“严派”的定义为基础,在判定工作中加以灵活运用,给出科学的整理方案,这是非常具有借鉴意义的。
李国英指出了功能定义所具有的局限性,他主张从构形和功能两个维度给异体字下定义:“异体字是为语言中同一个词而造的同一个字的不同形体,并且这些不同的形体音义完全相同,在使用中功能不发生分化。”[12]这一定义相较于章琼先生所下的定义而言,补充了字形方面的不足,结论更为完善。
综上所述,笔者认为对于异体字“一字异形”“一词异形”的分歧,异体字的研究应以字为本位,即“一字异形”是合理的,以此为基础,对于异体字的定义需避免“宽派”的观点,而采用“严派”的观点,既要回归异体字“音义完全相同”的本质特征,排除功能部分重合的字,又要在认同字音和字义方面借鉴章琼先生的方法,使异体字的整理工作更加科学和完善。异体字的定义之所以会存在上述种种分歧,是因为随着异体字研究的不断深入,学者们一直走在发现问题、解决问题的路上。真理总是越辩越明,因此有理由相信,随着异体字理论体系的不断完善,研究方法越来越科学,将来一定能够得出更为准确的定义。
基于对异体字定义的分析,异体字的分类也可以“从宽”“从严”两个角度来考察。既然认同狭义异体字定义的合理性,那么也会同样认同在此基础上产生的“从严”的分类方式。此外,随着汉字构形学理论的兴起,产生了将异体字分为异写字、异构字的分类方式,并被广泛应用。
主张“从宽”进行分类的学者其实是将异体字分为音义完全相同和音义部分相同两大类,并有一些学者在此基础上对异体字进行细分。
吕叔湘将异体字分为两类:真正的异体字,即音义完全相同;部分异体字,即音义部分相同[9]34。
曹先擢将异体字分为完全异体字和不完全异体字[13]。
李荣将异体字分为功能完全相同和用途有宽窄之分[14]。
黄颂康将异体字分为纯异体字和部分异体字[15]。
周祖谟在“从宽”的分类方式基础上将异体字分为七类:①古今字的不同;②表音表义不同;③形旁不同;④声旁不同;⑤结构成分的位置不同;⑥偏旁有无的不同;⑦笔画不同[16]。
裘锡圭在认同部分异体字的基础上,将狭义异体字分为八类:①加不加偏旁的不同;②表义、形声等结构性质上的不同;③同为表意字而偏旁不同;④同为形声字而偏旁不同;⑤偏旁相同,但配置方式不同;⑥省略一部分字形跟不省略的不同;⑦某些比较特殊的简体跟繁体的不同;⑧写法略有出入或因讹变而造成的不同[10]205-208。在众多工作中,裘锡圭先生的分类最为详细。
高更生对《一异表》所收字进行分析,将异体字分为五类:①典型异体字;②包孕异体字;③交叉异体字;④同音异体字;⑤异音异体字。高更生先生所说的典型异体字即学界普遍认同的狭义异体字,而包孕异体字和交叉异体字则概括了异体字音义部分相同的所有情况。高先生认为在对异体字进行整理时,典型异体字必须被承认,但无需将包孕异体字和交叉异体字剔除,只需标注清楚就可以了。这表明了他对部分异体字的承认。至于同音异体字和异音异体字,高先生认为它们并不属于异体字,应该予以剔除[17]。
苏培成的《现代汉字学纲要》继承了高更生先生的分类方法,将异体字分为单纯异体字、包孕异体字、交叉异体字三类[18]。
吕永进同样既肯定了狭义异体字,又认同包孕异体字的存在。他认为异体字内部存在“宽严之争”这一问题的症结在于:传统观念上一直将字符作为记录词的符号,如果将字符的记录单位从词下放到义项,使字符和义项直接对接,那么这种争论便迎刃而解了,记录同一义项的一组字都是异体关系[19]。这种说法看似合理,但在实际的异体字整理工作中是不具备可行性的。
主张“从严”进行分类的学者是在狭义异体字这一界定下对异体字进行分类的,将音义部分相同的字摒除在异体关系之外。
王力的《古代汉语》一书排除了在异体关系中存在争议的三类字,包括部分读音相同、意义相近的字,既存在相通部分又存在不通部分、关系难以理清的字,以及并非在任何情况下都能互相代替的字。这样一来,那些音义部分相同的字就不属于异体字了。在此基础上,他将异体字分为四类:①形声字与会意字之差;②改换意义相近的义符;③改换声音相近的声符;④变换各成分的位置[7]156-157。这种分类方式是被广泛接受的。
在王宁的《汉字学概要》一书中第一次提出了异写字和异构字的概念,认为异体字可分为异写字和异构字两类。异写字又可分为构件写法变异造成的异写字和构件位置不固定造成的异写字;异构字又可分为因构形模式不同而形成的异构字和构形模式相同构件不同的异构字[20]91。
李国英不仅将异体字分为异写字和异构字两类,而且还指出:“异构和异写并不在一个层面,每一个异构形体都可能产生自己的异写形式,异写属于异构下面的层次。”“整理异体字最好把异构、异写的层次关系描写清楚,排列出谱系。”[12]给异体字建立谱系这一想法是十分有意义的,通过这一工作能够更为直观地观察异体字的内部层级结构,观察异写字和异构字之间暗含的规律,便于异体字研究工作的进一步深入。
章琼一方面根据形体结构和功能把异体字分为五类:①为语言中同一语词而造、在使用中功能没有分化;②造意不同,但在实际使用中用法相同、功能重合;③同一古文字形体由于传承演变、隶定楷化的方式不同而产生的不同形体;④异写字,指在书写元素上产生的差异,对于构形模式、结构分布和构意不产生影响;⑤讹字,这里专指那些积非成是进入字书的而非一般的讹字[8]41-42。虽没有直接根据异写字和异构字来进行分类,但后三种类型实际上是同一文字在形体上的变化,并不对构形和构意产生影响,都应属于异写字的范畴。
另一方面,章琼先生对现代汉语7 000个通用字中2 739个能在《汉语大字典》中找到对应异体字的汉字进行分析,整理出6 786个异体字,并将这些字分成两大类:汉字系统自身原因产生的异体字和社会原因产生的异体字。前者又细分出三个小类:①因造字方法不同造成的异体字;②因文字演变造成的异体字;③因文字使用原因造成的异体字。并据此形成了现代汉语通用字对应异体字表。章琼先生认为:以往那些“根据造字和形体结构方面的不同来为异体字分类,抓住了异体字的形体特征,但局限也十分明显。这种分类只适合于分析一组异体字中正字与相应的异体字在结构上的差异,对于一批异体字或全部异体字来说,这种分类方法是毫无意义的。……因此,这里我们尝试着按照异体字产生的原因和途径来对异体字进行分类”[8]17。这种分类方式在异体字的研究和整理上发挥了很大作用,为系统地观察和研究异体字提供了一个新的视野。
随着汉字构形学理论的兴起和异写字、异构字等定义的出现,异体字的分类变得复杂起来。异写字和异构字如何界定、如何分类、学界存在哪些分歧以及如何去处理等都是当下尚无定论的问题。
最早给异写字和异构字下定义的是王宁先生,随后王贵元、李国英、李运富等人也分别对其进行论述。目前对于异写字和异构字的定义、分类等问题还没有形成完全统一的观点。就连王宁先生本人的定义也是一直在改进和完善中。在《汉字构形学导论》中王宁先生给出了最新的定义,“在同一体制下,记录同一个词,构形、构意相同,仅仅是写法不同的字样,称作异写字”;“形体结构不同而音义都相同、记录同一个词、在任何语境下都可以相互置换的字,称作异构字”[21]。这两个定义均以构形、构意和书写方法为落脚点。
李国英先生说,“异构字,即用不同的构字方式或选取不同构件构成的异体字”;“异写字,即由于书写变异形成的异体字”[12]。这是从构件、构形方式和书写方法的角度来定义。相较于王宁先生所给定义,基本意义不变,但较为简单。
李运富先生说,“异写字,指结构属性相同而写法不同的字”;“异构字,指为同一词位而造但构形属性或理据不同的字”[22]。这是从构形属性、构形理据、构件以及书写方法的角度给出的定义。
由此可见,构形属性、构形理据以及书写方法是定义异写字和异构字的关键要素。
各家对于异写字和异构字的分类大体方向一致,但在细分的类别上存在差异。对于异写字和异构字的分类,学界普遍认同的观点是:对异写字是按照书写元素也就是笔画层面的不同来分类;对异构字是按照构意、构形模式和构件的不同来分类。学界目前没有达成一致的观点在于:构件相同、构件位置不同的字形如何归类;构件简省字形如何归类[23]。
1.构件相同、构件位置不同的字形的归类问题
王宁先生和李国英先生对于这种字形的归类问题持相反的观点,前者把这种字形归入异写字,后者将其归为异构字。王贵元先生认为这种情况不能一概而论,那些以不同的构件位置来体现不同构意的字形,应属于异构字;而那些由人为造成的构件位置的变化,虽在一定程度上影响或破坏了字的构意,但并不属于构意不同,故而应归为异写字。王贵元先生据此将其分为两种情况:一种是方位异写字,另一种是组合位置变换的异构字。之所以产生上述分歧是因为各家分类的标准不同。笔者认为异体字的构件位置变化不影响字的构形理据,构件也没有发生变化,故而不应属于异构字,应归为异写字。
2.构件简省字形的归类问题
李国英先生认为“偏旁减省”属于异写字;李运富先生则有不同的理解,他认为无论是简省相同的构件还是不同的构件,其本质在于构件数量的变化,这种字形应归为异构字;王贵元先生认为构件不同是异构字的典型特征,而构件简省也属于构件不同的一种,因此构件简省的字形应属于异构字。笔者认为构形理据和构形模式的不同是认定异构字的基本原则,构件的简省大多不对构形理据和构形模式产生影响,故而构件简省字形应属于异写字。
此外,构件简省又可分为两种情况:一种是简省重复构件,一种是简省部分不重复构件。重复构件的简省会导致原字形的构形理据受到影响,但并不会完全消失,原字形的构意仍然存在于简省字形当中;而简省部分不重复构件则会造成原字形的构形理据在简省字形中无法辨认,不利于二者之间关系的认同[20]91。
学界对于异写字和异构字的定义虽然有所不同,但大体上都是从构形属性、构形理据和书写方法这三个角度出发给出的,而且在此基础上进行的详细分类也都是大同小异。异写字的分类在书写层面进行,而异构字的分类则在构形模式、构形理据的基础上进行。这里应该认同一个基本原则,即在不影响构形理据情况下,因为构件相同、构件位置不同而产生的异体字以及因偏旁简省而产生的异体字都应属于异写字。
异体字的整理工作离不开对它的界定和分类,目前学界对此虽有分歧,但大体的方向是一致的,因此异体字整理才能取得如此丰硕的成果。新中国成立初期,在给异体字下定义时产生了“一字异形”和“一词异形”的讨论,在此基础上又出现了广义异体字和狭义异体字的不同定义。受定义的影响,异体字的分类存在宽和严的分歧。之后又在汉字构形学理论下产生了异写字、异构字以及相关问题。在这样不断地发现问题、解决问题的过程中,异体字理论发展呈现出一个逐步深入和细化的过程,异体字理论体系也逐步走向科学和完善。与此同时,学者们也提出了许多异体字整理方法,借助这些方法可进行异体字的整理以及异体字数字化等工作。