摘 要 随着电子计算机的普及,出版物中使用不规范“简化字”的现象较过去有所好转,但也时有所见。现行语文工具书和《通用规范汉字表》在简化字问题上处理原则不一,收字互有参差。有些辞书对所收字形及字间关系的解释不够确当。这种情况给文字编校及汉字信息处理造成了许多不便和困惑。《通用规范汉字表》现已正式公布,今后字典、词典编纂及各类字表制定工作应以此为据,进一步坚持规范,加强衔接,免生龃龉。
关键词 通用规范汉字 繁体字 简化字 异体字 汉字信息处理
一、出版物中的不规范“简化字”
多年以前,笔者曾撰文分析了出版物中的五种不规范“简化字”:一是将停止使用的异体字进行了简化,如:餽(馈)作,匳(奁)作,闚(窥)作,齧(啮)作,鑑(鉴)作,譁(哗)作;二是将已与他字合并或已删去部分偏旁的繁体字进行了类推简化,如:齣(出)作,誇(夸)作,鬚(须)作,嶽(岳)作,闢(辟)作,開(开)作;三是将几个偏旁均已简化的字做了部分简化,如:餼(饩)作,櫛(栉)作;四是对已更换的偏旁进行了部分简化,如墳(坟)作;五是把非“简化偏旁”的某些偏旁当作“简化偏旁”,进行了错误类推,如繶作,隰作。(何茂活 1992:39)
二十多年过去了,上面所说的情况至今仍存在,比如有的出版物把“昆仑”印作“崑”,就属于上面说的第一种情况。据《第一批异体字整理表》,“侖”的异体“崙、崘”已被淘汰,据《简化字总表》,“侖”简作“仑”,因此“崙”字不能再做类推简化。再如某书引述《叠雅》卷一“枚枚、绵绵、、沐沐,密也”(刘叶秋 2004:173),其中的“”应作“緻緻”。因为“緻密”之“緻”已与“招致”之“致”合并简化为“致”,这里要想显示该词的形义联系,免使读者产生疑误,只需保留繁体写法,而不能简作“”。甘肃定西有个地名巉口,当地有的报刊曾写作“”,显然是参照“馋、搀、谗”的简化方式“简化”的,但这是不规范的,因为它的右偏旁并非“简化偏旁”,不能进行类推。《语言文字规范手册·〈简化字总表〉说明》(1991):“未收入第三表的字,凡用第二表的简化字或简化偏旁作为偏旁的,一般应该同样简化。”照此规定,下面这个字倒是可以类推简化——甘肃张掖有一古县名“觻得”,近年出版的地方史志中多作“得”(张掖市志编修委员会 1995:12)。“乐”是“可作简化偏旁用的简化字”,这样类推简化应当说是可行的,但这样一个古地名中的冷僻字,到底有没有必要简化,凡有此类偏旁的字是不是可以无限类推?关于这个问题,《通用规范汉字表》征求意见稿(2009:1—4)第六条做了很好的回答:“根据国务院1986年‘今后对汉字的简化应持谨慎态度,使汉字的形体在一个时期内保持相对稳定的指示精神,本字表以外的字,不再类推简化。个别领域确需类推简化的,需报国家语言文字工作主管部门批准。”2013年8月正式公布的《通用规范汉字表》同样秉承了这样的精神,“对社会上出现的在《简化字总表》和《现代汉语通用字表》之外的类推简化字进行了严格甄别,仅收录了符合本表收字原则且已在社会语言生活中广泛使用的‘闫、、等226个简化字”。因此“觻得”之“觻”仍以保持旧有的书写形式为宜。
当然,近年来出版物中出现不规范简化字的情况已有了很大好转,究其原因,主要是随着电脑的普及,出版物的排版环节“前移”,文稿作者和文字录排者基本实现了统一。因此上述不规范字在电脑录入时受到了很大程度的限制——一般的写作者和文字录入者,很少会使用电脑的造字功能,刻意造出上面这些不规范字。但是,也正是因为计算机的普及,有关“简化字”的一些新问题又随之产生。因其牵涉文字编校、辞书编纂及汉字信息处理等多方面问题,所以应予重视和研究。
二、“讬”是一个不规范“简化字”
近年来,笔者在阅读和编辑过程中,注意到了一个不规范“简化字”——“讬”。据中国知网检索,近十多年来,仅各种期刊所载论文篇名中出现的“讬”字就有多个,如《〈春秋经〉何以讬始于鲁隐公》《“脂批”不是伪讬么?——对蔡义江等驳论的评议》《敦煌本〈孔子项讬相问书〉成书时代浅探》《〈孔子项讬相问书〉体制探源》等。至于正文中使用这个字就更为多见了。我们再用超星读秀检索,发现多种图书都使用了这个“讬”字,主要见于“岳讬”(人名)和《孔子项讬相问书》。
“讬”字其实不是一个规范汉字,与之对应的规范汉字是“托”,有时如确需保留异体则应作“託”。这个字的情况跟上面所说的“餽、匳、闚、齧、鑑、譁”的情况大体相似。
《说文解字·言部》:“託,寄也。从言,乇声。”1955年公布的《第一批异体字整理表》中将“託”列为“托”的异体字,予以淘汰。因此此后于1964年公布、1986年经个别调整重新发布的《简化字总表》中,便没有也不可能有“讬”这样一个“简化字”。正是因为这样的缘故,其后编纂的《新华字典》、《现代汉语词典》(以下简称《现汉》)、《辞海》、《汉语大字典》、《汉语大词典》等字词典中都没有收录这个字(《辞源》为繁体字版,更不可能出现此字)。像《现汉》就只是在“托2”条下括注了它的异体字“託”,该条的义项包括“委托;托付”“推托”和“依赖”。字词典如此,作为规范标准的一些字表也是如此,如1988年公布的《现代汉语常用字表》《现代汉语通用字表》以及2013年正式公布的《通用规范汉字表》中就都没有“讬”这个不规范字。1980年由国家标准总局发布、1981年5月1日起实施的《信息交换用汉字编码字符集·基本集》(GB2312—80)也是如此。
鉴于以上情况,我们在写作和编辑工作中应当按照规范,弃“託”而用“托”,坚决反对使用“讬”字。至于《孔子项託相问书》这样的古代文献,如果从保留文献特征尤其是从“项託”是个人名的角度考虑,也可以保留“託”的写法。其他像“信托、委托、伪托、托收、阿托品”之类的词语中的“托”都不能使用“託”或“讬”字。
那么“讬”这个不规范字是怎么产生并且在正式出版物上频频现身的呢?笔者认为原因有三:
一是许多作者和编辑并不清楚“托、託”之间的关系,因而在转录有关文献材料时对“託”字的偏旁做了简单的类推简化。殊不知,《第一批异体字整理表》所列的停止使用的异体字是不能再进行类推简化的。仅以“言”旁的异体字为例,请看该字表中的以下几组:
酬〔酧詶醻〕 訛〔譌〕 嘩〔譁〕 歡〔懽讙驩〕 薯〔藷〕 嘻〔譆〕
喧〔諠〕 咏〔詠〕 噪〔譟〕 贊〔賛讚〕 志〔誌〕 注〔註〕
这几组括号中的字是停止使用的异体字,其中的“詶、醻”就不必再简化作“、”,其他各例括号中从“言”的字也都不应类推为从“讠”。《辞海》1979年版缩印本卷末所附编写人名单中有一位“庄
文”,这个“”字就是不规范的。人名中可以保留异体字,但不能再做类推简化。1999年版作“詠”,是对的。当然有几组字,后来根据1986年重新发布的《简化字总表》的说明做了适当调整,比如:欣〔訢〕、宴〔讌醼〕、呵〔訶〕、诳〔誆〕,这几组中的“訢、讌、訶、誆”不再作为淘汰的异体字,而分别简化为“、、诃、诓”。
二是《汉字内码扩展规范》(GBK,1995 年制订并公布)以及在此基础上制订的GB18030—2000《信息交换用汉字编码字符集基本集的扩充》和GB18030—2005《中文编码字符集》均收列了“讬”字。这几个字符集(GB18030是对GBK的修订,内容基本相同),是对基本集的扩充,其中收录了很多难字、僻字,包括繁体字、异体字、俗简字等,这些字符主要用于古籍整理等,我们不能把这些非通用字,当作通用规范汉字。“讬”字只能看作一个俗简字,而非通用规范汉字。
三是有的工具书误将“讬”字解释为“託”的简化字。如香港商务印书馆根据汉语大词典出版社出版的纸质版《汉语大词典》编辑制作的电子版《汉语大词典》2.0版,就专列“讬”字条,并明确解释为“‘託的简化字”;与之相应,把“託”解释为“‘讬的繁体字”。这是与纸质版不相符的,纸质版中并无“讬”字。将“託、讬”看作繁简字也是不妥的。我们所说的“简化字”有其特定的含义,那就是见于《简化字总表》的简化字和运用该表第二表“可作简化偏旁用的简化字和简化偏旁”类推出来的字,而这个“类推”是有一定限度的。比如已经停止使用的异体字和已经合并简化的繁体字,就不应该再进行类推简化。因此这个“讬”字和上面所说的“、、、、、、”等一样,都可以称为“不当类推”的不规范字。
三、字词典及各种字表之间的分歧现象
上面说到的工具书与各种字表之间存在的分歧现象,给文字录入和编辑工作带来了许多困惑。现从这个角度略举数端,以供大家讨论。
(一)《现汉》中有而《汉语大字典》第一版、《汉语大词典》、GBK字符集中均无的简化字。比如《现汉》中所收录的“、、、、、”等字,在两部大字典、大词典中却只有相应的繁体字“訏、搊、灒、、繨、韡”。产生这一分歧的原因是,前者遵从的是《〈简化字总表〉说明》“未收入第三表的字,凡用第二表的简化偏旁作为偏旁的,一般应该同样简化”;而两部大型字词典则有它们自定的原则——《汉语大字典·凡例》(1993):“简化字以中国文字改革委员会编发的《简化字总表》所列字目为准。”《汉语大词典》(1993)所收简化字也是“以中国文字改革委员会、文化部、教育部1964年联合发布的《简化字总表》所列的2236个字为限”。也就是说,未列入该表的字,不做类推简化。需要说明的是,《辞海》1999年版在繁简字处理上与《现汉》大体相同,上述各例除“()”字无论繁简均不收录外,其他均无不同。但第六版(2009年版)的处理办法却又与《汉语大字典》《汉语大词典》大体相同,上述诸字除“(訏)”和“()”不收外,其他分别为“搊、灒、繨、韡”。为何做这样的调整?新版“凡例”中有一条可作解释:“偏旁类推简化以《简化字总表》中的132个‘可作简化偏旁用的简化字和14个‘简化偏旁为准。类推简化的范围,视文字实际使用情况从严掌握。”《汉字内码扩展规范》《信息交换用汉字编码字符集基本集的扩充》和《中文编码字符集》在简化字收列方面的原则,大体与《汉语大字典》第一版、《汉语大词典》相当,上述各简化字形在这些字表中均未收录。上述分歧现象,使人左右为难,莫衷一是。笔者前段时间编校一篇关于当代作家徐的专论,原稿通篇作“徐訏”。若改为简体,须造字替换;若依字库,不改亦可。斟酌再三,还是依据《现汉》,改为“徐”了。事后在中国知网检索,发现各刊的处理很不统一,甚至同一刊物也前后不一。比如《名作欣赏》杂志,1999—2010年刊发篇题中含有此名的文章共7篇,2009年第4期以前3篇均作“徐”,之后4篇均作“徐訏”。这种情况显然是作者、编辑及印刷厂迁就字库的结果。
(二)《现汉》和GBK字符集中有而《汉语大字典》第一版、《汉语大词典》中没有的简化字。如“缐、、讱、诐、诪”等字,在两部大型字词典中只有“線、撝()、訒、詖、譸”等繁体字形。这一分歧产生的原因与上条大体相同,只不过这些简化字形,GBK字符集中已经收录,我们在录入电脑时没有麻烦。需要特别注意的是“缐”字。“線”作为“綫”的异体,本已淘汰,“綫”又简作“线”,故不应再有“缐”字。但它作为姓氏时并不作“线”,所以社会上仍在使用。《现汉》、GBK字符集及《通用规范汉字表》均收录了此字。《辞海》1999年版只将“線”作为“线”的异体收列,但第六版增设“缐”字条。
(三)GBK字符集中有而字词典中没有的简化字。这种情况除上面所说的“讬”字以外,比较典型的还有一个“锺”字。这个字本作“鍾”,是“钟情、钟山、钟灵毓秀、钟馗、钟子期”等词语中“钟”的繁体字。据《简化字总表》,“鍾、鐘”二字简作“钟”,故无“锺”这一简化字。可是多年以来,出版物上常常出现“锺”的写法,如人民文学出版社1985年版《围城》,就将作者写作“钱锺书”,四川文艺出版社1991年版《〈围城〉汇校本》同样如此。《现汉》、《汉语大字典》第一版、《汉语大词典》纸质本均有“鍾”而无“锺”。也许是考虑到社会用字的实际,GBK字符集中收录了“锺”字。《汉语大词典》电子版亦收录此字,并解释为“鍾”的简化字。《通用规范汉字表》三级字表也收录了此字,并在所附《规范字与繁体字、异体字对照表》后加注说明:“鍾:用于姓氏人名时可简化作‘锺。”于是,这个原本不规范的简化字最终获得了一个“合法”的身份。这个字的“死而复生”,可以说是文字的约定俗成性和规范化要求之间矛盾抗衡的结果。
(四)《通用规范汉字表》中有而GBK字符集中没有的简化字。《通用规范汉字表》“对所收《简化字总表》、《现代汉语通用字表》之外的字,依照《简化字总表》的原则可以类推简化的,在保持原字结构和遵循字形系统的前提下,新类推简化了265字”(见征求意见稿“说明”)。如:(繶)、(櫍)、(駺)、(鷟)、(磾)等。正式公布的字表中类推简化字减少为226字,上举5字中,删去了“(駺)”字。上述5字的简化形式均见于《辞海》第六版,见于《现汉》第5版的只有后两例,第6版增收“”及“”。《通用规范汉字表》还根据语言生活的现实状况,对少数几个原来的繁体字做了类推简化,如“”(原作蘋,简作苹)、“”(原作噁,简作恶)等;同时也对个别异体字做了类推简化,如:(勣,同绩)、(頫,同俯)。另有“(賸,同剩)、(驩,同欢)”等字见于征求意见稿,而不见于正式公布的字表。上述“、、、、、”6字,均不见于《汉语大字典》第一版、《汉语大词典》和《辞海》1999年版(第六版增收“”);见于《现汉》的有“、、、”。这种情况显得十分纷乱,今后语文工具书的修订应以《通用规范汉字表》为依据进行必要的调整。
下面顺便谈谈《汉语大词典》纸质版和电子版的收字差异问题。该词典电子版2.0版帮助文件“概览”中说:“由于本光碟是基于Windows95/98/NT/2000/XP中文版开发的,为了保证本光碟与Windows95/98/NT/2000/XP中文版字符集GBK(Code Page)的兼容性,所以收入的汉字字头少于印刷本。”其实,上面所说的“讬、锺、讱、诐、诪”均见于电子版而不见于纸质版。再如电子版有“侭”字,并说是“儘”的简化字,其实《简化字总表》中将“盡、儘”合并简化作“尽”,并无“侭”这样一个简化字。又如“櫊”字,电子版:“櫊,同‘阁。”纸质版则无“櫊”字。可见电子版所收字头总量虽少,但有些字头却也是纸质版所没有的,并且有些字形之间的关系解释是不准确的。这种情况需要我们使用时加以注意。另须说明的是,该词典电子版3.0版使用的完全是繁体字,所以不存在我们这里讨论的简化字规范问题。
总括上面各种情况,我们可以把几种字词典及字表之间在简化字字形收列方面的分歧现象列表分析如下:
四、结语及补识
综上所述,我们的意见有三点:一是“讬”字不是通用规范字,除人名中可保留“託”的写法以外,其他均应作“托”。《汉语大词典》电子版对“讬、託”二字字形关系的解释是不恰当的。二是GBK字符集与现行字词典,在繁简字、异体字等问题的处理上存在矛盾,有些在现行字词典中并无简化字形的字,在字符集中出现了“简化字”;而有些字词典中有简化字形的字,在字符集中却只有繁体。这种分歧现象给语文规范化和汉字信息处理带来了很多麻烦和困惑,应当引起重视。三是字词典编纂和《字表》研制过程中,应注意相互之间的照应和衔接。《通用规范汉字表》中新列入的一些简化字,有待今后在相关字表及工具书修订中予以增补。
本文初稿撰写于2011年,当时尚未得见《汉语大字典》第二版。后幸而获见,急忙查验本文所论问题,结果发现该版在简化字收录上对初版所定原则做了调整,其《凡例》“收字”部分有如下两条:
3.简化字收录以中国文字改革委员会1964 年编印,1986 年经国务院批准、国家语言文字工作委员会重新发表的《简化字总表》为依据。该表中的简化字全部收录,释义以“‘×的简化字”表示。
4.根据当今用字实际需要,适当收录《简化字总表》以外的类推简化字,释义以“‘×的类推简化字”表示。此类字收录范围仅限于《现代汉语通用字表》和当代著名工具书,余不类推。
由于上述调整,所以本文第三部分所论《现汉》收录而《汉语大字典》第一版未收的字,在第二版中多已收录。具体情况如下:“、、、、、、、讱、诐、诪、、、、、、、、、、、”这21个字均已收录,释义皆为“,‘訏的类推简化字”这种样式;“锺、缐、侭”未收。“锺”字不收合乎其例,“缐”字不收疑系疏忽,“侭”字不收则是理所当然。总体来说,上述调整与本文的讨论与期望正相契合,不禁欣幸之至。但是转而再查本文第一、二部分所论“不当类推”的“简化字”,发现除“、、、、、讬”等不收外,大多都收入了该版,如:“、、、、、、、、、、、、、、、、”等(释义均采取“,‘闚的类推简化字”这种样式),而与之相类的“讚、譟、譆”则没有收录相应的“类推简化字”。与之相比,上列自“”至“譆”这些字中,收入《现汉》的简化形式只有“、、”(第6版只有“”),《通用规范汉字表》则全未收录。这不能不让人认为,《汉语大字典》第二版收录“类推简化字”的范围未免太宽了,且同类问题的处理也不够统一。与之相比,上文所引《辞海》第六版所采取的“类推简化的范围,视文字实际使用情况从严掌握”的做法,窃以为颇为可取。《通用规范汉字表》对类推简化字进行“严格甄别”的做法则更可嘉赏。在《通用规范汉字表》正式公布之际,我们由衷地期待它对《汉语大字典》《汉语大词典》以及其他语文工具书的修订产生直接而深远的影响。
参考文献
1.辞海编辑委员会.辞海(1979年版缩印本).上海:上海辞书出版社,1980.
2.辞海编辑委员会.辞海(1999年版缩印本).上海:上海辞书出版社,2000.
3.辞海编辑委员会.辞海(第六版).上海:上海辞书出版社,2009.
4.国务院关于公布《通用规范汉字表》的通知(国发〔2013〕23号).中国政府网. http://www.gov.cn/zwgk/2013—08/19/content2469793.htm.2013—08—19.
5.汉语大词典编辑委员会,汉语大词典编纂处.汉语大词典.上海:汉语大词典出版社,1990.
6.汉语大字典编辑委员会.汉语大字典(第一版缩印本).成都:四川辞书出版社;武汉:湖北辞书出版社,1993.
7.汉语大字典编辑委员会.汉语大字典(第二版).成都:四川辞书出版社;武汉:崇文书局,2010.
8.何茂活.出版物中的几种不规范“简化字”.语文建设,1992(3).
9.教育部,国家语言文字工作委员会.通用规范汉字表(征求意见稿).中国教育报,2009—08—13(1—4).
10.教育部,国家语言文字工作委员会.通用规范汉字表.北京:语文出版社,2013.
11.刘叶秋.中国字典史略.北京:中华书局,2004.
12.语文出版社.语言文字规范手册(增订本).北京:语文出版社,1991.
13.张掖市志编修委员会.张掖市志.兰州:甘肃人民出版社,1995.
(河西学院文学院 甘肃 734000)
(责任编辑 郎晶晶)