吴松林 吴冠乔
(1.东北大学 河北秦皇岛 066004;2.德拉萨大学 菲律宾马尼拉 0900)
《二十四史》生难字研究以计算机造字开发技术为手段,以生难汉字为目标,以能够进行语义对等的英文释义为媒介,以辞书编撰原理为指导,通过跨学科研究,取得应用性的技术成果。
研究对象是日常较少使用到的生难汉字,字库的建设是重要而且费时、费力的工程,也是决定后续工作能否正常进行的关键要素。建库的文字除了少量可以从百度、搜狗、QQ等时尚拼音输入法提取出来以外,绝大多数汉字必须诉诸计算机编码设计,通过硬性规定设计字形、外部关系设计和内部特征设计等方法,完成纸质录入和编校前期的计算机处理技术。这是整个课题的工作难点。
英文释义要求结合具体汉字的语用关系,细致、精确、客观地反映出文字的语义内涵。双语释义工作是极具精细化的技术过程,这是整个课题的工作重点。
汉英双解《二十四史》生难字字典(以下简称《生难字字典》)编纂的主要目的之一是为了“《二十四史》整体英译工程”做的前期工具性准备。《二十四史》英译过程中遇到最大难题之一就是:阅读过程中会遇到很多难僻字,普通学者、甚至有些专家都不能正确识读,对其表意更是一头雾水,翻译成英文就更无从谈起了。《生难字字典》对《二十四史》中生难字进行筛选并编纂成汉英双解字典,包括自用电子字典,满足《二十四史》英译工程的需要。
对于该字典中、英文释义没有书证,基于以下几点考虑:
(一)《生难字字典》的编纂不是为了中国读者或专家阅读《二十四史》专门进行的中文注释,而是为了把《二十四史》翻译成英文而做的前期工具性铺垫,编纂目的不同。所以,中、英文释义没有出现书证。
(二)《生难字字典》一旦投入市场,使用的人群绝不仅仅限于“《二十四史》英译工程”团队,典籍翻译领域的专家或学者会以此为参考,而中华典籍绝不仅仅指《二十四史》,还包含其他各类古代文献。如果这部字典里面只提供《二十四史》中的书证,难免过于学院气,进一步增强项目组了劳动的强度,大大缩小了字典的使用效度。
(三)对于英文释义也是基于使用人群考虑的。《生难字字典》从国际角度而言,一定程度上充当着维护民族文化身份的角色。我们将中华的精髓译为英语,融入到世界多元文化中去,认同多元文化的共生,使之相互影响,共同发展。为了方便外国普通读者或汉学研究机构更好了解生难字或《二十四史》中的生难字,把《生难字字典》定位成一种辅助性工具,提供简单、直白的英文释义,而且,考虑到英文翻译的统一性和规范性,没有在英文释义中体现书证。
通过自查,随机遴选出“厩、厝、佤、傈等二级字,收了‘傈’,却没收‘僳’”,解释如下:
《生难字字典》在最初收字的时候也参照了国家《现代汉语字典》收字标准,一级字多少、二级字多少,也是按这样的划分标准去做的。进一步论证的时候,考虑到《生难字字典》自身的特色就是收录生难字,但何为“生难字”?这里定义为:生难字是指一般学者不易识读的简化字、繁体字、异体字及其他汉字。按照这一定义,对收录的字头进行审阅,划掉了熟识的字头,划掉部分字头,结果导致体系最终不完善。但是,考虑到《生难字字典》本身就不同于普通的各类辞典,应该有自己的收录标准,因此没有完全按照国家现代汉语汉字收录标准收录生难字字头。
(一)《生难字字典》中确实存在大量的异体字、通假字等,释义只说同某、通某,但被同、被通的字缺没有存在于该字典中,主要是因为大部分“被同、被通的字”属于简单字,比如:
其中,被同、被通的字的为“至、乖、老、所、夜、成、事……”,对于这批字是否收录到《生难字字典》中,讨论结果是:这批被同、被通的字属于简单字,不符合《生难字字典》字头收录标准,不建议收录。对于该被同、被通的字“释义没有着落”的问题,项目组也进行了讨论,因为这些字为简单字,其释义为所有国内一般学者耳熟能详,对于“《二十四史》英译工程”不造成障碍,对于国内普通学者使用该字典也不产生影响,对于国外读者或研究者由于项目组都提供了英文释义,也未造成任何障碍。基于以上考虑,研究最终决定不收录被同、被通的字。
(二)在《生难字字典》中“被同或通的字”还有这样的情况:被“同”的字属于生难字范围,一般学者也不认读,比如:
对于这种情况项目组是这样处理的:在《生难字字典中》收录了该字头,并提供了中英文释义。如上文提到的被同字在字典中可找到:
②枣子jujube;Chinese date③姓a surname
(一)对于注音无调号问题,查阅了《生难字字典》中无音调的字,发现存在以下两种情形:
1.确定字头后,对于该字的读音主要参考了《汉语大字典》(共9册,四川出版集团·四川辞书出版社;湖北长江出版集团·崇文书局)和《难僻字字典》(浙江大学出版社)。对于注音无调号的字头,在这两本词典中就无音调,查阅了其他书籍,也没有查到这些字头的音调,项目组理解为该字头本身就是轻音,没有音调。由于没有找到其他相关依据,未敢对这类字头读音进行处理,尊重了《漢语大字典》和《难僻字字典》。
2.电脑上编辑之后,然后整合完成,由于项目组成员各自电脑系统不同,在整合过程中,电脑程序原因不明地将部分音调去掉了,项目组成员没有意识到这一问题,之后,校对无音调字头的时候才发现了这一问题,并逐一进行了校正。
(二)对于“有的字缺中文释义、有的字缺英文释义”和“释义不对或不准确,中英文都有这种情况,较为普遍”这两个问题,主要从对外传播角度给予考虑。字典主要服务于“英译工程”,为有需要向国外展现中国文化的人提供工具性帮助,最终向外国人展现中国传统文化的魅力与精髓,确立我国文化的民族性。为了方便国外人理解生难字,我们在中文和英文释义方面只选取了使用度最高、最为广义的释义,尤其实在英文释义方面只列出了三个较为直接的解释,力求准确、简练、明白,省略了那些偏、难的解释,并没有穷其尽。
这里出现了双重标准,在《凡例》中明确提到“收字……生难字参照2013年《通用规范汉字表》(8105字)三级划分标准及有关辞书……字头释义以《简化字总表》所列字目为准”。从这一点观察,应该按照2013年《通用规范汉字表》(8105字)的统一标准进行修正。
《二十四史》生难字汉英双语研究旨在解决跨文化交际过程中的文字障碍,运用辞书编辑学原理、比较语言学原理、语义学原理和计算机技术等多学科,设计完成涵盖38759个未译汉字的英文释义工作。汉英生难字双语编写首先利用数字化处理技术,界定字典编撰的原则,描述字典编撰的方法和手段,确定编写的具体流程,明确编撰过程中所需要解决的主要问题,通过规模化英译处理,完成这部针对性较强的辞书编辑字库和英译工作。