杜翔 李志江
摘 要:《两岸科技常用词典》根据《汉语拼音正词法基本规则》,给出了19 500条科技名词的拼写形式。重点探析了科技名词拼写中概念整体性、分连写、连接号使用等方面的难点,交代了处理这些难点的具体方法,并阐明之所以这样处理的思路和依据。
关键词:汉语拼音,正词法,科技名词
中图分类号:N04;H125.2;H06 文献标识码:A 文章编号:1673-8578(2015)05-0020-06
2012年,修订后的《汉语拼音正词法基本规则》[1](以下简称《基本规则》)正式发布。《基本规则》规定了用《汉语拼音方案》拼写现代汉语的规则。笔者作为修订课题组成员,在修订之初就意识到汉语语汇的内部结构多种多样,《基本规则》只能就其一般情况做出规定,举例也不可能面面俱到。因此在《基本规则》修订完成后,我们马上编写了《〈汉语拼音正词法基本规则〉解读》[2],接着又编写了《汉语拼音词汇(专名部分)》[3],同时对专名拼写中的难点也撰文探析。从2014年开始,我们着手进行了《两岸科技常用词典》的汉语拼音拼写工作。
《两岸科技常用词典》收录了海峡两岸常用的科技名词19 500个,涉及30个门类。其中,既有普通名词,又有专有名词;既有拼写的分连写问题,又有大小写问题。情况比较复杂,难点较多。这部词典的汉语拼音拼写是运用《基本规则》在科技名词注音上尝试性的全面实践。本文拟就其中的难点问题进行探讨,对前述已做过解读、探讨的问题则不再赘述。
一 表达概念的整体性与词语内部的分析性的矛盾
周有光先生指出,汉语拼音正词法充满着内在矛盾[4]。他在列举了13对矛盾之后说,归结起来是习惯性和合理性的矛盾。科技名词,尤其是表达复杂概念的科技名词以多音节的短语为主,作为一个概念,处理为连写,能显示其整体性;而全部连写以后,一长串的字符没有停顿,无法体现语音节律和内部结构,影响人的理解。
《基本规则》就这种情况附列了变通规则第4条:
在中文信息处理方面,表示一个整体概念的多音节结构,可全部连写。例如:
ɡuómínshēnɡchǎnzǒnɡzhí(国民生产总值)
jìsuànjītǐcénɡchénɡxiànɡyí(计算机体层成像仪)
shìjièfēiwùzhìwénhuàyíchǎn(世界非物质文化遗产)
表示一个整体概念多音节结构的这种情况在化合物名称上表现得最为突出,如糖精的化学名为“邻磺酰苯甲酰亚胺”,又称“邻苯甲酰磺酰亚胺”。按照语音节律,分别读为:邻磺/酰苯/甲酰/亚胺,邻苯/甲酰/磺酰/亚胺(其中“/”表示分写,下同)。从这对异名的内部组成部分来看,存在着异序关系,按照各组成部分,划分为:邻/磺酰/苯甲酰/亚胺,邻/苯甲酰/磺酰/亚胺。
《基本规则》规定:“四音节及四音节以上表示一个整体概念的名称,按词或语节(词语内部由语音停顿而划分成的片段)分写,不能按词或语节划分的,全都连写。”与上述糖精的化学名那样超过五音节的化合物名称相比,四音节或五音节的化合物名称相对简单些,如“乙酰甲酸、乙酸异戊酯”,按照语音节律和语义结构可划分为:乙酰/甲酸、乙酸/异戊酯。
科技名词在语篇中使用时,着眼的是其整体概念,需要在拼写形式上突出其整体性;而在词典中作为一个词目出现时,着眼的是其内部结构,需要在拼写形式上反映其内部结构的层次。正是这种着眼于语篇所要求的整体性和着眼于词语内部所要求的分析性的不同,反映了整体概念与词语内部语音节律、语义结构的矛盾。
就化合物名称的拼写问题,《现代汉语词典》试印本所附的《〈现代汉语词典〉注音连写、大写、隔音暂用条例》[5]专门做了规定:
(1)一律用短横把其中的化学成分隔开。例如:
硫酸-钠 氧化-铁 蛋白-胨 苯-甲酸
(2)“过”“高”二字之后另加短横。例如:
过-锰酸-钾 高-锰酸-钾
这种拼写形式既照顾了词目的整体性又考虑了词目的内部结构,不失为一种两全其美的办法。但这种拼写形式带来的问题是短横(连接号)太多,比较烦琐。在给词典注音时,我们把连接号主要用于并列成分之间(详见难点之四),而且按照语音节律中“以双音节成分为语节单位、单音节成分不挂单”的规律,做了或分写或连写的处理(详见难点之二)。
以上讨论了化合物名称的拼写。其他类别的科技名词我们也按照“按词或语节分写”的原则进行拼写。如:中医学名词“异物/入/耳”“阴/极/似/阳”,信息学名词“点/对/点/连接”,军事学名词“空/对/地/导弹”,计量学名词“瓦特/小时”。
二 分词连写中语音节律和语义结构的矛盾
汉语拼音拼写的主要规则是分词连写,分词连写的依据既要考虑语法上以词为单位及语义上的完整性,也要考虑语音节律,满足听觉心理(语感)和视觉心理的要求。一般说来,拼写时语音节律和语义完整二者是可以兼顾的,但也有彼此矛盾,不可得兼的情况:
1.单音节成分前面或后面只有一个连写成分时,单音节成分跟它前面或后面的连写成分一起连写。如:加辅料炒(加辅料+炒)、臂神经丛(臂+神经丛)、增白蛋白药(增+白蛋白+药)、透气式防毒服((透气+式)+(防毒+服))、抗胆碱酯酶药(抗+胆碱酯酶+药,其中“胆碱酯酶”由“胆碱酯+酶”组成,是一个连写单位)。
2.单音节成分居末、前面是分写成分的情况。如“(2+2)+1”,即定语为四音节,内部是“2+2”,而中心语为一音节的模式。按照冯胜利的右向音步模式理论[6],其结构层次的音步被划分为“2+3”。在这种情况下,分词处理就要着眼于语流音步模式,而与其结构层次并不一致。如“普通质量钢”,“普通”与“质量”是一对直接成分,合起来做中心语“钢”的定语,但在语流中跨层组合为一个“2+1”式超音步“质量钢”,拼写为:普通/质量钢。又如:路基/修整机(路基修整+机)、金刚/宝座塔(金刚宝座+塔)。endprint
专有名词的拼写形式需要将通名部分和专名部分区分开来,通名部分和专名部分需要分写,各分写部分分别大写。在这种情况下,通名即便是单音节也需要分写。如:“伤寒杂病论”拼写为:Shānghán Zábìng Lùn,“神农本草经”拼写为:Shénnóng Běncǎo Jīng。
3.单音节成分居前、后面是分写成分的情况。如“1+(2+2)”,即一个单音节成分限定后面整个多音节成分的模式。在这种情况下,就需将这个单音节成分与邻近的双音节成分分写,以凸显单音节成分对整个多音节成分的限定。如 “真两性畸形”,“真”限定“两性畸形”,拼写为:真/两性/畸形。又如“牛/海绵状/脑病” “圆/内接/多边形” “反/弹道/导弹/导弹” “拟/副/交感/神经/药”。
根据以上规则,一些对应的异名名词的拼写形式并不相同。以下各组对应异名名词中左边为分写,右边为全连写:真/两性/畸形,真阴阳症;皮质/促素,促皮质素;密封/舱室,密封舱。
4.多个单音节成分叠加的拼写。吕叔湘先生曾指出这类现象:“有时候语素排列跟结构层次一致,但是语音段落跟它们不一致,也会引起对结构的错觉。”[7](笔者按:吕先生此处说的“语音段落”即“语音节律”)他举“大型车道”为例,按结构层次为“(大型+车)+道”,但按照语音节律为“大型+(车+道)”。与“大型车道”相类似,“艾滋病病毒”的台湾名“爱滋病毒”的结构层次为“(爱滋+病)+毒”,但按照语音节律为“爱滋/病毒”。又如“电子能谱仪”的结构层次为“(电子能+谱)+仪”,按语音节律为“电子/能谱仪”; “超强台风”的结构层次为“超+(强+台风)”,按语音节律为“超强/台风”。
上述情况限于两个单音节成分合起来又成词的情况,如果不能成词或者不常见,还是应该处理为连写。如“构造用钢”,结构层次为“(构造+用)+钢”,处理为连写(类似的“生活用水”因“用水”常见,则可处理为“生活/用水”)。又如“罗马柱式”,结构层次为“(罗马+柱)+式”,“柱式”这种组合常见(如多立克柱式、科林斯柱式、塔司干柱式等),作为一个词看待,处理为“罗马/柱式”。再如“常温压焊”指在常温下只靠外加压力使金属产生强烈塑性变形而形成接头的焊接方法,也叫冷压焊,结构层次为“(常温+压)+焊”,处理为连写。
三 在正确理解知识内涵的基础上做出恰切拼音
给语言单位进行拼写时,首先需要理解该语言单位反映的内涵,分析该语言单位的语义结构。科技名词反映了各个学科的专业知识,只有在正确理解其知识内涵,弄清得名之由以后,才能分析其语义结构,给出恰切拼音。与普通名词相比,科技名词这种情况表现得尤为突出,不少词目需要查阅相关资料才能判断。试举5例:
1.嘉应子。李子的异名“嘉应子”,词典初稿注音为jiāyīngzǐ。现代闽南地区的特产嘉应子(又写为“加应子”)指用话梅、李子制作而成的果脯,我们怀疑此名跟广东梅州的古称“嘉应”有关。查嘉应州系清雍正十一年由程乡县升格而成,“嘉应”得名之由一说因当地盛产嘉应子而来,可见嘉应子在前,嘉应州得名在后。据南宋程大昌《演繁露·嘉庆李》记载:“韦述《两京记》:‘东都嘉庆坊有李树,其实甘鲜,为京城之美,故称嘉庆李。今人但言嘉庆子,岂称谓既熟,不加李亦可记也。”由于“庆”“应”谐音,“嘉庆子”又名“嘉应子”。 因此,“嘉应子”应注为jiāyìngzǐ。
2.京山梅花。按照语音节律,“京山梅花”可划分为:京山/梅花。“京山”是否跟湖北省的县名“京山”有关?查词典释义,注为“即‘太平花”,“太平花”释为:“学名:Philadelphus pekinensis又称‘京山梅花。虎耳草科山梅花属。……在中国,分布于内蒙古、辽宁、河北、河南、陕西、山西、湖北等省区。”该植物为山梅花属,学名中的pekinensis指明了产地北京。再查相关资料得知“太平花”主要分布于中国华北,为河北省省花。因此可以肯定,“京山梅花”的语义结构是“京+山梅花”,其中的“京”为“北京”,得名与“湖北京山”无关,处理为连写,拼写为:jīngshānméihuā。
3.藏经楼。词典释义为“用于储藏佛教经典的楼阁式建筑”,根据这一释义,“藏”是动词“储藏”义,读为cángjīnglóu无疑。但是按照佛教传统的说法,藏经楼用于搜集佛教所有的经律论三藏,好像佛经的库藏一样。“藏”指“经律论三藏”,应读为zàngjīnglóu。词典所释为现代通行读法,为了向读者交代另有一个读音,在此条下加了知识窗。
4.井干式。“井干式”是一种建筑样式,将原木粗加工后嵌接成长方形的框,然后逐层再制成墙体,再在其上面制作屋顶。与“井干式”经常对举的有“干栏式”,是指用竖立的木桩构成底架,建成高出地面的一种房屋。今西南某些地区还继续使用。人们很容易把“井干式”的“干”与“干栏式”的“干”联系起来,注为gān。进一步查找资料,我们发现,“井干式”的繁体字为“井幹式”,也作“井榦式”,“榦”通“韩”。据《说文》,“韩,井垣也。”井垣即井栏。《汉语大词典》“榦”立了hán的音项,因此“井干式”的“干”应注为hán,如果按照“榦”的现代通行音,也可注为ɡàn。
5.伤寒卒病论。根据中医学专家对词典初稿的意见,“卒”读cù,同“卒中”之“卒”。考证这部书书名沿革,《隋书》所载为《张仲景辨伤寒》,《唐会要》所载为《张仲景伤寒论》,《新唐书》所载为《伤寒卒病论》,宋代始名《伤寒杂病论》。《伤寒卒病论》书名在前,因“卒”“杂”字形相似,后世以《伤寒杂病论》书名通行。“卒病”指“致死之病”,“卒”当为“死”义,因此“伤寒卒病论”的“卒”当注为zú。
四 用于合称的连接号使用
汉语拼音拼写时,连接号是经常使用的一个重要符号,连接号形式为短横“‐”,体现了连接号前后成分之间的相互联系,是介于分写、连写之间的表示半连写的一种手段。这里重点探讨其用于合称的使用。endprint
1.用于并列合称的拼写。如寸口脉诊法中的三个诊脉部位“寸关尺”,拼写为:cùnguānchǐ。“星箭分离”中的并列合称“星箭”为分离的两个主体,拼写为:xīngjiàn fēnlí。“空地导弹”中的并列成分“空地”为导弹发射的起讫点,拼写为:kōngdì dǎodàn。“亲子鉴定”中的并列成分“亲子”指血缘关系中“父母亲”与“子女”,拼写为:qīnzǐ jiàndìng。
属于连写成分内部的并列合称,不需要加连接号。如“信噪比”中“信噪”为并列合称,应拼写为:xìnzào,但其后的“比”为单音节成分,需要跟前面的成分连写,这样就无须再加连接号,拼写为:xìnzàobǐ。同样情况如“母子式渔船”中的“母子式”拼写为:mǔzǐshì。
2.用于多重并列成分的拼写
词目中的连接号在汉语拼音拼写时通常直接移用。如“数模转换”的台湾名“数位-类比转换”拼写为:shùwèilèibǐ zhuǎnhuàn。需要注意的是,如果连接号前后的语言单位内部并非连写的拼写单位,若加上连接号,会造成语义结构关系的混乱,这种情况下应删去第一层并列成分之间的连接号,成为分写的两个部分。如“欧亚—西伯利亚大陆桥”,“欧亚”和“西伯利亚”是并列成分,表示该大陆桥的起讫点,其中“欧亚”又是一个并列成分,拼写时需删去第一层并列成分“欧亚”和“西伯利亚”之间的连接号,保留“欧”“亚”之间的连接号。“欧亚—西伯利亚大陆桥”拼写为:uYà Xībólìyà Dàlùqiáo。与此相类似,“亚欧—新海大陆桥”中的“新海”指陇海铁路和兰新铁路中的新疆和海州(连云港)两个地名,拼写为:Yàu XīnHǎi Dàlùqiáo。
五 相关词目的系统性和一致性
1.基于概念树的词目系统性
科技概念通过科技名词来表达,相关科技概念之间具有层级性,构成概念树。在科技名词拼写中,应考虑科技概念之间的相互关系,注意相关词目收词的平衡和释义的照应,给词目做出恰切拼音。
以“全球导航卫星系统”为例。“全球导航卫星系统”又称“全球卫星导航系统”,目前世界上主要有美国的“全球定位系统” (GPS)、俄罗斯的“全球卫星导航系统” (GLONASS)、欧洲的“伽利略卫星导航系统”(Galileo)和中国的“北斗卫星导航系统” (BeiDou,也称为COMPASS)。上述四大导航系统中,词典初稿漏收了俄罗斯的“全球导航卫星系统”这个专有名词,“全球导航卫星系统”只作为普通名词出现;与此相反,美国的“全球定位系统”这个专有名词也是普通名词,词典初稿漏收了这个义项。换句话说,“全球导航卫星系统”和“全球定位系统”既是普通名词,又是专有名词。我们补出了相应义项,并按照专有名词内部各分写部分的首字母大写的规则,进行专名拼写标注。
跟“全球导航卫星系统”相关的科技名词有“导航定位卫星”“卫星制导”“卫星导航”等,这些词目的收录、释义都需要注意相关词目的照应,拼写时也要注意其系统性。如用“全球定位系统”构成的科技名词有“全球定位系统制导”(台湾名为“GPS导引”),是为美国三军建立的一个战略性全球导航和武器投放系统,其中的“全球定位系统” (GPS)就是美国的导航系统这个专有名词,“制导”为普通名词。“全球定位系统制导”拼写为:Quánqiú Dìngwèi Xìtǒng zhìdǎo。
2.同类词目处理的规则一致性
作为一部词目数以万计的工具书,词目的系统性和一致性显得十分重要。这需要我们按照词目特点运用合适的规则拼写,做到同类词目处理的规则一致性。
内部含有标点符号的词目的拼写。如逻辑运算“门”有“‘或门”(台湾名“间或闸”)、“‘非门”(台湾名“反闸”)、“‘等价门”(台湾名“等效闸”)、“‘异或门”(台湾名“互斥或闸”)等名词,大陆名中有引号,这些含引号的词目怎么处理?引号前后是否空格?按照汉语拼音标点符号通常直接移用中文标点符号的规则,我们把这些“1+1”“2+1”词目处理为连写,并在对应的位置加上引号,引号前后没有空格。如“‘或门”拼写为:“huò”mén,“‘异或门”拼写为:“yìhuò”mén。台湾名“互斥或闸”结构为“2+1+1”,需分为三段,拼写为:hùchì huò zhá。
普通名词中含有专有名词成分的拼写。科技名词通常为普通名词,有些科技名词内部含有专有名词成分,如果这个普通名词整体为一个连写成分,首字母小写;如果是分写形式,则其中的专有名词成分保留首字母大写的拼写形式,其他分写部分首字母小写。如:
孔庙kǒngmiào(Kǒng+miào),比较:文庙wénmiào(wén+miào)。
关帝庙guāndìmiào(Guāndì+miào),比较:武庙wǔmiào(wǔ+miào)。
麦尔登呢màiěrdēngní(粗纺毛织物名,首先产于英国麦尔登)
康拉德界面Kānglādé jièmiàn(地壳分界面,由地质学家康拉德发现)
六 结 语
上述所列各项,是我们在按照《基本规则》给《两岸科技常用词典》注音过程中遇到的主要难点。所谓难点,也就是拼写中不循常例的一些极少数的甚至是个别的现象。能不能发现拼写难点,考验的是我们对汉语拼音拼写规则的熟悉程度;能不能处理好拼写难点,考验的是我们在汉语拼音拼写规则之外的知识水平。在运用《基本规则》拼写科技名词的实践过程中,我们一直注意梳理这些拼写中的难点,力求妥善处理,但是由于目力和学养所限,疏漏不周之处在所难免,期待读者批评指正。
参考文献
[1] 中国国家标准化管理委员会. GB/T 16159-2012 汉语拼音正词法基本规则[S]. 北京:国家技术监督局,1996
[2] 教育部语言文字信息管理司.《汉语拼音正词法基本规则》解读[M].北京:语文出版社.2013.
[3] 董琨主编.汉语拼音词汇(专名部分)[M].上海:上海辞书出版社.2015.
[4] 周有光.正词法的内在矛盾[J].文字改革,1983(9): 2-5.
[5] 中国社会科学院语言研究所词典编辑室.《现代汉语词典》注音连写、大写、隔音暂用条例[M].北京:商务印书馆,2004.
[6] 冯胜利.论汉语的“自然音步”[J].中国语文.1998(1): 40-47.
[7] 吕叔湘.汉语语法分析问题[M].北京:商务印书馆.1979:35.endprint