医学术语语言特征的定量研究

2024-10-11 00:00万梅
中国科技术语 2024年4期

摘要:医学术语指称医学领域的专业概念,是汉语词汇系统的组成部分,其语言特征包括组成部分、结构形式都符合汉语的形成和发展规律并表现出特有的性质。运用定量研究方法,以语料库医学术语为研究对象,对医学术语的用字、词类、音节数量、结构类型等进行详细考查,可以了解这类特殊用语的命名理据和构造规律,为医学术语的规范化提供本体依据。

关键词:医学术语;语言特征;定量研究

中图分类号:N04;R3文献标识码:ADOI:10.12339/j.issn.1673-8578.2024.04.008

Abstract: Medical terminology refers to professional concepts in the field of medicine and it is an integral part of the Chinese vocabulary system. Language features of medical terminology including components and structural forms follow the regularity of Chinese formation and development with its own properties. This article conducts a quantitative research to examine the characters, word class, number of syllables, structural types of medical terminology based on a corpus, in order to explore the naming motivation and structural rules of these special terms, and provide ontological basis for the standardization of medical terminology.

Keywords: medical terminology; language features; quantitative research

0引言

术语具有二重性即专业属性和语言特征。术语指称特定领域内的专业概念,与该领域的概念体系相对应,满足单义性、理据性、系统性等要求,但其构成和一般词语一样,也是以某种自然语言的词汇单位为基质的。术语,也就是词,词所具有的任何语言特征术语也都具有[1]。医学术语既是指称医学领域专业概念的单位,同时也是语言单位,是汉语词汇系统的重要组成部分。我国的现代医学是通过引进西医逐步发展起来的,虽然医学术语较多来源于外语词的翻译,但其组成部分、结构形式都建立在我们民族自然语言即汉语的基础上,符合汉语的形成和发展规律。作为专业用语,医学术语在此方面和一般词语既有共性也表现出特有的性质和规律。对医学术语的语言特征包括其用字、词类、音节数量、结构类型等进行定量研究,可以了解这类特殊用语的命名理据和构造规律,为医学术语的规范化提供本体依据,促进术语标准化发展。

已有的关于医学术语的研究涉及领域广泛,较多关注中文医学术语的标准化建设[2]、医学术语翻译等内容[3]。但以标准术语集为研究内容,结合语言学和医学的跨学科研究方法为基础的语料库研究并不多见。本文以语料库医学术语为考察对象,运用定量的研究方法,突出“对特定范围内材料忠实而详尽的描写”[4],对医学术语的语言特征进行详细考察和分析,以了解其构造形式和结构内容。考虑到研究的实用性和科学性,研究语料主要来自于人民卫生出版社出版的《医学英语词汇》[5]中的医学术语,以临床学科医学术语为主;增录了人民卫生出版社出版、供全国高等学校医学类专业使用教材中所附的医学名词索引(以临床学科为主),并以全国科学技术名词审定委员会发布的《医学名词》系列包括《细胞生物学名词》[6]《人体解剖学名词》[7]《药学名词》[8]《显微外科学名词》[9]《呼吸病学名词》[10]等所收录的医学术语为参考,共收集医学术语6603条。

1医学术语的构造形式

现代汉语中合成词占优势,特别是由两个或两个以上语素结合在一起构成的复合式词语占了大多数,总体来说较为齐整并易于分析。作为汉语词汇系统的组成部分,医学术语在构造形式上与一般词语有相同之处,但也因词语来源、使用范围等方面的不同而存在差异。从其进入汉语词汇系统的方式来看,主要采取的是意译、音译的方法,将其从音素词转化为汉字的组合,例如术语“支气管炎(bronchitis)”“利胆药(choleretics)”“恩替卡韦(entecavir)”等,此外,还有一些特殊类型的术语如字母词、数字词等。文章首先考察其外在构造形式包括用字、音节数量等的分布情况,这对于分析医学术语的定名具有重要意义。

1.1医学术语的用字

医学术语的用字是指本研究语料库中全部6603条医学术语所使用的汉字。医学术语大多源自外语,并通过翻译方式进入汉语词汇系统。通过对语料库中全部医学术语做穷尽性的考察,根据来源途径可将其分为五大类:意译词、音译词、字母词、数字词以及其他,数量、占比及例词见表1。

可见,意译是医学术语进入汉语词汇系统的主要方式。史有为曾对汉语意译词占优势的情况进行了阐释:“汉语词音长度的最佳区间,汉语的语素单音节倾向,汉语的语词系列化或系统化要求以及汉人的认知特点大都有利于意译词而不利于音译词。”[11]意译词数量居多现象的原因与汉语言文化、民族认知心理紧密关联,其中尤为突出的因素应该是汉字的表意特征。音译词在汉语中无法“见形识义”,没有广泛流行的先天优势。除了意译词、音译词、字母词和数字词这四类以外,还有11例医学术语较为特殊,它们由汉字、字母和数字共同构成,例如“甲型H1N1流感”,这类术语在本研究中数量不多,不作为主要分析对象。

从属于表音文字的外语词转化为表意文字的汉语词,医学术语在选字方面的特征、规律和一般词语相比所体现出的特点,可以通过统计考察其用字进行相关分析。我们对语料库中全部医学术语进行统计,去除其中的英文字母、阿拉伯数字以及特殊符号(如“-”),发现6603条医学术语共使用了1001个汉字,使用次数从1~1292次不等。首先,为了考察医学术语用字的通用化和规范化程度,我们将以上全部1001个用字与教育部、国家语言文字工作委员会2013年制定并公布的《通用规范汉字表》进行对比分析。研究发现:上述用字中,有922个用字在一级字表中,75个在二级字表中,三级字有1个(哒),只有3个用字(崀、矽、铕)不在字表内。可见,医学术语的用字基本未超出《通用规范汉字表》所收录的汉字,考虑到了译词的接受性和使用度。其次,考察所有用字的使用频率。我们将1001个用字的使用次数按照1次、2~9次、10~99次、≥100次的标准分成四个等级,各等级的用字数量和所占比例见表2。

根据上表中划分的四个等级,我们将全部用字按照使用次数由低到高分为单次字、罕用字、常用字和高频字。单次字是指仅出现1次的用字,共93个字;罕用字指出现次数为2~9次的用字,共503个字;常用字的出现次数介于10~99次,共372个字;高频字指所有出现次数在100及以上的用字,共有33个。我们着重对其中的高频字和仅出现1次的单次字进行了详细考察,重点分析它们的分布及构词特征,这将有助于了解医学术语的构成和定名规律。

高频字参与构成了大量医学术语。通过分析字义以及在术语中出现的位置,发现大部分高频字的构词功能较为一致,有章可循。例如,“性”在本研究语料库的医学术语中出现次数多达1292次,主要作为后缀,构成如“急性”“先天性”“继发性”等修饰语;“病”“炎”“症”“瘤”等作为疾病的类别名称,在医学术语中多用于指称属概念,常作为中心语成分构成诸多下位概念如“肾病”“脑膜炎”“淋巴瘤”等;“肾”“心”“肺”等作为人体器官的指称,同上述指称疾病类别概念的“病”“炎”一样,常作为中心语构成下位概念如“肾病”“心包炎”“肺炎”等。这些高频字构词能力强,指称的大多是医学领域中的类别概念,作为上位概念的构成成分可以形成语言形式上层级分明的系统,对应概念体系中不同的层级关系。

对单次字在医学术语中的分布情况进行考察,发现这些字在其中大多是作为修饰、限定成分,并呈现出一定的形象性和比喻意义,如“镰状细胞”“鹰嘴骨”“猫抓伤”“琥珀胆碱”“舞蹈病”等,还有的是来自音译词部分的后期造字,如“呋塞米”“卟啉”“氩气刀”等。前一类在日常语言中较为通用,形象特征明显;后一类大多与元素有关,多为音译时给已有汉字加上表示类别的偏旁另造的新字。

总体来说,医学术语作为专业用语在用字方面兼有通用性和中立性的特点:一方面,用字基本未超过《通用规范汉字表》所收录的汉字,生僻字不多,考虑到了术语的接受性和使用度;另一方面,医学术语倾向于使用表示中性意义的字,使得医学概念的表达准确、科学,一般不易产生联想意义;再者,尽量选择书写简便的字也是考虑因素之一,这是语言的便利性要求所决定的。

1.2医学术语的音节数量

在词的诸多特征中,长度是最基本且易于量化的词汇结构属性特征之一。音节是测量汉语词长的单位,一般可以采取一个汉字一个音节的方法[12]。杨锡彭指出,汉语词的音节数量“一般不超过3个音节,其中双音节词和单音节词占大多数,4个音节以上的主要是成语等熟语性质的单位”[13]。医学术语大多通过翻译途径从其他语言进入汉语词汇系统,了解其在词长分布方面的特点,有助于进一步认识这类专业术语的形式特征。排除语料库中含有字母、数字及其他特殊符号的医学术语如“CT血管造影”“2型糖尿病”“神经营养素-3”等,我们对其余全部6360个医学术语包括词和短语的音节特征进行统计分析。

统计发现,医学术语的音节数量呈现多样、悬殊的状态,具体音节数从1到19不等。其中,单音节词数量不多,只有27个;四音节的词和短语在语料库中数量最多,共有1587个,其次是五音节,共有1006个。医学术语的音节数量及分布的详细情况见表3。

从音节数量的总体情况来看,医学术语并不符合汉语词汇以双音节为主的音节特征,这是医学术语和一般词语的不同点之一,原因与医学术语的来源以及专业属性有关。一方面,医学术语主要译自英语词,源词语的结构、音节数量对汉译词的词长有一定影响,尤其是经音译途径进入汉语的医学术语,为了在源词语的发音基础上尽量保持两种语言的语音相似,加上英语中大量存在的复辅音转化为汉语时只能用音节去对应,最后形成汉译的医学术语多在三音节及以上数量。例如源词语“kratom”仅有两个音节,音译为“克腊托姆”(一种咀嚼剂)进入汉语,虽然音节数量增加,但保持了同源词语的语音对应。另一方面,术语的外在形式和概念内容紧密相关,医学术语指称医学领域的专业概念,医学概念本身的专业性、内涵的丰富性决定了其表征形式的复杂性,尤其对于汉语这类缺乏形态特征的语言来说,一定的词长是准确表达概念内涵的重要途径。例如“淋巴核素扫描显像(lymphoscintigraphy)”一词,源词语是词根和词缀的组合,这一概念在汉语中必须经由一定数量的词语搭配,符合汉语的结构形式才能准确指称复杂的综合特征,因此较多的音节组合不可避免。

2医学术语的结构类型

术语一般包括词和短语,前者有单纯词和合成词之分,合成词主要有复合式、重叠式和附加式三种构词方式。医学术语中短语占大多数,无论组成短语的音节数量有多少,因该短语是表达医学领域某一特定概念的语言形式,其内部结构必然符合汉语短语的构造规律。此外,还有字母词、数字词等特殊形式的医学术语,所对应的也是相关的医学专业概念。

2.1医学术语词

医学术语中的单纯词数量不多,多是单音词或音译词,如“痈”“吗啡”“纳洛酮”等。医学术语单纯词的结构较为单一,没有汉语一般词语中的联绵词、叠音词,且单音词多为表示疾病、身体部位、药物等类别的上位概念术语,是属概念的指称,有较强的构词功能。音译的单纯词多是对源词语的拟音而来,构词成分之间往往不发生意义关系。

医学术语中的合成词有复合式和附加式两种,没有重叠式。根据统计,本研究语料库的医学术语复合式合成词中,以偏正式居多,其次是主谓式、动宾式、动补式和并列式。不同结构的数量、占比和例词详见表4。

附加式的合成词由词根和词缀一起构成,又叫派生词。根据词缀所在的位置主要分前加式(前缀+词根)和后加式(词根+后缀)。前加式派生词在本研究对象中不多,这种构词方式不是医学术语形成的主要途径,而后加式则较为普遍。根据统计,上述三个后加词缀在医学术语中的构词能力很强,其中后缀“性”附加在词根后构成的派生词有78个,后缀“化”构成派生词39个,后缀“型”构成的派生词有35个。“性”和“型”作为医学术语的构词后缀,一般用于说明疾病的特征、症状等,对中心语起修饰、限定的作用,如“急性胰腺炎”“先天性心脏病”“乙型肝炎”“扩张型心肌病”等;“化”作为后缀,主要用于描述器官、病情、体征等各方面的变化,如“肺纤维化”“肝硬化”等。这类构词后缀的能产性和使用率普遍较高,在短语中也大量出现,用于表达知识的进一步深化,是指称复杂概念的有效手段。

2.2医学术语短语

短语虽然由词构成,形式上可长可短,但是作为专业名词的医学术语指称的是特定的专门概念,其所具有的专业性、科学性、标准化的特点决定了医学术语中的短语一般都是固定组合,无论是字数、结构形式都不能任意增删、改变,具有十分稳固的特点。医学术语短语中偏正结构的组合最多,其次是主谓结构、述宾结构、述补结构和联合结构,详细统计情况见表5。

因为偏正结构反映修饰和被修饰的关系,短语的中心语可以搭配一个或多个修饰语来表达限定的意义。医学术语中有很多基础概念如属概念、上位概念,指称下位概念的术语常以上位词作为中心成分,以其为中心构成很多下位词,偏正结构的中心语和修饰成分组合能恰当地指称这类概念,例如“内镜下食管静脉曲张套扎术”,这是一个多层偏正结构,“术”是一个高频字,表示“方法”“技术”,“套扎术”的内涵较广,加上限定成分“食管”“静脉曲张”“内镜下”,完整、准确地指称了这种针对食管静脉曲张破裂出血和预防出血的治疗方法。主谓结构反映的是主体的行为、状态等方面的内容。人体的器官、组织、体液等组成部分的各种变化是医学的主要研究内容之一,指称这类概念的医学术语数量较多,多是主谓结构,例如“肾小球硬化”“脾功能亢进”“上消化道出血”等。述宾结构是汉语词汇中普遍存在的结构类型,但在医学术语短语中数量不多,这与医学术语源词语的译法有关。例如“心脏移植(heart transplant)”,这一术语其实表达的是述宾结构“移植心脏”的意思,受源词语的影响直译为“心脏移植”(主谓结构)。这类术语还有很多,如“胰岛素输注”“断指再植”“心肌保护”等,都是按照源词语形式上的顺序直译而来,没有将其转变为汉语中的述宾结构。医学术语中的述补结构多表示体征、症状或治疗的发展程度,如“心动过速”“通气不足”等。联合结构所表示的两项或两项以上相互间类似、并列的关系并不是表征医学术语这种具有严格外延和内涵限定的专业词语的主要方式,很多时候不能满足术语指称单一概念这一要求,因此在医学术语的表达形式上不多见,本研究中一共有67例。

2.3其他类型的医学术语

除了上述全部由汉字构成的词和短语以外,医学术语中还有很多含有字母、数字等构成成分的词语,根据其外在形式的特点,主要分为字母词和数字词两大类进行考察。

医学术语字母词可分为两类,一类是由英语字母加上汉字共同构成的词语,例如“B型利钠肽”;另一类是完全由英语字母构成的源词语的全称缩写,例如“ICU”(Intensive Care Unit,重症监护治疗室)。在本研究语料库中共有126例字母词。第一类,从字母所在的位置来看,有字母在前的如“T波交替”,字母在中间的如“周围T细胞淋巴瘤”,也有字母在后面的如“环孢素A”;从字母的表义作用来看,分为以下几种情况:(1)字母用于类别的顺序,如维持身体健康必需的有机化合物维生素就有维生素A、维生素B、维生素C等不同种类,这里的字母用于给不同的类别排序;(2)字母的外形表义,如“T波”“T细胞”等;(3)字母表示“未知”的意思,如“X射线”“X染色体”“Y染色体”中的字母X和Y,是由于最初发现该物质时对其功能不明,因此用数学中表示未知数的字母来命名。第二类中较为通用的有“CT”(计算机断层扫描)、“MRI”(磁共振成像)等,而“PTC”(经皮肝穿刺胆管造影)、“PACU”(麻醉后恢复室)、“RA”(类风湿性关节炎)则多是专业程度较高、只有医学专业人员才了解其义并在专业范围内使用的医学术语。

医学术语中数字词不多,这里的数字包括阿拉伯数字和罗马数字两种,主要用来表示类别、等级等,前者如“1型糖尿病”“2型糖尿病”等,后者如神经损伤分类法中按照损伤程度分为五度,分别用罗马数字Ⅰ、Ⅱ、Ⅲ、Ⅳ、Ⅴ表示不同程度。此外,也有数字、字母同时出现在某一术语中如“甲型H1N1流感”,其中的字母和数字组合表示流感病毒的类别,这类组合在医学术语中不多见,本研究中还有“同侧C7神经根移位术”“低T3综合征”“IL-1拮抗剂”等。

3医学术语的词性特征

关于医学术语的词性特征,主要考察的是医学术语词的词类、分布以及医学术语短语的词性序列及分布情况。

3.1医学术语的词类分布

汉语划分词类的主要依据是语法功能,同时以形态和意义作为参考。但是,汉语词类的划分至今仍有分歧,各家分类的数目和名称不完全一样。存在分歧的原因首先在于各家依据的分类标准不同,其次,汉语的词本身没有形态依据或词类标记[14]。医学术语作为汉语词汇系统的组成部分,在分析词性特征时也可能遇到同样的困难。但是,术语不同于普通词语,“词性大多单一”[15]。术语的本质是称名功能,名词以及在名词基础上构成的词组是专业术语的主体,由名词构成的术语其名词性特征恰恰与它面对的称名任务相符合[16]。经过统计分析,医学术语的词性特征总体与以上论述相符,也是以名词和名词性短语为主,动词和动词短语次之,形容词和形容词短语的数量相对不多。我们首先考察语料库中全部医学术语词所属的词类以及分布,不同词类医学术语的数量、比例及例词见表6。

医学术语的词类主要集中在上述三种,数量最多的是名词,其次是动词和形容词。需要说明的是,其中有些术语属于兼类词,有的兼有名词和动词的性质,如“感觉”“化疗”,这些术语在不同的语境中可能发挥不同的语法功能。对于这种情况,计数时一般在不同的词类中各计一次。

短语也可以从整体语法功能上进行分类,主要有名词性短语、动词性短语、形容词性短语等[17]。根据这种功能分类,对医学术语短语的类别进行统计分析,详细情况见表7。

本研究语料库中医学术语短语共有4978项,根据功能划分有名词性短语、动词性短语和形容词性短语,没有其他功能类型。其中,名词性短语数量最多,共3481项;其次是动词性短语,共1086项;形容词性短语相对较少,共411项。这与医学术语主要发挥的概念称名作用相符,多是指称医学领域内的事物或现象等。医学术语短语基本都是单义的固定短语,表达相对应的医学概念,其中的组成成分一般不能任意增减或更换。

3.2医学术语短语的词性序列分布

汉语短语的组成手段主要是语序和虚词,语序就是构成短语的词的排列顺序,还可以按照构成短语的层次将其分为简单短语和复杂短语。医学术语短语大多是多层的复杂短语,将其组成部分按照词性排列得出医学术语短语的词性序列。对本研究语料库的医学术语短语进行统计、分析后,出现频率最高的前10种短语的序列形式见表8。

从上表可见,“名词+名词”的词性序列在医学术语短语中最为常见,这种组合通常是表达下位概念的有效方式,从结构类型上看,与医学术语中偏正结构短语数量最多的情况相符。例如表中的“房室旁道”指的是心房与心室之间的一条附加旁道,即“房室的旁道”,术语表达的含义可从这两个名词的组合推导出来。“名词+名词+名词”和“形容词+名词”的词性序列在医学术语短语的组合中数量次之,这与医学术语中以名词短语居多的现象相符。了解医学术语的词性序列对于掌握该术语指称的概念具有辅助作用,根据医学术语的结构特点,复合形式的短语占大多数,这方面研究可以为医学术语教学方法的改进提供有效途径,特别是对于那些指称丰富的概念内涵、构造形式复杂的术语来说,了解其中心成分以及多重修饰部分的意义将有助于迅速、准确地掌握术语的整体概念含义。

4结语

综上所述,我们对医学术语的语言特征包括组成部分和构造形式有了如下了解:医学术语主要包括全部由汉字构成的词和短语以及一些由字母、数字构成的特殊类型的词语。其中,单纯词主要有单音节词和音译词两种,总体数量不多,合成词中以偏正式为主,其次是主谓式,动宾式、动补式、并列式的词数量不多。从词类性质来看,名词居多,其次是动词,形容词数量相对较少。短语特别是偏正结构的短语在医学术语中占绝大多数,主谓结构短语次之,述宾结构和述补结构相对较少,联合结构最少。从词类性质来看医学术语短语,其中名词短语数目最多,其次是动词短语和形容词短语。医学术语多是复杂短语,词性序列多样,但基本序列是“名词+名词”,通过多层组合的形式表达丰富的概念内容。不同结构的词和短语的数量与医学术语本身的专业性、科学性、系统性等特点和要求有关,也与其来源即外语词的构造有关,在汉语词汇的句法基础上,这两方面因素共同作用,决定了医学术语在形式结构方面的特征。本论文的研究结果有助于了解医学术语的命名理据和构造规律,为医学术语的规范化提供本体依据。

参考文献

[1] 郑述谱.术语学论集[M].北京:商务印书馆,2014:30.

[2] 胡建平,张晓祥.中文医学术语标准体系构建研究[J].中国卫生信息管理杂志,2023,20(1):13-18.

[3] 万梅,吴娟娟.外来术语音译的语音对应研究:以西药名词为例[J].淮北师范大学学报,2022,43(4):78-84.

[4] 苏新春.词典与词汇的计量统计[M].上海:上海辞书出版社,2013:5.

[5] 孔令泉,蒲莹晖.医学英语词汇[M].北京:人民卫生出版社,2014.

[6] 全国科学技术名词审定委员会,细胞生物学名词审定委员会.细胞生物学名词[M].北京:科学出版社,2009.

[7] 全国科学技术名词审定委员会,人体解剖学名词审定委员会.人体解剖学名词[M].北京:科学出版社,2014.

[8] 全国科学技术名词审定委员会,药学名词审定委员会.药学名词[M].北京:科学出版社,2014.

[9] 全国科学技术名词审定委员会,显微外科学名词审定委员会.显微外科学名词[M].北京:科学出版社,2016.

[10] 全国科学技术名词审定委员会,呼吸病学名词审定委员会.呼吸病学名词[M].北京:科学出版社,2018.

[11] 史有为.异文化的使者:外来词[M].长春:吉林教育出版社,1991:22.

[12] 刘海涛.计量语言学研究进展[M].杭州:浙江大学出版社,2018:26.

[13] 杨锡彭.外来词的语音汉化[J].北华大学学报,2007(4):56-62.

[14] 黄伯荣,廖序东.现代汉语[M].北京:高等教育出版社,2011:34.

[15] 王有志.科技术语的词类[J].中国科技术语,2008,10(4):9-11.

[16] 孙寰.术语的功能与术语在使用中的变异性[M].北京:商务印书馆,2011:209.

[17] 全国科学技术名词审定委员会,语言学名词审定委员会.语言学名词[M].北京:商务印书馆.2011:61.

作者简介:万梅(1982—),女,博士,安徽医科大学国际教育学院副教授,从事国际学生医学语言教学和研究。主要研究方向为术语学、汉英语言文化比较,关注医学和语言学的学科交叉及相关领域。发表多篇关于医学术语翻译和规范问题的研究论文,主持和参与的课题研究方向包括医学语言、汉语国际教育等。通信方式:hywm216@126.com。

收稿日期:2024-01-10修回日期:2024-05-28

基金项目:世界汉语教学学会、汉考国际教育2022年度科研项目“面向MBBS专业汉语教学的医学术语等级划分研究”(CTI2022B09);2022年度安徽省高等学校质量工程项目“MBBS专业留学生小学期制语言文化课程教学体系的构建”(2022jyxm719)