MeSH增补概念表中的中草药术语使用

2015-03-22 05:23
中华医学图书情报杂志 2015年1期
关键词:主题词术语中草药

, ,

《医学主题词表》(Medical Subject Headings,MeSH)是美国国立医学图书馆编制的主题词表,是一部规范化的可扩展的动态性叙词表[1],是生物医学文献标引的重要依据。MeSH词表定期更新,在一定程度上反映了国外医学界对中医药学的理解与认识以及当前专题研究的热点等。MeSH由主题词表、副主题词表、增补概念表、树形结构表等组成,主题词表是其主体部分,主题词能揭示文献主要研究内容并具有动态性。近年MeSH收录的中医药学主题词数量不断增加,但没有按照中医药学科体系和规律增加中医药学主题词。目前中医药学主题词不仅数量少而且部分概念有些宽泛和有失准确[2],因此在PubMed中检全与检准中医药学文献比较困难。

增补概念表(Supplementary Concept Records,SCRs)中的术语大多直接来自文献中的词汇。增补概念是对主题词的补充与扩展[3],主要用于标引化学物质、药物、罕见疾病概念等。它没有树状结构号,但是一个增补概念对应一个或多个主题词,运用更广阔[4]。SCRs设置了同义词作为物质名称(Name of Substance)入口词(Entry Term),从而使其具有聚类同义词的功能[5]。SCRs每周更新[4],收录文献中新出现专业术语的速度较主题词更快,术语量也在不断增加,至2013年收录的增补概念已达214 234个[6],对学术论文关键内容的揭示也更加全面。我们在检索实践中,发现很大一部分中医药尤其是中草药的概念虽然没有对应的主题词,却体现为增补概念。总之,增补概念具有主题词的基本特征,覆盖面广泛,特别是收录了大量的中医药术语并且更新迅速,对研究中草药术语更有意义。

本文通过SCRs与MeSH的映射关系获取SCRs中相关中草药术语,多维度分析,发现了中草药相关增补概念的现状及存在的问题。一方面了解了国际上对中草药的认知情况,为中医药术语规范化建设提供参考,另一方面探索了在PubMed中有效提高中草药文献查全率与查准率的策略。

1 数据来源和方法

通过MeSH Browser[7]获取映射到(Heading Mapped To)中草药(Drugs, Chinese Herbal)的增补概念869个,检索时间为2013-11-20。根据增补概念注释数据及术语来源文献,对术语进行翻译和相关信息(国别/地区、单味药、中药提取成分、复方、经方与自拟方)标注。经方与自拟方包括了方剂的各种剂型,国别/地区信息以术语来源文献作者署名的国家或地区为准。由于术语表达存在差异,为了更好呈现被收录的国内增补概念现状,对香港、台湾地区和中国大陆增补概念分别统计。

2 结果与分析

2.1 中草药相关增补概念总体状况

总体上看,MeSH中草药相关增补概念呈现随时间稳步增长的趋势(图1),这与近年来中草药研究受到国际认可与重视、相关研究文献不断增长有一定关系。2008年收录增补概念最多,为269个,这主要与2008年MeSH开始大量收录来源于中国期刊的增补概念有关。这些期刊包括《中西医结合杂志》、《中华男科学》、《南方医科大学学报》等,来自《中西医结合杂志》的增补概念最多。

图1 增补概念变化趋势

从增补概念来源国家/地区的分布(图2)来看,排名前5位的分别为中国大陆、日本、台湾地区、韩国、香港地区,其他国家/地区收录的增补概念数均在10个以下。来源于中国大陆的增补概念约占69%,但是从使用频次来看,却与增补概念只占11%的日本不相上下,而且高使用频次(60次以上)的增补概念更多来源于日本。一方面是因为日本的汉方研究起步早、成果发布时间早,其使用的中草药相关术语成为增补概念的时间较其他国家/地区早,如“柴胡桂枝汤”1979年成为增补概念,目前被使用138次;另一方面是因为日本研究人员对同一中草药研究的关注度与认知度比较高,研究也比较集中和系统。

图2 增补概念来源国家/地区分布

2.2 中草药相关增补概念反映出的中草药研究方向

相关增补概念反映出中草药研究方向可分为单味药、中药提取成分、复方(经方、自拟方),其中复方相关增补概念居多,占80%以上。

复方相关增补概念的来源分析表明,我国(包括香港、台湾地区)中草药研究多为自拟方,而日韩研究主要集中在经方。

此外,日本同一经方的研究的文献数量往往高于中国大陆。这与日本在开发研究汉方成药制剂时多选用我国名医典籍中的古方、很少选用现代临床应用的经验方有关,也与日本汉方业发展得到政府政策支持、重视科研及投入等有关[8]。在多种有利因素的促进下,日本汉方业在国际市场占大量份额,国际认知度高。国内自拟方与经方研究都较为零散,难以形成规模,因此认知度较低,无法形成与日韩抗衡的市场竞争力。

2.3 中草药相关增补概念存在的问题

2.3.1 增补概念重复收录

中草药术语翻译国际上尚无统一标准,不同国家或地区的表达习惯与翻译又存在差异,加之中草药相关术语往往有拉丁文、汉语拼音、英文、缩写等不同译名,所以收录时未能加以甄别就会导致概念的重复收录。这一现象在复方相关增补概念中表现得更加突出。以下是增补概念重复收录的几种类型。

一是汉语拼音与拉丁文翻译不同造成重复收录。同一中草药往往由于汉语拼音与拉丁文翻译的差别被视为两个概念被同时收录。这种情况常出现在来源不同的概念中,如秦皮-qinpi(台湾地区)、Cortex Fraxini(中国大陆),四君子汤-si-jun-zi-tang(韩国)、Shikunshi-to(日本),当归芍药散-toki-shakuyaku-san(日本)、danggui-shaoyao-san(中国大陆),五虎汤-Goko-to(日本)、Wu-Hu-Tang(中国大陆),桂枝汤-keishi-to(日本)、guizhi decoction(中国大陆),真武汤-shin-bu-to(日本)、zhen-wu-tang(中国大陆);也有来源相同而由翻译差异造成的,如黄芪-Huang Qi、Radix Astragali seu Hedysari(中国大陆)。

二是剂型翻译差异或缺省造成重复收录。复方(经方)中通常有汤、散、丸等不同剂型,由于剂型翻译的差异(如汤剂有tang与decoction两种译法)而被视为不同概念,如龙胆泻肝汤-longdan xiegan decoction(中国大陆)、longdan xiegan tang(台湾地区),三拗汤-San-Ao decoction(中国大陆)、san-ao-tang(台湾地区)。剂型翻译缺省也会导导致重复收录,如玉屏风散-yupingfeng(中国大陆)、yu ping feng san(香港),酸枣仁汤-suanzaoren、suanzaorentang(中国大陆),银翘散-yinqiao、yinqiaosan(中国大陆),大承气汤-Da-Cheng-Qi(中国大陆)、Da-Cheng-Qi-Tang(中国大陆)等。

三是词形差异造成重复收录。如果没有同义词的聚类,微小的词形变化都会导致检索结果的差异。部分中草药相关增补概念在汉语拼音中加入“-”或空格形成了词形的差异,如温脾汤-wenpi decoction(中国大陆)、wen-pi-tang(日本),人参养荣汤-renshen yangrong decoction(中国大陆)、ren-shen-yang-rong-tang(日本),左金丸-Zuo-Jin-Wan(台湾)、zuojin(中国大陆),六君子汤-liujunzi(中国大陆)、liu-jun-zi-tang(日本);平胃散-ping wei san(中国大陆)、ping-wei(中国大陆),十全大补汤-shiquandabu(中国大陆)、Shi-Quan-Da-Bu-Tang(中国大陆),一贯煎-yiguanjian decoction(中国大陆)、Yi Guan Jian Decoction(中国大陆),左归丸-zuogui(中国大陆)、zuo gui wan(中国大陆)等。

四是多种原因造成重复收录。如四物汤-samultang(韩国)、shimotsu-to(日本)、si-wu decoction(中国大陆)、si-wu-tang(韩国),小柴胡汤-shosaiko-to(日本)、xiaochaihu(中国大陆)、xiaochaihu-tang(中国大陆),茵陈蒿汤-inchinko-to(日本)、yinchenhao(中国大陆)、yin-chen-hao-tang(台湾地区)、in-chern-hau-tang(中国大陆)。

此外,一些来源中国大陆的增补概念由于细微的差异被视为不同概念重复收录,如二至天癸颗粒(er'zhi tiangui、erzhi tiangui)[9-10];亦有由于数字表述不一样而收录为不同概念,如冠心2号(guan xin II、guanxin No. 2、guan-xin-er-hao);还有名方翻译不同而致重复收录,如片仔癀(pianzihuang,pien tze huang)。

以上重复收录的增补概念既有来源于不同国家或地区的,也有来源于同一国家与地区的。其中来源于中国大陆的术语规范性不强问题相对其他国家与地区的更严重。在中草药国际市场上中国制剂所占份额并不高,如果在相关制剂研究与翻译中不规范用语,将不利于中草药的推广与宣传。

2.3.2 同义词聚类不足

增补概念表对同一概念的不同译名(即同义词)做了有效的聚类,如八味地黄丸以hachimijiogan为物质名,列 ba-wei-di-huang-wan、bawei dihuang wan、hachimi-jio-gan 、pa-wei-ti-huang-wan、Rehmannia eight formula等同义词为入口词(Entry Term),形成同义词环,有利于文献集中与检索。但实际上,增补概念表的同义词聚类仍存不足,一方面是由于概念重复收录所致,另一方面是增补概念虽同时收录同一中草药的多种不同译名,但仍有所遗漏,如四物汤虽然收录了来源于不同国家的4个概念samultang(韩国)、shimotsu-to(日本)、si-wu decoction(中国大陆)、si-wu-tang(日本),但以siwutang、siwu decoction、siwu tang等自由词检索仍能查出中国大陆与台湾地区的四物汤研究文献。

就已有的增补概念同义词聚类来看,来源于日本的增补概念相对规范,对同一中草药的揭示也较其他国家或地区更加丰富,往往既有拉丁文译名,又有汉语拼音,还有汉方缩名代码等。如四逆散的物质名为shigyaku-san,同义词有Si-Ni-San、TJ-35;小柴胡汤的物质名为shosaiko-to,同义词有sho-saiko-to、shosaiko-toh、TJ-9、TJ9、xiao-chai-hu-tang;人参养荣汤的物质名为ren-shen-yang-rong-tang,同义词有ninjin-yoei-to、ninjin-youei-to、TJ-108、TJ108。而来自中国大陆的术语却因没有同义词聚类而重复收录,如黄芪-Huang Qi、Radix Astragali seu Hedysari、一贯煎-yiguanjian decoction、Yi Guan Jian Decoction等。

2.3.3 类方未能整合标引

对于同一方剂的不同剂型或制剂未能整合标引而视为不同概念分别收录,如六味地黄汤(Liuwei Dihuang Decoction)与六味地黄丸(liu-wei-di-huang wan)、桂枝茯苓胶囊(guizhi-fuling)与桂枝茯苓丸(keishibukuryogan)。

2.3.4 增补概念错误收录

中草药相关增补概念存在错误收录的情况。如迈普新并不是中草药而是西药胸腺肽,研究人员用汉语拼音maipuxin进行表达;芬必得(商品名fenbid)实为布洛芬缓释胶囊,属于西药,但研究人员在文献中使用其商品名,以致收录人员将这两个物质误认为是中草药,将其收录为中草药相关增补概念。这与我国研究人员在发文时英文翻译习惯使用商品名而不习惯使用通用名有关。

3 建议

SCRs收录了大量的中草药术语并逐年增加,对检索和研究中草药文献都起了积极作用。其增补概念虽然大部分源于中国大陆,但同一经方对应文献量并不高于其他国家/地区的文献产出,反映出中国大陆的中草药研究相对零散未形成系统,同类经方的关注度与认知度差,影响了中国在中草药国际市场的竞争力。因此,我们一方面要规范增补概念,另一方面注意使用规范术语和多种术语。

3.1 进一步规范增补概念

SCRs对中草药虽然做了规范但仍然存在概念重复收录、同义词聚类不足、错误收录等问题。

一方面是因为收录人员缺少中草药知识或了解不够深入,未能对相关术语进行必要的内涵审核,以完善相关增补概念。建议收录人员定期对中草药相关增补概念进行梳理与整合,采取一些措施。如可在中草药汉语拼音与拉丁文中选取一个作为物质名称,另一个作为入口词;针对复方汤、丸、散剂、颗粒的增补概念,采用剂型缺省的译名作为物质名称,以避免翻译不同导致重复收录;参见《中国中医药主题词表》对类方的处理方式,如以六味地黄丸做为主题词,将六味地黄冲剂、六味地黄口服液、六味地黄汤、地黄丸均做为入口词[11],此法使概念更简洁、更利文献聚类与检索。

另一方面是因为缺乏统一的中草药翻译标准以及作者不规范翻译,这在中国大陆研究人员身上表现得更加突出。中国研究人员不仅翻译不规范甚至随意、错误翻译,易产生混淆(即同一中草药有多种译名或不同表达方式被认为是多种不同的药物),以致相同主题文献难以集中,对于提高中草药在国外的认知度有一定影响,也不利于中草药的推广。虽然国内有很多文献论述方剂英译的问题并探讨相关对策,如朱薇等提出中药方剂名称英译应遵循统一性、准确性和简洁性原则[12],但未受到中草药研究人员的重视与接受,推进缓慢,始终未有统一规范或标准,各种乱象未能得到有效的纠正。目前还是需要尽快制定翻译标准特别是经方的翻译标准,促进规范用词,提高国际上对中草药的认知度。我国中草药研究人员在发文之前也应了解已有研究的相关翻译或通过MeSH(SCRs)进行查询,以掌握术语的使用情况,运用已有的术语合理地翻译自己的文献,尽量保证相关主题概念的一致性,这样才有利于提高同一中草药的关注度及形成规模研究。此外,可在文献翻译中附上拉丁文的翻译以提高文献的检出率和研究成果的国际影响,与目前的一些研究衔接与融合。

3.2 文献检索时使用规范术语和多种术语

鉴于中草药相关增补概念存在的问题不可能在短时间内得到纠正,研究人员在利用PubMed检索中草药文献时应注意同一中草药的多种译名,采用适当的检索策略,如根据实际情况合理利用增补概念、增补概念的同义词聚类功能等。如检索四物汤相关文献,考虑到samultang(3篇)、shimotsu-to(22篇)、si-wu decoction(13篇)、si-wu-tang(51篇) 4种不同表达方式,使用检索式“samultang OR shimotsu-to OR si-wu decoction OR si-wu-tang”,检出83篇;若再加上自由词siwutang、siwu decoction、siwu tang使用检索式“samultang OR shimotsu-to OR si-wu decoction OR si-wu-tang OR siwutang OR siwu decoction OR siwu tang”,则检出129篇。所以,研究人员应关注中草药术语状态,以全面了解不同国家与地区研究的现状。

猜你喜欢
主题词术语中草药
益林中草药 初现规模化
三味中草药 消炎效果好
关键词的提取与确定
中草药制剂育肥猪
《中国医学计算机成像杂志》2020 年第26 卷主题词索引
脑筋急转弯
《中国骨与关节杂志》2016 年第五卷英文主题词索引
有感于几个术语的定名与应用
从术语学基本模型的演变看术语学的发展趋势