学科融合视域下医学汉语学术词表的构建*

2023-06-12 08:35:16袁亮杰王治敏
关键词:词表预科覆盖率

钱 隆, 袁亮杰, 王治敏

(北京语言大学 国际中文教育研究院,北京 100083)

一、引 言

学科融合是一种跨学科的思维方式和方法,旨在将不同学科领域的知识、理论、技术和方法有机地结合起来,以解决现实世界中的复杂问题。随着中资企业对外投资业务的不断扩大,国际中文教育与职业领域的融合发展已成为丰富国际中文教育学科内涵、探索教育改革创新的新方向。专业是学科的基础,(1)冯向东.学科、专业建设与人才培养[J].高等教育研究,2002,(3).做强学科的前提首先是要做好专业。就医学专业而言,2018年,中国接收医学专业(2)这里的医学教育包含西医和中医两个学科。的来华学历留学生共61883名,占学历生总人数的23.97%;接收本科留学生人数最多的前50所高校中,有11所是医科大学。(3)教育部.2018来华留学生简明统计[M].北京:教育部国际合作与交流司,2018.可见,我国已经培养了大量的医学留学专业人才。虽然我国在来华留学生医学学历培养上取得了突出的成就,但医学汉语研究起步晚,规模小,(4)张悦,李莉,崔涛.基于中国知网的近20年我国来华留学生医学汉语研究现状分析[J].中国继续医学教育,2023,(2).中文专业和医学专业、预科教育和本科教育缺少一定的衔接,导致现有的国际中文教育资源不能满足医学专业留学生的中文教学和学习。中文专业和医学专业的融合发展已经成为必然趋势,这也是学科发展的必然选择,针对外籍学生的医学教育亟须提供通用汉语与专业汉语资源的有效衔接。因此,本研究构建了医学汉语学术词表(Medical Chinese Academic Vocabulary List,简称MCAVL)以服务于医学专业留学生的中文教学和学习。

学术词表是对一般通用词表的扩展,通过强调在各类学术文本中经常出现的词汇,能够向学习者直接展示学习目标。毫无疑问,学术词表提高了学术词汇的学习效率,可以减轻学习者的学习负担,能极大地满足学术词汇教学和学习的需要。(5)Nation ISP.Learning Vocabulary in Another Language[M].Cambridge:Cambridge University Press,2001.

目前,英语学术词表研究已有相当丰富的研究成果。(6)刘迪麟,雷蕾.学术词表研究综述[J].外语教学,2020,(2).最具代表性和影响力的学术英语词表,一个是Coxhead开发的学术单词表(Academic Word List,简称AWL),另一个是Gardner和Davies创建的学术词汇表(7)Gardner D,Davies M,A new academic vocabulary list[J].Applied Linguistics,2014,(3).(Academic Vocabulary List,简称AVL)。学者们借鉴AWL和AVL的编制方法又陆续开发了各学科的学术英语词表,如:医学英语学术词表(8)Wang J,Liang S,Ge G.Establishment of a medical academic word list.English for Specific Purposes[J],2008,(4).、化学英语学术词表(9)Valipouri L,Nassaji H.A corpus-based study of academic vocabulary in chemistry research articles[J].Journal of English for Academic Purposes,2013,(4).、护理学英语学术词表(10)Yang M.A nursing academic word list[J].English for specific purposes,2015,(37).、环境科学英语学术词表(11)Liu J,Han L.A corpus-based environmental academic word list building and its validity test[J].English for Specific Purposes,2014,(39).等。汉语学术词表的开发和研究目前尚处于起步阶段,相关研究成果较少,目前仅见薛蕾开发的汉语语言学学术词表(12)薛蕾.基于汉语语言学论文语料库的学术汉语词汇析取及特征研究[D].云南师范大学硕士学位论文,2017.、朱明玉构建的通用领域学术词表(13)朱明玉.通用学术汉语词表研究[D].云南大学硕士学位论文,2020.、王笑然和王佶旻开发的经贸类本科专业学术汉语词表(14)王笑然,王佶旻.经贸类本科专业学术汉语词表研究[J].语言教学与研究,2022,(4).等。而在医学领域,暂未发现有研究者开发医学汉语学术词表。教育部中外语言交流合作中心曾在2020年开发了医学汉语水平考试(Medical Chinese Test,简称MCT)大纲,该大纲提供了1500个医学汉语专业词汇。不过MCT大纲词表收录了很多医学专业词汇,并不是一份服务于医学学术教学的词表。积累学术词汇是攻读学位的学习者面临的一个主要挑战,(15)Evans S,Green C.Why EAP is necessary:A survey of Hong Kong tertiary students[J].Journal of English for Academic Purposes,2007,(1);Durrant P.To what extent is the Academic Vocabulary List relevant to university student writing?[J].English for specific purposes,2016,(43).因而医学汉语学术词表的缺失将不利于医学学术词汇的教学,也不利于医学汉语教材的编写,在一定程度上会影响学生的学术学习和训练。

汉语学术词表的开发主要是为了衔接预科教育和本科教育这两个阶段。进入医学本科专业学习的留学生通常不熟悉医学专业的学术词汇,听课、听报告、读文献和写论文都会遇到问题,现有的预科生医学汉语教材对医学本科基础教材的词汇衔接度较低,不能满足医学汉语教学和学习的需要。(16)陈蒙,甄珍.来华预科生医学汉语教材与本科生医学专业教材的词汇衔接度研究[J].医学教育研究与实践,2023,(2).并且医学留学生大都来自发展中国家,学生的总体素质有待提高,这就给医学汉语教学带来更大的困难。(17)姜安.论医学专业留学生的医学汉语教学[J].现代医药卫生,2009,(20).因此,本研究的目标是开发医学汉语学术词表,服务于医学专业的预科留学生和本科留学生,用于衔接预科教育和本科教育这两个阶段。

本研究拟回答以下问题:(1)构建的MCAVL可以覆盖多少医学学术文本?(2)MCAVL与MCT大纲词表有哪些差异?

二、研究设计

(一)构建医学汉语学术语料库

学术词表的构建通常需要借助大规模文本语料库来完成。语料库可以反映出词表中词汇的频数和覆盖情况,(18)Nation ISP.Learning Vocabulary in Another Language[M].Cambridge:Cambridge University Press,2001.因此本文采用语料库驱动的研究方法,(19)卫乃兴.基于语料库和语料库驱动的词语搭配研究[J].当代语言学,2002,(2).通过自建医学汉语学术语料库(Medical Chinese Academic Corpus,简称MCAC)来开发MCAVL。

学术语料库中的语料一般采集自学科专业教材和学术期刊论文。(20)Coxhead A.A new academic word list[J].TESOL Quarterly,2000,(2).为确保语料库设计更具科学性,我们兼顾语料的代表性和典型性等原则来选取语料。(21)郭曙纶.汉语语料库应用教程[M].上海:上海交通大学出版社,2013.根据MCAVL的构建目标,本研究调查了中国大陆地区6所代表性的医学院提供的本科生培养计划和培养方案,统计了各个院校开设的医学专业及其专业课程,将这些课程使用的教材作为MCAC的教材语料。据此,我们收集了82本医学教材,全部由人民卫生出版社出版。根据医学一级学科的划分以及医学专家的建议,将82本医学教材归入8个子库,分别是基础医学库、临床医学库、口腔医学库、公共卫生与预防医学库、中医学库、药学库、医学技术库和护理学库。考虑到接受医学教育的留学生除了要学习专业教材外,还需要阅读学术期刊论文,因此本文还收集了医学期刊论文作为MCAC的期刊论文语料。语料选自2011年至2020年被北京大学中文核心期刊目录收录的22种医学期刊,每种期刊每年随机采集两篇文章,据此我们收集了440篇医学期刊论文,论文全部归入期刊子库。

语料采集完毕后,对语料进行了清洗,删除了作者信息、基金项目、图表、注释、参考文献等冗余信息。清洗结束后,使用教育部语言文字应用研究所提供的汉语分词和词性标注系统CorpusWordParser进行了机器自动分词,并进行人工校对以修正部分错误。最终,我们构建的MCAC包含9个子库、29594872个字、18763879个词例(word tokens)、67328个词型(word types)。语料库详细信息见表1。

表1 MCAC详细信息

(二)医学汉语学术词表的构建维度

编制学术词表前,通常需要确定选词标准。词表中的学术词汇必须用系统、严格的选词标准来提取,(22)Lei L,Liu D.A new medical academic word list:A corpus-based study with enhanced methodology[J].Journal of English for Academic Purposes,2016,22.Coxhead曾使用高频性、专业性和广泛分布性3个原则来编制AWL。(23)Coxhead A.A new academic word list[J].TESOL Quarterly,2000,(2).Gardner和Davies在编制AVL时,则确定了专业性、广泛分布性、均匀分布性和学科指数四个标准。(24)Gardner D,Davies M,A new academic vocabulary list[J].Applied Linguistics,2014,(3).这两份词表的选词标准都受到了一些质疑。首先Coxhead在专业性选词时,删除了全部的高频词汇,(25)Coxhead A.A new academic word list[J].TESOL Quarterly,2000,(2).研究发现通用词汇和学术词汇之间并没有明晰的界限,高频词汇可能是学术词汇,学术词汇也可能是高频词汇,开发学术词表时没有必要排除所有的高频词。(26)刘迪麟,雷蕾.学术词表研究综述[J].外语教学,2020,(2).其次,Gardner和Davies在提取学术词汇时,没有使用高频性选词标准,(27)Gardner D,Davies M,A new academic vocabulary list[J].Applied Linguistics,2014,(3).这使得AVL收录了更多的低频词。为了规避以上问题,本研究选择了以下6个标准来提取医学汉语学术词汇。

1. 高频性

词频是判断词汇是否常用的重要指标。词的出现频率越高,说明词越常用,在词表中位置越靠前。(28)崔维霞,王均松.基于语料库的词表创建原则及方法研究[J].中国科技术语,2013,(2).依据齐普夫定律(Zipf’s Law),可以帮助学习者提取性价比最高的学术词汇来减轻学习负担。二语学习者通常需要掌握文本中95%~98%的词汇才可以较好地理解文章的内容。(29)Nation ISP.Learning Vocabulary in Another Language[M].Cambridge:Cambridge University Press,2001.因此我们设定95%的覆盖率来确定最低词频。在MCAC中,当词频设定为200时,6968个词型覆盖了17827227个词例,即10.35%的词型覆盖了95.01%的词例,词汇的抽取效果较好。因此,词频在MCAC中大于或等于200的词语才可以入选MCAVL。

2. 专业性

设定专业性选词标准是为了将学术文本中经常出现的词汇提取出来并区别于通用词汇。Coxhead在编制AWL时去除了2000个通用词族;(30)Coxhead A.A new academic word list[J].TESOL Quarterly,2000,(2).Gardner和Davies则使用了频率比标准,确定词在学术文本和非学术文本中的频率比来选取学术词汇。(31)Gardner D,Davies M,A new academic vocabulary list[J].Applied Linguistics,2014,(3).考虑到Coxhead研究的不足,本研究选择了频率比标准来提取医学汉语学术词汇。首先将北京语言大学语料库中心(BLCU Corpus Center,简称BCC)的文学库、新闻库和微博库合并为非学术文本语料库,然后计算预收录词在MCAC中的出现频率与其在BCC非学术文本语料库中出现频率的比值。若频率比大于1,表示该词在MCAC中的频率更大,在医学学术文本中出现频次更高;反之,则表明该词在非学术文本中出现的频次更高。最后,对频率比设定在1到6的范围内进行反复试验来确定合适的频率比。为了区分学术词汇和通用词汇,本研究将《中国政府奖学金本科生来华留学生预科基础教育结业考试·基础汉语常用词汇表》(简称:预科基础词表)作为通用词表进行参考,该词表包含3000个汉语基础常用词汇。结合预科基础词表设定不同的频率比来提取医学学术词汇。

试验发现,当频率比设定为1.2时,如“家庭”(频率比:1.24)、“或者”(频率比:1.34)等通用词就会被收录至MCAVL;如果设定得太高,频率比为2时,如“老化”(频率比:1.93)、“研制”(频率比:1.89)等医学核心学术词汇就会被排除出MCAVL。因此,预收录词如果没有出现在预科基础词表中,频率比设定为1.5最为理想。但是,如果预收录词出现在预科基础词表中,频率比设定为1.5则过低,如“主动”(频率比:1.51)、“练习”(频率比:2.16)、“可能”(频率比:2.59)等通用词就会被MCAVL收录,且收录这些词不利于突出学术词表的专业性。因此,MCAVL中的词如果出现在预科基础词表中,频率比达到3才能入选。通过该标准,我们从6968个词型中抽取出4255个符合专业性标准的词型。

3. 广泛分布性

仅依靠词频的高低来提取词汇有很大的片面性,词表创建过程中还需考虑到词语的分布。Coxhead规定入选AWL的词要在人文、商业、法律、科学4个学科和28个子学科领域的15个或更多领域中至少出现10次。(32)Coxhead A.A new academic word list[J].TESOL Quarterly,2000,(2).Gardner和Davies则规定入选AVL的词在9个学科中至少出现在其中的7个学科中,且每个学科中出现的频次(每百万)至少为20%的数学期望。(33)Gardner D,Davies M,A new academic vocabulary list[J].Applied Linguistics,2014,(3).综合来看,Gardner和Davies设置的词在各个子库出现的下限值由子库规模决定,因此广泛分布性标准更好。参照该标准,我们在MCAC的9个子库中进行反复的实验,最终,本研究规定入选MCAVL的词至少需要在MCAC的6个子库中出现,且在每个子库中的出现频次(每百万)至少为20%的数学期望。据此,我们从4255个词型中抽取出3402个符合广泛分布性标准的词型。

4. 均匀分布性

收录词表的词语还需要考虑在语料库的各个子库中是否均匀分布。某些高频词可能广泛分布于语料库的各个子库,但其在各个子库出现的频率可能是不均匀的。依据本词表的构建目标,MCAVL中的词应较为均匀地分布在MCAC的各个子库中。为了实现这一目标,我们在词汇抽取时选择了Julliand’s D值(34)Julliand A,Chang-Rodriguez E.Frequency Dictionary of Spanish Words[M].The Hague:Mouton,1994.作为均匀分布的计算指标。词表构建时,D值设定没有统一的标准,所以我们对D值设定在0.3到0.8的区间内进行试验。试验发现,如果D值设定得太高,如设在0.8,那么“器官”(D值:0.75)、“粘膜”(D值:0.69)等常用医学学术词汇就会被排除出MCAVL;D值设定得太低,如低于0.6,词表的均匀分布性就无法保证,如“精子”这个词,D值为0.51,其在基础医学库的出现频次(每百万)是口腔医学库的143倍,数据表明该词的分布是不均匀的。我们规定Julliand’s D值达到0.6及以上的词语才能入选MCAVL。通过该标准,本研究从3402个词型中删除了925个词型,保留了2477个词型。

5. 学科指数

Gardner和Davies在提取学术词汇时还选用了学科指数标准,即收录AVL的词在9个学科的任何一个学科中的频次(每百万)不能超过其子库数学期望的3倍。(35)Gardner D,Davies M,A new academic vocabulary list[J].Applied Linguistics,2014,(3).这条标准可以有效保证预收录词不会只在某一个学科领域高频出现。本研究也考虑了该选词标准,我们对学科指数设定在2到4的区间内进行试验。试验发现,学科指数设定为3时,效果最好,不会去除过多的学术词汇,也可以保证词不会只高频出现在某一子库。我们规定学科指数不超过其子库数学期望3倍的词语才能入选MCAVL。以“宫缩”为例,该词在护理学子库的出现频次(每百万)是330.169次,在护理学子库的数学期望为72.861次,实际频次(每百万)是数学期望的4.532倍,超过了3。可见,“宫缩”更常见于护理学领域,其在护理学领域更加突出,不符合MCAVL的构建目标,故予以剔除。最终,从2477个词型中抽取出2019个符合学科指数标准的词型。

6. 人工校对

完成以上步骤之后,我们根据实际需要还进行了人工校对。校对的主要内容为判断词表中的每一项词条是语素、词、固定短语还是非固定短语。现代汉语词汇应该包括词和固定短语两类。(36)黄伯荣,廖序东.现代汉语(增订六版,下册)[M].北京:高等教育出版社,2017.为了体现MCAVL的专业性和有效性,本研究规定入选MCAVL的只能是词、固定短语和医学常用短语,语素和非医学短语不能入选MCAVL。我们从2019个词型中删除了319个语素和非医学短语,如“泌”“脊”“十年”等,并保留了“用于”“心力衰竭”“动脉硬化”等固定短语和医学常用短语。

人工校对结束后,我们最终得到了一个包含1700个词型的MCAVL。为了提高医学汉语学术词汇的教学和学习效果,对MCAVL进行了进一步分级,词汇的分级依据主要是覆盖水平,分级详情见表2。

表2 MCAVL的分级情况

分级前将每个词按词频大小进行排列,词频最大的“细胞”排第1位,词频最小的“嗜血”排第1700位。然后按照6:3:1的覆盖水平对MCAVL中的词汇进行分级。其中排序前255的词占MCAVL总覆盖水平的60.27%,这些词归入一级词表;排序256至880的625个词占总覆盖水平的30.48%,这些词归入二级词表;其余的820个词占总覆盖水平的9.25%,这些词归入三级词表。分级后,我们为学习者和教师展示了医学汉语学术领域的高频词、中频词和低频词。为了达到最好的学习效果,学习者应当依次由一级到三级学习MCAVL。

三、结果与讨论

(一)MCAVL的覆盖水平

为了回答前文提出的问题“构建的MCAVL可以覆盖多少医学学术文本?”并检验词表的有效性,我们计算了MCAVL对MCAC的词汇覆盖率,见表3。

表3 MCAVL及其处理词表对MCAC的覆盖水平

一般来说,学术词表对学术文本的覆盖率集中在10%左右。(37)Nation ISP.Learning Vocabulary in Another Language[M].Cambridge:Cambridge University Press,2001.MCAVL的1700个词型覆盖了MCAC中5453059个词例,覆盖率为29.06%,覆盖效果良好。MCAVL覆盖率高出约19%可能是因为本词表没有像AWL那样去除所有的通用词汇。为了进行更好的对比,去除MCAVL中与预科基础词表重复的词,再进行词汇覆盖率计算。去除后,MCAVL包含1498个词型,覆盖了MCAC中3621614个词例,覆盖率为19.30%。与其他学术词表相比,MCAVL的覆盖率依然高出约10%,说明本研究提取的学术词汇有较好的专业性。除此之外,我们还计算了MCAVL与预科基础词表结合后的词汇覆盖率。两词表结合后,包含4469个词型,覆盖了MCAC中13988633个词例,覆盖率为74.55%。这说明学习者学习了预科基础词表和MCAVL后,就可以理解医学学术文本中大约四分之三的词汇。

为了调查MCAVL是否是一份真正的学术词表而非通用词表或其他语体词表,我们将MCAVL分别置于BCC的各个子库中进行词汇覆盖率计算,结果见表4。

表4 MCAVL对BCC的覆盖水平

由表4可知,MCAVL对BCC学术子库的覆盖率最高,达到了12.59%;其对BCC新闻子库的覆盖率为4%,覆盖水平不足学术子库的三分之一;对文学和微博子库的覆盖率更低,均不足2%。可见MCAVL具有较好的学术代表性,并不是通用词表或其他领域词表。值得注意的是,MCAVL对BCC学术子库的覆盖率要比MCAC的覆盖率(29.06%)低,二者的覆盖率相差近17%。这是因为BCC学术子库收录的语料除了医学学术文本外,还包括其他学科的学术文本。这也表明医学学术词汇和通用学术词汇之间存在明显差异。

为了考察MCAVL是否在各医学学科中存在差异,我们调查了MCAVL在MCAC各个子库的覆盖情况,结果见表5。

表5 MCAVL对MCAC各个子库的覆盖水平

由表5可知,MCAVL对临床医学库、基础医学库、护理学库和药学库的覆盖率都超过了30%,覆盖水平良好,词表可以在这些医学领域的学术汉语教学和学习中发挥较好的作用。Gardner和Davies发现通用学术词汇在各专业各学科的分布其实并不均衡,(38)Gardner D,Davies M,A new academic vocabulary list[J].Applied Linguistics,2014,(3).MCAVL也有类似的情况。虽然本研究使用了均匀分布性选词标准,但是MCAVL对MCAC的覆盖水平仍不均衡,其中对中医学库的覆盖水平最差,覆盖率低于20%。可见,通用医学汉语学术词汇在医学各学科各专业的使用上仍然存在明显的差异,特别是在中医学上。

(二)MCAVL与MCT大纲词表的对比

为了回答前文提出的问题“MCAVL与MCT大纲词表有哪些差异?”,我们对MCAVL和MCT大纲词表进行了对比。总的来看,两词表有以下几点不同:

从服务对象上来看,MCT大纲词表的研制目标主要服务于医学专业的留学生和在中国境内外使用汉语进行临床诊疗的汉语非第一语言的医护工作人员;而MCAVL主要服务于医学专业的预科留学生或者即将进入医学专业的本科留学生。

从词表的功能来看,MCT大纲词表是为了让学习者能够更好地熟悉医院场景,并能就病情进行相应的描述、沟通和交流;而MCAVL主要是为了让学习者了解和掌握医学学术文本中的学术词汇,更好地从预科阶段过渡到本科阶段。

从具体的选词来看,两词表也存在明显差异。MCT大纲词表既包含通用词,如“弱”“升高”等,也包含医学学术词,如“病程”“体征”等,还包含医学专业词汇和术语词汇,如“不饱和脂肪酸”“呼吸性碱中毒”“视神经乳头”等;而MCAVL则主要收录的是医学学术词汇,只包含少量的通用词汇和术语词汇。通过多字词占比和平均词长可以更好地区别MCAVL和MCT大纲词表中专业词汇和术语词汇的数量差异,见表6。

表6 MCAVL和MCT大纲词表的单字词、双字词、多字词占比及平均词长

与通用词汇相比,汉语专业词汇以双词素词和多词素词为主,(39)孙旭东,戴卫平.科技词汇的基本特点探讨[J].中国科技术语,2017,(1).并且这些双语素词和多语素词通常都是多字词。由表6可知,MCT大纲词表的平均词长为2.70,MCAVL则为2.08;MCT大纲词表的多字词占比为37.07%,而MCAVL的多字词占比仅为13.35%,这说明MCT大纲词表的平均词长和多字词占比均大于MCAVL,MCT大纲词表收录了更多的医学专业词汇和术语词汇。

除了对词表进行以上对比,本研究还比较了MCAVL和MCT大纲词表对MCAC的词汇覆盖水平。为了与MCT大纲词表的全部1500个词语进行比较,我们对等选取MCAVL中排序前1500的词语。词汇覆盖情况见表7。

表7 MCAVL(前1500)和MCT大纲词表对MCAC的覆盖水平

由表7可知,MCAVL(前1500)覆盖了MCAC中5399554个词例,覆盖率为28.78%;而MCT大纲词表只覆盖了MCAC中2894052个词例,覆盖率仅为15.42%,二者的覆盖率相差了13.36%,MCAVL(前1500)的覆盖水平更好。两词表与预科基础词表结合后依然有较大的差异,MCAVL(前1500)和预科基础词表结合后,覆盖率为74.27%;MCT大纲词表和预科基础词表结合后,覆盖率仅为64.15%,二者相差10.12%。可见,无论是否与预科基础词表相结合,MCAVL(前1500)的覆盖率都要高于MCT大纲词表,两词表存在明显差异。从服务于留学生的学术教学和学习这个角度来看,MCAVL的有效性更好,能够有效弥补现有医学汉语词表缺少学术词汇的不足。

(三)MCAVL中的通用词汇

在专业性选词时,我们选择了频率比选词标准,没有去除所有的通用词汇,这使得MCAVL包含了少部分的通用词汇。MCAVL与预科基础词表有202个重复词,这些重复词既可以看作是医学学术词汇,也可以看作是通用词汇。收录这些词的理由有以下两点:

一是因为这些词在学术文本中出现的频率是非学术文本的3倍以上,如“疾病”的频率比为47.77,“细菌”的频率比为31.45,“死亡”的频率比为4.35,这些词值得引起学习者的注意。

二是因为有一部分词,其在医学学术领域常用的词性和词义有别于通用领域。词性上以“酸”为例,“酸”这个词在通用领域常作形容词,《现代汉语词典(第七版)》中“酸”作形容词表示“像醋的气味或味道”;而在医学学术领域,“酸”常作名词,表示“电解质电离时所生成的正离子全部是氢离子的化合物”。因此虽然“酸”在医学学术领域和通用领域都高频出现,但是其常用的词性却不同。词义上以“糖”为例,“糖”在《现代汉语词典(第七版)》中有3个义项分别是:(1)“有机化合物的一类,可以分为单糖、双糖和多糖,是人体内产生热量的主要物质,也叫碳水化合物”;(2)“食糖的统称”;(3)“糖果”。经过对语料的观察,我们发现在医学学术文本中“糖”最常用的是义项(1),而在通用领域中“糖”常用的义项是(2)和(3)。可见,“糖”虽然在医学学术领域和通用领域都高频出现,但是其常用的词义是不同的。

学术词汇教学要注重学术词汇的学术义与通用义的辨析。(40)张博.学术汉语词汇的主要特点及教学策略[J].世界汉语教学,2022,(4).因此,在医学汉语教学和学习时,教师和学习者都应注意医学学术词汇在医学学术领域和通用领域的差异,并做好这两方面的辨析。

四、结 语

本文通过语料库驱动的研究方法开发了一个包含1700个词型的医学汉语学术词表(MCAVL)。通过对比和分析,我们发现MCAVL对医学学术文本的覆盖率达到29.06%,MCT大纲词表的覆盖率仅为15.42%,说明该词表可以很好地服务医学学术汉语的教学和学习,并为医学学术词汇研究和医学汉语教材编写提供依据。同时,MCAVL与预科基础词表结合后,对医学学术文本的覆盖率达到了74.55%,表明该词表可以有效衔接预科教育和本科教育两个阶段。

除此以外,本研究调查了MCAVL在医学汉语学术语料库(CAC)各子库的覆盖情况,发现在临床医学库、基础医学库、护理学库和药学库的覆盖率都超过了30%,对中医学库的覆盖水平最低(18.93%),表明各学科各专业的医学学术词汇之间存在明显差别。因此,未来研究中可开发不同学科领域的医学汉语学术词表,特别是中医学汉语学术词表。

医学汉语学术词表的开发为医学汉语教学提供了基础语言资源的支撑,促进了医学学科和中文学科的融合。学科融合可打破学科壁垒,促进知识的整合和创新。学科融合视域下,国际中文教育研究要实现可持续高质量发展,需要重视同各学科的深度合作,构建针对不同领域的基础语言资源,以解决各学科专业基础教学资源的短缺问题,有效促进国际中文教育与不同学科之间的协调发展。

猜你喜欢
词表预科覆盖率
民政部等16部门:到2025年村级综合服务设施覆盖率超80%
今日农业(2022年15期)2022-09-20 06:54:16
我国全面实施种业振兴行动 农作物良种覆盖率超过96%
今日农业(2021年21期)2021-11-26 05:07:00
A Chinese-English List of the Sports Programmes in Winter Olympics 冬奥会项目名称汉英对照词表
英语世界(2021年13期)2021-01-12 05:47:51
跟踪导练(二)(6)
分部积分法在少数民族预科理工类高等数学教学中的探索
叙词表与其他词表的互操作标准
基于喷丸随机模型的表面覆盖率计算方法
新疆高校“后预科时代”面临的挑战及对策
语言与翻译(2015年3期)2015-07-18 11:11:05
基于覆盖率驱动的高性能DSP指令集验证方法
计算机工程(2014年6期)2014-02-28 01:28:03
留学生预科教育的管理——以北京大学预科教育管理经验为例