王 桐 王 伟 车宏鑫 吴可凡 陈 祥
(吉林大学公共卫生学院医学信息学系 长春 130021)
医学信息学于20世纪70年代初由国际信息处理协会首次提出[1],是以信息学、信息管理和信息技术为依托,研究医学领域中的信息现象和信息规律,用于医学决策和管理的一门交叉学科[2]。随着全球发达国家对医疗健康信息化日益重视,我国也积极建设医疗卫生信息化服务体系[3]。社会对医学信息相关专业人才的需求随之增加,然而医学信息专业本科生就业岗位与专业匹配度不高[4],这对医学信息教育提出更高要求。将中美两国医学信息教育进行对比发现[5],我国医学信息教育以本科教育为主,开展硕博研究生培养的高校数量较少。研究生培养较本科生培养在科研问题识别、理论和方法创新方面要求更高[6],但目前缺少对医学信息相关专业研究生培养特征的分析。同时,医学信息学是交叉学科,强调学科知识整合、共享和交融[7],具体指利用多个学科的理论、方法和技术解决医学信息领域科学问题。分析我国医学信息相关专业的跨学科特征对完善培养方案具有重要指导作用。因此本研究以研究生学位论文为数据基础,探究医学信息学科交叉现状,分析医学信息相关学科研究生培养内容特征,总结当前我国医学信息高层次人才培养特点,以期为完善医学信息高层次人才培养体系提供参考借鉴。
参考中国医学发展系列报告中医学信息学进展[8]相关内容选取研究对象,确定医学信息研究生教育二级学科专业名称;通过中国研究生招生信息网筛选具体专业名称,包括医学信息学、医学/医药/智能/卫生信息管理、医学信息工程/系统/技术、中医药/药学信息学、医学生物信息学/生物医学信息处理/生物医学信息与仪器、计算医学/健康数据科学。由于本研究目的是探究医学信息专业研究生的跨学科研究特征,而管理学门类下相关专业多为本科专业,如信息管理与信息系统(医学信息方向),因此未纳入分析,最终确定具有相关专业的39所高校。通过中国知网硕博士论文数据库进行查询,共有18所高校相关专业可检索到公开学位论文,涉及13个学科,已毕业博士70名和硕士188名,见表1。提取其论文所标注的中国图书馆分类代码[9]及论文摘要。检索时间为2021年12月1—5日。
表1 研究对象基本情况统计分析
2.2.1 学科分布基本统计分析 对学位论文中标注的二级学科分类代码进行描述性统计分析,了解医学信息相关专业研究领域的基本分布。按专业名称分别统计代码分布情况,对比不同专业在研究内容上的学科侧重。
2.2.2 基于VOSviewer的论文分类代码共现分析 以中国图书馆分类代码[9]作为学位论文学科归属的测量指标。同一篇论文被赋予多个分类代码体现医学信息领域同一个研究课题的多学科交叉。分类代码共现可以揭示医学信息专业不同研究方向中各细支学科知识互换和交叉的模式。因此借助可视化分析工具VOSviewer对学位论文标注的分类代码进行共现与聚类。
2.2.3 基于隐含狄利克雷分布模型的学位论文研究主题分析 以学位论文摘要为数据源,构建语料库,基于隐含狄利克雷分布模型主题建模对摘要内容进行语义分析,挖掘医学信息研究的主题分类。对所有毕业论文进行主题识别,分析医学信息宏观研究内容的主题分布;根据专业名称划分3个类别,分别进行主题识别,对比分析不同专业研究内容上的异同。中文摘要的自然语言处理通过Python的jieba库实现。
根据学位论文所属二级学科的分布(仅显示频次大于等于3的学科分类),当前医学信息专业使用最多的方法和技术源于计算机科学领域,围绕基础医学、肿瘤医学和预防医学相关问题展开研究。根据名称将专业进一步划分为3类:生物医学信息学、医学信息学和中医药信息学。对3类专业分别进行分析,医学信息学和中医药信息学仍以计算机科学为主要方法,但医学信息学以预防医学和肿瘤学为主要研究问题,中医药信息学主要解决中医学和临床医学中的科学问题。生物医学信息学则以生物化学、分子生物学、肿瘤学等为研究核心,侧重于基础研究,见表2。
表2 各类别专业研究生选题所属的二级学科(部分)
根据学科代码共现关系,所有学科分类号可聚为10类,见图1、表3。
图1 医学信息专业的学科分类共现
表3 医学信息专业研究生选题共现分类及所属学科
其中分类4是所有医学信息相关专业研究内容的核心,包含计算技术、计算机技术、临床医学、生物物理学、神经病学与精神病学、仪器、仪表,以解决医学相关问题为目的,以计算机技术为手段,应用于医疗健康领域。
医学信息专业研究生选题内容主题建模可视化结果,见图2;医学信息相关专业学位论文研究主题,可归纳为7个,见表4。3个专业类别下研究内容的主题分布,见表5。
图2 研究内容主题建模可视化
表4 医学信息相关学科研究生毕业论文摘要主题及关键词
表5 不同专业类别研究生毕业论文摘要主题及关键词
当前我国高校医学信息相关专业建设并不统一,名称上仅中医药信息学达到一致。生物医学信息学相关专业名称差异较大,存在医学生物信息学、生物医学信息技术及生物医学信息处理多个表述,医学信息学相关专业也存在同样现象。不同表达揭示了学科侧重方向,但不利于整个学科体系的规范管理,仍需进一步统一。
不同专业类别在选题上具有明显差异,生物医学信息学以生物化学、分子生物学和肿瘤学为主要组成,以计算机技术与生物技术为研究手段,解决细胞及更细化层面的生物医学问题。中医药信息学利用计算机技术处理中医领域的科学问题。医学信息学关注信息处理方法和理论的创新及改进,以提出更高效率和精度的数据和信息处理技术、方法及模型理论为导向。虽然医学信息的3个专业类别均涵盖多个学科,但在信息与知识传播等方面探究较少。
当前医学信息专业的研究以医药卫生、工业技术及生物医学为核心。以解决医学相关问题为目的,借助信息科学及计算机科学的理论和方法解决科学问题是医学信息专业跨学科研究的主要模式,因此培养单位应以医学及计算机科学为培养核心,开设理论及方法实践课程。可根据研究生本科教育经历,提供薄弱环节的选修课程。为非医学生提供医学技能培训,如开设疾病与健康检测方法、诊断和治疗干预、疾病预防等课程。为医学相关专业学生提供信息科学及计算机科学相关课程,例如数据库开发、编程技术、数据挖掘、信息检索、信息组织等,提高数据收集及处理组织能力。随着数据时代的快速发展,要不断更新课程内容。计算机科学、数学与计算生物学、保健科学、统计与概率等是全球医学信息主要学科组成[10]。相比国际医学信息学科发展,我国在数学等学科方面较为薄弱,缺少数学及建模方面相关研究。
4.3.1 前沿主题研究尚待加强 医学信息学前沿主题可分为5个:基于网络的认知行为疗法、可穿戴智能运动检测设备、移动医疗及适用于健康医疗的智能移动端应用、基于网络的干预治疗研究和移动医疗及数字医疗[11-13]。我国研究生所开展的研究内容较少涉及上述选题,在探知前沿方面仍需锻炼。国际医学信息学近10年研究热点可分为5类:生物医学信息学、卫生信息系统的开发与管理、卫生信息分析方法与实际应用、人工智能在临床诊疗中的应用、医学信息学新技术的应用与发展[14-15]。我国研究生对前3个热点均有探究,但对新技术,如移动健康、远程医疗及数字疗法等方面探究较少,应增加相关课程或讲座,培养研究生对前沿信息的快速掌握能力。
4.3.2 生物医学信息学与中医药信息学研究特征具有明显差异 生物医学信息学以基因、蛋白质和细胞层面的科学问题为核心,利用计算机和信息技术及方法解决问题。因此该学科应保证研究生具备基础医学相关知识,关注组织及以下水平的研究前沿问题,进行计算机及信息分析相关技术培训。中医药信息学是我国特色学科,目前处于起步发展阶段,应多关注中医结构化及非结构化数据特征的识别,融合医学信息学解决问题的科学方法处理中医学相关问题。除基本知识相关课程外,也应尝试开设以研究为基础的教学课程,规范研究生科研流程,培养科研思维以及处理未知问题的科研能力。
通过对我国医学信息相关专业研究生学位论文进行学科分布及研究内容分析,探索医学信息专业的跨学科特征,研究结果对医学信息高层次复合型人才培养方案的完善及更新具有指导价值。对258位研究生的学位论文进行分析发现:首先,医学信息专业的研究以医药卫生、工业技术及生物医学的跨学科交叉为主;其次,与当前国际医学信息学研究热点及研究前沿相比,新技术及应用的相关研究较为薄弱,应增加获取前沿研究信息的渠道及训练。最后,各专业应根据研究内容侧重,提供符合学科特色的核心课程,并以科学研究为基础进行科研思维、逻辑和能力的培养及训练。当前我国医学信息相关专业在专业名称、培养目标、骨干课程和学科隶属关系等方面存在问题,建议加强规范化管理和标准化建设,各院校形成合力,推动医学信息专业和学科的高质量发展和可持续发展。