基于文献计量视角的医学信息学高被引论文特征研究

2022-09-09 10:13陈晓炜邢美园
医学信息 2022年15期
关键词:科研机构信息学资助

陈晓炜,邢美园

(浙江大学医学院附属第一医院图书馆,浙江 杭州 310003)

自20 世纪70 年代末首次规范医学信息学(medical informatics,MI)学科名称以来[1],国际医学信息学领域发展迅速。我国于20 世纪80 年代起发展医学信息学[2],科研学者积极开展相关研究,但研究成果及科研能力仍有较大提升空间。因此,分析国内外医学信息学领域高质量论文的文献特征信息有助于提升我国的科研质量。目前已有研究采用文献计量学对该领域的学科发展路径[3]、发展趋势、研究热点、学科教育等[4-7]进行深度剖析,但存在仅讨论国内医学信息学发展、侧重分析研究热点及发展趋势、发表时间较早、文献质量良莠不齐等不足。本研究以2022 年3 月10 日基本科学指标(ESI)数据库更新的医学信息学高被引论文(Highly Cited Papers)为研究对象,对发文年限、期刊、作者、国家/地区、研究机构、基金等文献特征信息进行分析总结,利用Incites 平台、VOSviewer_1.6.13 和CiteSpace 5.8.R3 可视化软件进行深入挖掘,以期追踪核心国家、核心机构、核心作者的科研表现,揭示国际医学信息学研究现状,旨在为我国医学信息学领域研究人员开展科研工作提供客观数据支持。

1 资料与方法

1.1 数据来源 在Web of Science 核心合集的SCI 数据库(Science Citation Index Expanded)中检索医学信息学领域相关文献,检索式为“Web of Science 类别=Medical Informatics”,点击“Highly Cited Papers”,共获得ESI 高被引论文479 篇,其中8 篇为热点论文,期刊论374 篇,综述105 篇,会议7 篇。

1.2 方法 使用Microsoft Excel 和Incites 平台整理统计文献特征信息;Python 脚本对作者数据进行归并整理,仅统计位列第一的作者信息,整理归并机构数据时仅统计分析一级机构,并进行人工确认。同时,使用VOSviewer_1.6.13 和CiteSpace.5.8.R3 软件绘制国家/地区合作网络和科研机构合作网络图谱。

2 结果与分析

2.1 发文年份特征 医学信息学领域的总发文量和高被引论文数呈总体上升趋势,2020 年尤为明显。高被引论文的总被引次数为101 619 次,篇均被引次数为212.15 次,6 篇被引次数超过1000 次,29 篇超过500 次。根据文献被引的时间累积效应,总被引次数和篇均被引次数呈逐年递减趋势。但在2012年和2013 年出现波动,分析发现这两年引用频次超过500 次的文献分别为7 篇和8 篇,提示这两年医学信息学领域涌现出大量的优秀科研成果,见表1。

表1 医学信息学高被引论文年度分布(2011-2021 年)

2.2 期刊分布特征 479 篇高被引论文来源于24 种期刊,见表2。其中22 种为多学科期刊,发表数量最多的是JOURNAL OF MEDICAL INTERNET RESEARCH。从出版国家看,英国期刊最多(10 种),其次是美国(5 种)。从影响力看,14 种期刊在该领域中排名前50%,为JCR Q1 区,6 种JCR Q2 区,7 种2020 年影响因子大于5 分,LANCET DIGITAL HEALTH最高,为24.519,24 种期刊平均影响因子为5.01。近半数高被引论文发表在该领域5 分以上的期刊上(46.56%),表明医学信息学研究逐渐受到学术界的重视。

表2 医学信息学高被引论文发文期刊分布前10 位(2011-2021 年)

2.3 作者分布及合作 高被引论文中24 篇为独著(5.01%),455 篇合著(94.99%)。文献署名1~98 人不等,87.89%的文献署名人数在2~10 人,署名4 人的最多(86 篇,17.95%)。利用VOSviewer 软件对文献合作数量大于3 篇的高被引论文进行作者合作网络分析,发现仅形成3 个合作团体,且团队间合作较少,表明国际上该领域已形成一批专业研究团队,内部合作较为密切,但需进一步提升团队间合作意识。

分析核心作者发现,该领域共有3 人以第一作者发表3 篇及以上高被引论文,见表3。20 人以第一作者发表2 篇,可认为他们是目前国际医学信息学领域的重要人物。加拿大多伦多大学的Peter C Austin 高被引论文数量最多,其次是英国剑桥大学的Dan Jackson 和加拿大西安大略大学的G Y Zou。虽然部分研究人员仅发表1 篇高被引论文,但不能忽视其对医学信息学发展做出的贡献,如剑桥大学Ian R White2011 年发表的Multiple imputation using chained equations: Issues and guidance for practice[8]被引频次达4244 次;范德比尔特大学Paul A Harris2019 年发表的The REDCap consortium: Building an international community of software platform partners[9]被引频次达2209 次。

表3 医学信息学一作高被引论文数超过3 篇的作者信息(2011-2021 年)

2.4 全球产出贡献及国际合作研究 479 篇高被引论文共来自64 个国家/地区。美国最多,高被引论文数高达223 篇,其他高产出国家有英国、加拿大、我国和澳大利亚等,见表4。美国、英国和我国的总被引频次均超过10 000 次;排名前10 的国家中仅我国、荷兰、英国和美国的篇均被引次数指标超过200 次。由此可见,我国医学信息学发展迅速,高被引论文的数量、质量及影响力均位于全球前列。

表4 医学信息学高被引论文数量排名前10 国家/地区(2011-2021 年)

高被引论文数量及合作国家数量呈整体上升趋势,24 篇独著文献涉及12 个国家/地区,226 篇国家/地区内合作文献涉及26 个国家/地区,229 篇国际合作文献涉及64 个国家/地区,见表5。对文献合作数量大于3 篇的高被引论文进行国家/地区合作网络分析,见图1,表明各国间科研合作密切,国际合作日益频繁。CiteSpace 分析发现德国、比利时、南非、丹麦等国家节点的中介中心性较强,见图2,表明对医学信息学领域高被引论文的合作网络具有较大贡献。

图1 VOSviewer 医学信息学高被引论文国际合作研究情况(2011-2021 年)

图2 CiteSpace 医学信息学高被引论文国际合作研究情况(2011-2021 年)

表5 医学信息学高被引论文国际合作研究情况(2011-2021 年)

2.5 科研机构产出及合作 479 篇高被引论文共涉及964 所科研机构,一作归属科研机构306 所。排名前10 的研究机构中6 所来自美国,4 所来自英国,1 所来自加拿大,见表6。哈佛大学、伦敦大学和多伦多大学的总被引次数均超过7000 次,篇均被引次数超过300 次的有伦敦大学、伦敦大学学院和英国医学研究委员会生物统计学所,表明英国知名科研机构虽然发文量不及美国,但文献质量及影响力不亚于美国。

表6 医学信息学高被引论文数量排名前10 研究机构(2011-2021 年)

我国共65 所科研机构为医学信息学高影响力科研产出作出贡献,其中大陆55 所、香港5 所、澳门1 所、台湾4 所;54 所为高校/研究院、9 所为医院、2所为政府部门。中国科学院发表文献数量最多(5篇),其次是香港中文大学(4 篇),之后是北京理工大学、北京协和医学院、华中科技大学、深圳大学、中山大学、温州大学、香港理工大学和香港大学(3篇),提示高校/研究院是我国医学信息学领域的研究主力军,但整体科研水平及影响力仍有待进一步提高。

为进一步了解科研机构合作情况,采用VOSviewer 软件对合作数量大于3 篇的高被引论文进行机构合作网络分析见图3,发现哈佛大学、伦敦大学、加州大学、斯坦福大学等国际知名高校的科研合作网络十分密集。CiteSpace 结果显示,香港中文大学、约克大学、北卡罗来纳大学、美国国立卫生研究院、约翰斯·霍普金斯大学、西奈山伊坎医学院的机构节点中介中心性较强,表明其对该领域科研合作网络的贡献十分突出。我国大陆科研机构的合作水平较少,仍需重视培养科研团队合作能力及合作意识,拓展国际合作交流圈。

图3 医学信息学高被引论文机构合作研究情况(2011-2021 年)

2.6 基金资助 基金资助文献往往具有较高的研究水平和意义。高被引论文中共有334 篇获得基金支持,总被引次数为73 775 次,篇均被引次数为220.88 次;145 篇无基金支持的高被引论文总被引次数为27 844 次,篇均被引次数为192.03 次。由图4 可知,2011-2021 年基金资助的高被引论文数量呈总体上升趋势,但占各年高被引论文总量的比例呈总体下降趋势。综上所述,基金资助对文献质量具有重要作用,但并非决定因素。

图4 医学信息学高被引论文基金分布情况(2011-2021 年)

基金资助机构中排名前10 的资助机构大部分归属于美国和英国,见表7。美国卫生与公众服务部和美国国立卫生研究院资助的高被引论文数超过100 篇,欧盟委员会和英国科研创新办公室资助超过50 篇。我国国家自然科学基金共资助19 篇高被引论文,排名第9,且资助时间均为2015 年之后。2015 年前后我国出台了一系列医疗卫生信息化建设的政策方针,如关于促进和规范健康医疗大数据应用发展的指导意见[10]、“健康中国2030”规划纲要[11]、“十三五”卫生与健康规划[12]等,表明政策支持有助于推我国医学信息学的高质量发展。

表7 医学信息学高被引论文数量排名前10 的基金资助机构(2011-2021 年)

3 讨论

本研究以ESI 数据库为数据来源,基于文献计量学对2011-2021 年医学信息学高被引论文的文献特征进行分析,探讨国际医学信息学领域的研究态势。研究发现,近10 年医学信息学的研究方向逐渐广泛,发文量和高被引论文数量呈增长态势,欧美等发达国家所占比重明显,且大部分受基金资助,中国国家自然科学基金的资助文献仅占3.97%。此外,该领域已形成明显的国际科研态势,美国、英国和我国的产出量、被引次数指标均位于前列。高被引论文往往由多位来自不同科研机构的科研人员以共同合作的方式完成,且以国际合作或国家/地区内部合作为主,提示多方合作更利于完成高质量论文。

现阶段我国医学信息学已处于高速发展阶段。从2011-2012 年的零成果到2015-2021 年高被引论文数持续位列前5,2020 年达到高峰,7 篇文献的被引数量超过200[13-19],表明在该领域我国已实现质和量的飞跃,成为国际医学信息学领域的高生产力和高影响力国家之一。从核心作者和科研机构指标上看,我国高被引论文虽多以团队合作形式完成,但与其他国家/科研机构的合作较少,提示尚未完全形成高质量的研究团队,需重视与知名高校和科研机构的合作交流,拓展学术交流圈。此外,基金资助情况是反映一个国家对学科重视程度的指标之一[20]。我国国家自然科学基金资助的高被引论文总数占比不到4%,占我国该领域基金资助ESI 高被引论文的50%,表明对医学信息学学科发展的重视程度有待提高。

综上所述,10 年来国际医学信息学领域发展迅速,国家、机构及作者间合作活跃。我国在该领域的科研水平和影响力提升显著,但核心作者、国际/机构间的合作层次不足,有待进一步改善。积极关注高产国家的科研机构、核心作者的科研动态,及时掌握热点前沿,加强知识交流意识,拓展研究方向,有助于推动国内医学信息学的发展。本文存在一定局限性,由于数据来源仅为Web of Science 核心合集SCI 数据库,虽然保证了文献质量,但是数据范围过窄。此外,由于医学信息学为典型的跨学科领域,研究方向广泛,部分高影响力文献并未列入该类别,导致未纳入研究范畴,可能影响结果的精确性。

猜你喜欢
科研机构信息学资助
鸡NRF1基因启动子区生物信息学分析
高校资助育人成效的提升路径分析
“隐形资助”低调又暖心
初论博物馆信息学的形成
美国防部资助研发能垂直起降的无人机
科研机构科技成果规模化转化模式研究
企业-科研机构合作创新的演化博弈分析
2600多名贫困学生得到资助
miRNA-148a在膀胱癌组织中的表达及生物信息学分析
霍尼韦尔新型制冷剂获欧盟科研机构认可