史浩阳,孙 焱
(山西医科大学管理学院,山西 太原 030001)
如何有效地利用信息技术建立科学完善的医院信息管理体系是当今学者研究的一个热点。本文通过对医院信息管理领域相关的文献进行可视化分析和主题演化路径分析,来梳理和探讨国际上该领域的研究热点和研究脉络,从而为今后的国内该领域研究提供支持和参考。
Vosviewer软件是一种知识图谱可视化软件,核心原理是“共现聚类”,能用来挖掘不同类型的群体。SciMAT 是一款科学图谱分析工具,拥有强大的数据预处理、网络精简等功能,可以进行关键词、作者、参考文献等分析单元的聚类和可视化操作。
以Web of Science 的核心合集作为国外数据来源,检索1991-2020 时间段、检索式为TS=(hospital information management)OR TS=(hospital AND information management)的所有“Article”类型的论文并进行数据清洗,最后得到共计16191篇文献,经过数据清洗,剔除了无效和不相关文献最终得到15468 篇文献,为之后的数据分析准备有效数据。
本文从关键词分析、主题演化等方面入手,采用VOSviewer 对样本文献关键词进行可视化分析,运用SciMAT 有效获取医院信息管理的相关研究在不同时期的热点主题、主题演进动态及演化状态,探索国际上该领域的知识演化规律。
国外发达国家和地区医院信息系统起步较早,发展较快。图1 为利用VOSviewer 软件从论文的题目和摘要中提取的关键词形成的共现标签视图,由左到右逆时针划分五大热点聚类如图1所示。
图1 VOSviewer关键词共现标签视图
第一个聚类主要是医院信息管理与具体临床疾病相结合形成的各类疾病管理,包含关键词“heartdisease”、“surgical-management”等,主要是具体的临床疾病与管理相结合的聚类,说明医院信息管理领域中信息对临床疾病的管理和判断也发挥着重要作用,医院信息管理对疾病的控制和疾病预防诊断也是未来该领域发展的一个重要热点方向。
第二个聚类主要是医院信息管理与临床疾病病因分析、临床研究对象相结合的聚类,包含关键词“etiology”、“infectious-diseases society”等,这个聚类主要是将医院信息数据应用在对疾病的分析中,运用计算机技术、数学分析、数据分析与挖掘,对临床疾病的病因进行分析,并对临床疾病的病因进行预测和推测,说明在未来发展中病因分析和疾病预测也是医院信息管理发展的又一大热点方向。
第三个聚类主要是医院信息管理在具体急救方式中的应用和指导方针,包括的关键词“guidelines”、“emergency medical”等,这个聚类主要是通过对医院收集起来的数据进行组织形成一个实用的适用的指导方针,应对某种临床突发疾病,比如包括感染性休克、急性缺血性脑卒中等疾病,这个聚类说明了医院信息管理又一大研究热点是应用信息技术处理实际临床急救问题。
第四个聚类主要是医院信息管理发展的基础理论和基本方法,涉及关键词“information-technology”、“clinical descision-support”等,这个聚类主要是通过数据分析、数据组织处理,运用计算机和数学领域技术对医院有效管理,说明运用科学信息技术来有效地解决医院管理中出现的问题也是该领域热点研究方向。
第五个热点聚类主要是医院信息管理的具体应用,关键词 有“patient participation”、“self-management”、“quality of life”、“hospital anxiety”等,这一聚类主要是针对信息管理在医院具体应用中产生的问题和解决办法,是对近年来医院信息管理领域的发展和效果评价,该聚类主要研究热点包括信息组织管理、医院资源管理和医院数据查询与统计等。
2.2.1 发文量统计
对文献关键词集合的共词分析和聚类分析是获得特定时期研究主题的常用方法,对不同时间段聚类主题流向的分析可获得持续性研究主题的演化情况。国际上关于医院信息管理领域研究论文除个别年份下降整体呈上升趋势。从年度发文量上看国际医院信息管理领域一直在发展,这与大数据时代医院信息管理系统的建设不断发展有着必然联系,见图2。
图2 年度发文量
2.2.2 基于时间序列的主题演化分析
本文根据每年的发文量和文献增长速度,将这三十年分为五个时期,第一时期:1991-2000时间跨度为十年,这是医院信息管理领域起步阶段,每年发文量较少,新技术新关键词较少(见图3)。其余时期时间跨度都为五年。对每个划分的时区的参数和指标进行设置,选择分析单元为word,数据精简值和网络值根据五个时间段的文献数量按比例分别设置为(2,2,2,3,4)用来确保每个聚类主题在该时间段都具有代表性,聚类算法设置为简单中心算法。五个时区的主题演进情况如图3所示,其中各结点的大小对应聚类的文献总量,线的粗细与包含指数成正比关系,有线连接的两个聚类表示研究的连续性,线的粗细代表关联的紧密程度,可以得出以下三条较为明显的主题演化路径。
图3 1991-2020年医院信息管理研究主题的演进动态
第一条是医院信息管理技术演化,该主题演化由hospitals→performance→information-technology 形成,该条路径关注的是医院信息管理技术的可使用性和性能的安全性,Jeremy C Wyatt等作者在1995年讨论了信息管理对临床医生重要的原因,探寻临床信息系统的好处,Winter,AF 等人在2001 为了降低医院信息管理的复杂性,区分了战略、战术和作战信息管理,从不同角度更进一步的看待分析医院信息管理这一领域,该路径中信息技术与医院管理在演变过程中相互交叉融合,演化路径相对稳定且较为清晰。
第二条是紧急系统响应演化路径,该主题演化由emergency→accident→communication→perceptions 形成。Chaudhry 等在2010 年用一个实验具体阐述了远程监护可以改善心力衰竭的预后,结果表明,在采用疾病管理策略之前,对紧急情况的评估是非常重要的。Abraham,William T.等在2011 年从一项随机的对照试验得出结果:在临床症状和体征上增加有关肺动脉压的信息可以改善心力衰竭的治疗,该条路径主要集中于构建信息系统对具体急性疾病的响应和交流,通过完善对医院各种信息的管理来提高防控急性病和紧急事件的处理能力,该条路径说明医院信息管理领域在向更加专业化的方向发展。
第三条路径是关于解决医院管理遇见相关问题演化,该主题演化为hospitals→cost→medicationerrors→adverse-events→barriers,主要是用来解决医院信息管理过程中产生的错问题,比如用药错误、病房管理等,Grasselli等作者在2020年设计了一个实验,通过实验描述了2020 年2 月在意大利北部ICU 接受PCR 确诊的SARS-CoV-2 感染患者的人口统计学模型,具体说明临床技术和临床信息管理对重症监护病房的管理的重要性,该路径主要是用医院信息管理技术解决医院实际问题的路径。
2.2.3 2016-2020时期热点主题发展分析
SciMAT 绘制的聚类战略图可以反映主题类团的成熟度,也可以预测未来的发展趋势。2016-2020年热点主题战略坐标图如图4 所示,战略图中节点代表聚类形成的热点主题,数字表示主题相关文献量,文献量越多研究热度越大。横轴为中心度,代表与其他主题之间的关联强度,中心度值越大,在研究领域中越重要,演化能力越强。纵轴为密度,代表主题内部关键词之间的关联程度,密度值越大,主题发展越成熟。对该时期研究热点的演化状态分析如下。
2016-2020 年时期的聚类战略图中共有17 个聚类团,因为这一时期受到新冠肺炎疫情的影响,在2019 年底至今都是医院信息管理飞速发展的时期,该时期主题聚类坐标图(见图4)右上象限形成了信息技术(INFORMATION-TECHNOLOGY)等四个聚类,这一时期的右上象限形成的聚类与前时期相似,但该时期在信息技术聚类中出现了个人健康记录、结构方程模型、能力改革等关键词,说明这一时期的重要主题在前时期的演变过程中有了进一步发展,在前一时期的电子健康档案基础上演变成这一时期的个人健康记录,并出现了较为专业的结构方程模型,进而说明在该时期信息技术与医院融合的更加完美,位于图4右下的新兴主题中,出现信息系统专业工具、信息系统的设计和记录等关键词,人口聚类中还出现了慢性病的关键词,说明目前医院信息管理领域在治疗特殊人群的研究很少,但是也有该方向的研究,右下象限出现的主题聚类多是由前期大部分内容主题在演进过程中吸收技术发展后形成的热点主题,是领域中基础,具有发展潜力的热点主题。
图4 第五时期聚类战略图
本文是通过分析近三十年的国外关于医院信息管理领域文献,用文献计量学方法和可视化技术把握国际医院信息管理领域的发展热点趋势和主题演化。可以得到以下结论。
该领域共有三条明显的演化路径:医院信息管理技术演化、紧急系统响应演化和解决医院管理遇见的相关问题演化。从这三条路径可以看出,该领域经过近30 年的发展演化,路径逐渐趋于平稳,研究热点逐渐由医院转为信息技术与医院相融合的大方向,且随着时间不断推移,出现了专业化趋势,研究热点聚类主题包括医院信息管理对疾病的控制和疾病预防诊断、运用信息技术进行病因分析和疾病预测、医院信息管理在急救中的应用、医院信息管理技术发展等,利用信息处理技术解决临床实际问题将会成为该领域未来发展的热点研究方向,我们希望通过系统的了解国际上该领域的热点和演化规律,可以对我国相关研究有所帮助。
本文的研究存在不足之处:一是文献来源较为单一,仅来自于WOS 核心合计数据库,二是分析方法采用的是可视化和文献计量学相结合的方法,以后有必要学习一些新的分析方法如流行病学分析方法来完善本研究。