基于CiteSpace的新冠肺炎防控知识图谱及可视化分析

2021-01-07 01:59司威孙晓玲陈海红
赤峰学院学报·自然科学版 2021年12期
关键词:新型冠状病毒知识图谱疫情防控

司威 孙晓玲 陈海红

摘 要:自新型冠状病毒疫情暴发以来,疫情传播迅速,传染性强,感染范围广,严重威胁着人类的生命健康,疫情防控形势严峻,全国各地高度重视疫情防控,有效遏制了病毒的蔓延。本文从CNKI中国知网检索与新型冠状病毒疫情防控有关的期刊文献,时间跨度限定为2019年12月1日至2021年7月31日,检索到中文文献3389篇,并以此作为数据源,利用可视化图谱分析软件CiteSpace从关键词、作者、合作机构等多个角度进行聚类分析并绘制可视化图谱,得出“疫情防控”“应急管理”“突发公共卫生事件”等研究热点,随着疫情的发展,研究热点向“护理管理”“线上教学”等方向进行扩展;在作者合作上还没有形成大型合作团体,主要以分散的形式存在;在研究机构上跨地域合作并未形成。在后疫情时期,疫情防控正由应急状态向常态化精准防控进行转变。

关键词:新型冠状病毒;疫情防控;知识图谱;CiteSpace

中图分类号:R222.18  文献标识码:A  文章编号:1673-260X(2021)12-0054-04

2019年末武汉爆发了新型冠状病毒性肺炎[1](Corona Virus Disease 2019,COVID-19),突如其来的疫情严重影响了人们的工作和生活,以习近平同志为核心的党中央高度重视,始终坚持人民至上、生命至上的原则,在全国范围内统一指挥,全面部署,形成了立体防控的战略布局,取得了抗击疫情的阶段性胜利。但疫情还远没有结束,境外的输入病例的变异毒株的出现,不断考验着我国的疫情防控措施,全国总体防控策略调整为“外防输入、内防反弹”,疫情防控工作由应急管理向常态化精准防控转变。

在疫情发展过程中,为更好地应对疫情做好防控工作,国务院应对新型冠状病毒性肺炎疫情联防联控机制综合组制定了新型冠状病毒性肺炎防控方案[2],同时众多机构和研究者也从防控措施、防控策略、人工智能、线上教学等多个角度对疫情防控过程中的重点问题进行研究和总结。本研究通过使用结合数学、统计学、文献学为一体的文献计量学方法,对CNKI中国知网中获取的大量文献进行定量分析生成一系列可视化圖谱,除了数据显示直观外更重要的是发现在疫情防控过程中当前研究热点和未来发展趋势,为后疫情时期的疫情防控指明方向。

1 数据来源与研究方法

1.1 数据来源

数据是从CNKI中国知网上检索与新型冠状病毒疫情防控相关的文献,检索时间限定为2019年12月1日至2021年7月31日,检索时使用“新型冠状病毒”“新冠肺炎”和“疫情防控”等作为主题词,文献来源限定为期刊,共检索到中文文献8215篇,为确保数据的完整性、准确性和相关性,经过人工筛选,剔除与研究主题无关、信息不全面、重复的文献以及领导人讲话、会议、新闻、通知、评论员文章等无效文献,处理后共得到有效文献3389篇。

1.2 研究工具

本研究选取CiteSpace 5.8.R2作为研究工具对文献进行可视化研究。CiteSpace[3]是一款运行在JAVA环境下由陈超美博士及其团队开发的应用于文献计量学中的知识图谱工具,能够呈现某个研究领域中科学发展的新趋势和新动态,并以可视化的形式绘制出合作网络、共现网络、文献共被引以及文献耦合等多方面的图谱。

1.3 研究方法

将从CNKI中国知网检索到的期刊文献以Refworks格式导出,按照download_xx.txt格式命名并以此作为数据源,将文件导入到CiteSpace软件中进行数据格式转换,格式转换完成后进行可视化分析。

在CiteSpace软件中新建项目,设置时间跨度为2019年到2021年,时间切片设置为一年,节点类型选取作者、研究机构以及关键词分别绘制可视化图谱。在生成的可视化图谱中观察节点的数量、大小、节点间连线数量、模块大小、聚类模块值(Modularity Q)和聚类平均轮廓值(Mean Silhouette)等指标参数,分析本领域当前研究的热点问题,以及预测未来的趋势。

2 结果分析

2.1 发文量分布情况

发文数量的多少代表着研究机构和研究者对该领域关注度的大小。2019年12月至2021年7月从CNKI中国知网检索的与新型冠状病毒疫情防控有关文献按月统计的发文量如图1所示。从图中可以看出,在新型冠状病毒爆发的首月虽未出现疫情防控相关文献,但从次月开始连续3个月发文量呈现爆发式增长,表明疫情发生后,疫情防控方面的问题迅速成为研究热点,各研究机构和学者纷纷投入相关方面的研究,为我国各单位、各行业疫情防控工作提供了科学有效的指导,有效遏制了新型冠状病毒的蔓延。自2020年5月后发文量逐渐减少,表明我国在抗击疫情过程中取得了阶段性胜利,相关的防控措施和防控策略等相继完善,在后疫情时期,疫情防控由应急状态向着常态化精准防控转变。

2.2 文献发表作者合作分析

在CiteSpace可视化软件中选取节点类型为“Author”,得出新型冠状病毒疫情防控文献作者合作网络分析图谱,如图2所示,该图谱密度为0.0193,图谱密度较低,表明作者较多但相对比较分散,从节点间连线来看,节点间连线较少,表明作者间合作并不紧密,合作关系主要是张英泽、杨丽、张明与其他作者间的合作。

2.3 研究机构合作分析

在CiteSpace可视化软件中选取节点类型为“Institution”,得出新型冠状病毒疫情防控文献发文作者合作机构网络图谱,如图3所示,通过该图谱发现发文机构主要是以大学和其附属医院为主,尤其是疫情发生地区(武汉)和科技发达地区(北京、上海等)的综合性医院,发文量较多的是华中科技大学同济医学院、北京大学第三医院、武汉大学中南医院、武汉大学社会学院等,研究机构比较分散,并未形成大型合作团体,合作仅局限于本地,地域间合作比较少见。

2.4 文献关键词共现分析

关键词是对一篇文献的核心概括,分析国内疫情防控过程中出现的高频率和高中介中心性关键词,能够窥探文献的主题,进而发现该领域当前的研究热点和趋势。

2.4.1 关键词共现分析

在CiteSpace可视化软件中选取节点类型为“Keyword”,由于文献中关键词相对比较集中,可视化图谱重叠严重,可读性差,为了使图谱中的节点和连线呈现得更加清晰对生成的图谱使用Pathfinder算法和Pruning sliced networks策略进行了剪枝处理[4],得出关键词共现图谱,如图4所示。图谱中节点数量为451,节点连线数为624,网络密度为0.0061。图谱中节点的大小代表该关键词出现的频次,节点越大表明该关键词出现的频次越高,与当前研究领域的相关性越强。根据图谱显示,除了疫情防控、新型冠状病毒性肺炎、新冠肺炎等关键词外,突发公共卫生事件、应急管理、感染防控等均属于高频词汇,除此之外随着疫情的发展和后疫情时期的到来,护理管理、线上教学等其他热点逐渐衍生出来成为重要关注点。

在关键词共现图谱中,为更清晰地显示热点词汇,剔除了与新型冠状病毒表述同义的名词,得到10个高频次高中介中心性关键词汇,如表1所示。高频次关键词代表了一定时期内本领域的研究热点和发展趋势[5];当图谱中中介中心性值大于0.1时,表明该关键词在本网络中影响较大[6],其中疫情防控、医疗机构、应急管理等关键词均具有较高的中介中心性。

2.4.2 关键词聚类分析

聚类分析按照数据特征进行分类,能够发现数据间潜在的依赖关系,本研究运用LLR聚类算法对关键词共现图谱进行聚类分析,共得到25个聚类,聚类模块值(Q值)和聚类平均轮廓值(S值)分别为0.7585和0.886,其中Q>0.3表示聚类结果显著,S>0.5表示聚类合理,因此本图谱聚类后完全符合上述标准,聚类效果较好。选取其中范围最大的10个聚类进行分析总结,根据研究的领域和热点进行归类:

#0、#3、#8大数据以及人工智能在疫情防控中的应用,自新型冠状病毒爆发以来,借助大数据及人工智能技术,构建了各类数字化平台[7],通过联防联控、网格化管理等方式,在疫情溯源与监控、物资调度等方面为疫情防控提供了强有力的数据支持。

#1国家和党中央对疫情防控的高度重视,各地各部门高度配合,全国人民众志成城,形成了伟大的抗疫精神,彰显了中国特色社会主义制度的优越性。

#2、#7、#9各行各业依据自己的行业特点,结合国家对于疫情防控的要求,制定有针对性的疫情防控措施和策略,构建了科学、精准、有效的防控机制;

#4为阻断疫情向学校蔓延,根据疫情防控要求,疫情期间“停课不停学”,各大中小學突破传统教学模式通过各种网络平台开展在线教育,促进了优质教学资源的共享,推动了教学模式的创新和改革;

#5新型冠状病毒是突发性公共卫生事件,在疫情防控救治中,形成中西医结合[8]、优势互补的救治方案,对新型冠状病毒的预防和诊疗起到了良好的效果;

#6面对突如其来的疫情,公众可能会出现焦虑、恐惧、抱怨等情况,在常态化疫情防控下,对各类人员尤其是重点人群(如一线医务工作者、患者等)进行有针对性地心理健康方面的干预和疏导。

关键词聚类明细表如表2所示。

3 总结及期望

本文采用文献计量学方法,使用CiteSpace可视化软件对与新型冠状病毒疫情防控有关的中文文献进行分析,以可视化图谱的形式,绘制了作者合作网络、研究机构合作网络、关键词共现网络三个方面的图谱,通过对图谱进行分析,得出结论。

新型冠状病毒疫情是突发公共卫生事件,在疫情出现早期疫情防控有关文献出现了暴发式增长,为做好各行业疫情防控提供了科学的指导意见和规范,在疫情相对稳定后相关文献逐渐减少并趋于稳定。作者间尚未形成相对稳定的合作团体,各研究机构间跨地域合作较少。我国虽然取得了抗击疫情的阶段性胜利,但疫情尚未结束在后疫情时期更应加强疫情防控管理,在此希望各研究机构和学者间加强合作,提高科研水平,为打赢疫情防控阻击战提供科学的指导和技术支撑。

疫情防控研究的内容和涉及的领域众多,除了防控措施、防控策略、应急管理等研究外,还向着大数据人工智能、线上教学、心理健康等方向进行扩展研究,为后疫情时期实现精准防控和企业复产复工以及大中小学及幼儿园复课的有序推进提供了常态化的疫情防控保障。

本文仅针对CNKI中国知网的文献数据对我国的疫情防控做了初步分析,发现了当前我国疫情防控过程中的热点和研究趋势。但新型冠状病毒疫情已经在全球范围内蔓延,本文并未对外文数据库进行检索,对国外的疫情防控没有进行研究分析,在后续的研究过程中将进一步补充完善。

参考文献:

〔1〕World Health Organization.WHO Director-General’s remarks at the media briefing on 2019-nCoV on 11 February 2020 [EB/OL]. https://www.who.int/dg/speeches/detail/director-generals-remarks-at-the-media-briefing-on-2019-novel-coronavirus-8-february-2020,2020-02-18.

〔2〕国家卫生健康委员会办公厅.新型冠状病毒性肺炎防控方案(第八版).(2021-5-14).http://www.nhc.gov.cn/xcs/zhengcwj/202105/6f1e8ec6 c4a540d99fafef52fc86d0f8/files/4a860a7e85d14d5 5a22fbab0bbe77cd9.pdf.

〔3〕Chen Y, Chen CM, Liu ZY, etal. Methodological functions of CiteSpace knowledge mapping Science of science research,2015,33(02):242-253.

〔4〕Chen Chaomei, Morris Steven. Visualizing evolving networks: Minimum spanning trees versus Pathfinder networks. Proceedings of IEEE Symposium on Information Visualization 2003, IEEE Computer Society Press,2003:67-74.

〔5〕令娟,樊玉清,胡兰文,等.基于CiteSpace及VOSviewer的2019新型冠状病毒研究热点的可视化分析[J].中华医院感染学杂志,2020,30(10):1468-1474.

〔6〕李杰.CiteSpace中文指南[EB/OL].http://blog.sciencenet.cn/blog-554179-1066981.html,2017 -07-18.

〔7〕李德仁,邵振峰,于文博,等.基于时空位置大数据的公共疫情防控服务让城市更智慧[J].武汉大学学报(信息科学版),2020,45(04):475-487.

〔8〕鲍丙豪,王彬,王继升,等.基于CiteSpace软件的中医治疗新冠肺炎等疫病研究状况及趋势的可视化分析[J].世界科学技术-中医药现代化,2020, 22(03):589-596.

猜你喜欢
新型冠状病毒知识图谱疫情防控
突发公共卫生事件中的药物使用法规依据
疫情防控下的高校网上财务管理思考
“新型冠状病毒”该如何防治
2013~2018年乌鲁木齐市猩红热流行病学特征分析
安徽省人畜共患病细菌性传染病综述
2013~2017年东莞市大岭山医院急诊科接种狂犬疫苗情况分析
传染病信息披露制度的法律建构与反思
基于知识图谱的产业集群创新绩效可视化分析
基于知识图谱的产业集群创新绩效可视化分析
基于知识图谱的智慧教育研究热点与趋势分析