基于CiteSpace的“区块链+医疗”领域研究热点及前沿分析

2022-02-04 04:53李向荣孙立辉
河北省科学院学报 2022年6期
关键词:发文聚类区块

李向荣,赵 霞,孙立辉

(河北经贸大学信息技术学院,河北 石家庄 050061)

0 引言

区块链作为国家大力发展的“新基建”之一,在技术革新和产业变革中发挥着重要作用,区块链技术的应用领域也逐渐广泛[1]。关于医疗行业的发展,中共中央印发的《“健康中国2030”规划纲要》提出要提供优质高效的医疗服务,加强健康医疗数据安全保障和患者隐私保护[2]等要求。当前,在医疗领域信息化和数字化的应用已经比较完善,配备着完备的医疗数字信息系统,很大程度上提高了工作效率。但是,这些医疗信息系统都是互相独立的,存在医疗信息安全性低、医疗数据不共享的问题[3]。为解决以上医疗行业的问题,基于区块链技术建立分布式医疗综合信息平台,系统化管理医疗信息资源以优化临床试验,对提高医院工作效率、保证数据安全和可靠性等方面有重要意义[4]。

本文通过中国知网收录的以“区块链+医疗”为主题的文献为数据来源,使用科学计量学分析软件CiteSpace对文献年发行量、作者合作关系、关键词共现、文献聚类、时间脉络发展、关键词突现等内容进行分析。了解“区块链+医疗”领域的研究现状和发展趋势,探寻区块链在医疗领域的研究热点和发展趋势,以期为研究者提供参考。

1 研究数据与方法

1.1 研究数据

研究数据来源于CNKI数据库,对国内区块链在医疗领域的文献进行分析研究。为表现研究领域内容的充分性,时间选择2016—2021年,以“区块链+医疗”“区块链+健康”“区块链+药”为检索主题的核心学术期刊和学位论文,并将主题内容相似度低的文献进行人工剔除筛选,最终检索到文献共175篇,将文献数据以txt文本格式导出使用。

1.2 研究方法

CiteSpace是一款在科学计量学、数据可视化背景下逐渐发展起来的引文可视化分析软件[5]。本文通过使用文献计量学方法和可视化视图从多个角度对区块链在医疗领域的相关研究进行整理和分析,客观地展现出当前该领域的研究现状、热点问题和发展趋势。此次研究主要运用CiteSpace.5.8.R1和其他文献计量软件,分析采集到的“区块链+医疗”文献数据的年度发文量、作者合作网络分析领域发展的趋势,根据关键词共现网络、聚类网络等以探究该领域的研究热点,根据时间线发展和关键词突现情况更好地预测该领域的发展趋势。

2 基于CNKI的“区块链+医疗”领域研究分析

2.1 年度发文量

通过对2016—2021年期间发表的175篇“区块链+医疗”领域的相关文献进行年度发文量统计分析,可以发现,近五年来关于区块链在医疗领域应用的发文量逐年增多的趋势,如图1所示。

2016—2018年,发文数量均小于15,呈现一个缓慢增长的趋势,说明该领域研究受到的关注度较低,处于初始阶段中。2019年10月24日,中央政治局第十八次集体学习时强调,区块链技术的集成应用在新的技术革新和产业变革中起着重要作用。此次会议确定了区块链的作用与地位,极大地推动了区块链技术的发展。受国家政策的影响,从2019年起“区块链+医疗”领域研究关注度越来越高,2019—2020年,相关发文量快速增长。虽然2021年数据并不完全,但是目前的发文量已经不低于2020年,总的来说,从2018年起,该领域的发文量逐年增多且增长速度较快,说明有更多的研究者关注于该领域的研究,“区块链+医疗”领域处于一个快速发展的阶段。

2.2 研究机构排名

图1 年度发文量分析图

表1 国内“区块链+医疗”领域研究机构发文量排名表

从表1可以看出,排名前五的研究机构依次为:南京邮电大学,其发文量占比为4.00%;郑州大学,其发文量占比为3.42%;华东交通大学和上海交通大学,发文量占比均为2.85%;中国科学院大学,发文量占比为2.28%。

同时,通过分析研究机构所发论文的参考文献引用关系发现,有些机构间引用参考文献是相关联的,例如,南京邮电大学与华东交通大学、上海交通大学之间,陕西师范大学与西安科技大学之间有引用相关文献关系。说明这些机构研究方向有相近之处,有利于加强机构间合作,推动领域研究快速发展。

2.3 作者合作网络

用CiteSpace软件对统计的文献作者合作关系进行分析,构建作者合作网络。研究离不开知识的共享,学者之间的知识交流更有助于领域研究的进一步发展。通过构建作者合作网络,可以了解该领域研究学者之间的合作关系,紧密稳定的作者合作关系有助于研究效率的提高,提高研究质量。根据检索到的“区块链+医疗”领域的175篇文献数据进行统计,按照作者发文数量从高到低进行排序,发文量前10的作者及发文量信息如表2所示。

从表2可以看到,发文数量在4篇以上的作者共有10人。其中,任君玉、吕英泽、孙雪峰发文数量都是6篇。可以看出区块链技术在医疗领域的应用得到了研究学者的重视,并取得一定的成果。其中,任君玉主要研究数据安全,采用区块链确保数据的安全存储,并对区块链系统的时延问题进行研究与仿真[6]。吕英泽主要研究隐私数据保护,提出了结合区块链的重大疫情患者隐私数据保护方案[7]。李健思、孙雪峰等主要研究基于区块链技术实现关于医疗健康的数据整合,形成多维度和持续性健康数据,为疾病的预测和防控提供科学辅助依据[8]。

表2 “区块链+医疗”作者发文量表

将文献文本数据导入CiteSpace中,时间跨度选择2016—2021年,时间切片为1,节点类型选择Author,点击运行进行数据分析,阈值设为2,其余设为默认选项,得到关于作者合作关系的网络图谱,如图2所示。

从图2中可以看到不同作者间的合作关系,其中,庞帅所在合作关系有邢立莹、杨佐森、孙雪峰、李健思等,这些作者的发文量都比较高,构建了这样一个作者合作群有助于各学者间交流经验。佘维、彭宇飞、刘炜、李阳、田钊等学者也构建了合作群,所在群学者人数也较多。从图2中可见共有12个作者合作群,有学者数量较大的合作群,也有合作群关系中仅有2人,还有一些学者是进行单独研究并没有合作群。虽然作者合作群数量不小,但是各个合作群之间并没有联系,是相对独立的,大部分研究者也是独立研究的状态,这种情况很难实现跨领域、深度的研究探索。研究者之间应该增强交流沟通,建立良好的合作关系,有助于“区块链+医疗”领域的健康持续发展。

图2 作者合作网络图

2.4 研究热点分析

2.4.1 关键词共现热点呈现分析

(3)气体法:取等浓度二种溶液各少许,分别逐滴加入盐酸,立即产生气泡的是N aH CO3,一段时间后才产生气泡的是N a2CO3;(第一步反应为:CO32-+H+=H CO3-,第二步反应为:H CO3-+H+=CO2↑+H2O)

将文献文本数据导入CiteSpace中,时间跨度选择2016—2021年,时间切片为1,节点类型选择Keyword,点击运行进行数据分析,得到关于关键词的共现图谱,如图3所示。选取频次大于10的高频关键词进行统计,共22条,形成“区块链+医疗”领域高频关键词表,关于该关键词的内容、词频和中介中心性等属性,如表3 所示。词频指关键词出现的次数,中介中心性是测量一个点在多大程度上位于图中其他“点对”的“中间”,中介中心性越高,表明该关键词的“中介”作用越强。从表3可以发现,词频越高,中介中心性不一定越高。关键词出现的次数越多不一定是研究热点,所以需要结合关键词的中介中心性来分析研究热点。

图3 “区块链+医疗”关键词共现图谱

表3 “区块链+医疗”高频关键词表

运用CiteSpace对检索到的文献数据的关键词分析,旨在了解近年来“区块链+医疗”领域研究的热点话题。上面对关键词操作得到了高频关键词表,同时得到“区块链+医疗”领域关键词共现图谱,如图3所示。共现图谱中共得到175个节点,469条连线,其中在图谱中的关键词字体越大表明该关键词出现的次数越多,学术贡献越大。 结合高频关键词表和共现图谱,将“区块链+医疗”领域的研究热点主要分为三个大方向:

(1) 医疗领域实现数据共享。传统医疗数据呈现出“孤岛”式存储,数据不能共享,给实际医疗工作带来了极大的不便。利用区块链的分布式存储技术以及去中心化思想,建立分布式医疗数据存储数据库,医护人员将医疗数据上传到分布式数据库中,通过共享模型实现医疗数据的共享。林孟晨等人[9]提出一种基于联盟链的电子医疗记录安全共享模型,实现用户之间在完全匿名和不需要群管理员的情况下,对数据进行查询处理。翟社平等人[10]通过构建私有链和联盟链,分别存储用户加密的电子病历和安全索引记录,提出分布式密钥生成技术设计数据共享协议,实现医疗数据共享。实现医疗数据共享为构建医疗电子病历、医疗图像共享与认证等应用提供了技术基础,对提高医疗服务质量,降低消耗成本等方面具有重要意义。

(2) 医疗数据在使用过程中的隐私保护问题。医疗数据具有来源广泛,数据量庞大等特点,在使用医疗数据的过程中一旦发生信息泄露将会在医疗行业中造成医患关系紧张、信任度下降等不良影响。医疗数据在使用过程中的隐私保护问题一直存在,不仅涉及到患者信息安全还涉及到行业信息甚至国家安全等方面。区块链技术的去中心化、不可篡改特征保证了医疗数据存储到数据库后不能更改;区块链加密技术阻止了区块节点的随意加入,保证了数据的隐私性。关于医疗数据隐私保护研究,刘格昌等人[11]提出一种基于可搜索加密的区块链数据隐私保护机制的方法,运用该方法增强了区块链数据隐私保护能力。徐文玉等人[12]将同态加密和以太坊的智能合约技术相结合,实现对用户数据的隐私保护。加强医疗数据在使用中的隐私保护问题,为改善医患关系、加强行业信任度和保障行业数据安全等方面具有重要意义。

(3) 提高数据安全性。传统医疗数据存储在各地数据库中,信息化系统功能并不完善,一旦出现数据泄露、数据篡改等情况将会对医疗工作产生很大的影响。利用区块链技术的去中心化、不可篡改性等特性提高数据安全性,吕琦[13]利用区块链的公钥、私钥的访问功能,实现数据的安全访问,利用区块链在信息保护上的优势,使得医疗数据更加安全可靠。区块链技术提高了医疗数据的安全性,为实现药品溯源,加强药品信息监管等应用方面有重要意义,有利于医疗领域健康持续发展[14]。

2.4.2 关键词聚类热点呈现分析

聚类标签的命名来源选择K“从关键词退去命名”,数据阈值选择g-index,规模因子k=25,聚类算法选择LLR算法,最终得到8个聚类,运行后结果如图4所示。图谱结点共175个,一个节点代表一个关键词,连线有469条,网络密度为0.030 8。聚类的模块值Q(Modularity)值为0.498 3,大于0.3表明聚类效果好,内部联系紧密结构明显。平均轮廓值S(Mean Silhouette)值为0.870 3,大于0.5,表明所形成的图谱可信度高,有较好的聚类效果[14]。关键词划分的8个聚类内容分别是:#0 中医药大数据、#1 共识机制、#2 隐私保护、#3区块链技术、#4 智能合约、#5 疾病预防控制、#6 医疗数据共享、#7 智慧医疗。 通过聚类8个内容分析得到,“区块链+医疗”领域的研究热点分为三个方面:

(1) 医疗领域的隐私保护。#1共识机制、#2隐私保护等聚类内容表明医疗领域的隐私保护是当前研究的热点话题。区块链的共识机制[15-16]、密钥技术在医疗领域的应用加强了行业数据的隐私保护,保证了数据的真实性、不可篡改性。陈先来等人[17]提出了一种基于区块链的患者在线交流模型,保证患者匿名与其他患者共享真实医疗数据并进行交流。

(2) 数据溯源。当医疗数据存入分布式数据库后,根据区块链技术的不可篡改特性,数据不能再次更改,保证了数据的安全性,利用时间戳和链式结构实现数据溯源。在新冠疫情背景下,利用该技术辅助医疗行业查询患者、密切接触者行动轨迹,结合医疗数据共享和数据溯源技术实现传染病风险预警与防治[18-19]。以此溯源技术实现药品溯源,保证了药品数据的真实性,防止假药信息被加入到药品信息系统中,还可以溯源到药品生产中的细节信息,保证了药品的安全性问题。

图4 “区块链+医疗”关键词聚类视图

(3)数据共享。聚类#0中医药大数据,#4智能合约,#6医疗数据共享主要聚焦于医疗数据共享。温文媖等人[20]提出一种结合区块链的可认证医疗图像共享方案,利用区块链中的智能合约和可视化共享技术对影子图像进行认证,实现医疗图像的安全性和共享性。林孟晨等人[21]提出了一种基于联盟区块链的电子医疗记录安全共享模型,利用区块链的去中心化思想,实现用户的隐私保护和医疗数据共享。可以说明,实现医疗数据共享是该领域当前研究的热点。

2.4.3 时间脉络演进趋势分析

文献关键词通过LLR聚类算法产生的9个聚类,用CiteSpace绘制热点时间线演变图如图5所示,图中横轴代表时间变化,纵轴代表聚类名称。从图中分析“区块链+医疗”领域随时间变化研究热点内容的变化,以及其演变趋势。图5中每个节点所在的位置代表着该关键词第一次出现的时间节点,随着该关键词出现的次数越大,节点也就会变得越大,连线代表着该关键词追溯的时间段。结合相关文献和时间线演变视图进行分析,可以得出:

(1)2016—2018年,热点关键词有“以太坊”“智能合约”“共识机制”“哈希链”等,相关文献主要集中于研究区块链技术如何在医疗领域应用的理论性探索[22-23]。

(2)2019—2020年,出现的关键词有“区块链数据库”“医疗保险去中心化”“公开验证信用积分智能合约”“医疗领域数据存储”“健康保险公共卫生信息系统”等,基于区块链的共识机制、智能合约等实现医疗领域的数据共享、数据透明化,并打造系统化医疗信息平台是研究热点。这些应用对医疗领域产生了很大的影响[24]。

(3)2020—2021年,新冠疫情爆发,进一步推动了“区块链+医疗”领域的发展,研究趋势关注于“新型冠状肺炎突发公共卫生事件”“共享电子病历”“互联网云药房平台”等。在当前疫情背景下,区块链技术通过多种方式提高医疗工作的效率与质量,如利用区块链溯源技术实现药品溯源与防伪,区块链分布式存储数据整合各个临床资源,区块链对称加密技术保证数据的安全性和个人隐私问题等。

图5 关键词聚类时间线演变图

2.5 研究前沿分析

利用CiteSpace中的突现分析功能,对关键词进行突现,分析“区块链+医疗”领域的研究发展演变。设置参数,γ=0.5,Minimum Duration=1,其余参数选择默认值,最终检测出19个关键词突现,结果见表4。其中,表格最后一列数据,加粗部分代表关键词突现年份,较细部分代表普通年份。通过对表4分析发现,在“区块链+医疗”领域的研究前沿主要有三个方面:

(1) 医疗电子病历。“医疗图像共享与认证”、“电子健康记录”、“医疗电子病历”三个关键词的突现程度都是高于1,且内容都属于医疗电子病历的内容,表明基于区块链技术实现医疗电子病历是未来的研究趋势。医疗电子病历的实现离不开医疗数据共享作支撑,是医疗数据共享的应用,切实到医疗领域中发挥实践性作用。医疗电子病历中存储着患者的个人信息和诊疗信息,方便数据的存储和查询。

(2) 药品信息溯源。在产品“同态加密”、“共识算法”、“数据安全”等突现关键词在区块链中属于加强隐私保护、数据安全的技术保障了区块链溯源技术的发展。区块链溯源技术在医疗领域的应用越来越多,通过分布式存储数据,利用区块链的链式结构,数据不可篡改特征实现药品信息溯源,可以查看到在药品生产过程中的关键步骤,提高药品的安全性,防止假药信息被篡改到系统中,对推动医疗领域健康发展有重要意义。

(3) 传染病风险预警与防控。新冠疫情背景下,实现对疫情的预警和防控非常有必要,通过区块链去中心化思想,对健康数据进行分布式存储,共识机制实现多个不同节点对健康数据操作的多方共识验证,智能合约部署在不同的分布式节点等一系列操作实现医疗健康数据的共享,为传染病风险预警提供数据支撑,利用区块链技术与AI技术结合实现传染病预警与防控。

3 总结

本文对收录于中国知网数据库的175篇“区块链+医疗”领域的文献数据用CiteSpace进行了可视化分析。通过对文献作者、关键词等内容进行共现、聚类操作得到相关的知识图谱、聚合网络;对文献数据的可视化分析,了解到该领域的研究者合作关系、研究热点以及未来的研究趋势。研究结论如下:

(1)2016年开始,“区块链+医疗”领域开始得到研究者的关注,从年发文量来看,呈现直线增长的趋势,研究进展也在逐年增大。研究者之间形成的合作群,互相交流,共同探讨,但总体的合作网络稀疏,合作关系还需进一步加强。

(2) “区块链+医疗”领域的研究热点是实现医学数据共享、隐私保护和数据安全等。基于区块链技术的去中心化思想,将区块链的技术如共识机制、智能合约应用到医疗中,实现“区块链+医疗”领域的数据共享、隐私保护和数据安全。

(3) “区块链+医疗”领域的研究趋势是将当前的研究热点进行应用,实现区块链技术和医疗领域的深度结合。基于区块链技术实现传染病风险预警与防控、医疗电子病历和药品信息溯源是该领域的重点研究方向,这将有助于提高医疗领域的工作效率,改善医患关系,加强药品监督管理。

区块链技术的应用具有重构行业模式的可能,对医疗领域亦是如此。它为医疗领域的发展提供了新的思路和技术支持,引起了新的变革。在今后的发展中,AI技术和区块链技术的结合将更好地促进医疗行业的发展。而且,区块链作为未来国家重点发展技术,其去中心化、开放共识、交易透明、可追溯等特性将会推动医疗领域健康持续发展。

猜你喜欢
发文聚类区块
区块链:一个改变未来的幽灵
10条具体举措! 山东发文做好返乡留乡农民工就地就近就业
区块链:主要角色和衍生应用
基于K-means聚类的车-地无线通信场强研究
区块链将给媒体业带来什么
区块链+媒体业的N种可能
基于高斯混合聚类的阵列干涉SAR三维成像
基于Spark平台的K-means聚类算法改进及并行化实现
基于改进的遗传算法的模糊聚类算法