张 俐,马敏象,杜 军,谭 鹏,普康晶,吴 斌
(云南省科学技术情报研究院,昆明 650051)
2020年伊始,新型冠状病毒肆虐全球,在此次突发疫情的强作用力刺激下,基于信息技术的高科技产品被泛在化全面应用,而区块链技术作为国家大力发展的“新基建”之一,在新冠疫情的倒逼之下,必然爆发出前所未有的技术力量。就医疗行业而言,传统医疗产业的信息化和数字化改造已大部分完成,“互联网+医疗”的各种商业模式也趋于成熟,进入了稳健发展阶段。医疗系统建成了HIS、EMR、PACS等数字医疗信息系统[1-4],寻医问诊、挂号、报销支付等流程变得更加便捷。然而,这些系统在支持检查、诊断、护理等核心诊疗流程方面是分散的,存在医疗信息安全性低,医疗数据难共享、易被篡改,医患之间缺乏信任,临床数据散乱、丢失等行业痛点问题[5-9]。
解决上述行业痛点的关键在于对分布式数据的协同管理、共识互认等机制的建立。区块链作为分布式数据存储、点对点传输、共识机制、加密算法、智能合约等技术的集成应用,近年来,已成为许多国家政府研究讨论的热点,产业界也纷纷加大投入力度[10-13]。根据区块链所具备的去中心化、透明度高、数据可追溯、保密性好等特点[14],基于区块链技术开发医疗信息综合大平台[15-16],构建药品及医疗器械溯源系统[17-18],对保障医疗信息资源的系统化、药品及医疗物质资源的合法性,实现优质医疗资源下沉以及改善医患关系、促进新药研发、提高医护工作效率等具有重要意义[19-21]。未来,“区块链+医疗”将成为数字医疗发展的主要方向[22]。
目前,我国正在逐步建立不同类别医疗机构间权责清楚、公平有效分工、推动分级诊疗的医联体,全力打造合作模式创新以及集临床服务、医疗教育、医学科研和成果转化为一体的医疗综合体,大力规划建设一批集健康、养生、养老等功能于一体的智慧医疗及智慧养老的大健康产业基地[23]。实现上述目标的一个关键是患者(消费者)信息的整合共享及互认共识。而区块链技术天然具有信息共享、数据不可篡改、可防伪、可溯源的特点,如果能够和医联体建设、数字医疗结合,势将对该领域的发展起到积极而又深远的影响,更能对及时控制和诊疗类似新型冠状病毒的疾病起到积极的支撑作用。
因此,本研究通过对期刊论文和专利信息的引用关系、词汇计量和标引统计进行分析,对国内外“区块链+医疗”领域的研究现状及发展趋势进行研究,揭示国内外“区块链+医疗”领域的研究热点和研究前沿,以期为相关研究人员能够更好地把握该领域的研究重点和研究方向提供情报支撑。
研究热点,是指一定时间段内被众多学者共同关注与研究的话题,具体表现在相关文献资料就是高频出现的关键词所代表的研究内容[24]。而研究分析论文被引用的模式和聚类,特别是成簇的高被引论文频繁地共同被引用的情况,就可以发现研究前沿[25]。CiteSpace是一款基于共引分析理论和寻径网络算法等对特定领域文献集合进行计量的信息可视化软件,可以根据关键词共现,以及关键词网络知识图谱,挖掘出行业领域研究的热点主题以及其发展脉络和趋势[26]。
首先,本研究以Web of Science数据库核心合集SCI-EXPANDED、SSCI、CPCI等收录的论文为研究对象,对国际“区块链+医疗”领域的主要研究国家、机构,以及研究方向等研究进展基本情况进行研究,并利用文献分析工具CiteSpace着重对国际该领域的研究热点与研究前沿进行分析。同时,以中国知网(China National Knowledge Infrastruc‐ture,CNKI)为数据来源,对国内“区块链+医疗”领域论文进行研究机构、主要研究内容等基础进行分析,并结合国家知识产权出版社专利检索库收录的中国专利信息,利用主题标引统计法对国内该领域的研究热点与研究前沿进行分析。最后,综合对比国内外该领域研究现状,对研究发展趋势进行预测,并提出相关建议。
基于Web of Science数据库核心合集进行主题检索,检索策略为“(health*OR medic*)AND block‐cha*”,截至2020年6月,共检索到“区块链+医疗”领域论文637篇。引文分析提示:该领域论文集被引频次总计4928次,平均每篇被引次数为7.74次。这表明该原始论文集具备一定的学术影响力,对其进行文献计量分析具有参考价值(图1)。
图1 国际“区块链+医疗”研究领域论文及引文量年份分布
从图1中的数据来看,该领域论文最早发表时间为2014年,仅有1篇,是关于区块链技术应用Meta分析的会议论文[27]。2016年以后,文献的发表量逐渐增多,并呈指数级增长,特别是2019年引文数量大幅上升;2020仅半年论文数已接近2018年发文量,引文数量已经超过2019年,增长趋势强劲。这意味着“区块链+医疗”领域的研究进入了蓬勃发展期,是当前数字医疗领域的研究热点和研究前沿,相关技术及应用的研究正在进入高速发展阶段。
据统计,国际“区块链+医疗”研究领域的发文量排名前8位的国家分别是美国、中国(不含台湾数据)、印度、英国、韩国、澳大利亚、加拿大和沙特阿拉伯(表1),覆盖了发达国家和发展中国家。其中,美国和中国的发文量在100篇以上,这两个国家的发文总和占了全部发文量的44.4%,是国际该领域研究的主要国家。发文量排名第1位的美国的相关研究开展较早,与中国、英国、印度、韩国等大部分国家均有学术合作,居于研究的核心地位。加州大学系统、宾夕法尼亚联邦高等教育系统、德克萨斯大学系统和麻省理工学院是美国的重要研究基地(表2)。我国在该领域的发文量仅次于美国,居世界第2位,且与美国、英国、澳大利亚等国家合作紧密,是国际该领域研究的重要力量。其中,中国科学院、电子科技大学、北京理工大学等是我国该领域的主要研究机构(表2)。
表1 国际“区块链+医疗”研究领域发文量排名前8位的国家
表2 国际“区块链+医疗”研究领域发文量排名前10位的研究机构
文献的被引频次表明了该文献在其研究领域中所处的地位[28]。被引频次越高,表明该文献在其研究领域中越重要,是该领域的奠基性文献或核心文献。表3列出的是国际“区块链+医疗”研究领域被引频次排名前10位的文献,从中可知,该领域被引频次最高的文献是美国麻省理工学院的Azaria等[11]2016年发表的会议论文“MedRec:Using Block‐chain for Medical Data Access and Permission Manage‐ment”,该文提出了一个基于区块链技术的记录管理系统MedRec,并将其用于处理电子病历。被引频次第2位的是我国华侨大学Yue等[29]2016年发表的论文“Healthcare Data Gateways:Found Healthcare Intelligence on Blockchain with Novel Privacy Risk Control”,该文提出了一个称为医疗数据网关(HGD)的应用程序,以解决共享医疗保健数据的安全性和可行性问题。被引频次第3位的是美国加州大学圣地亚哥分校Kuo等[3]2017年发表的综述“Blockchain distributed ledger technologies for biomedi‐cal and health care applications”,该文介绍了区块链技术的优点、缺陷和在生物医学和医疗保健领域的最新应用。核心论文分析表明,目前,国际上“区块链+医疗”的研究主要集中在计算机科学、工程学、医疗信息学、保健和科学服务等学科领域。
表3 国际“区块链+医疗”研究领域被引频次排名前10位的文献
本研究使用CiteSpace软件对2016—2020年国际“区块链+医疗”领域被引频次前50位的研究论文进行技术关键词共现分析,并描绘其技术主题聚类的技术演化过程,得到该领域技术演化时间路径图(图2)。从图2可知,“区块链+医疗”领域的技术主题聚类较多,说明相关技术研究较为分散。2019年以前,技术研究主要分布于聚类主题#0(操作系统)、#1(信息检索)、#2(基于区块链的临床数据管理)、#3(个人健康记录)、#4(隐私技术)、#5(创新实体)、#7(健康体系)、#8(加密技术)、#9(生物识别电子证件系统)和#10(个人档案服务系统)。出现于2016年的聚类主题#0(操作系统)、#1(信息检索)的相关主题关键词共现频次较高,不但在该技术主题后期多次出现,聚类主题#3、#4、#5、#6、#7、#8、#9、#10等技术主题也多次出现相同的关键词共现,这说明操作系统和信息检索相关技术是“区块链+医疗”领域研究的知识基础,也是目前该领域的研究热点。而聚类#6(供应链管理)、#14(移动感知)中的技术则出现于2020年,是该领域较新的技术研究主题,可认为是该领域的研究前沿。
图2 国际“区块链+医疗”研究领域技术演化时间路径
为解决聚类主题存在的技术内容交叠的问题,本研究对12个技术主题聚类进行归纳,根据技术相似性[30]原则,将其分为6组(表4):第1组,主要针对医疗区块链操作控制系统的研究,包括聚类主题#0和#14;第2组,主要针对区块链医疗信息提取相关技术的研究,包括聚类主题#1和#8;第3组,主要针对临床研究管理体系的研究,包括聚类主题#2;第4组,主要针对的方向是区块链电子健康记录(包括电子病历),包括聚类主题#3、#4、#7和#10;第5组,主要针对区块链医疗供应链管理的研究,包括聚类主题#6;第6组,研究结合生物学,主要针对的是基于区块链的生物识别技术,包括聚类主题#5、#9,该组研究的内容较为新颖。
表4 国际“区块链+医疗”研究领域技术主题研究热点统计
由表4可知,在国际“医疗+区块链”领域文献研究的6个大组中,医疗区块链控制系统的研究主要集中于区块链数据安全性和物联网技术耦联;医疗信息提取的研究主要集中于智能合约技术和电子病历技术;基于区块链临床研究管理系统的研究主要集中于云计算;电子健康记录的研究更多的是注重隐私保护技术;医疗供应链管理的研究主要集中于区块链的信任机制;生物识别方面的研究更多的是注重如何进行身份认证。除此之外,从相关技术热点出现的时间可以看出,数据安全、技术耦合、隐私保护、信任机制等是目前该领域技术研究的热点和前沿。对技术研究热点进行深入分析可发现:每一项技术均被用于解决实际应用中出现的具体问题,开发出实用的医疗信息管理系统,包括提出MeDShare系统——一个在医疗大数据缺乏信任的环境下,基于区块链的共享医疗数据的系统;利用以太链的智能契约加强访问控制和数据混淆的Ancile系统;以JavaScript语言打包数据,校对系统在上传数据过程中因人工故障引起的数据不一致的mHealth系统等(表5)。
本研究以CNKI数据库为来源,检索策略为:主题="区块链"AND关键词=(医+健康+卫生+病+药+疫苗),截至2020年6月,共检索到以“区块链”和“区块链技术”为主题的相关文献263篇,发表时间如图3所示。对文献被引频次进行合计,共被引次数为754次,平均每篇文献的被引次数为2.87次,远低于该领域英文文献的被引平均数。
图3 我国“区块链+医疗”研究领域发文量趋势图
从图3数据来看,我国的“区块链+医疗”行业领域的研究始于2016年,增长趋势与英文文献基本相同,但年均发文量低于英文的年均发文量。就文献内容而言,前期对应用可行性方面的阐述较多,技术和应用方面的研究较少;随着技术地不断发展,国内该领域的研究不断深入,其中研究较多集中于应用,对技术本身的研究也在不断增加。
数据基础分析显示,我国在“区块链+医疗”领域的研究比较分散,没有明显的研究领军机构。发文量排名前10位的机构发文篇数均为个位数(图4),这些机构分别是西安电子科技大学、华中科技大学、成都中医药大学、四川大学、上海大学、山东师范大学、山东大学、武汉大学、北京邮电大学、北京交通大学和东华软件股份公司(发文量与第10名相同),这与发表英文文献的机构分析中,我国主要的研究机构(中国科学院、电子科技大学、北京理工大学)并不相同。本研究对中文、英文发文量排名前10位的机构的研究内容进行梳理后发现:①我国发表英文文献的中国科学院、成都电子科技大学开展相关研究的时间较早,始于2017年;②发表英文文献的中国科学院、成都电子科技大学和北京理工大学的研究内容既包括对区块链技术本身的研究,如隐私保护、数据共享、安全存储、与物联网、5G技术耦合协议等,也包括了对区块链应用的研究,如应用区块链技术开发医疗保健系统、电子病历、个人健康系统等;③发表中文文献的机构大部分研究开始于2018年以后,主要研究内容为区块链技术的应用方面,即将区块链技术应用于电子病历、电子健康档案、医疗保险系统、药品溯源等领域,2020年后,随着新冠疫情的暴发,出现了将区块链技术应用于传染病监测预警和防治领域的研究;④我国关于“区块链+医疗”的研究机构主要集中于北京、四川、山东、湖北、上海等地区(表6)。
表6 我国“区块链+医疗”研究领域主要研究机构及其研究内容
图4 我国“区块链+医疗”研究领域发文量排名前10位的机构
表7列出的是我国“区块链+医疗”研究领域被引频次排名前10位的文献。从表7中可以看出,排名第1位的是北京邮电大学软件学院薛腾飞等[14]2017年发表的《基于区块链的医疗数据共享模型研究》,提出了一个基于区块链的医疗数据共享模型,适用于解决各医疗机构数据共享的难题。排名第2位的是河北北方学院附属第一医院黄永刚[31]2016年发表的《基于区块链技术的电子健康档案安全建设》,讨论了医疗在去中心化、隐私保护、基因测序方面的应用,并构想相关场景,为基于区块链技术的电子健康档案建设带来新的研究思路。排名第3位的是中国传媒大学计算机学院梅颖[32]发表的《安全存储医疗记录的区块链方法研究》,结合区块链和云存储技术,提出了一个医疗记录安全存储方案。核心论文分析表明,我国“区块链+医疗”的研究主要集中于计算机软件及计算机应用、医学教育与医学边缘学科等方面,与国际该领域的研究方向大致相同。此外,排名前10位的中英文被引用文献对比显示,除排名第1位的文献外,中文文献的被引用频次均低于英文文献,我国该领域的研究深度和广度,以及发表文献的质量均有待进一步提高。
表7 我国“区块链+医疗”研究领域被引频次排名前10位的文献
4.2.1 基于关键词共现的分析
使用CiteSpace软件对CNKI检索到的文献进行关键词共现分析,得到技术主题聚类的时间演化图(图5)。从图5可以看出,国内“区块链+医疗”领域的技术主题分为七类,即#0智能合约、#1区块链技术、#2加密货币、#3数据共享、#4访问控制、#5云存储和#6二维码。对其进一步进行关键词提取,并按照时间梳理分析得到国内“区块链+医疗”领域的研究热点脉络表(表8)。从技术演化的时间路径和关键词脉络可知,我国国内对“区块链+医疗”的研究主要围绕智能合约、加密、数据共享、云存储等方面开展,其中,智能合约、隐私保护、数据共享、共识机制、分布式存储等应用于电子健康档案、电子病历、医药供应链、医疗保健、药品溯源、医疗保险等方面,是该领域具体的研究热点,新型冠状病毒肺炎疫情防控、智慧医疗终端等为目前的研究前沿。
表8 我国“区块链+医疗”研究领域热点关键词脉络表
图5 我国"区块链+医疗"研究领域技术演化时间路径
4.2.2 基于技术主题标引的分析
由于国内“区块链+医疗”领域的公开文献中综述较多,研究论文较少(这与王发明等[24]的研究情况相似),平均质量不高(平均被引频次较低),不能较好地体现相关研究的规律性,因此,本研究除了采用CiteSpace软件对CNKI检索到的文献进行关键词共现分析外,还结合该领域国家知识产权出版社专利检索库收录的中国专利信息,利用标引统计法开展国内该领域的研究热点与研究前沿分析。
国家知识产权出版社知识产权公共服务平台的数据检索显示(图6),截至2020年6月我国关于“区块链+医疗”的专利申请总量为472件,除1件是2010年美国英特尔公司在我国申请的专利以外,其他专利的申请时间均在2016年以后,特别是2018年以后专利申请量较前2年呈爆发式增长,这与研究文献发表的时间完全吻合。
由图6可知,目前,我国“区块链+医疗”行业领域处于较快发展阶段,研究热点仍集中于相关技术的应用领域,针对技术本身的研究亦开始增加(2019年、2020年数据受专利公开滞后和数据库更新影响,仅供参考)。
图6 “区块链+医疗”中国专利申请情况
根据我国公开发表的研究文献和专利申请,采用人工主题标引和统计分析法得到我国“区块链+医疗”领域技术研究热点图(图7)和应用研究热点图(图8)。
从图7可以看出,目前,数据管理、区块链节点及存储介质,以及隐私保护和共享技术是国内“区块链+医疗”领域的技术研究热点。其中,隐私保护和共享技术自2016年以来一直是该领域技术研究的重点;数据管理、区块链节点以及存储介质的相关研究在2019年成为研究热点,将是未来该领域技术研究的主要研究方向。此外,多链架构研究、存储容量可扩展模型、基础协议即应用技术、链接区块链与物联网系统、远程数据验证协议、平台安全机制在近年成为技术研究的热点,同时,也是未来该领域技术研究的发展方向。
图7 我国“区块链+医疗”领域技术研究热点图
从图8可以看出,国内“区块链+医疗”领域的应用研究主要集中于医疗数据云存储安全共享、电子病历(包括电子处方、住院申请系统、医院管理系统等)、医疗物资(包括药品、样本、医疗废弃物等)追溯、医保结算、监测系统和电子健康信息共享及终端设备。2018年以来,医养服务平台、临床护理平台(包括输液、配药、药物反应等)、基因相关应用平台(包括基因数据共享及基因信息应用平台)和互联网医院成为该领域新的研究重点。同时,2019年3月8日,广州市标准化研究院、中国标准化研究院等23家机构联合发布标准《区块链技术产品追溯应用指南》(T/CSPSTC 23-2019);2019年12月7日,深圳华大基因科技有限公司等5家机构联合发布标准《基因数据流通区块链存证应用指南》(T/SZAS 9-2019),这标志着我国区块链技术在医疗应用领域的研究取得了阶段性研究成果,并且国内的研究内容开始向国际化靠拢。
图8 我国“区块链+医疗”领域应用研究热点图
关键词共现分析和主题标引分析表明,我国在“区块链+医疗”领域的技术研究热点和前沿与国际该领域的研究内容基本相同,均为数据共享、隐私保护、信任机制、技术耦合、移动感知等;两者的区别在于2019年以来国内出现了新的研究热点:多链架构、数据管理、区块链节点以及存储介质等。另外,就国内外该领域技术应用的研究热点和前沿而言,除了相同的基于区块链的电子病历、医疗健康信息管理系统、药品追溯系统、医疗保险系统应用以外,国际相关领域的研究前沿出现了基于区块链的生物识别系统,而国内的研究前沿主要集中在基于区块链的传染病疫情防控监测、医疗物资追溯等方面。
区块链技术是继云计算、物联网和大数据之后的一项颠覆性信息应用技术,其核心技术包括分布式账本技术、非对称加密算法以及智能合约等,具有去中心化、匿名性、开放性、自治性、匿名性和集体维护等特点。将区块链技术应用于医疗领域,对于解决行业数据共享难、医疗记录被篡改、患者隐私保护、医患关系紧张等痛点,具有重要意义。通过对国内外“区块链+医疗”研究领域的文献和专利信息分析可知:
(1)国际该领域的相关研究主要开始于2016年,其后文献量增多,并呈指数级增长,这表明该领域的研究目前正处于蓬勃发展的阶段;美国和中国是该领域研究的主要力量;加州大学系统、宾夕法尼亚联邦高等教育系统、德克萨斯大学系统和麻省理工学院是美国重要的研究基地。国内的相关研究稍微滞后,主要开始于2017年,其后文献量呈现大幅增长;目前,我国该领域的研究机构主要集中于北京、四川、山东、湖北、上海等地。
(2)目前,国内外针对“区块链+医疗”研究的学科领域基本相同,包括计算机科学、工程学、医学信息与医学边缘学科等。
(3)我国该领域发表英文文献和发表中文文献的主要研究机构并不相同,发表英文文献的机构主要研究内容既包括对区块链技术本身的研究,也包括对区块链应用的研究;而发表中文文献的机构主要研究内容更注重于区块链技术的具体应用方面。国内该领域相关研究的深度和广度,以及文献的质量有待进一步提高。
(4)国内外该领域的研究热点均围绕解决医疗产业在应用区块链技术过程中出现的问题进行展开。技术研究包括数据安全、技术耦合、隐私保护、信任机制、移动感知等。目前,该领域已经处于技术布局逐步完整、生态体系日趋成熟的良性进化状态。相比较而言,2019年以来国内出现了新的研究热点,如多链架构、数据管理和区块链节点以及存储介质等。
(5)目前,国内外基于区块链技术的应用研究主要集中于电子病历、医疗健康信息管理、医疗物资及药品追溯、医疗保险等医疗管理系统的研发和使用。2020年以来,国外应用研究出现了基于区块链的生物识别系统,而国内出现了基于区块链的传染病疫情防控监测系统的研究。
未来,随着大量医疗数据的富集式上链,数据安全相关技术研究将长期处于大风潮的窗口期,多种技术融合,交叉信任机制的建立,基于智能契约加强访问控制和数据混淆,以及新兴小波技术的融合,无疑将为区块链的整体安全架构不断添薪助燃,从而形成多种技术交叉集成,跨领域技术深度融合的技术发展趋势。同时,围绕目前医疗领域“数据共享”“隐私保护”等难点痛点的问题,领域内的机构基于区块链技术可能进行多种医疗生态体系的演化,包括基于“电子病历”的全链式健康体系、基于“诊疗数据”的医药科研研发体系、基于“生物基因”的医疗资源溯源体系、基于“个人健康信息”的移动终端-云健康数据监测体系等,各种“区块链+医疗”的应用项目将如雨后春笋,催生和激励着传统信息医疗结构体系向智能化和智慧化发展。此外,2020年在新冠疫情背景下涌现的一批应对新冠疫情的相关研究,包括居民的电子健康记录和医疗信息提取,医疗供应链控制系统,迅速汇集患者的医疗数据,寻找和筛选靶向药物等,意味着区块链技术与医疗管理控制的结合已成医疗信息化的一种主流趋势,两者深入融合的集成应用与研究必然会引领医疗领域的“时尚风潮”。
在区块链技术寻找应用突破口的大趋势背景下,本研究针对医疗领域供给侧进行科技创新的需求,区块链技术赋能医疗行业的未来沿革路径建议如下。
(1)以区块链技术作为医疗领域“新基建”的重要突破口,在重点研发领域形成全面化的纵深布局体系。
(2)基础研究领域,研究“区块链+医疗”的数据管理框架下,提供数据共享和互操作的完善机制;深入研究隐私保护、身份认证、互操作基础架构以及相关的安全模型;建立医疗行业各类系统的对接和交换接口标准,提升上链数据存储和共享的安全性,促进合理规范地应用区块链。
(3)应用研究领域,搭建基于智能合约的医疗资源共享服务平台,构建“挂号导诊+在线问诊+医疗自媒体+健康直通车+药品配送+电子处方流转+医保报销等延伸服务”等数字医疗行业闭环,优化和串联患者、医生、基层医疗机构、省级优质医疗机构、医疗行业医疗服务创新平台、优势学科专家团队等医疗关联主体利益链接和医疗关系;搭建基于大数据“智能推荐”的移动-云端电子健康管理平台,促进人群对其医疗保健的参与,以满足人群、社区和医学研究人员的需求,促进健康数据资源的共享,支持医疗领域创新型人才和团队科研工作,提升科技创新条件保障能力。
(4)加强国内外科技合作交流,集聚技术创新资源,促进医疗领域区块链核心技术的持续发展。