王若羽,李王婷,张少冲,杨卫华
糖尿病视网膜病变(DR)是糖尿病影响视网膜的并发症,对患者的视力构成重大威胁[1]。2015年,全世界约4.15亿人被诊断患有糖尿病,到2040年预计将增加至6.42亿[2]。据估计,全球超过1/3的糖尿病患者患有DR,约1/10的糖尿病患者患有威胁视力的DR,包括增殖性DR和糖尿病性黄斑水肿[3]。多数糖尿病患者如果通过早期筛查及时发现DR,给予系统全面的眼科检查和治疗,可避免永久性视力丧失。然而,传统的筛查或诊断方法需要专业的眼底专科医生指导,筛查过程耗时、费力、昂贵,且仍存在资源缺乏的问题。因此,大规模的DR早期筛查仍然是一项重大挑战。
随着人工智能(AI)的出现和不断发展,其在医疗保健领域的整合,包括眼科重大疾病的筛查,成为一个研究热点。AI是指利用计算机在很少或没有人为干预的情况下模拟智能行为,这是一个广义的术语[4]。AI技术涉及多个方面,包括传统的机器学习(ML)和深度学习(DL)[5]。针对DR的辅助诊断,在传统ML阶段,AI可以通过特征提取,定位视网膜图像上的病变,即根据成像生物标志物,包括微动脉瘤、硬性渗出、棉絮斑、黄斑水肿等,对DR进行诊断和分级。随着使用多层次、多神经元学习算法的DL的出现,构建了多个使用DL进行DR筛选的系统,较传统ML具有更高的特异性和敏感性[6-7]。随着AI技术的不断发展,越来越多的AI研究将知识驱动和数据驱动相结合,这在DR研究中也有所体现[8]。AI在DR筛查中的整合将显著提高诊断效率,节省人力和财力,使偏远贫困地区的远程诊断和智能诊断成为可能[9],这是一个非常有前景的领域。
AI在眼科疾病中的应用已有文献计量学研究[10-12],本研究对AI在DR中的应用进行最新的文献计量学研究,旨在利用文献计量学方法对在Web of Science Core Collection(WoSCC)检索到的论文进行分析,结合作者团队的研究基础和该领域最有影响力的10篇论文,评估糖尿病视网膜病变人工智能研究的全球应用现状,并分析其热点和趋势,探索该研究领域知识的动态前沿,为AI专业人员、眼科医生和医学影像研究人员提供指导和建议。
1.1材料于2023-06-24检索2012-01-01/2022-12-31在WoSCC发表的关于糖尿病视网膜病变人工智能研究的论文,并独立验证数据。检索公式为TS = (AI or “Artificial Intelligence” or “neural network” or “transfer learning” or “Machine Learning” or “Deep Learning” or automat* or algorithm) AND TS = (“diabetic eye disease” or “diabetic retinopathy” or “diabetic macular edema”)。检索结果中选择英文论文,排除综述、早期访问、会议论文、书籍章节、数据论文和撤回的论文。阅读所有论文的标题和摘要进行人工筛选,排除研究对象非DR,研究方法不包含AI的论文,筛选流程见图1。
1.2方法本研究纳入论文研究内容均为AI在DR检测、诊断和分级等领域中的应用,采用CiteSpace 6.2.R4软件对年发文量、国家、机构、论文来源、研究领域、关键词等进行分析,并进一步分析影响力最高的10篇论文。
2.1年发文量通过CiteSpace软件的去重功能筛除重复论文,最终纳入论文1009篇。2012~2019年,关于糖尿病视网膜病变人工智能研究的论文数量稳步增加,在2020年开始明显上升,并在2021年首次超过200篇,见图2。
图2 2012~2022年关于糖尿病视网膜病变人工智能研究的年发文量。
2.2国家利用CiteSpace软件的默认设置统计每个国家的论文数量,并分析国家之间的合作关系,2012~2022年糖尿病视网膜病变人工智能研究领域发文量最高的10个国家见表1。纳入论文涉及79个国家,图3中每个标签的大小和黄色节点区域代表发文量,黄色节点较大的前3个国家分别是中国、印度和美国,分别有287、234、157篇论文;节点之间的连线表示国家之间的合作关系,连线越多表明该国和其他国家的研究合作越活跃;紫红色圆圈的宽度表示国家的中心性,即影响力大小。连线越多,中心性越高,紫红色圆圈越宽。分析显示,“英国”标签的紫红色圆圈的宽度最大(0.31),其次是与之相差极小的“美国”标签(0.30),表明英国和美国发表的关于糖尿病视网膜病变人工智能研究的论文影响力最大。H指数可以精确反映一个国家的学术成就[13],美国的H指数(48)较其他国家更高,表明美国在该领域的研究质量较高。值得注意的是,新加坡虽然在该阶段内发文量仅37篇,但H指数却达到21,提示新加坡在该领域的研究或有较大潜力。总体而言,中国的论文数量最多,美国在该领域的研究最具参考价值。
表1 2012~2022年糖尿病视网膜病变人工智能研究领域发文量最高的10个国家
图3 2012~2022年对糖尿病视网膜病变人工智能研究做出贡献的国家的合作共现图。
2.3机构利用CiteSpace软件的默认设置统计每个机构的论文数量,2012~2022年糖尿病视网膜病变人工智能研究领域发文量最高的10个机构见表2,其中英国和中国各有3家机构进入排名,但英国的3家机构H指数均高于中国,且英国的3家机构H指数(14)均为最高,表明英国在该领域的研究具有一定的影响力。图4中每个节点的大小与每个机构的发表量呈正相关;紫红色圆圈的宽度表示机构的中心性;节点之间的连线表示机构之间的合作关系。
表2 2012~2022年糖尿病视网膜病变人工智能研究领域发文量最高的10个机构
图4 2012~2022年对糖尿病视网膜病变人工智能研究做出贡献的机构合作共现图。
2.4论文来源和研究领域纳入的糖尿病视网膜病变人工智能研究发文量最高的10个期刊见表3,涉及的研究领域包括工程技术、计算机科学、电信学、眼科学、数学与计算生物学、医学信息学、放射学核医学成像、化学、仪器与仪表、生命科学和生物医学,构成了研究前沿涉及的热门学科,包括工程技术、数学、神经学、信息科学和眼科,其中IEEEAccess为在糖尿病视网膜病变人工智能研究领域最活跃的期刊。图5为基于学科共现网络制作的研究领域聚类图,展示了纳入论文所涉及的主要研究领域及各领域之间的关联情况,其中计算机科学与信息系统、医学信息学、光学、多学科科学、眼科学、生物学为主要的研究领域,不同色块间的重叠表示所选研究涉及的研究领域的重合情况。
表3 2012~2022年糖尿病视网膜病变人工智能研究领域发文量最高的10个期刊
图5 2012~2022年糖尿病视网膜病变人工智能研究涉及的主要研究领域。
2.5关键词基于关键词共现合作网络分析图对随时间发展的突现关键词进行分析,以更好地了解2012~2022年糖尿病视网膜病变人工智能研究,反映研究热点的转移。将CiteSpace软件的默认设置替换为以下模式:“时间切片”=1,“γ”=0.1,“最短持续时间”=1,选择具有最强突现性的10个关键词进行展示,结果见图6。突现性分析可以检测某段时间内论文数量的巨大变化,以确定某个主题词或关键词的消退或发展。图6中被调查的时间线上出现的关键词描绘为红色条块,2012~2022年突现关键词包括眼底图像(2012~2014年)、视网膜图像(2013~2017年)、检测自动化(2013~2017年)、匹配滤波器(2015~2018年)、自动检测(2016~2018年)、分频辐去相干影像(2016~2017年)、神经网络(2018~2019年)、迁移学习(2021~2022年)、血管分割(2021~2022年)、卷积神经网络(CNN)(2021~2022年)。图7为基于关键词共现合作网络分析呈现的关键词聚类图和研究领域聚类图,展现了关键词的聚类情况和与之对应的研究领域,其中“#0视盘”对应“眼科学”,“#1光学相干断层成像”对应“计算机科学和AI”,“#2深度学习”对应“多学科科学”,“#3特征提取”对应“工程学及电气与电子工程”,“#4检验”对应“内分泌与新陈代谢”,“#5卷积神经网络”对应“计算机科学与跨学科应用”。
图6 2012~2022年糖尿病视网膜病变人工智能研究中具有最强突现性的10个关键词。
图7 2012~2022年糖尿病视网膜病变人工智能研究中基于关键词共现合作网络分析结果 A:关键词聚类;B:研究领域聚类。
2.6高影响力论文纳入论文中“在所有数据库中被引用的次数”最高的10篇论文[6-7,14-21]见表4,提示糖尿病视网膜病变人工智能研究是有前途的,但涉及临床应用时,仍存在一定的限制。
表4 2012~2022年糖尿病视网膜病变人工智能研究领域被引频次最高的10篇论文
本研究结果显示,2020~2022年关于糖尿病视网膜病变人工智能研究的发文量显著增加,表明随着对DR的检测、诊断、分类和随访的需求增加,研究者对糖尿病视网膜病变人工智能研究的兴趣也显著增加。AI的发展以眼科的临床实践为研究前沿之一[22],其中DR是研究最多的眼病[23]。DL算法被证明在检测和分类DR和相关眼病方面具有高度敏感性和特异性[6-7],是一个极有前途的研究领域。2018年,美国食品和药品监督管理局批准了一种可以从视网膜照相图像中检测参考性DR的AI系统,这是首个在医学领域获得批准的独立诊断系统[14],表明糖尿病视网膜病变人工智能辅助诊断系统在临床应用中具有广阔的前景,有望推动临床辅助诊断系统的变革。
纳入本研究的论文中,中国的发文量最多,但高被引论文占比和论文总量占比却未呈现相对应的比例。英国和美国的中心性最高,同时美国的H指数较其他国家更高,表明这两个国家在该研究领域处于领先地位。此外,中国和印度也拥有相当大的中心性和影响力,而新加坡被认为在该领域的研究有较大潜力。发文量排名前三的研究机构分别来自埃及、英国和美国。分析H指数发现,埃及知识库(EKB)、伦敦大学(UoL)、莫菲尔德眼科医院和伦敦大学学院(UCL)在该领域影响很大。AI研究的重点已经从提升AI辅助DR检测和分类转变为对糖尿病视网膜病变人工智能辅助诊断系统的研究。AI应用于DR的诊断和分类,通常基于视网膜照相图像和OCT分析进行,使用视网膜血管分割和定向局部对比检测病变,包括微动脉瘤和硬性渗出。
基于突现关键词的聚类可以识别研究的活跃领域、前沿热点和趋势。本研究发现,2012~2017年出现的关键词是“眼底图像”“视网膜图像”和“检测自动化”,表明最初的研究重点是研究智能算法,用于对视网膜图像上的病变进行分割和定位,以辅助诊断DR。图像特征的量化处理逐渐应用于DR自动识别,因此,评估视网膜血管的特征对于基于血管病理学的疾病诊断非常重要[24]。传统的诊断依靠经验,容易出现错误,因此,需要一个客观的标准衡量诊断结果。人体视网膜血管的自动定量是减少智能诊断主观误差、提高准确性的保证[25]。Wu等[26]开发了一种计算机辅助量化框架,用于渗出液和微动脉瘤的自动检测,并比较了中度和重度非增殖性DR的形态学特征,结果表明计算机辅助量化DR可以成为临床医生更好地研究DR的实用方法。Franklin等[27]开发了一种新的视网膜照相图像自动血管分割方法,将每个图像像素分离为血管和非血管,用于视网膜照相图像微动脉瘤的自动识别。使用多层感知器神经网络检测视网膜微动脉瘤有助于眼科医生的诊断,并对DR患者进行随访。视网膜照相图像和OCT的诊断定位包括渗出物[28]、视盘[29]、微动脉瘤、出血、棉絮斑[30]。然而,机器识别的效率有限,有时需要人工确认,这与目前依赖DL的智能诊断不同[31]。传统的ML识别系统通常被用作临床医生筛查和诊断的辅助工具[32]。
2015~2018年出现的关键词是“匹配滤波器”“自动检测”和“分频辐去相干影像”。匹配滤波是一种分割算法,可用于血管提取和微动脉瘤检测。从彩色眼底照相图像中发现红色病灶,尤其是微动脉瘤,对于DR的早期诊断至关重要,但如何在彩色视网膜图像上准确地自动检测微动脉瘤仍然是一个具有挑战性的问题,其中一个重要的解决方案是基于过滤器的微动脉瘤检测算法,即利用多尺度匹配滤波器进行血管提取筛选图像中的微动脉瘤[33-36]。除匹配滤波外,研究者也在积极探索其他智能算法,为DR的智能诊断和分级提供新的方向。OCTA是一种新兴技术,利用连续的横断面B型扫描在同一位置的OCT信号的变化对比血管腔内流动的红细胞与静态组织。分频辐去相干影像(SSADA)被证实是一种高效的OCTA算法,其可用于可视化和量化眼睛血管网络的变化,是评估视网膜灌注的可靠工具[37-39]。关键词“自动检测”出现的时间段是2016~2018年,在此期间,DL算法,包括CNN在DR中的应用等,推动了这些进步和转变。DL是一组计算方法,允许算法通过从大量示例中学习来编程[6]。与传统的监督学习相比,DL大大提高了自动检测的准确性,同时减少了工作量,具有明显的优势。2016年,Abràmoff等[15]研究证明,与传统ML算法相比,CNN显著提高了DR的识别性能。
2018~2019年出现的关键词是“神经网络”,2021~2022年出现的关键词是“迁移学习”“血管分割”和“卷积神经网络”,表明包括迁移学习在内的AI是近年的研究热点。虽然DL模型提供了自动特征提取和分类,但仍需要大量带注释的数据集训练这样的智能模型。基于迁移学习的模型被研究人员广泛使用,以克服标注数据不足和计算开销大的问题。CNN是图像相关应用中著名的DL算法之一[40],其通过不断修改和自我学习完成任务,在计算机视觉研究领域取得了很大进步[41-42]。Gulshan等[6]利用深度CNN创建了一种基于视网膜照相图像自动检测DR和糖尿病性黄斑水肿的算法,该研究表明,基于DL算法在评估成人糖尿病患者视网膜照相图像时,对于检测建议转诊的DR具有很高的敏感性和特异性。Le等[43]通过迁移学习构建了一个基于OCTA图像的再训练CNN用于DR分类,其灵敏度为83.76%,特异性为90.82%。另有许多研究表明,CNN已成为DR筛查、分期和预测的主要工具,具有广泛的应用前景[44-45]。
DR的自动化监测和筛查可以显著减少人力和时间,同时,早期治疗可以减少疾病进展所造成的视力损害。因此,DR的自动检测和分级一直是该领域的研究热点。DR的自动检测技术一直在不断提高。早期视网膜照相图像中DR相关病变的智能识别和诊断主要通过ML进行检测。在此期间,开发了各种用于DR筛选的ML工具,如决策树、支持向量机(SVM)、人工神经网络(ANN)、贝叶斯分类器等。然而,传统ML的识别效率有限,有时还需要人工确认。因此,有学者尝试在ML的基础上加入集成学习算法来整合各种算法,使计算机通过不同的策略识别与DR相关的病变。自2016年以来,由于DL在DR自动识别中的逐步应用,自动检测的效率和准确性均有很大提高。
本研究纳入论文涉及的前6个主要学科领域为计算机科学与信息系统、医学信息学、光学、多学科科学、眼科学、生物学,表明糖尿病视网膜病变人工智能研究不仅仅只是AI和眼科学中某一疾病的结合,而更多的是多学科的结合应用。其中,AI与计算机科学与信息系统直接对应,DR和光学、眼科学和生物学直接对应,而医学信息学和多学科科学显然体现了跨学科领域相互赋能的关系。基于关键词共现合作网络分析呈现的关键词聚类图和研究领域聚类图(图7)更加细致地展现了关键词的聚类情况和与之对应的研究领域。视网膜照相图像中视盘的检测对于识别各种视网膜异常情况至关重要,如DR。智能DR辅助诊断被认为是DR早期诊断中最重要的,同时也是效率和性价比极高的筛查方法[46],故对视盘的自动分割是糖尿病视网膜病变人工智能研究中既往研究的一个重要切入点[47-49]。2022年,Zaaboub等[50]在彩色视网膜照相图像中精确定义了一种新的、鲁棒的视盘分割方法,该方法在视盘检测和分割方面达到了最先进的性能。AI应用于DR的诊断和分类通常基于彩色眼底照相和OCT图像分析进行,使用视网膜血管分割和定向局部对比来检测病变,包括微动脉瘤和硬性渗出,该过程需要尽可能精准的特征提取,CNN的出现对此贡献了极大的助推作用。AI是近年发展迅速的一种以DL为基础的智能系统,该研究领域涉及多学科知识与技术的深度融合,需要多学科技术资源的合作与共享。目前还存在数据标准化、临床验证不足、产品有待投入使用等问题。虽然AI辅助DR筛查的研究机遇与挑战并存,但随着研究的逐步深入和相关跨学科研究人员的共同努力,AI辅助诊断DR在眼科的临床应用有望取得更大进展。
本研究综合分析纳入论文中被引频次前10篇论文的研究局限性,将AI在诊断眼科疾病中的限制性分为以下5种:(1)智能辅助诊断系统的设计因复杂的临床条件和主观评价标准而变得复杂;(2)AI训练模型的样本量相对有限,实际有效性有待确认;(3)现有的辅助诊断系统无法独立诊断,具体临床应用需要眼科医生或专业人士的建议;(4)不一致的临床参考标准可能导致智能算法性能的差异;(5)现有智能辅助诊断系统的可解释性仍不尽人意。为促进糖尿病视网膜病变人工智能研究的应用提出以下建议:(1)为了开发更鲁棒和可用的智能辅助诊断系统,需要更多类型和更大的数据集,建立一个统一的高质量DR影像数据库,并不断对其进行优化和数据扩充,可以更好地满足DR的智能诊断需求,解决样本量的问题,如建立一个可以整合不同来源的数据并解决碎片化数据的数据库,可能有利于进一步的研究[51];(2)研究范围需要包括各种常见的疾病类型,如青光眼和年龄相关性黄斑变性[52-53];(3)需要统一的DR诊断输出标准,以保证各种系统的通用性;(4)更多高水平的眼科医生应参与数据集的筛选阶段和算法的检查阶段,以获得更准确的临床诊断;(5)应该保证AI临床诊断的合法地位,在确保技术先进的情况下,可以批准AI进行独立输出诊断建议;(6)相关专业人员应加强技术研究,增强技术可视化,进一步提高AI技术的使用率,同时,对于AI技术临床研究评价的规范化也有助于临床应用[54]。
此外,本研究方法也存在一些潜在的局限性:(1)由于本研究方法是对以往文献进行分析,研究的前瞻性可能不够准确,同时,从研究到发表有一段时间,发表的论文往往与实际研究时间不同步;(2)本研究仅对WoSCC数据库中的英文论文进行分析,考虑到同时融合和分析不同数据库或不同语言的数据不现实,其他数据库或其他语言的论文未被纳入,这可能导致结论出现偏差,如英语系国家的中心性结果或较实际偏高;(3)本研究主要分析了AI技术在单发DR病例中的应用,未系统分析AI在包括DR在内的多发性视网膜疾病中的应用。
近年来,基于图像分析的智能算法训练越来越受到关注。AI在糖尿病筛查和诊断中的应用正在世界范围内进行研究。特别是美国目前在该研究领域的影响力最大。AI在DR筛查和诊断中的应用显著改变了眼科医生和患者的临床环境,这些技术提供了更严格、更快和远程的诊断服务。但这些方法有一定的局限性,如AI训练模型的样本量有限,其临床应用的实际有效性需要确认,现有模型只能作为辅助诊断工具,临床应用还需要眼科医生或专业人士提供建议。此外,目前多数研究仍处于系统开发和测试阶段,尚未开发出复杂的智能辅助诊断系统。最初的研究主要集中在分析用于定位或识别视网膜照相图像上病变的智能算法,以辅助DR诊断。目前,研究的重点已经从AI辅助DR检测和分级转向糖尿病视网膜病变人工智能辅助诊断系统的研究。因此,在训练和测试算法时,有必要获取更多的国家和民族来源的数据,并合并更复杂的眼科数据,以解决现有的局限性。然而,这是一项具有挑战性的任务,除了主要开发算法的计算机工程专家外,还需要各个专业层次的眼科医生参与其中。