人工智能在老年眼科疾病检测中的应用

2023-11-06 16:37陶思翰马广成陈茜施炜
实用老年医学 2023年9期
关键词:眼科青光眼灵敏度

陶思翰 马广成 陈茜 施炜

人工智能(artificial intelligence, AI)是人类历史上的第四次工业革命。AI的概念最早是在1956年由约翰·麦卡锡提出,他定义AI是一个通用术语,“指表现出智能行为的硬件或软件”[1]。但直到最近,由于新算法、专业硬件、云服务和大数据的发展,AI才得以实现。机器学习(machine learning, ML)出现于20世纪80年代,是AI的一个分支,是计算机通过从已知数据库中提取广义原理,应用在新数据上做预测的方法。深度学习(deep learning, DL)出现在21世纪初,是机器学习中重要的子领域,主要作用是大数据处理以及预测分析[2]。DL通过模拟人脑的统计模式,根据互联节点层间连接的权重来处理输入,使用表征学习方法自动提取所需的特征,并对复杂的数据集进行分类[3],大大减少了算法结构对人力的依赖。DL为现代社会的许多方面提供了动力,例如识别图像中的物体、实时语言翻译、语音操作设备等等。

近年来,医疗保健领域一直走在AI应用的前沿。AI在眼科领域的应用同样是近年来的热点。AI通过对眼科影像学检查结果进行智能分析,在糖尿病视网膜病变(DR)、年龄相关性黄斑变性(AMD)、青光眼等老年人常见眼科疾病的筛查、诊断、分级和指导治疗方面展现了强大的性能,同时在眼科远程医疗中也有重要应用[4-5]。

在这篇综述中,我们总结了近年来AI在眼科领域的主要进展,阐明了现阶段AI应用于临床可能存在的一些问题,并指出了一些解决方法和未来发展方向。

1 AI在DR中的应用

DM是一种发病率逐年增加的常见代谢性疾病。据WHO推算,到2030年,DM总人数将达到3.66亿。DR是DM常见的微血管并发症,是老年人群后天性失明的主要病因。随着DM病人人数的增加,预计到2030年DR和视力威胁DR(VTDR)病人的数量将分别增至1.91亿和5630万[6]。视网膜病变的早期检测是DM病人管理的重要组成部分。美国糖尿病协会的现行指南建议没有任何眼部症状的DM病人每2年看1次眼科医生。

在过去几年中,世界各地的许多科研团队致力于将DL与DR的筛查相结合,可能改变传统的DR筛查模式。 Abràmoff等[7]曾在2013年基于874例DM病人的数字眼底彩色图像开发了爱荷华检测项目(IDP),以检测可疑的糖尿病性视网膜病变(RDR),并利用 Messidor-2 数据集验证,得到IDP的灵敏度和特异度分别为96.8%和59.4%,AUC为0.937。2016年时,Abràmoff等[8]又验证了用于DR检测的DL增强算法,其灵敏度和特异度分别为96.8%和87.0%,AUC为0.98,大大提升了算法的特异度。Gulshan等[9]用128 175张眼底视网膜图像训练开发了DR筛查的新系统,该算法最大的特点是具有多个操作点,因此可以调整其灵敏度和特异度以匹配特定临床设置的要求。虽然DL结合DR筛查展现出了强大的诊断效率,但是DL对于诊断特征的抓取并不会自动显示出来,并且这些特征可能是人们以前未知或忽略的。因此,临床医生和病人都担心DL像一个“黑箱子”,缺乏解释性。Gargeya等[10]开发的算法通过自动生成的异常区域热图,使得DL学习到的信息可视化,该算法在使用训练数据集进行5倍交叉验证时的AUC为0.97,灵敏度和特异度分别为94%和98%。Reguant等[11]则运用了更加先进的Grad-cam方法尝试将DL的分类过程可视化,使用了Inception-v3等4个神经网络分别独自训练来对眼底照片进行5级分类,该研究得到的准确率为89%~95%,AUC、敏感度和特异度分别为95%~98%、74%~86%和93%~97%。Ting等[12]首次将DL筛查系统应用于真实的DR筛查计划并从6个不同的国家和地区来自10个不同社区、不同人种的外部数据集进行验证,基于VGG-19开发的DL筛查系统在检测RDR和VTDR时的AUC、灵敏度、特异度分别为0.936、90.5%、91.6%和0.958、100%、91.1%,10个外部数据集的AUC为0.889~0.983。Li等[13]回顾性地从上海市第一人民医院收集3285例病人的8739张视网膜眼底图像,使用深度集成优化了的Inception-v4算法检测DR和糖尿病黄斑水肿(DMO),并在DR检测上实现了99.2%、92.5%和96.1%的AUC、灵敏度和特异度,在DMO检测上实现了99.4%、93.0%和97.1%的AUC、灵敏度和特异度,其表现等于或超过眼科医生。

来自上海交通大学的Dai等[14]开发了一个名为DeepDR的深度学习系统,大大提升了早期DR的检测准确性。该系统基于对视网膜病变的准确检测,实现了DR从早期到晚期的全过程诊断,对微动脉瘤的检测尤其准确。还有学者将AI对DR的筛查用于初级保健中心[15]或者社区卫生服务中心[16]。时至今日,AI在DR中的应用已日趋成熟,研究从公开的视网膜图片数据库渐渐转向真实世界,很多研究从经济效益等更实用的角度评估了AI在DR筛查和分期中的应用。然而,在中低收入国家,AI大规模运用于DR的临床筛查在当下仍不可行。

2 AI在AMD中的应用

AMD占全球所有失明病人的8.7%,是发达国家最常见的致盲原因,尤其是60岁以上人群。随着人口老龄化的大幅加快,其流行率可能会进一步增加。预计到2040年,2.88亿病人可能患有AMD,约10%的病人患有中度或更严重的AMD[17]。年龄相关眼病研究(AREDS)将AMD分为无、早期、中期和晚期。美国眼科学会建议,中度或更严重的AMD病人至少每2年就诊1次。和DR一样,AMD的筛查与AI结合同样展现了巨大的潜力。

Ting等[12]报告了一种基于临床AMD筛查开发的DL筛查系统,使用38 189例病人的108 558张未经黄斑分割的以视网膜中心凹为中心的视网膜图像对DL系统进行了训练和测试。使用DL架构VGG-19开发的DL系统在检测AMD时的AUC、灵敏度和特异度分别为0.932、93.20%和88.70%。Burlina等[18]基于AREDS数据集4613例病人的十多万张眼底照片将AMD进行了二元分类:无AMD和早期AMD分为一类,中期AMD和晚期AMD分为一类,并训练了2个不同的DL系统以比较它们的准确率,分别是AlexNet的DCNN模型(DCNN-A)和OverFeat的DCNN(DCNN-U),其中DCNN-U使用了迁移学习的方法。使用原数据集进行五倍交叉验证,DCNN-A报告的诊断准确率为88.4%~91.6%,AUC为0.94~0.96。DCNN-U报告的诊断准确率为82.4%~83.9%,AUC为0.89~0.90。然而,该研究的一个局限性在于它完全依赖于AREDS数据集,没有使用单独收集的临床数据集进行性能评估。Grassmann等[19]通过DL对AMD进行自动分级,基于AREDS 9级严重等级量表将眼底图像分为13类。同样运用AREDS数据集,并从中提取了3654例病人的120 656张眼底图片,70%用于训练集,20%用于验证集,10%用于测试集,并且加入了包含5555张眼底图片的KORA数据集作为独立外部测试数据集。该研究训练了6个不同的卷积神经网络(CNN)并应用了数据增强方法。同时,针对DL领域的“黑匣子”问题,该研究通过随机屏蔽部分眼底图像后检测结果的准确率来确定眼底图像中被DL感知和整合的重要区域,从而将DL的分类过程可视化。

由于单眼患渗出性“湿性”年龄相关性黄斑变性(exAMD)的病人,另一只眼患exAMD的概率将大幅增加。Yim等[20]选择了2795例单眼患有exAMD的病人,用每1~12个月获得1次的同眼光学相干断层扫描(OCT)图像训练CNN,以输出1个分数,表示6个月内转化为exAMD的可能性。Yim在ROC曲线上确定了2个可用于不同临床场景的操作点:一个高灵敏度操作点具有80%的灵敏度和55%的特异度,另一个高特异度操作点具有34%的灵敏度和90%的特异度。这一表现超过了6名视网膜专家中的5名。

3 AI在青光眼中的应用

青光眼是全球范围内导致失明的主要原因[21]。 全球40~80岁人群青光眼的患病率为3.4%,到2040年,青光眼病人人数预计将增加到1.118亿[22]。AI将在青光眼的筛查、诊断和监测中发挥着关键作用。

AI应用于青光眼筛查最大的困难在于青光眼是一种异质性疾病,对该疾病的结构和功能损害难以达成一致性定义。在青光眼的早期阶段,定义和诊断尤其困难。临床上通常用杯盘比(CDR)来量化青光眼的视神经病变。然而,人群中视盘的面积差异可以达到5倍,所以实际上用CDR来定义视杯的病理性扩大是不合理的。虽然青光眼的定义并不明确,但DL系统可以被训练用来识别疾病的表型特征。 Ting等[12]将青光眼视盘改变的标准定为CDR>0.8,以此来训练算法检测青光眼。相似地,Li等[23]则把青光眼视盘改变的标准定为CDR>0.7。这两个算法检测结果的准确率都超过90%。相较于将单一的采用CDR值作为标准,Shibata等[24]开发的青光眼检测系统则加入了更多眼底特征性改变,如视网膜神经纤维层萎缩、视盘出血和视乳头周围萎缩等,这些眼底病变发生在CDR增高之前。检测系统使用3242张确诊青光眼病人的眼底照片对算法进行训练和测试,得到了0.965的极高AUC。Elze等[25]开发了一个无监督的计算机算法,以识别包括青光眼和非青光眼缺陷的视野缺损模式,并为这些模式分配加权系数。该方法已被证明可用于检测青光眼引起的早期视力缺损。Yousefi等[26]使用另一种高斯混合和期望值最大化方法沿不同轴分解视野,以检测视野缺损的进展。在检测视野缺损进展方面,此算法优于当前其他算法。在青光眼的治疗和临床预测方面,尽管当今常用的降低青光眼眼内压(intraocular pressure, IOP)的治疗方法已被证明在延缓青光眼进展方面有效,但一些研究表明,疾病进展仍然不可避免。这表明,我们尚未找到针对各种形式青光眼的最佳治疗方案。针对于此,Kazemian等[27]开发了一种临床预测工具,该工具使用眼压和视野数据来预测不同目标眼压下的疾病轨迹。进一步完善该工具,整合其他眼科和非眼科数据,将有助于建立目标眼压,并根据具体情况制定实现目标的最佳策略。Schell等[28]则通过眼内压和视野的纵向数据准确预测了青光眼病人的视野缺损进展。

AI在眼科的应用可以与远程医疗联合使用,作为一种良好的医疗供需失衡的解决方案,AI技术在DR、AMD、青光眼等图像的特征提取和自动化筛查中具有良好的临床应用前景。但目前还存在一些不足和挑战,包括临床技术挑战、算法结果的准确性和可解释性、病人的隐私保护伦理问题等。如何明确AI可能引起的医疗事故、医疗纠纷等的主体责任问题,也亟待解决。

综上,AI在眼科领域的研究和应用取得了巨大的成果,当下仍存在一些不足和挑战,但随着AI技术的不断发展和人们将AI运用于医疗领域研究的深入,这些问题或许可以迎刃而解。

猜你喜欢
眼科青光眼灵敏度
眼科诊所、眼科门诊、视光中心的区别
青光眼问答
第二十二届亚非眼科大会(AACO 2022)
第二十二届亚非眼科大会(AACO 2022)
改善青光眼 吃什么好呢
“青光眼之家”11周年
导磁环对LVDT线性度和灵敏度的影响
地下水非稳定流的灵敏度分析
穿甲爆破弹引信对薄弱目标的灵敏度分析
青光眼“未病先防”