人工智能在社区糖尿病视网膜病变诊断及转诊中的应用

2023-01-07 07:26董秀清杜绍林刘华秀邹江凤刘明慧
中华实验眼科杂志 2022年12期
关键词:阅片专家组眼科

董秀清 杜绍林 刘华秀 邹江凤 刘明慧

东莞东华医院眼科,东莞 523000

目前,糖尿病患病率日益升高,预计到2040年,全球将有6.42亿糖尿病患者[1]。糖尿病视网膜病变(diabetic retinopathy,DR)作为其主要并发症之一,已成为我国工作年龄人群盲和低视力的主要原因[2-3],给个人、家庭及社会造成巨大的经济负担。DR引起的严重视力丧失可通过早期诊断、及时干预避免[4],因此对糖尿病患者进行早期DR筛查尤为重要。在我国,分级诊疗模式的实施使大量糖尿病患者被分流至社区医院进行慢性病管理[5]。由于缺乏专业眼科人才,社区医院无法对其管理的糖尿病患者进行早期诊断及定期DR筛查。许多社区医院目前仍依赖传统的远程阅片模式,面临着人工阅片效率低、结果反馈滞后及转诊不及时等问题[6]。因此,提高社区糖尿病患者彩色眼底照片的判读效率及准确性成为亟需解决的问题。近年来,深度学习算法的快速进展使人工智能(artificial intelligence,AI)检测DR的敏感性及特异度均得到显著提升[7-8]。但关于AI在社区临床应用场景中的实际效能及其与社区医生相比在DR诊断及转诊方面的效能差异尚缺乏深入探索。因此,本研究拟通过比较AI及社区医生诊断、转诊DR的效能,探索AI在社区医院中应用于DR筛查、诊断和转诊中的可行性及价值。

1 资料与方法

1.1 一般资料

采用诊断试验研究方法,选择2020年1月1日至2021年12月31日就诊于东莞市寮步社区卫生服务中心、东莞市东城卫生服务中心、东莞横沥医院的糖尿病患者421例纳入本研究,其中30眼因瞳孔无法扩大、屈光介质混浊等原因影响图像质量予以排除,最终共812眼纳入研究。其中男267例,占63.42%,女154例,占36.58%;年龄18~82岁,平均(51.72±11.28)岁;病程0~30年,平均(4.77±4.77)年。入组患眼均采用单视野眼底照相技术,以黄斑为中心拍摄50°彩色眼底照片,所摄照片的拍摄位置、清晰度需符合我国基于眼底照相的DR人工智能筛查系统应用指南[9]要求,并将以上眼底彩色照片建立样本图库。纳入标准:(1)由内科或全科医师确诊为1型或2型糖尿病;(2)年龄≥18岁;(3)理解并同意研究方案,配合检查者。排除标准:(1)屈光介质混浊影响成像质量者;(2)合并视网膜静脉阻塞、年龄相关性黄斑变性、视神经炎等眼底疾病患者;(3)既往有眼底病治疗史者,包括眼内注药、视网膜激光光凝、玻璃体切割手术等;(4)合并高度近视、青光眼、葡萄膜炎等其他眼病者。本研究方案遵循《赫尔辛基宣言》,经东莞东华医院伦理委员会批准(批文号:2019DHLL046)。研究涉及患者的一般资料及彩色眼底照片均进行了匿名化处理。

1.2 方法

1.2.1诊断标准 研究对象需符合以下糖尿病诊断标准[10]:有多饮、多尿、多食和体质量下降的糖尿病典型症状,随机血浆葡萄糖浓度≥11.1 mmol/L;空腹血浆葡萄糖浓度≥7.0 mmol/L;口服葡萄糖耐量试验2 h血糖≥11.1 mmol/L。人工及AI阅片均根据DR国际分期标准[11]进行结果判读(表1),分为无糖尿病视网膜病变(no diabetic retinopathy,NDR)、轻度非增生性糖尿病视网膜病变(nonproliferative diabetic retinopathy,NPDR)、中度NPDR、重度非增生性糖尿病视网膜病变NPDR和增生性糖尿病视网膜病变(proliferative diabetic retinopathy,PDR)。其中,有转诊意义的糖尿病视网膜病变(referable diabetic retinopathy,RDR)定义为中度及重度NPDR、PDR以及有临床意义的黄斑水肿(clinically significant macular edema,CSME)[12-13]。

表1 DR国际分期及诊断标准[11]Table 1 International grading and diagnostic criteria fordiabetic retinopathy [11]国际分期眼底表现NDR无异常轻度NPDR仅有微动脉瘤中度NPDR微动脉瘤,存在轻于重度NPDR的表现重度NPDR存在以下任一改变但无PDR表现:(1)任一象限中有多于20处视网膜内出血(2)2个以上象限有静脉串珠样改变(3)1个以上象限有显著的视网膜内微血管异常PDR出现以下一种或多种表现:新生血管形成、玻璃体积血、视网膜前出血 注:DR:糖尿病视网膜病变;NDR:无糖尿病视网膜病变;NPDR:非增生性糖尿病视网膜病变;PDR:增生性糖尿病视网膜病变 Note:DR:diabetic retinopathy;NDR:no diabetic retinopathy;NPDR:non-proliferative diabetic retinopathy;PDR:proliferative diabetic reti-nopathy

1.2.2分组阅片 (1)眼科专家组 由2名高年资主治以上职称眼科专科医师共同阅片,根据以上分期标准进行诊断。当2人诊断结果有异则增加第3名高于或等同前2名医师职称的眼科医师参与阅片诊断,并综合3人意见得出最终结果,作为该彩色眼底照片诊断的金标准。眼科专家组诊断为中度NPDR、重度NPDR或PDR的彩色眼底照片均为RDR。(2)社区医生组 提前由眼科专家对社区医生进行DR彩色眼底照片阅片及诊断培训,考核通过后由2名社区医生共同阅片,根据以上分期标准进行诊断并提出是否建议转诊。当2人诊断结果有异则增加第3名通过培训考核的社区医师参与阅片诊断,并综合3人意见得出最终结果。(3)AI系统组 采用上海鹰瞳医疗科技有限公司(Airdoc)的眼底疾病综合智能诊断软件(comprehensive artificial intelligence retinal expert,CARE)自动分析并给出诊断结果及转诊意见。CARE系统基于单个卷积神经网络(convolutional neural network,CNN),在TensorFlow平台(版本1.10.1;Google,Mountain View,CA,USA)和Python scikit学习包0.22.2上使用Inception-ResNet-V2架构,对207 228张眼底照片进行训练构建而成。CARE系统通过对彩色眼底照片分析,自动识别视网膜出血、渗出及玻璃膜疣的个数、最大面积及总面积和血管参数(图1),并根据其算法分析获得DR诊断结果。该系统已在国内进行多中心内部验证及外部测试,其敏感性和特异度分别达到93.8%和87.8%。CARE系统对DR的诊断分期与国际分期一致;AI系统给出的转诊意见包括定期检查、建议观察、进一步检查和立即治疗4个等级,其中进一步检查及立即治疗定义为AI建议转诊。

图1 CARE系统诊断流程图 AI:人工智能Figure 1 Diagnosis process of CARE system AI:artificial intelligence

1.3 统计学方法

2 结果

2.1 眼科专家组判读分期情况

所有彩色眼底照片中,眼科专家组判读分期结果中NDR共570眼,轻度NPDR共23眼,中度NPDR共120眼,重度NPDR共60眼,PDR共39眼,RDR共219眼。

2.2 AI系统对DR的诊断效能

眼科专家组与AI系统对所有彩色眼底照片的诊断结果如表2,3所示。与眼科专家组相比,AI系统诊断有无DR的敏感性为87.60%,特异度为97.89%,PPV为94.64%,NPV为94.90%;诊断有无RDR的敏感性为90.41%,特异度为96.29%,PPV为90.00%,NPV为96.45%。

表2 眼科专家组与AI系统诊断DR结果(眼数)Table 2 Diagnosis of DR by ophthalmologists and AIsystem (eyes)眼科专家诊断AI诊断DR(+)DR(-)合计DR(+)21230242DR(-)12558570合计224588812 注:AI:人工智能;DR:糖尿病视网膜病变 Note:AI:artificial intelligence;DR:diabetic retinopathy

表3 眼科专家组与AI系统诊断RDR结果(眼数)Table 3 Diagnosis of RDR by ophthalmologists and AIsystem (eyes)眼科专家诊断AI诊断RDR(+)RDR(-)合计RDR(+)19821219RDR(-)22571593合计220592812 注:AI:人工智能;RDR:有转诊意义的糖尿病视网膜病变 Note:AI:artificial intelligence;RDR:referable diabetic retinopathy

2.3 AI系统和社区医生诊断一致性评价

与眼科专家组相比,AI系统诊断DR及RDR的Kappa系数分别为0.87(P<0.001)和0.87(P<0.001);经过培训及考核的社区医生组对DR及PDR的诊断结果如表4,5所示,其Kappa系数分别为0.93(P<0.001)和0.98(P<0.001)。AI系统和培训后的社区医生均与眼科专家组的诊断结果具有极强一致性。

表4 眼科专家组与社区医生组诊断DR结果(眼数)Table 4 Diagnosis of DR by ophthalmologists andcommunity physicians (eyes)眼科专家诊断社区医生诊断DR(+)DR(-)合计RDR(+)22022242RDR(-)0570570合计220592812 注:AI:人工智能;DR:糖尿病视网膜病变 Note:AI:artificial intelligence;DR:diabetic retinopathy

表5 眼科专家组与社区医生组诊断RDR结果(眼数)Table 5 Diagnosis of RDR by ophthalmologists andcommunity physicians (eyes)眼科专家诊断社区医生诊断RDR(+)RDR(-)合计RDR(+)2145219RDR(-)0593593合计214598812 注:AI:人工智能;RDR:有转诊意义的糖尿病视网膜病变 Note:AI:artificial intelligence;DR:referable diabetic retinopathy

2.4 AI系统和社区医生转诊有效率比较

在眼科专家建议转诊的219眼中,AI系统给出相同建议的有效转诊率为90.87%(199/219),高于社区医生组的89.50%(196/219),差异无统计学意义(P=1.000)。

3 讨论

研究显示,我国大陆糖尿病人群中DR患病率约为23.0%,其中NPDR和PDR的患病率分别约为19.1%和2.8%[14]。2017美国糖尿病学会指出通过早期检查、定期随访、及时处理可避免98%由DR造成的视力丧失[15]。在我国,87%的糖尿病患者就诊于县级及以下医疗机构,以社区为中心、社区-疾控中心-医院“三位一体”的管理模式有利于糖尿病慢病管理的持续进行[16]。然而社区医疗卫生机构中眼科医疗资源相对有限,使社区医疗卫生机构的DR早期防治工作存在筛查难度大、诊断准确性及有效转诊率低等问题。在确保较高准确性的前提下提高诊断效率,突破专科人力资源限制,实现大规模、快速的DR早期筛查、诊断和转诊,这正是糖尿病患者群体庞大、专科人才匮乏的社区医疗卫生机构所需要实现的。眼底照相机在基层医院的普及及其与远程医疗相结合的模式可在一定程度上缓解上述困境,但因人力成本高、效率低下,无法开展大规模DR筛查[17]。

现代AI技术高速发展,已广泛应用于医学检查及治疗,在眼科领域展现出了巨大潜力。自2018年首台由美国食品和药品管理局批准用于DR检测的AI设备IDx-DR面世,已有多项研究显示AI在DR的诊断及病变分级上成效显著[18-21]。本研究中应用我国首个国家药品监督管理局批准的眼底图像AI辅助诊断系统CARE,结果显示其在诊断DR及RDR上均体现出良好的性能,与专业眼科医师判读结果相比,诊断一致性极强,与国内多中心真实世界研究结果相似[22]。该系统在诊断RDR上展现出稳定的准确率,与目前国际成熟的AI系统性能相仿。Ting等[23]以76 370张彩色眼底照片为训练集,训练机器自动学习、识别RDR的特征并建立AI系统,其训练数据集的受试者工作特征曲线下面积(area under subject operating characteristic curve,AUC)达到0.936,灵敏度和特异性分别为90.5%和91.5%;再采用该AI系统对40 752张彩色眼底照片进行验证诊断,AUC、灵敏度、特异性分别为0.889、91.8%和73.3%。然而该系统对于轻度NPDR的识别性能还有待进一步训练。不同于识别RDR的智能系统,Gargeya等[24]建立了基于CNN算法、主要用来区分NDR和轻度及以上NPDR的AI系统,其AUC达到了0.97,灵敏度和特异性分别为94%和98%。Abrmoff等[25]和Takahashi等[26]的研究则致力于探讨更为详细的DR-AI分级。

在实际临床应用场景中,AI系统的使用价值主要体现在眼科医疗资源相对缺乏的社区医疗卫生机构中,可解决全科医生阅片水平参差不齐、读片时效性低下等问题。现有研究多为比较AI与眼科医师诊断DR的效能,少有研究比较AI与全科医师在诊断DR效能上的差异。本研究的创新之处在于验证该AI系统的诊断准确率后,进一步比较AI系统与社区医生的诊断效能及决策性能。在本研究中,预先对参与读片的社区医生进行规范培训,培训方式结合理论授课及阅片实践。通过培训及考核后,社区医生诊断DR和RDR的结果与眼科专家具有极强一致性(Kappa值分别为0.93和0.98),略高于CARE系统(Kappa值分别为0.87和0.87)。以上研究结果表明,规范的培训及考核可有效提高社区DR诊疗水平,但广泛化、同质化、规范化的培训工作所耗费的人力、时间成本极高,而依靠于互联网、云计算的AI诊断系统则节省了繁琐的培训工作。至于AI与未经培训的非眼科专业医疗人员在DR诊断效能上的高低,国内有研究通过比较AI与初级、中级、高级职称的内分泌科医生对1 000张糖尿病患者彩色眼底照片的阅片结果,发现与AI的诊断符合率为94.7%,高于不同职称的内分泌科医生(初级、中级和高级职称组诊断符合率分别为94.0%、91.4%和93.4%)[27]。本研究结果显示,在转诊决策性能评估上,CARE系统对RDR患者中90.87%病例做出“进一步检查”或“立即治疗”的建议,转诊效率优于培训后社区医生的89.50%。此外,研究指出在医疗卫生资源相对缺乏的基层医院引入AI辅助筛查、诊断,可提高疾病的诊断效率,延缓疾病进展,节省疾病治疗费用[28]。本研究应用CARE系统上传彩色眼底照片后,可在1 min内获取诊断报告及转诊建议,其效率远高于人工阅片。国内一项8 012例的DR AI筛查研究结果显示,从图像上传至分级报告完成,人工分级耗时为AI的97.5倍[29]。Johansen等[30]采用ophdiat AI系统对3.8万人进行DR筛查和监测,使专业眼科医生节省了60%的时间。

综上所述,本研究结果表明CARE系统应用于社区DR诊治工作中具有良好的诊断和决策性能,且时效性强,可为社区开展大规模、智能化DR筛查提供新的策略。本研究也存在一些不足,如基于单视野彩色眼底照片评估范围有限及纳入研究的样本量有限等,今后我们将进一步完善研究设计,扩大样本量,并扩展至基于光相干断层扫描及其血管成像的AI研究,为地区DR防治体系的建立搭建数据平台。

利益冲突所有作者均声明不存在利益冲突

作者贡献声明董秀清:参与设计试验、实施研究、采集数据、分析和解释数据、文章撰写;杜绍林:参与设计试验、分析和解释数据、文章审阅及定稿;刘华秀:参与设计试验、实施研究及起草文章;邹江凤:参与实施研究、采集数据;刘明慧:参与采集数据、分析数据

猜你喜欢
阅片专家组眼科
眼科诊所、眼科门诊、视光中心的区别
ThinPrep玻片扫描分析影像系统在子宫颈细胞学中的临床应用
第二十二届亚非眼科大会(AACO 2022)
第二十二届亚非眼科大会(AACO 2022)
人工智能阅片在体检肺结节筛查中的应用价值
协会专家组2021年工作会议在哈尔滨市召开
阅片列表在耳科住院医师颞骨CT影像阅片教学的应用与实践
计算机辅助检测系统(CAD)在16层CT低剂量肺癌筛查肺结节检出中的应用价值
韩长赋部长在巴拿马接见中国热科院农业专家组
升降散加味治疗眼科疾病验案举隅