董娜,崔婷,王露露,师荣慧,冯洁,黄晓俊*
1.730000 甘肃省兰州市,兰州大学第二临床医学院
2.730000 甘肃省兰州市,兰州大学第二医院消化科
胃癌是全球第五大常见恶性肿瘤和癌症相关死亡的第四大原因,全球每年新增胃癌患者约109 万例,因胃癌死亡患者约77 万例[1]。我国是胃癌高发国家,胃癌发病率和死亡率分别位居恶性肿瘤第2、3 位[2]。据报道,早期胃癌5 年生存率>90.0%[3],而进展期胃癌5 年生存率<10.0%[4]。由于胃癌早期缺乏特异性症状和体征,大多数胃癌被诊断时病程已进展到晚期,导致胃癌患者整体预后较差[5]。因此胃癌的早期诊断和合理治疗对于改善患者预后至关重要。然而胃癌的诊断准确性与医师的临床经验和专业知识储备密切相关,存在被误诊和漏诊的可能性。随着人工智能(AI)在医学领域的快速发展,机器学习技术特别是深度学习和神经网络在胃癌诊断、治疗和预后预测方面展示出良好应用前景[6]。有学者尝试采用支持向量机算法识别可用于早期诊断胃癌的生物标志物[7];有学者利用深度学习技术对内镜图像、计算机断层扫描图像、病理图像进行诊断分析,实现了对胃癌的诊断/分期和预后预测[8]。近年来将AI 应用于胃癌诊治的研究日益增多,但尚未得到系统分析。本研究采用VOSviewer、CiteSpace 软件对2003—2022 年AI 应用于胃癌诊治的研究进行文献计量学分析,旨在阐明该领域研究的概况和发展趋势,为该领域研究者提供参考。
于2022-11-06,计算机检索Web of Science(WOS)核心合集数据库,获取将AI 应用于胃癌诊治的相关研究。采用的检索式为(((((TS=(Stomach Neoplasm*))OR TS=(Gastric Neoplasm*))OR TS=(Cancer of Stomach))OR TS=(Stomach Cancer))OR TS=(Gastric Cancer))AND((((((((((((((((((((((((TS=(artificial intelligence))OR TS=("computational intelligence"))OR TS=("deep learning"))OR TS=("computer aided"))OR TS=("machine learning"))OR TS=("support vector machine"))OR TS=("data learning"))OR TS=("artificial neural network"))OR TS=("digital image"))OR TS=("convolutional neural network"))OR TS=("evolutionary algorithms"))OR TS=("feature learning"))OR TS=("reinforcement learning"))OR TS=("big data"))OR TS=("image segmentation"))OR TS=("image segmentation"))OR TS=("hybrid intelligent system"))OR TS=("recurrent neural network"))OR TS=("natural language processing"))OR TS=("bayesian network"))OR TS=("bayesian learning"))OR TS=("random forest"))OR TS=("evolutionary algorithms"))OR TS=("multiagent system")),将文献语言限定为“English”,将文献类型限定为“article”和“review”,检索时间跨度为2003—2022 年。排除标准:(1)会议论文、述评;(2)文献主题与本研究的研究内容无关;(3)重复发表的文献。最终纳入文献703 篇,导出完整记录和参考文献,将其以“download_txt”格式保存。
采用VOSviewer 1.6.18 和CiteSpace 5.7.R5 软件进行文献计量学和可视化分析,数据分析前使用CiteSpace 5.7.R5软件对从WOS 导出的数据进行去重,去重后仍为703 篇文献。采用VOSviewer 1.6.18 软件对国家(地区)间、机构间、作者间的合作情况、共被引作者情况、关键词共现与叠加情况进行可视化分析,采用CiteSpace 5.7.R5 软件进行机构中介中心性分析、期刊双图叠加分析、近6年共被引文献聚类分析、共被引文献聚类时间线图分析及参考文献突现分析。其中关键词共现分析旨在通过主题共现发现研究热点的结构分布;关键词叠加分析旨在通过将时间因素叠加到关键词共现网络中,显示出研究趋势的演变;期刊双图叠加分析旨在通过对施引和被引文献所属期刊进行聚类和叠加分析,显示学科论文的分布及引文轨迹等信息;共被引文献聚类分析旨在通过分析文献同时被其他文献引用的频次判断在所研究领域中产生过重大影响的文献并对其进行聚类,可以反映研究的发展和演进动态;共被引文献聚类时间线图分析旨在通过分析聚类之间的关系和某个聚类中文献的引用情况,显示某个研究主题研究基础的时间跨度;参考文献突现分析旨在通过分析参考文献的时间分布,显示出频次变化率高、增长速度快的突现参考文献,进而分析学科的研究前沿和发展趋势。此外,采用Excel 2019 软件绘制发文量条形图及国家(地区)、机构、期刊、作者、共被引作者、引用参考文献和关键词的描述性分析表格。
703 篇文献中,596 篇(84.8%)为论著、107 篇(15.2%)为综述。2016 年以前年发文量少且增长缓慢,年发文量最多的一年为2013 年(12 篇);2017 年开始年发文量快速增长,2022 年达195 篇(截至2022-11-06),约为2016 年的20 倍(图1)。近6 年发文量占总发文量的90.3%(635/703),多项式拟合结果显示,R2=0.933 6,提示发表年份与年发文量之间存在相关性,未来该领域的文献会持续增加。
该领域发表文献共来自52 个国家(地区),发文量>100 篇的国家(地区)只有中国,发文量≥5 篇的国家(地区)有25 个。表1 总结了近20 年发文量排在前10 的国家(地区)的发文情况,中国发文量位列第1(366 篇),美国(93 篇)、韩国(86 篇)、日本(79篇)和德国(47 篇)发文量分别位列第2、3、4、5 位;总被引用次数排在前5 的国家(地区)依次是中国(4 371 次)、美国(2 704 次)、日本(2 232 次)、德国(1 189 次)和韩国(890 次);虽然来自中国的文献总被引用次数最多,但来自荷兰、美国、英国、日本、德国和意大利的文献的平均被引用次数均高于来自中国的文献。基于VOSviewer 软件分析国家(地区)间的合作情况(图2),节点之间的线条表示存在合作关系,线条越粗表示关系越紧密,即总链接强度(TLS)越强,TLS 排在前5 的国家为中国、日本、美国、德国和韩国。
表1 发文量排在前10 的国家(地区)的发文情况(截至2022-11-06)Table 1 Top 10 countries(regions)in term of publication volume
图2 国家(地区)间的合作网络图谱Figure 2 Mapping of collaborative networks among countries(regions)
共1 162 家机构参与将AI 应用于胃癌诊治的相关研究,其中发文量≥5 篇的机构有74 家。发文量排在前3 的机构依次为中国科学院、中山大学和上海交通大学,分别发表文献32、25、25 篇(表2)。基于VOSviewer 软件,针对发文量≥5 篇的机构绘制机构间的合作网络图谱(图3),TLS 排在前3 的机构为多田智广消化内科和直肠科研究所(416)、中国科学院(392)和东京大学(360)。中介中心性是节点中心性的度量指标,可反映节点在网络中的重要性,在CiteSpace 生成的图谱中,有紫色外圈的节点为具有高中介中心性的节点。CiteSpace 生成的图谱显示,中国科学院(0.19)、成均馆大学(0.17)、武汉大学(0.16)、哈佛大学(0.12)、中山大学(0.11)和中国医科大学(0.11)等中介中心性较高的机构在该领域的研究中发挥着重要作用(受限于篇幅,未呈现CiteSpace 生成的图谱)。
表2 发文量排在前10 的机构的发文情况(截至2022-11-06)Table 2 Top 10 institutions in term of publication volume
703 篇文献刊载于330 种期刊,其中26 种期刊发文量≥5 篇。发文量排在前10 的期刊共发文156 篇,占总发文量的22.2%;Frontiers in Oncology 发文量最多(32 篇);Gastric Cancer 被引用次数最多(519 次);Gastrointestinal Endoscopy 2022 年影响因子最高(10.396);5 种期刊2022 年Journal Citation Reports(JCR)分区为Q1,其余5 种期刊为Q2 区,见表3。共被引次数最多的期刊是Gastrointestinal Endoscopy(1 004次),其次为Gastric Cancer(702次)和Endoscopy(631 次),见表4。期刊双图叠加分析结果显示,引用路径主要有4 条;施引期刊的所属领域集中在“Medicine,Medical,Clinical”(“药物,医学,临床”)、“Molecular,Biology,Immunology”(“分子,生物学,免疫学”)领域;被引期刊的所属领域集中在“Molecular,Biology,Genetics”(“分子,生物学,遗传学”)、“Health,Nursing,Medicine”(“健康,护理,药物”)领域(图4)。
表3 发文量排在前10 的期刊的发文情况及2022 年评价指标情况(截至2022-11-06)Table 3 Publications and evaluation metrics in 2022 of top 10 journals in term of publication volume
图4 基于施引期刊与被引期刊的双图叠加分析Figure 4 Double graph overlay analysis of citing and cited journals
该领域研究涉及4 088 名作者和16 338 名共被引作者。表5 显示了发文量和共被引次数排前10 作者的发文情况,TADA TOMOHIRO 发文量最多(16 篇),其次为TIAN JIA(11 篇)和YU HONGGANG(10 篇);共被引次数最多的作者为BRAY FREDDIE(186 次),其次为HIRASAWA TOSHIAKI(122 次)和JIANG YUMING(111次)。作者间合作网络见图5,作者共被引图谱见图6。
表5 发文量和共被引次数排在前10 的作者的发文情况(截至2022-11-06)Table 5 Publication of top 10 authors in terms of pulication volume and total number of citations
图5 作者间的合作网络图谱Figure 5 Mapping of collaborative networks among authors
图6 作者共被引图谱Figure 6 Mapping of co-citation of authors
共有参考文献22 273 条,其中76 条参考文献共被引次数≥20 次。共被引次数排在前10 的参考文献的具体信息见表6。共被引次数排在首位的参考文献为Global cancer statistics 2018:GLOBOCAN estimates of incidence and mortality worldwide for 36 cancers in 185 countries(183 次),其次为Application of artificial intelligence using a convolutional neural network for detecting gastric cancer in endoscopic images(113 次) 和Application of convolutional neural network in the diagnosis of the invasion depth of gastric cancer based on conventional endoscopy(78 次)。鉴于纳入的703 篇文献中多数文献发表在2017—2022 年,对近6 年共被引文献进行聚类分析,可以更好地确定研究前沿。近6 年共被引文献共被分为10 个集群,其中endoscopy(内镜)、digital pathology(数字病理学)、radiomics(影像组学)、image classification(图像分类)、system biology(系统生物学)与胃癌的诊断和分期有关(图7)。共被引文献聚类时间线图显示,endoscopy(内镜)、digital pathology(数字病理学)、radiomics(影像组学)、image classification(图像分类)是当前的研究热点,system biology(系统生物学)是最早出现的研究热点(图8)。图9 显示了突现力排在前15 的参考文献,该领域的引文数量极速增加始于2016 年,大量参考文献仍然被频繁引用,表明AI在胃癌诊治领域的应用仍是未来几年的研究热点。
图8 共被引文献聚类时间线图Figure 8 Co-cited literature clustering timeline
图9 突现力排在前15 的参考文献突现信息Figure 9 Top 15 reference with the strongest citation bursts
共有关键词2 609 个,总出现频次为4 977 次,95 个关键出现频次≥10 次。表7 显示了出现频次排在前10 的关键词的基本情况。出现频次>100 次的关键词有gastric cancer(胃癌)、deep learning(深度学习)、artificial intelligence(人工智能)、classification(分型)、cancer(癌症)和diagnosis(诊断)。使用VOSviewer 生成关键词共现网络图谱(图10),每种颜色代表一个聚类,将所有关键词聚为4 类,红色聚类:AI 辅助胃癌的生物学研究,涉及的关键词包括gene(基因)、expression(表达)、gene-expression(基因表达)、biomarkers(生物标志物)等。蓝色聚类:AI 辅助胃癌的内镜诊断,涉及的关键词包括gastrointestinal endoscopy(胃肠道内镜)、capsule endoscopy(胶囊内镜)、upper-gastrointestinal endoscopy(上消化道内镜)等。黄色聚类:AI 辅助胃癌的病理诊断,涉及的关键词包括pathology(病理学)、digital pathology(数字病理学)、histology(组织学)等。绿色聚类:AI 辅助胃癌的非内镜治疗及预后预测,涉及的关键词包括chemotherapy(化疗)、immunotherapy(免疫治疗)、surgery(外科手术)、outcome(预后)。图11 为关键词叠加网络图谱,显示了关键词随时间变化的趋势,黄色节点代表新兴关键词,提示这些关键词可能为当前研究热点。由图可见,deep learning(深度学习)、convolutional neural network(卷积神经网络)、radiomics(影像组学)、gastrointestinal endoscopy(胃肠道内镜)、pathology(病理学)和immunotherapy(免疫治疗)是近2 年频繁出现的关键词,可能成为未来的研究热点。
表7 出现频次排在前10 的关键词的基本信息(截至2022-11-06)Table 7 Basic information about the top 10 keywords in term of frequency
图10 关键词共现图谱Figure 10 Co-occurrence mapping of keywords
图11 关键词叠加图谱Figure 11 Mapping of keywords overlay
本研究使用两种常用的文献计量学分析软件VOSviewer 和CiteSpace 对过去20 年将AI 应用于胃癌诊治的相关研究进行可视化分析,客观阐述了将AI 应用于胃癌诊治相关研究现状、发展趋势和未来的研究热点,可为研究者更好地把握研究现状和发展趋势提供参考。
根据发文量统计结果,近6 年发文量占总发文量的90.3%,预计发文量将持续增加,可见AI 近年来在胃癌诊治领域得到了长足发展。中国在该领域发文量远超其他国家(地区),但来自中国的文献平均被引用次数远低于来自荷兰、美国、英国、日本、德国的文献,这可能与我国对将AI 应用于胃癌诊治的研究起步较晚,导致研究成果的学术影响力较低有关,因此我国学者应注重提升研究的质量及影响力。美国在发文量及文献平均被引用次数上均位列第2,可见美国学者在该研究领域占有重要地位。根据TLS,中国、美国和日本与其他国家(地区)的合作较多。发文量排在前10 的机构中,来自中国的机构有7 所,其中中国科学院不仅发文量最高、TLS 较强,还具有最高的中介中心性,提示其在该领域具有很高的影响力,同时与其他机构有较多合作。
发文量排在前5 的期刊为Frontiers in Oncology(2022年影响因子为5.738,JCR 分区为Q2)、Scientific Reports(2022年影响因子为4.996,JCR分区为Q2)、Cancers(2022年影响因子为6.575,JCR 分区为Q1)、Gastrointestinal Endoscopy(2022 年影响因子为10.396,JCR 分区为Q1)和World Journal of Gastroenterology(2022 年影响因子为5.374,JCR 分区为Q2),其中Gastrointestinal Endoscopy为影响因子最高且共被引次数最多的期刊,在该领域具有较高的学术影响力。施引期刊的所属领域集中在2 个领域;被引期刊的所属领域也集中在2 个领域,这意味着将AI 应用于胃癌诊治的过程中需要跨学科合作。
共被引次数排在前10 的文献反映了将AI 应用于胃癌诊治相关研究的热点方向,其中大多数文献内容涉及胃癌或早期胃癌的内镜诊断。Global cancer statistics 2018:GLOBOCAN estimates of incidence and mortality worldwide for 36 cancers in 185 countries 一文的共被引次数最多,为基于全球185 个国家36 种癌症发病率和死亡率的综述[9]。共被引次数排在第2 位的为发表于Gastric Cancer 的文献Application of artificial intelligence using a convolutional neural network for detecting gastric cancer in endoscopic images,该文主要介绍了由研究团队开发的一种根据内窥镜图像自动检测胃癌的卷积神经网络系统,该系统具有高度敏感性,可以作为内镜医师诊断胃癌时的辅助工具[10]。共被引文献聚类时间线图可显示研究前沿的变化趋势,胃癌的生物学特征[7,11]是早期研究热点,随后研究热点转变为胃癌的数字病理学诊断[12-13]和影像组学分析[14-17]。
所有关键词可聚类为4 类,分别为AI 辅助胃癌的生物学研究,AI 辅助胃癌的内镜诊断,AI 辅助胃癌的病理诊断和AI 辅助胃癌的非内镜治疗及预后预测。根据发文量统计结果,从2 个时期出发对关键词聚类分析结果进行分析。第1 个时期是2003—2016 年,在该时期年发文量缓慢增长,领域研究主要关注胃癌分类和诊断,包括胃癌的生物标志物检测[18]、内镜诊断[19]和淋巴结转移状况预测。但使用的分析技术有限,且采用的数据集数量级较小。前列腺癌等其他癌症领域AI 研究聚焦在癌症筛查和手术治疗[20]。第2 个时期是2017—2022 年,该时期年发文量快速增长,计算机辅助诊断成为主要应用方向。深度学习因其稳定而卓越的性能成为出现频次最高的AI 方法,现已被用于胃癌的内镜诊断[21]、病理学诊断[22]、分期[23-24]、疗效和预后预测[16,25],与关键词叠加图谱显示的研究热点基本一致。
与内镜医师相比,基于深度学习的计算机辅助诊断系统在诊断疾病时不受限于内镜医师的临床经验,有助于提高不同经验水平内镜医师的诊断准确性,减少误/漏诊,有更高的诊断性能[26]。借助图像增强内镜很难识别发生于非肿瘤性上皮和上皮下的病变[27],而拉曼光谱与内镜、AI 技术的结合应用有望弥补内镜检查技术中存在的不足。此外,支持对病理图像进行分割的深度学习模型的运用不仅有助于消除病理医师在病理标本检查过程中主观偏见造成的不利影响,还有助于解决注释良好的病理图像数据不足的难题[28]。由抗程序性死亡蛋白1(PD-1)/程序性死亡受体-配体1(PD-L1)和细胞毒性T 淋巴细胞相关蛋白4(CTLA-4)等免疫检查点介导的共抑制信号通路在肿瘤诱导的免疫抑制中发挥重要作用[29]。微卫星不稳定和人类疱疹病毒(EBV)阳性是胃癌患者长期预后较好的生物标志物,两种亚型(微卫星不稳定型、EBV 阳性型)胃癌对免疫抑制剂具有潜在易感性。而深度学习模型可以从经苏木精-伊红染色的胃癌组织切片中检测微卫星不稳定和EBV 阳性状态,可作为后续需要接受分子检测人群的筛选工具,并预测患者对免疫治疗的反应性[25]。基于计算机断层扫描图像的深度学习模型的运用有助于放射科医师评估胃癌淋巴结转移[30]、浆膜浸润[31]和腹膜转移[32]情况,指导胃癌患者术前治疗,避免不必要的手术和并发症的发生。内镜检查、影像识别和生物标志物筛查技术与AI 的结合为胃癌检测、治疗和监测工作的开展提供了更多可能性。
本研究结果表明,AI 已被广泛应用于胃癌诊治领域,未来该领域研究年发文量将持续增长。美国在本领域占据主导地位,中国学者应当加强与其他国家(地区)学者的交流、合作,致力于提升我国研究成果的学术影响力。深度学习、卷积神经网络及影像组学等AI 技术辅助胃癌的内镜诊断、病理诊断和免疫治疗是当前研究热点与前沿方向,而开发出可支持实时内镜诊断、病理诊断,以及结合基因组学和蛋白质组学进行胃癌综合诊断的AI 系统可能是未来研究的重点。因AI 具备高效的学习能力和计算能力,未来将会得到进一步的推广应用。但AI 在未来的临床实践中不会完全取代医师,将人工服务与AI 相结合可弥补部分国家(地区)和医疗机构医疗资源、专业内镜与病理医师缺乏的不足,助力AI在胃癌诊治领域实现新突破。本文局限性:由于文献的被引用次数受其发表时间的影响,因此于2022 年发表的高质量文献的被引用次数可能还没达到理想的水平,这可能导致研究前沿的探索结果出现时间上的延迟;此外,本文仅将WOS 核心合集数据库中的英文文献纳入分析范畴,可能导致其他语种文献被遗漏。
作者贡献:董娜进行文章撰写和修改;崔婷负责确定研究内容及数据检索;王露露、师荣慧使用VOSviewer 和CiteSpace 软件绘制图谱;冯洁指导数据分析;黄晓俊负责文章质量控制,对文章整体负责。
本文无利益冲突。