人工智能应用于肺癌领域的文献可视化分析

2023-06-22 00:09刘桑雪何慧敏
现代信息科技 2023年3期
关键词:文献计量可视化分析肺癌

刘桑雪 何慧敏

摘  要:对肺癌的分析诊断是人工智能应用的重点领域,检索Web of Science数据库2012年—2021年国内外人工智能在肺癌领域应用的相关研究文献,通过文献计量软件CiteSpace对国内外人工智能在肺癌领域应用的研究现状、热点以及前沿趋势进行可视化分析,为人工智能在癌症疾病领域的进一步研究提供参考,推动中国人工智能技术与肿瘤领域的交叉研究。

关键词:人工智能;肺癌;可视化分析;文献计量

中图分类号:TP391;R730.2 文献标识码:A 文章编号:2096-4706(2023)03-0110-04

Literature Visual Analysis of Artificial Intelligence Applied in the Field of Lung Cancer

LIU Sangxue, HE Huimin

(Guangxi Medical University, Nanning  530021, China)

Abstract: The analysis and diagnosis of lung cancer is the key field for the application of artificial intelligence. Search the relevant research literature of the application of artificial intelligence in lung cancer field at home and abroad from 2012 to 2021 in the Web of Science database, and visually analyze the research status, hotspots and frontier trends of the application of artificial intelligence in lung cancer field at home and abroad through the bibliometric software CiteSpace, to provide reference for further research of artificial intelligence in the field of cancer disease, promote the cross research of artificial intelligence technology and tumor field in China.

Keywords: artificial intelligence; lung cancer; visual analysis; bibliometrics

0  引  言

人工智能利用計算机模型和算法模拟人类大脑,拥有强大的特征学习能力,能够整合海量数据信息,以提高人们分析、处理信息的效率。随着人工智能技术的成熟,其在医学领域应用逐渐加深,人工智能技术为癌症的风险评估、临床诊断、精准治疗、生存预测等方面提供快速、有效的方法手段,可以在某种程度上降低癌症发生率和死亡率[1]。肺癌的发病率很高,是世界范围内致人死亡的主要疾病,准确诊断对肺癌患者的治疗至关重要。本文通过检索近十年的相关文献,通过知识图谱分析国际人工智能在肺癌领域的应用现状和发展前沿,为中国的人工智能技术在癌症领域的研究和应用提供参考。

1  资料来源与统计方法

1.1  资料来源

在Web of Science数据库中以Artificial Intelligence、AI、Deep Learning、Machine Learning、Lung Tumors、Lung Cancer等主题词组成检索式检索2012年01月01日—2021年12月31日公开发表的关于人工智能在肺癌领域中应用的相关文献,文献类型选择“article”,语种选择“English”,通过去除重复性文献和非学术性文献,共纳入1 940篇文献进行计量分析。

1.2  统计方法

应用CiteSpace 5.8.R3进行统计分析,将时间跨度设为2012年—2021年,以每一年作为一个时间切片,选择相应的节点类型分别将总体发文量、国家和机构发文合作、作者发文合作、研究热点和前沿趋势等方面的统计结果可视化展示。共现网络图谱节点的大小表示该节点发文量的多少,节点之间的线条粗细表示合作强度,节点年轮外圈的颜色深浅代表中心度大小,指示该节点在联系整个网络中发挥的作用大小[2]。国际研究热点基于高频词和高中心性关键词来分析,研究前沿通过词频变化率较高的突现词来反映。

2  结果与分析

2.1  总体趋势分析

国际年度发文量反映该领域知识量增长的情况。根据检索结果,2012年—2021年发表相关文献共1 940篇,呈现逐年增长的趋势。2012—2017年处于该研究领域发展的起步阶段,发展平缓;2018—2021年处于快速发展阶段。2012年国际发文仅21篇,2021年发文量高达730篇。

2.2  国家与研究机构发文分析

研究结果显示,一共有17个国家发表关于人工智能在肿瘤领域的研究超过30篇,中国和美国的发文量远远高于其他国家,发文量分别达691篇和636篇。韩国发文126篇,位列第3;印度116篇,位列第4;荷兰发文101篇,位列第5。

通过对研究机构的分析,发文量居于首位的是中国科学院,共52篇;排第2的机构有3家,分别是上海交通大学、复旦大学和哈佛医学院,发文量43篇;斯隆-凯特森癌症研究中心发文量位列第3,发文37篇。发文量前10的研究机构中包括了6家中国研究机构。

2.3  国际合作分析

根据国家合作网络图谱,国际合作中心度排名前5位的国家分别为英国(0.17)、西班牙(0.14)、德国(0.13)、美国(0.11)、中国(0.10)。英国的中心度最高,表示与其他国家之间的合作关系最紧密最重要。

机构合作中心度排名前5位的机构分别为马斯特里赫特大学(0.22)、上海交通大学(0.21)、拉德堡德大学(0.21)、丹娜法伯癌症研究院(0.19)、德克萨斯大学安德森癌症中心(0.19)。研究机构合作网络图谱如图1所示。

2.4  作者发文合作分析

通过作者合作网络图谱寻找对人工智能应用于肺癌研究领域有重大贡献和影响力的核心作者群,如图2所示。最高产作者是来自美国的Robert Gillies,其合作中心度和文献被引频次也较高。发文量排名前10的作者共有11位,其中中国作者仅有2位,分别是Wei Qian、Ming Li。

2.5  共被引文献分析

根据共被引文献分析统计,共有22篇文献被引次数超过50次,其中最高被引量达157次,表1列出了被引量排名前10位的关键经典文献。高被引文献内容主要集中在利用深度学习方法进行医学图像分析的研究。

2.6  研究热点

关键词共现图谱结果显示,人工智能应用于肺癌领域的内容主要有分类、诊断、生存分析等,运用人工智能的方法手段主要为深度学习、机器学习、卷积神经网络等。高频关键词和高中心性关键词如表2所示。

2.7  研究前沿

突现词是短时间内词频变化率较高的关键词,更适合探测学科发展的新兴趋势和突然变化[3]。显示持续至今的突现词有纹理特征、图像分类、标志物和断层摄影术,根据强度排序得到近十年人工智能在肺癌领域Top15的突现词,如图3所示。

3  趋势与难题

3.1  人工智能在肺癌中的应用仍是当前医疗领域的研究趋势

自2012年起,国际间针对人工智能在肺癌领域的研究呈现持续增长的趋势。统计发现,肺癌为排名第1的高频关键词,说明人工智能在癌症领域的研究中,肺癌是应用较为广泛和典型的疾病,且通过2021年相关文献量达到730篇可知,人工智能在肺癌领域应用的热潮日益高涨。

从国家发文量和中心度来看,美国和中国均排在前5位,说明这两个国家针对人工智能在肺癌领域的研究与合作处于世界前列;但由于中国人口基数大,且发表文献篇均被引次数为15.48次/篇,低于美国的32.86次/篇,而世界发表文献的篇均被引次数为22.43次/篇,说明中国的人均发文量和发文影响力均比不上美国,而美国文献影响力处于世界先进水平。荷兰的发文量和国家合作中心度都位居世界前5,且文献篇均被引高达109.36次/篇,远远超出世界水平,表明荷兰在该领域中具有较突出的贡献和较强的代表性。当前,AI在医学领域应用呈现爆发式增长的态势,人工智能理论与实践均达到了一定高度。各国争相出台有关政策和方案,以期为人工智能技术的发展和创新保驾护航。与中国相比,美国人工智能战略更加强调跨学科交叉和对人工智能产业的投入[4]。人工智能是新兴产业的核心,中国应立足于国务院《新一代人工智能发展规划》的要求[5],提高投入产出比,加强国际与国内研究机构和企业的交流,助力人工智能在医疗产业的发展,输出有较高影响力的成果。

从作者发文分析得出,居于前10的中国作者仅有2位,说明中国对人工智能在肺癌领域的研究有突出贡献的研究者较少,医疗人工智能涉及多专业融合,提示中国应建立规范化的复合型人才培养体系,积极引进高端人才、留住人才,保证人工智能在医学领域的可持续发展[6]。

3.2  人工智能在肺癌领域的研究涉及多方面应用

通过关键词共现分析得出,研究热点主要集中在两个方面:(1)利用AI技术对肺癌预测、分类和生存分析。其一,研究者重点关注分析医学影像特征实现肺癌的预测和分类。肺结节是肺癌早期的临床表现,计算机断层摄影(CT)是早期结节良恶性鉴别的有效手段,由于海量数据和人工阅片耗时长伴随着漏诊误诊等问题,人工智能辅助实现肺结节的筛查诊断是现阶段精准医疗的研究热点。其二,AI技术联合生物标志物的应用[7]。利用机器学习方法研究生物标志物对肺癌的诊断、治疗选择和预后预测是该领域的重点方向。(2)对人工智能的方法學研究,主要的方法学有机器学习、深度学习等,通过分类器、支持向量机、随机森林和微阵列等算法结合大数据构建模型来预测分类肺癌,以及研究如何进一步优化模型或提高算法对癌症预测的灵敏度。

突现词反映了人工智能在肺癌应用研究中的前沿趋势。根据统计结果发现,人工智能对肺癌的影像分析既是研究热点,也是前沿。基因表达、蛋白质研究、治疗、人工智能的方法学手段等也是前沿的体现。由于分析工具数量和数据集的增多,医学图像分析领域呈指数级增长。图像识别技术不仅用于肺癌的诊断筛查,且用于放射治疗过程中肿瘤靶区和危机器官的自动勾画以及对放疗不良反应的预测等[8]。目前应用较广泛的图像识别技术可以通过高通量计算从CT、PET等医学影像中快速提取定量特征,分析特征与治疗结果或基因表达的关系,挖掘图像中潜在的信息,这一过程也被称为放射组学[9]。纹理特征分析是目前的一个研究前沿,它在肿瘤诊断中被要求具有更高的计算标准[10]。基于人工智能技术,癌细胞的蛋白质研究可以预测肿瘤发生、生长、转移、治疗等过程,蛋白质研究与基因表达息息相关,微阵列基因表达数据可用于癌症类型预测[11],微阵列技术为分析基因表达数据提供了方法。

近年来,研究者们更多的关注人工智能在肺癌应用领域的方法学研究,人工智能技术的创新和发展为肺癌研究应用创造了新可能。机器学习是人工智能的核心,高度准确和可靠的机器学习方法在整合和分析庞大而复杂的数据集方面发挥着关键作用。深度学习是机器学习的一大分支,2015年Lecun Y表示深度学习允许计算模型来学习具有多个抽象级别的数据表示,深度卷积网络在处理图像等方面带来了突破进展[12],成为受欢迎的特征提取器,已被证明在自然图像分类方面明显优于经典的机器学习方法。图像分类的深度卷积神经网络结构越来越多样,VGG系列网络、ResNet和U-Net等网络的诞生验证了图像分类分割的性能在逐步提高。研究者们为癌症的预测和诊断不断提出新的方法和网络训练策略以提高模型的准确性,并优化改进模型可能出现的过拟合、研究可重复性和操作性等技术问题,这些是未来人工智能在肺癌或其他癌症应用中方法学研究突破的关键。

3.3  人工智能在医学应用领域面临的难题

随着个性化决策和精准医疗的普及,人工智能在肺癌领域的应用正在一步步深化。然而在日常临床实践中建立可靠的癌症结果预测模型仍是一个挑战。例如图像识别、药物效果预测等都需要大规模数据来训练模型,过程中消耗大量计算资源,对硬件要求较高;对于医学影像数据,前期的获取和手工标注对于研究机构来说比较困难。医疗人工智能涉及法律法规和伦理道德,特别是AI技术挖掘分析医疗大数据时,可能会造成个人隐私信息的泄露,而相比其他国家,中国对个人隐私安全保护的法制体系尚不完善,因此需要不断丰富体系内涵来适应人工智能的更新迭代。《人工智能白皮书(2022年)》[13]中表明安全可信的人工智能要朝着一体化的方向发展,加速推进风险防控体系。因此势必要完善法律法规,推进国家监管体系建设,加强人工智能在医疗应用中的技术保护,明确人工智能与医疗使用人员之间的责任,以实现精准医疗与人工智能战略目标。

4  结  论

综上所述,目前人工智能在肺癌领域的研究已成为国际研究热点。在我国,应充分吸收国外的前沿热点,加强国际及研究机构间的交流合作,并在中国肿瘤防治的基础上,推动中国人工智能技术与肿瘤领域的交叉研究。

参考文献:

[1] 杨文静,吕章艳,冯小双,等.人工智能在癌症研究领域的文献可视化分析 [J].肿瘤防治研究,2021,48(2):133-139.

[2] 陈悦,陈超美,刘则渊,等.CiteSpace知识图谱的方法论功能 [J].科学学研究,2015,33(2):242-253.

[3] 杨文静,杜然然,吕章艳,等.人工智能在疾病预测研究中可视化分析 [J].中国公共卫生,2021,37(5):871-874.

[4] 王迎春,李辉,杨丞磊,等.美国人工智能研发战略计划2019更新版重点及启示 [J].科技导报,2020,38(11):26-30.

[5] 国务院.国务院关于印发新一代人工智能发展规划的通知 [R/OL].(2017-07-20)[2022-07-19].http://www.gov.cn/zhengce/content/2017-07/20/content_5211996.htm.

[6] 董星宇,陈敏.医疗人工智能发展存在的问题及对策 [J].医学与社会,2019,32(5):80-82.

[7] HAO X K,LUO H Y,KRAWCZYK M,et al. DNA methylation markers for diagnosis and prognosis of common cancers [J].Proc Natl Acad Sci U S A,2017,114(28):7414-7419.

[8] 甘武田,应延辰,全红,等.肺癌放射治疗中人工智能的应用进展 [J].中华肿瘤防治杂志,2021,28(18):1428-1432.

[9] GILLIES R J,KINAHAN P E,HRICAK H. Radiomics:Images Are More than Pictures,They Are Data [J].Radiology,2016,278(2):563-577.

[10] WANG H K,ZHOU Z W,LI Y C,et al. Comparison of machine learning methods for classifying mediastinal lymph node metastasis of non-small cell lung cancer from (18)F-FDG PET/CT images [J].EJNMMI research,2017,7(1):11.

[11] YANG Y,XU L,SUN L D,et al. Machine learning application in personalised lung cancer recurrence and survivability prediction [J].Comput Struct Biotechnol J,2022,20:1811-1820.

[12] LECUN Y,BENGIO Y,HINTON G. Deep learning [J].Nature,2015,521(7553):436-444.

[13] 中國信息通信研究院.人工智能白皮书(2022年) [EB/

OL].[2022-07-19].http://scdsjzx.cn/scdsjzx/ziliaoxiazai/2022/

4/18/d03a2d33b67d4c398ddfca504cf410ab/files/43b00b8feccd423ea2e2a4014e9d672a.pdf.

作者简介:刘桑雪(1997—),女,汉族,广东汕尾人,硕士研究生在读,研究方向:医学信息管理、计算机及应用等;通讯作者:何慧敏(1973—),女,汉族,湖南岳阳人,研究生导师,博士,研究方向:教育管理、医学信息管理、计算机及应用等。

收稿日期:2022-09-15

基金项目:2022年自治区级新工科、新医科、新农科、新文科研究与实践项目(02506222234C)

猜你喜欢
文献计量可视化分析肺癌
中医防治肺癌术后并发症
对比增强磁敏感加权成像对肺癌脑转移瘤检出的研究
我国医学数字图书馆研究的文献计量分析
我国职业教育师资研究热点可视化分析
声波吹灰技术在SCR中的应用研究
国内外智库研究态势知识图谱对比分析
可视化分析技术在网络舆情研究中的应用
国内外政府信息公开研究的脉络、流派与趋势
基于文献计量分析我国生物科学素养研究状况(2001~2016年)
microRNA-205在人非小细胞肺癌中的表达及临床意义