机器学习在垂体腺瘤研究中的应用进展

2023-09-16 08:06侯思源王振霖
中国耳鼻咽喉颅底外科杂志 2023年3期
关键词:低钠血症腺瘤机器

侯思源,王振霖

(首都医科大学宣武医院 耳鼻咽喉头颈外科颅底外科中心,北京 100053)

垂体腺瘤(pituitary adenoma, PA)是鞍区常见的良性病变,是继脑膜瘤和神经胶质瘤之后第3常见的颅内肿瘤,占15%~20%[1-2]。PA可发生于任何年龄的人群中,发病率约为(80~90)/10万人,手术治疗是目前最为肯定的根治性治疗方法之一。然而,由于不同种类的PA患者具有复杂多样的临床特征,单纯使用传统的生物统计学技术或评分系统来对其诊断、手术风险或术后结果进行分层预测具有很大的挑战性。近年来,机器学习作为人工智能的重要研究领域,越来越多地被应用于PA的诊断和治疗等方面的研究中。与传统研究方法不同的是,机器学习可以自动筛选变量,捕捉变量之间的非线性关系,从而提高预测能力[3]。本文拟对机器学习在PA研究中的应用作一综述。

1 机器学习概述

机器学习这一概念最早由计算机学家Arthur Samuel于1959年提出,是计算机科学的一个分支,依赖于多种计算机程序实现,所采用的常见算法包括支持向量机、K邻近算法、朴素贝叶斯、随机森林树及人工神经网络等。如今已广泛应用于医学领域中。临床医生利用数据进行发掘及分类,进而更准确地对疾病进行诊断、治疗及预后预测。根据学习类型的不同,可分为监督学习和非监督学习。监督学习的主要目的为分类和回归,即通过对已进行标签分类的训练数据学习,识别观察类别,进行模型训练,并将训练好的模型应用于预测新的标签数据中。非监督机器学习则用来处理不具有分类标签的数据,目的在于寻找数据之间潜在的规律[4-5]。除此之外,半监督学习是监督学习与非监督学习的融合,可以分析大量无标签数据,同时用少量的含有分类标签的数据增强其识别能力[6]。近年来,逐渐被应用于PA的研究领域,主要涉及PA的影像识别、手术并发症和预后预测等。

2 机器学习在PA影像识别中的应用

放射组学是一个快速发展的研究领域,即利用数学算法在医学图像中提取定量指标,不仅可以达到对图像进行高级分析的目的,甚至可以提示肿瘤的基因表达,以协助临床进行早期的疾病筛查、治疗选择并判断预后[7],其有效性已在多种肿瘤中得到了证实,包括预测结直肠癌术前淋巴结转移、非小细胞肺癌的预后等[8]。放射组学分析的主要步骤包括图像的采集与重建、目标区域分割、特征提取与筛选以及模型的建立与验证[7]。对于PA的影像识别而言,放射组学所提取的PA影像特征可分为4类,包括:肿瘤强度特征、肿瘤形状和大小特征、肿瘤纹理特征和肿瘤小波特征[9]。通过对影像学资料中的信号进行分析,有助于对肿瘤的性质、范围和侵袭性等进行更加准确的判断。 Niu等[10]于PA患者T1WI加权像中共提取了65个定量成像特征,经过Lasso回归及支持向量机模型的构建,可于术前有效地判断PA对海绵窦区域的侵袭性,并以Knosp分级体现。 Wang等[11]收集了105例经病理诊断为PA的患者和100例经病理诊断为Rathke囊肿的患者,通过提取MRI中的特征,分别利用4种机器学习的算法建立了用于术前区分PA和Rathke囊肿的模型。作者发现其中人工神经网络模型的性能最佳,其准确率、敏感性和特异性分别为76.7%、73.9%、80.0%,曲线下面积(area under the curve,AUC)为0.848。Zhao等[12]则进一步基于术前影像学特征联合血液学指标,建立了鉴别垂体囊实性腺瘤与颅咽管瘤的模型,决策曲线分析显示这一模型获得了满意的鉴别诊断效果,有助于术前对疾病进行准确的临床诊断。由此提示放射组学使得术前对PA的影像识别成为了可能,甚至可以帮助术者在术前区分肿瘤的类型,了解侵袭情况,还可提示PA的亚型和增殖情况。Zhang等[9]利用此种方法成功地依靠影像学资料联合临床特征在术前区分了无功能PA中的零细胞腺瘤与其他亚型,从而为选择治疗方案提供了参考依据。Peng等[13]应用支持向量机模型,通过分析PA患者的MRI图像,精确地区分出不同的PA免疫组化亚型之间的差异,结果显示,该模型在T2加权图像上表现良好,可为神经外科医生在术前的临床决策提供潜在的指导。此外,Ugga等[14]通过统计89例接受鼻内镜下PA切除术的患者,应用分析术前MRI中的纹理衍生参数及术后病理结果,首次提出应用放射组学可有效预测垂体大腺瘤的ki-67增殖指数,便于更准确地在术前进行病变分类,且有助于更集中、更高效地随访和长期管理。值得关注的是,上述两项研究均认为T2WI序列对于模型的建立更具价值。Zeynalova等[15]的研究结果则进一步证实,与单序列模型比较,T2WI加权图像更能预测垂体大腺瘤的质地。在预测组织病理学方面,T2WI加权图像似乎比T1WI和T1WI增强图像包含了更多的鉴别信息。有研究认为这可能与肿瘤本身大小、特征有关,其潜在的机制仍需进一步研究和验证。

3 机器学习在预测PA术后并发症中的应用

机器学习在个性化医疗中的应用日益增多,利用大数据集和预测模型使临床医生能够更有信心地诊断、治疗和判断预后。与传统统计学基于因果假设的检验原理不同,机器学习对于模型的可解释性关注较少,重点围绕算法的交叉验证及迭代改进,在数学上关注模型的预测性能和泛化,能够发现变量之间的内在联系,其复杂性是传统模型无法比拟的[6,16]。建立预测模型通常分为4个阶段,包括:提出临床问题、数据预处理、训练模型及模型验证。对于PA来讲,准确预测术后不良事件有助于提醒外科医生更多地关注到有可能发生术后并发症的患者[17]。Hollon等[18]在纳入400例PA的回顾性队列研究中,利用机器学习方法,建立了预测PA术后出现早期并发症的模型,准确率高达87%,并筛选出了围术期最低和最高血钠浓度、年龄、体质指数和存在库欣病与否等重要变量。

PA术后低钠血症发生率为2.4%~23%[16,19],可表现为不同程度的头痛、恶心、呕吐、精神状态改变、癫痫发作甚至死亡。相关研究表明,术后延迟低钠血症报告的发生率为3.6%~19.8%[20-21]。其多发生于术后第7天,使患者再入院率升高或延长住院时间。因此,预测术后低钠血症的发生有利于对重点人群进行监测。既往的单中心回顾性研究对术后低钠血症的影响因素进行了探索,提出其危险因素可能包括术后脑脊液分流,心脏、肾脏及甲状腺的基础疾病等[19]。Cote等[21]则认为其发生可能与年龄、性别、肿瘤大小、血钠水平及有无库欣病相关。Patel等[20]进一步综合了多项研究总结认为高龄、女性、库欣病、高促甲状腺激素水平为术后发生延迟性低钠血症的危险因素。总体而言,对于术后低钠血症的发生,各项研究得出的危险因素不甚相同,缺乏系统性的预测模型。Voglis报道应用机器学习方法建立了术后低钠血症的预测模型,最终模型纳入了10个预测变量,其中术前血清催乳素是最重要的预测指标,其次是术前血清胰岛素样生长因子1水平、体质指数和术前血清钠水平等。这项预测模型相比于传统研究方法考虑到了各个危险因素之间的相互作用,能够更加准确地预测术后低钠血症的发生[16]。

除低钠血症外,术中脑脊液漏的发生同样不可忽视,持续性的脑脊液漏可导致头痛、颅内感染等。Staartjes等[22]基于深度神经网络的预测模型对术后脑脊液漏进行预测,结果提示鞍上Hardy等级高、既往手术史和年龄较大可能是预测脑脊液漏的关键因素。Tariciotti则应用了5种不同的算法对238例PA患者术中脑脊液漏进行预测,其中随机森林树的预测性能优于其他模型,研究认为重要的预测因素有激素水平、年龄、肿瘤直径、体积、侵袭性、肿瘤横径与两侧海绵窦段颈内动脉距离的比等[23]。

4 机器学习在预测PA患者预后中的应用

大多数研究判断PA术后复发的依据是基于PA全切除术后的随访期间复查的MRI以及术后恢复正常的激素水平再次升高。不同PA的复发率不同,泌乳素瘤及无功能腺瘤的复发率最高,库欣病患者次之[24]。关于PA的术后复发,绝大多数研究仍旧使用传统的统计学方法来探索其危险因素。2018年,Lv等[25]开展了一项纳入了270例PA患者的单中心研究,进行了长达10年的随访,通过多因素分析得出肿瘤大小、侵袭性和病理类型是预测肿瘤复发的重要影响因素。而对于无功能腺瘤来讲,患者的年龄、性别、肿瘤大小及侵袭性在一些研究中也被认为存在预测肿瘤复发的价值[24,26]。为了更加准确地预测患者手术的预后结果,加强重点患者的管理和随访,有必要使用更为准确的方法来对PA患者的预后情况进行研究。

目前应用于PA预后预测的研究多集中于库欣病。Liu等[27]使用了决策树、梯度增强决策树、极限梯度提升等5种算法对北京协和医院970例PA患者的术后复发情况进行了预测,其中随机森林树模型的预测性能最好[AUC=0.781,95%CI(0.706, 0.856)],最重要的预测变量包括年龄、术后晨血清皮质醇最低点和术后晨促肾上腺皮质激素水平最低点、术前晨促肾上腺皮质激素水平、病程、术前血清皮质醇水平、术前24 h尿游离皮质醇水平和术后24 h尿游离皮质醇水平最低点。Nadezhdina等[28]也采用了人工神经网络模型对249例PA患者术后3年内是否复发进行了预测,预测因素包括年龄、病程、MRI数据、术后晨促肾上腺皮质激素和皮质醇水平,其AUC为0.912。此外,Zoli等[29]回顾性分析了151例接受内镜经鼻蝶入路手术治疗库欣病的PA患者,其研究终点结局为肿瘤彻底切除、术后缓解和疾病的长期控制。其使用K邻近、支持向量机、梯度提升算法分别建立了预测模型,并根据AUC值调整算法,结果认为肿瘤大小、侵袭性和促肾上腺皮质激素分泌细胞的组织学是3个终点的主要预测因素。

在PA患者的预后方面,Fan通过对201例库欣病PA术后患者随访,应用开发并验证了用于预测PA术后未达到立即缓解的患者是否会在长期随访中出现延迟缓解的模型,其AUC值为0.762,研究者认为这一模型有助于个体化治疗策略的制定[30]。除库欣病外,Qiao等[3]统计了2010—2018年患有生长激素型PA的833例患者,使用多种算法建立了预测术后6个月内的内分泌缓解模型。这些模型在99例来自另一院区的患者和52例来自第3家机构的患者中进行了验证,算法的C统计量高于传统算法(P<0.001)。以上研究提示机器学习在PA患者预后方面可能存在着优良的预测价值。

5 总结与展望

既往的研究显示机器学习有更强的预测能力,目前已被广泛应用于PA的影像学判读、术前评估、治疗方案的制定、并发症预判及术后缓解或复发的预测中,但机器学习的过程易受到数据缺失值的影响,结果往往解释性较差。另外,由于样本量、外部验证的限制或缺乏统一的研究标准,在一定程度上制约了机器学习在PA诊断及预后预测方面的应用。因此,未来应以建立高质量多中心的数据库为目标,规范纳入及排除标准,完善并统一临床资料数据,开发更为精准的预测模型并于临床中进一步验证,促进PA的规范化管理及精准治疗。

猜你喜欢
低钠血症腺瘤机器
机器狗
机器狗
后肾腺瘤影像及病理对照分析
未来机器城
姜兆俊治疗甲状腺腺瘤经验
胸腺瘤放射治疗研究进展
托伐普坦治疗顽固性心力衰竭合并低钠血症的效果观察
颅脑损伤并发低钠血症42例临床护理
微量泵补钠在充血性心力衰竭并稀释性低钠血症中的应用
鞍区肿瘤术后低钠血症及癫痫发作2例