何爽 田金 龙麟 赵丽丽 肖军
作者单位:250014 济南 1.山东中医药大学第一临床医学院;266033 青岛 2.青岛大学附属青岛市海慈医院,青岛市中医医院肿瘤中心
近年来,随着对肺癌分子生物学的深入研究,肺癌的诊断、治疗和预后等都有了实质性的进展,但肺癌死亡率依旧逐年上升[1]。因肺癌筛查及早期诊断模式尚不规范,患者临床风险预测模型不够成熟,患者的个体化差异及技术受限等,多数患者初诊肺癌时即被诊断为晚期[2]。肺癌患者预后与临床分期密切相关,提高早期肺癌诊断率是获得长期生存的关键[3]。因此,选择有效的诊断和筛查方法对提高肺癌的早期诊断率和预后都至关重要。本文主要综述现有肺癌早筛与早诊技术手段及其结合人工智能和机器学习技术的应用研究进展。
美国国家肺筛查试验(national lung screening trials in the United States,NLST)建议在肺癌筛查期间进行低剂量CT 扫描,其中低剂量CT 筛查较胸片可降低20%的死亡率[4]。基于该研究的良好结果,NCCN指南建议符合NLST 纳入标准的人群进行低剂量CT扫描[5]。美国癌症协会和其他医疗组织也建议,对于符合NLST 纳入标准的患者,应首先考虑进行低剂量CT 筛查[6]。英国的肺癌筛查显示,1 952 名50~75岁完成低剂量CT筛查的受试者基线患病率为1.7%,高于NLST 结果(1.03%),假阳性率为3.6%,证实了低剂量CT 扫描在肺癌风险人群中早期诊断的有效性[7]。我国一项多中心、基于人群的一次性低剂量CT 肺癌筛查有效性前瞻性队列研究显示[8],经低剂量CT 筛查的79 581 名受试者比143 721 名未接受低剂量CT 筛查的受试者的肺癌发病密度高47%,肺癌死亡率降低31%,全因死亡率降低32%。随着放射诊断学中人工智能(artificial intelligence,AI)的快速发展,其对提高疾病诊断性能的潜在效用已得到广泛认可。研究发现,AI 处理模型在低剂量CT 上自动检测肺结节并量化冠脉钙体积的检查结果与专家的结论非常契合,具有高敏感性和特异性,并显著改善了包括不良心脏事件和肺癌1 年随访结局预测[9]。AI 的引入能提高肺癌诊断效力并改善发病率及死亡率、降低医疗成本。而机器学习作为AI 的核心,能根据数据或既往经验优化计算机程序性能。STEMMER 等[10]回顾性分析NLST数据,使用3种机器学习算法评估受试者冠脉钙化评分、肝脏脂肪变性水平和肺气肿百分比,结果表明机器学习算法能帮助医师评估这一特定人群中心血管疾病死亡的发生率和风险。因此,将这些算法应用于现有的低剂量CT 扫描能提供有价值的医疗保健信息,并有助于未来的进一步研究。低剂量CT 扫描的优点是辐射剂量低、扫描速度快,且灵敏度与CT 相当。然而,NLST 提示低剂量CT 扫描的假阳性率为23.3%,而且还存在过度诊断、辐射暴露、成本高等缺点[5,11]。此外,低剂量CT 扫描在肺癌早筛中的应用仍有许多问题尚待克服,例如进一步明确筛查时间间隔,如何对肺癌高危人群进行准确分类,如何避免过度诊断和治疗,如何建立有效的风险模型来评估哪些类型的肺成像特征容易发展为肺癌等。
AFB 检查的工作原理是在正常组织、不典型性增生和原位癌中呈现出不同的光谱,当用蓝光照射时,正常支气管黏膜荧光呈现红色和绿色,病变部位的荧光呈浅棕色,不典型性增生和癌前病变呈红棕色,因此它能够发现白光支气管镜(white light bronchoscope,WLB)无法发现的异常病变。有研究[12]分析了自体荧光成像视频支气管镜检查(autofluorescence imaging video bronchoscopy,AFI)的诊断性能,并与WLB 进行比较,发现AFI 的敏感性优于WLB,而且误诊率显著减小。但是在应用AFB检查时,医师必须观看一个长视频来搜索定位病灶,这使过程变得非常繁琐而容易出错。CHANG 等[13]提出了一种实用的自动AFB 分析方法,即通过软件区分无信息的视频帧和有信息的视频帧,再确定哪些有信息的视频帧包含可疑的支气管病变并划定病变区域,以用于区分视频中的有效信息及非有效信息。该法对支气管病变部位的搜索定位比人工浏览视频更有效,并可描绘潜在的病变区域。该研究结果显示信息分类准确率≥97%,病变检测准确率≥97%。此外,AFB 联合生物标志物还能提高诊断率,如支气管内鳞状化生病灶中存在特定的DNA拷贝率改变,能可靠地预测具有AFB可视化癌前病变受试者的肺癌风险[14]。有研究对高危患者低级别癌前病变的AFB内镜进行随访,发现戒烟可显著降低轻度或中度异型增生患者5 年内患肺癌风险,且识别支气管发育不良可能有助于肺癌筛查计划中的风险分层策略[15]。AFB 联合WLB、活检或内镜窄带成像(narrow band imaging,NBI)时可明显提高癌前病变和原位癌的诊断率[16-17]。然而,目前由于设备和检验成本较高,AFB尚未被广泛接受。
EBUS 检查是一种微创的支气管内超声技术,EBUS 联合一种特殊的穿刺活检针可用于实时超声引导下经支气管镜穿刺活检,即支气管内超声引导下经支气管镜针吸活检(endobronchial ultrasound-guided transbronchial needle aspiration,EBUS-TBNA)[18]。目前EBUS-TBNA 对诊断性支气管镜检查的发展产生了巨大的影响。一项随机对照试验[19]发现,对疑似肺癌患者进行CT 扫描后,以EBUS-TBNA 作为初始检查方法可以提供准确的诊断和淋巴结分期,与传统诊断策略相比,EBUS-TBNA 可以缩短治疗决策的时间,并可能在不增加成本的情况下提高肺癌患者的生存率。EBUS加引导鞘这项新技术联合虚拟支气管镜导航与单用EBUS 对孤立性肺结节的诊断率无明显差异,但联合组可显著缩短支气管镜到达病灶的时间,从而缩短治疗决策时间,提高工作效率,也降低手术并发症发生风险[20]。对于可能受到完整组织不足而限制某些纵隔病变的诊断率,已有研究[21]证实,在标准EBUS-TBNA 中加入纵隔冷冻活检可显著提高纵隔病变的诊断率,具有良好的安全性,显示这种联合方法可能是纵隔疾病有效的一线诊断手段。此外,在EBUS 中引入AI 技术和机器算法的有关研究[22-23]已被证实能提高诊断精度,这为自动化过程提供了可能,也可能进一步减少EBUS的时间和费用,有望在临床上推广应用。
值得注意的是,EBUS-TBNA 主要利用抽吸产生负压来进行,这可能增加活检部位组织损伤,使样本质量下降从而降低其准确率,所以目前该技术存在争议。一项随机对照研究比较了不同EBUS-TBNA 技术(即抽吸加探针、仅抽吸和仅探针)对诊断率的影响,结果显示三种技术之间的诊断率无差异[24]。HE等[25]探索在EBUS-TBNA 中使用慢拉毛细血管技术替代抽吸,发现该法可以通过改善核心组织的获取,显著提高肺门和纵隔淋巴结肿大疾病的诊断准度,可能是诊断累及纵隔和肺门淋巴结增大疾病的有效手段。
NBI 是一种可以将血管形态和黏膜结构可视化的成像技术。一项meta 分析显示,NBI 在检测癌前病变方面与AFB 相比具有更高的敏感性(80%)、特异性(84%)和诊断优势比(31.49%)[26]。NBI 还能区分鳞癌(鳞状化生、鳞状不典型增生或鳞状细胞癌)和腺癌,其中点状血管形状更倾向于腺癌,而弯曲的血管和突然终止的血管类型更倾向于鳞癌[27]。临床试验发现NBI 在诊断中央型肺癌中具有较高的准确性、敏感性和特异性[28]。Meta 分析也显示NBI 在检测早期肺癌方面优于WLB[29],可能是早期肺癌检测一种有效的方法。但是,由于肿瘤的异质性,组织活检只代表了肿瘤的状态,不能反映疾病发展的动态过程,而且多次活检对患者具有侵入性,因此未来仍需设计新的技术来改善这一困境。
CTCs 是从原发或转移性肿瘤中释放到外周血中的肿瘤细胞,CTCs 的捕获对癌症早期发现、诊断、预后监测以及了解转移过程具有重要意义。CTCs 含量极低,其分离和富集技术比较困难,目前细胞搜索系统(CellSearch system)是美国食品药品管理局(FDA)批准的第一个也是唯一一种CTCs 检测方法[30]。基于CTCs 分析的巨大潜力,已有团队开发新型ChimeraX®-i120 平台以促进CTCs 的富集、免疫荧光标记和基于机器学习的鉴定,且证实该平台和集成工作流程作为临床环境中CTCs检测和下游基因组分析的工具是有效的[31]。
CTCs 已成为包括肺癌在内的多种癌症的潜在诊断生物标志物。HE 等[32]报道在Ⅰ期和Ⅱ期肺癌中使用CellCollector 检测法,CTC 检测率高达62.5%,而且在CTCs 中TP53、FGFR1、HER2、PDGFRA和CFS1R的基因突变部位以及在肿瘤组织中这些基因的突变部位有71.6%的相似性,首次揭示早期肺癌CTCs 的分子和遗传变异特征,为CTCs 作为早期肺癌分子诊断的临床应用提供了新的数据支持。DUAN 等[33]也报道用CellCollector 检测法分离CTCs 可能有效区分良恶性结节,可用于肺癌的早期诊断。JIAO 等[34]开发了一种深度学习影像组学模型并与CTCs 计数相结合,主要用于预测接受立体定向放射治疗的早期非小细胞肺癌(non-small cell lung cancer,NSCLC)患者复发,结果发现可优化患者分层。还有研究[35]采用细胞搜索系统和细胞过滤技术在术前对NSCLC 患者进行CTCs 检测,结果显示,有CTCs 的患者无疾病生存期(disease-free survival,DFS)较无CTCs 的患者差,由此认为术前CTCs 检测可能是判断术后预后的重要手段。未来CTCs 联合CT 检查有望弥补单纯CT 检查在肺部疾病诊断中的不足,避免患者接受胸部CT 引导下穿刺等有创检查带来的风险。但CTCs 作为早期诊断标志也有一定局限性,有研究发现经支气管镜下解除气道肿瘤阻塞后,75%的患者CTCs 增加,因此在治疗的同时也可能促进CTCs 扩散,从而形成转移[36]。此外,如何开发合理有效的富集方法和评估CTCs 分子特征的技术、如何在最优条件下获得足够数量的CTCs以及如何将其标准化于临床应用有待研究。
ctDNA 是指人体外周血中来自肿瘤基因组的游离DNA片段,通常只占游离DNA(cell free DNA,cfDNA)的0.01%~1.00%,且易受高浓度野生型cfDNA 干扰,因此需要高灵敏度和特异度的检测方法[37]。通过机器学习辅助的深度甲基化测序可对少量ctDNA 进行超灵敏监测,在癌症筛查中具有一定优势[38]。SZPECHCINSKI 等[39]研究表明,NSCLC 患者的血浆ctDNA 水平不仅高于健康人群,也高于慢性呼吸道炎症患者。LIANG 等[40]结合ctDNA 和DNA 甲基化区分肺癌和良性结节,敏感度和特异度分别为79.5%和85.2%,而且对ⅠB期肺癌(敏感度为85.7%)的鉴别优于ⅠA 期肺癌(敏感度为75.0%)。CHEN 等[41]通过靶向测序检测了Ⅰ~Ⅲ期NSCLC 患者的ctDNA 和肿瘤组织DNA(tumor DNA,tDNA),在ctDNA 和tDNA 中发现了频繁的驱动突变,证实了外周血ctDNA 检测对早期检测NSCLC 基因突变的可行性。ctDNA 不仅在早期肺癌的诊断中极具潜力,还可用于监测早期肺癌转移播散以预测复发风险[42]。
作为一种非侵入性的检测方法,ctDNA 分析为肺癌的早期诊断提供了一个可行的选择,但现有的技术仍不能克服敏感性分析的困难,相对高昂的花费、较长的检测时间、复杂的流程等也限制了其在临床中的应用。此外,缺乏可靠的阈值及ctDNA 反映所有基因突变的比例较低等问题也仍需进一步研究。
研究表明,微生物与肿瘤进展和原发性耐药密切相关[43]。最近,POORE 等[44]研究TCGA 数据库并进行微生物读取,在包括肺癌的癌症类型和组织及血液中发现了独特的微生物特征,使用机器学习识别和区分并比较其性能,通过对血浆样本进行深度宏基因组测序证明了无细胞微生物谱区诊断癌症和区分癌种的能力,该研究揭示了微生物在癌症诊断中的作用。目前,大量立足于全基因组测序和16S/18S rRNA等基因测序技术的研究相继开展,使肺癌早筛应用的微生物标本来源从组织病理样本扩展到肠道、口腔、肺泡灌洗液和痰液等菌群样本。研究发现[45],肺癌患者肠道微生物与健康人群存在差异,一些菌群丰度的变化和代谢产物的改变可能预示患癌风险增加,表明肠道菌群对肺癌早筛可能具有重要作用。VOGTMANN等[46]在3项队列研究分析中发现,多种口腔微生物指标与肺癌风险呈前瞻性相关,为口腔微生物用于筛查早期肺癌提供了依据。目前,在大多数癌症患者组织和血液样本中都发现了独特的mbDNA,可用于识别癌症的存在和类型。与ctDNA 相比,基于循环mbDNA 的检测优势之一是其在身体不同部位之间的多样性。当然,在mbDNA 领域仍有许多问题需要解决,例如在制备DNA 过程中,微生物污染是必须关注的问题,此外如何识别mbDNA 是正常的微生物变化还是肿瘤相关的变化也仍需探索。
苏格兰早期肺癌诊断(ECLS)试验[47]招募了12 208 名高危患者进行肺癌自身抗体的新型血液检测,如结果为阳性,则作为干预组每6个月行1次低剂量CT 扫描,持续长达2 年,结果发现早期CDT 检测对Ⅰ/Ⅱ期疾病的敏感度为52.2%,特异度为90.3%,对Ⅲ/Ⅳ期疾病的敏感度为18.2%,特异度为90.2%;在干预组中,56例肺癌中有33(58.9%)例在Ⅲ/Ⅳ期被确诊。该研究证明了该法在肺癌临床早期诊断中具有广阔的应用前景。平铺肽阵列提供了一种描绘整个基因组编码的表位方法,这些表位触发了与肿瘤发展相关的自身抗体反应,它利用基于全基因组衍生的平铺肽阵列来鉴定与NSCLC 自身抗体反应性相关的表位,可作为精准早期检测的潜在手段[48]。
人附睾蛋白4(human epididymal protein 4,HE4)是可用于区分肺癌与健康个体及良性肺部疾病患者的一种生物标志物,特别是对于小细胞肺癌(small cell lung cancer,SCLC)而言。Meta 分析[49]发现HE4在筛选SCLC 时具有较高的诊断效能,认为HE4 是一种有前途的肺癌诊断生物标志物。WANG 等[50]联合检测HE4、CEA、NSE、CYFRA21,发现可提高肺癌的诊断水平,其中血清HE4在区分肺癌患者和正常人群时具有高度特异性,与CYFRA21-1 相当,但在肺癌与肺炎患者鉴别中的特异度低于CYFRA21-1,因此HE4对肺癌的诊断准确性仍需进一步研究。
基于E-Nose技术的呼吸分析是一种无创、操作简单、成本低廉的肺癌检测新技术,是对现存肺癌诊断方法的有益补充。E-Nose 可通过分析呼出气体中细胞代谢产生的挥发性有机化合物发挥作用。研究显示E-Nose 在区分良恶性结节以及鉴别癌组织类型甚至EGFR 状态方面具有很高的准确性[51]。CHEN等[52]应用E-Nose 系统对肺癌进行检测和分期,结果显示肺癌检测的灵敏度为95.60%,特异度为91.09%,分期的识别准确率在80%以上。CHEN 等[53]通过金属离子诱导的氧化石墨烯组装构建E-Nose,用于先进的呼出气诊断,从肺癌患者和健康对照中收集106 份临床呼出气样本进行E-Nose 检测,结果显示,肺癌患者与健康对照组可明显区分,通过模型估计的敏感度为95.8%,特异度为96.0%。然而,在探索E-Nose使用价值时,发现其可操作性较低,并且缺乏使医生能够实时完成样本收集和数据分析的标准化和小型化设备,这是该技术更广泛应用于临床的主要限制。通过E-Nose进行肺癌筛查依赖于使用机器学习方法建立的预测模型,然而仅用单一的机器学习方法来检测肺癌存在检测准确率低、假阴性率高等缺点。针对这些问题,LIU 等[54]从多种经典模型中选取性能优异的个体,构建集成学习框架,并使用该框架分析214 个由E-Nose测量的呼吸样本,结果表明,该框架的准确性、敏感度和特异度均达到95%左右,该学习框架克服了单一模型的缺点,为E-Nose呼气分析提供了一种改进方法。
呼出的气体中含有成千上万的挥发性有机化合物,气体可以通过冷凝器转变成液体即EBC,进而提取出用于诊断肺癌的非侵袭性生物标志物。基于分析EBC中基因表达和特定分子变化的肺癌诊断试验,结合转录调节因子GATA6 和甲状腺特异增强子结合蛋白NKX2-1,实现了肺癌诊断98.3%的高灵敏度和89.7%的特异度[55]。有研究[56]应用数据独立采集方法对EBC 蛋白组学进行鉴定,结果表明,这些蛋白主要与人类疾病有关,其中S100A11、ANXA1、ENO1 和FABP5在EBC蛋白组中可能起重要作用,证明在EBC个体样品中进行蛋白组学分析是有效的,其中一些蛋白可能是新的肺癌生物标志物。在获取EBC样本时,患者自身因素(如患有呼吸道其他疾病、营养状态等)、环境因素(如空气污染、湿度等)和气体收集储存分析技术等差异都会影响检测结果。此外,挥发性有机物类型多、来源复杂、技术和方法缺乏统一标准等,因此该技术还未应用于临床。
肺癌筛查目的是降低肺癌死亡率,目前已研发出的众多肺癌筛查与早期诊断技术中,低剂量CT 具有明显优势,成为肺癌早筛应用最广泛的影像学方法。内镜检查观察病变直观、高效、优势突出。液体活检、挥发性有机物和特殊的肿瘤自身抗体检测简单、无创,特别是液体活检及液体活检与低剂量CT 联合诊断可能是近年来肺癌早期诊断的热点和研究方向,而呼吸分析可能成为肺癌筛查的主要方法,E-Nose在预测疗效的作用大有前景,AI和机器学习在肺癌筛查中广泛应用并弥补了人为操作可能带来的误差以及提高工作效率。然而,当前肺癌早筛还存在许多问题和挑战,比如肺癌筛查计划的依据和方案未形成共识;肺癌筛查的患者风险模型、受益者范围和时间间隔如何选择等,因此需要考虑目标人群的识别、招募和依从性,筛查频率,综合戒烟干预措施及成本效益以及性别差异等因素,同时着手建立标准的早期肺癌筛查与诊断的临床路径,积极开展大型试验验证高危风险模型的实用性,评估有吸烟史的人群以及戒烟干预在肺癌筛查中的获益等。相信未来会有更多的研究者进一步探索研究,使这些技术早日纳入临床检查应用中,实现肺癌早期发现、早期诊断和早期治疗,从而提高肺癌患者生存质量,延长生存期。