曾 凡,陈 晨,黄士美,张大涯,白飞虎
(1.海南医学院,海南 海口 571199;2.海南医学院第二附属医院,海南 海口 570216;3.海南省消化疾病临床研究中心,海南 海口 570216)
大肠癌(Colorectal cancer,CRC) 是全世界最常见的肿瘤之一,发病率与死亡率逐年上升[1],它是全球癌症死亡的第三大原因,被认为是全球的公共卫生问题[1]。癌症的早期检测策略以及预防措施是提高生存率的关键。虽然结肠镜检查是CRC 筛查的黄金标准[2],但是全世界许多筛查项目都广泛提倡使用粪便免疫化学测试进行CRC 初筛后,阳性结果患者进行结肠镜确诊的筛查方法[3]。
相较于传统的愈创木酯法便潜血试验(guaiac Fecal occult blood test, gFOBT),粪便免疫化学检测(Fecal immunochemical testing, FIT)具有操作简便、灵敏度高、不需饮食限制等优点。FIT 通常用于对有症状的患者进行优先调查,在识别CRC 方面优于单独的症状评估[4,5]。它的定量性质可以优化资源 使 用。FIT 已 被 提 议 作 为CRC 的 排 除 测 试[5]。本文概述了CRC 的流行病学情况,FIT 的检测原理、FIT 筛查CRC 的效能、并概述并总结了影响FIT 筛查效能的因素,FIT 筛查的优缺点及其创新型应用,对未来应用FIT 筛查CRC 进行展望。
CRC 是指发生在结肠和直肠黏膜上皮的恶性肿瘤。不同部位CRC 发病率从高到低依次为直肠、乙状结肠、盲肠、升结肠、降结肠以及横结肠。CRC发病隐匿,早期无症状或症状不明显,仅有腹部不适感等,早期诊断率仅为5%,而60%~70%的患者被确诊时已发展为CRC 中晚期[6]。
CRC 从癌前病变进展到癌一般需要5~10 年的时间,为疾病的早期诊断和临床干预提供了重要时间窗口,是最适合进行早期筛查和预防的癌症之一[7,8]。在欧洲 一 项研究中,经 过CRC 筛 查 的人群10 年后患CRC 的风险从1.22%降至0.84%[9]。相关CRC 筛查试验的研究均指出,CRC 筛查可降低CRC 死亡率,并显著降低全因死亡率[8-11]。因此,早期筛查能够有效的降低CRC 的发病率及其死亡率。
粪便隐血试验(fecal occult blood test, FOBT)是一种简单、安全、价廉的筛查CRC 的方法,可分为gFOBT 和FIT[12]。
FOBT 可以检测粪便中的少量血液,这可能表明肠道出血[13]。若为恶性疾病出血呈持续性,而存在溃疡等良性出血情况则为间断性,因此可以区分良恶性疾病。
FIT 是抗人血红蛋白抗体与粪便中的血红蛋白抗原结合后形成抗原-抗体复合物产生特异的化学反应,通过免疫测定法能可靠地测量粪便中血红蛋白浓度(f-Hb),可精确到每克粪便中Hb 的微克数(μg/g)[14]。
目前临床常用的FIT 类型分为定性和定量FIT,其原理均为抗原-抗体反应。定性法通过横向流动免疫色谱法将可溶性Hb 从粪便中分离出来,并被人Hb 抗体捕获并通过各种可视化技术使其可见[14]。定量 FIT 采用免疫乳胶凝集法,以抗原抗体反应的高灵敏度来检测大便中的微量Hb[13]。相关研究发现在CRC 筛查中,定量FIT 在提高晚期肿瘤的检出率、减少结肠镜检查工作量方面均优于定性FIT[15,16]。
FIT 主要分为胶体金法、酶联免疫吸附法和单克隆抗体法。胶体金法是免疫法中最常使用进行粪便隐血试验的方法,主要是用通过免疫试纸条对人血红蛋白或转铁蛋白抗原进行检测,比化学法更加灵敏,特异性和准确性更高,被世界卫生组织和世界肠胃镜检查协会所推荐[17]。
2.3.1 FIT 的诊断效能 FIT 的诊断效能高于gFOBT,已成为人群CRC 筛查中主要的粪便隐血检测技术。FIT 因其具有易于使用、能定量分析以及对晚期大肠肿瘤(ACN)的敏感性更高的优点已取代gFOBT[6-29]。
相较于FIT 试验,gFOBT 灵敏度低,且结果易受到饮食、药物等外界因素影响[25]。在过去二十年中,各国越来越多地采用FIT 试剂盒,而不是gFOBT,因为其具有优越的敏感性和特异性[30]。与gFOBT 不同,由于下消化道血红蛋白的分解,FIT试剂盒不能检测上消化道出血,不会受到上消化道出血的影响[28]。
在Akram 等[30]的 研 究 中,分 别 将FIT 与gFOBT 应用于人群CRC 筛查,发现FIT 组中CRC检出率明显更高(0.79%vs.0.8%,P=0.003),有更高的敏感性和特异性。蔡金平等[31]分别应用FIT与gFOBT 对50 例疑似为CRC 早期患者进行早期CRC 筛查,证实了FIT 在CRC 早期筛查中效果更佳。一项荟萃分析中发现应用FIT 试剂盒进行筛查,CRC 诊断的敏感性约为70%~80%[32-34]。Mikaël 等[35]学者应用FIT 筛查CRC,发现其诊断CRC的敏感性为80.5%。因此,综合以上研究发现,相较于gFOBT,FIT 在筛查CRC 过程中,其灵敏度更高,很好的规避了gFOBT 易出现假阳性、假阴性、灵敏度低、易受饮食等外界因素影响等弊端,其在CRC 筛查中筛查效能较高。
2.3.2 适宜的阳性阈值能够提高FIT 的诊断效能FIT 已被广泛用于筛查,对单一低阈值FIT 敏感性估计为90%。D'Souza 等[5]学者在研究中证明了FIT 对于符合标准的有症状患者,可用于排除早期CRC,敏感度相当于结肠镜检查。Berry 等[36]学者研究发现降低FIT 阈值(≥10 μg/g)会增加晚期肿瘤的检出率,但需要诊断性结肠镜检查的患者比例会增加一倍。如果实施一年一次低阈值FIT 而不是三年一次的结肠镜检查,结肠镜检查的数量可以减少70%以上,显著节省成本。2017 年英国国家卫生与临床优化研究所(NICE)分析FIT 筛查CRC 的诊断准确性的研究发现,当FIT 试验阈值由≥10 μg/g 逐渐增加至≥20 μg/g 时,汇总估计敏感性由89.1%增至89.5%,特异性由85.8%增至86.6%[37]。因此,适当调整FIT 试验阈值能有效提高其诊断效能。
2.3.3 FIT 检测对CRC 的发病率和死亡率的影响 FIT 用于计划筛查有助于降低筛查人群中CRC 的 发 病 率 和 死 亡 率[2,38]。例 如Nwankwo 等[39]学者在台湾省内应用FIT 筛查CRC 发现,筛查后晚期CRC 发病率减少34%,死亡率减少40%。同样地,在德克萨斯州的一项研究中发现,FIT 结合结肠镜对腺瘤的检出率明显高于单独进行结肠镜检查[40]。Zhao 等[40]学 者 基 于 中 国 结 直 肠 息 肉 护 理(NCPC)评分,与FIT 一起形成的风险分层模型(Li’s 模型)能够识别出55.8%的晚期腺瘤和72.7%的早期CRC。该模型有望作为一种可行的风险分层方法来改进结肠镜检查效率。因此应用FIT 检测筛查CRC 能在一定程度上降低其发病率及死亡率,是一种筛查效能较高的筛查手段,值得被推荐作为CRC 早期筛查的常用手段之一。
2.4.1 阳性阈值对FIT 筛查效能的影响 Khasawneh 等[41]学 者 应 用FIT 筛 查CRC 研 究 发 现,设定FIT 阈值为4 μg Hb/g 时,其诊断CRC 的阳性预测值为5.0%,阴性预测值为99.8%,息肉检出率为25.5%。当调整FIT 阈 值 为10 μg Hb/g 时,CRC 和息肉检出率被提高。同样地,一项在赫茨山谷应用FIT 筛查CRC 的研究指出:当FIT 阈值分别为≥4 μg Hb/g,≥10 μg Hb/g 和≥100 μg Hb/g 时,其筛查敏感性 分别为93%、91%和72%[44]。Gerrard 等[43]学者研究发现,将FIT 阈值从10 μg Hb/g 提高到20 μg Hb/g,漏诊CRC 的年平均值(NNI)显著增加,因此,10 μg Hb/g 似乎是双FIT 策略中检测CRC 的最佳阈值。因此,当FIT 设定不同的阳性阈值时,其在筛查CRC 的诊断效能中是不同的。只有当FIT设定适宜的阈值时,其对CRC 的检出率及筛查的敏感性才能实现最佳效果。综合目前许多研究,可以发现,当设定FIT 阈值为10 μg Hb/g 时才能兼具较高的CRC 检出率及筛查敏感性。然而在这些研究中,对不同阈值FIT 的特异性结果较少,今后的研究可以多侧重于其诊断特异性方面。
2.4.2 性别和年龄对FIT 筛查效能的影响 Mikaël等[35]学者研究发现在FIT 筛查CRC 中男性的敏感性(83.7%)高于女性(76.2%,P=0.066),却不受受试者年龄的影响。另一项研究发现在FIT 筛查CRC 中男性比女性更为敏感。同样地,一项在西班牙应用FIT 筛查CRC 并研究其敏感性的研究指出,男性的阳性率和阳性预测值均高于女性[44]。
有些研究表明,年龄对FIT 筛查CRC 的敏感性无显著差异,甚至随着年龄的增加其敏感性下降[45,46]。一项 研 究 报 告 了 检 测CRC 的敏感性和 特异性,并没有发现年轻人群与老年人群之间的测试表 现 有 显 著 差 异[46]。因 此,在FIT 筛 查CRC 中,FIT 对于男性的诊断敏感性高于女性,不同的年龄段之间的诊断敏感性差异不大。虽然上述研究最终得出了性别与年龄对FIT 诊断效能的影响,但是具体影响机制却鲜有报道,因此未来这方面的研究前景是广阔的,值得深究。
2.4.3 CRC 发生部位及发展阶段不同对FIT 筛查效能的影响 研究发现,FIT 对远端CRC 的筛查敏感性显著高于近端结肠癌为(94.2%vs.71.1% ,P<0.001)。并且应用FIT 筛查不同阶段的CRC,如Ⅰ、Ⅱ、Ⅲ和Ⅳ期,其筛查敏感度分别为89.6%、88.7%、83.3%、71.2% 和68.3%(P<0.001)[35]。CRC 发展阶段越早,FIT 敏感性越高。
有研究发现,发生在右侧结直肠的CRC 通常具更有侵袭性,临床症状出现时间更早,因此可能比发生在左侧结直肠部位的CRC 更快地被诊断[48]。还有学者发现FIT 对远端CRC 的筛查敏感性高于近端[49],他们认为FIT 筛查敏感性的差异可能是由不同CRC 发生部位的细胞内Hb 的传输及降解时间不同引起的;也有认为是因为CRC 发生位置的不同,Hb 具有不同的电势和机械应力引起的[52]。总体而言,早期CRC 的FIT 敏感性高于晚期CRC。此差异早已在先前的研究中观察到[48-52]。
如上所述,FIT 对远端CRC 的筛查敏感性高于近端,具体机制众说纷纭,但凭借这一规律有望在未来早期筛查CRC 的过程中尽早确定肿瘤发生的位置,以利于确定具体的治疗方案。并且,FIT 对于早期CRC 的筛查敏感性高于晚期,这对于CRC 的早期筛查是十分有利的。
2.4.4 FIT 筛查次数对筛查效能的影响 目前有许多关于FIT 筛查CRC 次数对筛查效能的影响的研究,结果不尽相同。在一项双FIT 队列中筛查CRC研究中发现,进行两次FIT 筛查CRC 的敏感性由93.3%提高到96.6%,且漏诊率降低了一半。并且与单一测试方法相比,双重测试将使调查数量增加7.3%。在减少漏诊病例和适度增加的工作量之间进行权衡表明,双重检测可能是值得的[43]。挪威的一项在全国应用FIT 进行每两年一次筛查,最多四次的筛查CRC 的研究发现,CRC 和晚期肿瘤的检出率随着FIT 筛查轮次的增加而增加[48]。同时Clark 等[55]学者对应用FIT 筛查CRC 的人群进行两轮筛查发现,第二轮和第一轮f-Hb 百分位数之间的差异具有高度统计学意义(P<0.001),进行两轮筛查能够提高晚期腺瘤的检出率。另一项Meta 分析指出,除了筛查人群的参与率外,FIT 筛查次数与大多数指标没有显著关联[50]。综合上述研究结果并基于两次FIT 筛查没有明显增加临床效益,目前应用FIT 筛查CRC 项目仍推荐每轮进行一次FIT筛查。
Ding 等[56]学者的Meta 分析中发现,样本量较大的研究报告了较低的参与率(样本量<50 000:67.53%,50 000~500 000:48.79%,>500 000:45.37%,P=0.005);并且指出全世界应用FIT 筛查CRC 的人群参与率因地而异,亚太地区的参与率为55.25%,欧洲为52.72%,北美为45.57%,南美为90.19%。
在我国,结肠镜筛查参与率仅14%,目前我国国民对CRC 筛查的重要性认知由于宣传力度不够大尚处于较缺乏状态,国内应用FIT 筛查CRC 的整体参与率仍较低[51]。
虽然研究发现FIT 可以在一定程度上提高CRC 筛查的参与率,但目前筛查人群对FIT 的阳性结果重视不够、对CRC 的认识不足、未感到明显身体不适是影响高危人群结肠镜依从性的主要原因,而追加结肠镜检查不及时,最终会导致疾病的延误[52,53]。
在一项观察性研究中,FIT 阳性的受试者,只有76.0%(范围:12.5%~96.7%)参加了推荐的结肠镜检查。另一项研究发现,在中国上海的人群中,只有39.8%的高风险个体参加了结肠镜检查随访,而在上海浦东新区的人群中,依从性低至24.0%,其中只有30.4%的FIT 阳性受试者参加了肠镜检查[54]。
FIT 筛查CRC 仍存在局限性,比如南昌的一项研究指出,对于间断出血的CRC,需要连续检测3天,或者对于未发生出血的早期CRC,无法筛查出大肠病变[55,56]。 因此,在进行早期CRC 筛查时,不能只依赖FIT 结果,还需与结合临床症状、影像学及血清学等检查,以提高准确性[30]。并且广州的一项研究发现FIT 试验仅采用定性的方法,未采用定量的方法,而粪便中Hb 含量对肠镜结果判定有关键性作用,易对研究结果造成混杂[46]。
常用的FIT 测试对癌前病变(12.3%~32.4%)和早期癌症(40%)的敏感性较低[62]。此外,由于吸烟或高龄,FIT 测试可能显示假阴性结果,这两者都是众所周知的CRC 危险因素,导致一些病例被遗漏。
FIT 通过检测粪便中的血红蛋白来判断是否出血,具有无创、简便、廉价的优点,但最大的缺点是容易出现假阳性、假阴性,特异度低[63]。因此,应用FIT 筛查CRC 仍存在一定的局限性。
2021 年1 月和4 月,一项FIT 的 创 新 性 应 用-多靶点粪便FIT-DNA 技术入选国家癌症中心发起的中国首部结直肠癌防治指南和中国临床肿瘤学会(CSCO)结直肠癌诊疗指南,成为唯一入选国家级指南的肠癌筛查基因检测技术[64]。
多靶点粪便FIT-DNA 检测是通过实验室技术检测粪便脱落细胞中的DNA 突变并联合FIT 形成个体综合风险评分(联合FIT、粪便KRAS、BMP3甲基化、NDRG4 甲基化和β-actin),对于综合评分超过预设阈值的受检者定义为高风险人群,需要进行结肠镜检查[65]。
一项meta 研究发 现,FIT-DNA 筛 查CRC 的合并灵敏度为94%,合并特异度为91%,合并诊断比值 比 为142[63]。FIT-DNA 筛 查 进 展 期 腺 瘤 患 者 的合并灵敏度为50%,合并特异度为90%,合并诊断比值比为10。说明FIT-DNA 对CRC 的检出率很高,FIT-DNA 对进展期腺瘤患者有一定的检出率,对CRC 及进展期腺瘤患者的筛查均存在一定的漏诊率,但误诊率低。
Li 等[66]学者通过分组,将首次诊断但未治疗的CRC 患者和干预组CRC 患者对比研究发现:FITDNA 检测对早期CRC 和晚期腺瘤的敏感性分别为7/7 和8/12。阴性预测值分别为98.1%(104/106)和93.7%(104/111)。早期CRC 和晚期腺瘤的总体筛查敏感性均为15/19,阴性预测值为96.3%(104/108)。FIT-DNA 检 测 对CRC 的 诊 断 敏 感 性 为98.8%(85/86),对晚期腺瘤的诊断敏感性为8/12。纳入干预组后,FIT-DNA 检测的总体诊断敏感性和特异性分别为91.6%(98/107)和89.1%(114/128)。这说明FIT-DNA 检测对CRC 具有较好的早期筛查效能及诊断效果。这说明整体来看FITDNA 诊断CRC 和进展期腺瘤有非常大的价值。
2020 年CSCO 学术年会,一项中国首个癌症早筛前瞻性大规模多中心临床注册试验一:Clear-C 数据结果提示多靶点粪便FIT-DNA 联合检测技术对CRC 及进展期腺瘤的检测灵敏度分别达到95.5%和63.5%,对CRC 的阴性预测值达到99.6%[63]。
因此,总的来说FIT-DNA 弥补了FIT 容易出现假阳性、假阴性,特异度低等缺点,是一个非常理想的筛查指标,但由于目前中国的临床试验数据较缺乏,临床价值尚存在争议。随着多靶点粪便FITDNA 联合检测技术的不断临床试验研究,该技术对于CRC 的早期筛查应用前景还是非常广阔的。
通过FIT 筛查,CRC 发病率及死亡率可以在一定程度上降低并提高CRC 的检出率。目前FIT 面临的问题主要是参与人员依从性较差,且主要用于大规模的人群筛查,不能因部分人群而异进行个体化筛查。未来期望能够灵活改变FIT 试验的阳性阈值以及增加检测方式的灵活性,进一步提高FIT筛查CRC 的优越性以及对FIT 进行创新性发展。
作者贡献度说明:
曾凡:撰写论文并修改;陈晨、黄士美、张大涯:负责收集文献并参与部分撰写;白飞虎:对文章提出修改意见及审核。
所有作者声明不存在利益冲突关系。