基于机器学习法的肠道黏膜mRNA表达谱预测IBD患者对英夫利昔单抗治疗应答情况的研究

2023-06-15 12:37张凯楠高建淑高鸿亮
新疆医科大学学报 2023年5期
关键词:英夫利差异基因单抗

张凯楠, 温 雯, 高建淑,2, 高鸿亮,2

(1新疆医科大学研究生学院, 乌鲁木齐 830017; 2新疆医科大学第一附属医院消化病二科, 乌鲁木齐 830054)

炎症性肠病(Inflammatory bowel disease,IBD)是一种累及胃肠道的慢性复发性的炎症性疾病,主要包括溃疡性结肠炎(Ulcerative colitis,UC)和克罗恩病(Crohn's disease,CD)两个临床亚型,其临床表现为腹痛、腹泻并伴有黏脓血便、体重减轻及其他不同程度的全身症状等[1]。目前治疗IBD的主要手段是调节炎症反应,减轻肠道炎症症状,促进黏膜愈合。在我国,治疗IBD的常见药物有氨基水杨酸制剂、激素、硫嘌呤类药物和环孢素及生物制剂[2-3]。其中,生物制剂药物英夫利昔单抗(Infliximab,IFX)通过抑制肿瘤坏死因子-α(Tumor necrosis factor-α,TNF-α)信号通路有效诱导和维持IBD患者的病情缓解,在IBD治疗中发挥着重要作用[4]。虽其疗效较好,但易出现原发性失应答和继发性失应答[5]。有报道指出,肠道黏膜的mRNA表达谱与IBD的疾病活动度、内镜和组织病理学评分密切相关[6],且可作为评估患者预后的标志物[7]。机器学习法是一门涉及统计学、神经网络、计算机科学等诸多领域的交叉学科,是人工智能技术的核心,其在多组学数据处理领域的应用体现出显著优势[8]。

目前,临床上为评估IFX治疗应答及失应答情况常检测患者英夫利昔单抗谷浓度和抗抗体丰度[9],但该方法用于首次治疗后,具有一定的滞后性,导致预测指标无法及时、有效的反馈用药结果,且不能在患者接受治疗前提供有效的信息,以帮助制定用药方案和及时选择替补用药。因此本研究采用机器学习法和转录组数据,预测IBD患者对英夫利昔单抗的应答,现报道如下。

1 资料与方法

1.1 一般资料使用高通量基因表达数据库(Gene expression omnibus,GEO, https://www.ncbi.nlm.nih.gov/geo)下载炎症性肠病患者首次英夫利昔单抗治疗前肠道黏膜的基因表达谱(GES16879)共计43例。其中CD患者为19例,UC患者为24例。患者在首次静脉输注5 mg/kg英夫利昔单抗前一周内接受内窥镜检查,并取病变结肠组织进行活检。上述组织使用Affymetrix人类基因组 U133 Plus 2.0 阵列获取mRNA表达谱。

1.2 分组方法在本研究中,将黏膜愈合作为英夫利昔单抗治疗应答情况的判定标准。UC和CD对英夫利昔单抗治疗应答被定义为黏膜完全愈合。判定标准:CD的组织学评分降低至少3分,UC的组织学评分为0或1分或Mayo内窥镜评分降低至0或1分[10-11]。不满足判定标准的患者被定义为失应答者。最终43名IBD患者中,20例为应答者(8例UC和12例CD), 23例为失应答者(16例UC和7例CD)。

1.3 差异基因获取与功能分析使用基于R语言的limma[12]软件包,差异倍数(log2FC)>1.5或<-1.5,且P<0.05为标准筛选差异基因。利用clusterProfiler 4.0[13]软件包进行差异基因的基因本体论 (Gene ontology,GO)和京都基因和基因组百科全书 (Kyoto encyclopedia of genes and genomes,KEGG)功能富集分析。

1.4 基于机器学习法筛选IBD患者对英夫利昔单抗反应的预测基因分别使用LASSO回归分析(通过交叉验证选择距离最小均方误差一个标准误所对应的正则化参数λ作为最合适的λ)[14]和SVM-RFE[15](根据SVM在训练时生成的权向量来构造排序系数,每次迭代去掉一个排序系数最小的特征属性,最终得到所有特征属性的递减顺序的排序)的方法筛选预测基因,求其交集。

1.5 预测模型的构建和效能评估绘制受试者工作特征曲线(ROC)并计算ROC曲线下面积(AUC),使用联合诊断法,利用Logistic回归建立联合诊断模型,ROC曲线进行二次评估。

2 结果

2.1 失应答者和应答者差异基因集及功能富集分析结果使用limma进行差异基因筛选后共发现182个差异基因,其中上调基因为17个,下调基因为165个(图1A)。GO富集分析结果显示,差异基因与对细菌的反应、对脂多糖的反应及中性粒细胞的激活等功能有关;KEGG富集分析结果显示,差异基因在细胞因子-细胞因子受体的相互作用、IL-17信号通路和病毒蛋白与细胞因子及细胞因子受体的相互作用等通路中发挥作用(图1B)。

注:A,对英夫利昔单抗应答和失应答的IBD患者的差异基因,其中蓝色代表下调,红色代表上调;B,差异基因的GO和KEGG富集分析。

2.2 预测模型基因的筛选结果LASSO回归分析共筛选出趋化因子配体22(CCL22)、chordin样蛋白2(CHRDL2)、环氧化物水解酶4(EPHX4)和白介素10(IL-10)等15个基因(图2A);SVM-RFE法筛选出BCL2相关蛋白A1(BCL2A1)、CHRDL2、趋化因子配体6(CXCL6)和趋化因子配体8(CXCL8)等22个基因(图2B)。两种方法共同筛选出CHRDL2、IL13RA2、MMP10和S100A9等4个基因(图2C)。

注:A,LASSO回归变量轨迹图;B:SVM-RFE交叉验证图;C:两种机器学习方法共同筛选出的差异基因。

2.3 预测模型的建立与性能评估结果上述4个差异基因的AUC分别为S100A9(0.946)、IL13RA2(0.972)、MMP10(0.893)及CHRDL2(0.870)。4个基因联合诊断模型(Logistics回归模型=-59.212 2+1.951×S100A9+0.758 1×IL13RA2+1.694 2×MMP10 +4.042 1×CHRDL2,AIC=18.51),其AUC为0.996,灵敏度为95.7%,特异度为100%,见表1、图3。

表1 各基因对IBD患者对英夫利昔单抗治疗反应预测的效能评估

注: A, 4个特征基因的ROC曲线; B, 联合诊断的ROC曲线。

3 讨论

目前,使用IFX是治疗IBD较有效的手段之一为,但其常出现失应答,因此探寻IFX反应的潜在生物标记物至关重要。本研究,利用IBD患者结肠黏膜的mRNA表达谱构建对英夫利昔单抗应答的预测模型。预测接受IFX治疗的IBD患者对IFX的应答情况在临床诊疗过程中具有重要意义。Roda等[16]报道指出,IBD患者对IFX治疗的原发性失应答率为10%~20%,继发性失应答率为20%~40%。说明不论是首次接受IFX治疗的患者,还是既往已接受过IFX治疗的患者,其出现治疗失应答的概率较大。尤其对于首次用药患者,若能提前预测其对IFX药物的应答情况,将有助于临床医务人员制定诊疗方案。此外,IFX药物价格相对高昂,对患者产生一定的医疗负担。随着生物大数据时代的到来,在获取大通量数据的同时也面临着数据处理难度增高的问题,而采用机器学习法可从高通量、高纬度的数据中筛选出范围更精准的数据供下游分析。本研究中,采用机器学习法从21 654个基因中筛选出182个差异基因,主要集中于细胞因子-细胞因子受体的相互作用、白介素17 信号通路等,进一步筛选出4个特征基因用于建模。该方法可降低高通量数据的分析难度,可提升模型临床转化应用的能力。此外,基于机器学习法预测IBD患者IFX治疗应答情况的相关研究较少。本研究构建的联合模型AUC为0.996,灵敏度为95.7%,特异度为100%,其性能参数可体现该模型具有良好的预测性能。

本研究构建了一个由4个特征基因构成的预测模型,包括S100A9、IL13RA2、MMP10和CHRDL2。S100A9 是一种钙和锌结合蛋白,在调节炎症过程和免疫反应中起重要作用[17],并且与IBD发生发展密切相关。IL13RA2是IBD患者对英夫利昔单抗治疗原发性失应答的最佳预测标志物之一[18]。MMP10也是IBD和结肠癌共有基因之一[19],参与中性粒细胞激活途径,与炎症反应密切相关。研究显示,CHRDL2在结肠癌中高表达[20],但在IBD中的致病机制还有待进一步研究。此外,由于CHRDL2是chordin蛋白家族的成员,属于一种分泌蛋白[21]。本研究单独使用CHRDL2表达谱构建预测模型,其AUC为0.87,灵敏度为82.6%,特异度为90%,说明其具有成为IBD患者对IFX治疗应答情况的独立预测指标,并且由于其分泌蛋白的特性,也使其具有无创检测的潜力,这一发现值得进一步深入研究。虽然本研究基于机器学习法构建出用于IBD患者对IFX的应答情况的预测模型,但本研究亦有不足之处。首先,本研究只进行一个队列数据的分析,缺少独立样本的外部验证;其次,本研究缺少本地实验数据对分析结果进行二次验证。今后,将会针对上述问题进行深入研究,以持续优化和验证本模型。

综上,本研究基于机器学习法,构建了一个由4个mRNA组成的模型,可用于预测IBD患者对IFX治疗的应答情况,可对该类患者的临床治疗方案拟定提供一定的参考。

猜你喜欢
英夫利差异基因单抗
FOLFOXIRI联合贝伐单抗±阿替利珠单抗治疗转移性结直肠癌
司库奇尤单抗注射液
基于RNA 测序研究人参二醇对大鼠心血管内皮细胞基因表达的影响 (正文见第26 页)
紫檀芪处理对酿酒酵母基因组表达变化的影响
英夫利西单抗在炎症性肠病应用进展(综述)
英夫利西单抗(类克®)“美丽人生”征文部分获奖图片展示
使用抗CD41单抗制备ITP小鼠的研究
英夫利西单抗治疗关节病性银屑病进展
英夫利西单抗(类克® )临床应用有奖征文通知
SSH技术在丝状真菌功能基因筛选中的应用