秦续元,周平平,宋 旸,杜珍武*,张桂珍,*
(1.长春肿瘤医院基因检测中心,吉林 长春130013;2.吉林大学第二医院骨科医院,吉林 长春130041)
肿瘤新抗原(Tumor Neoantigen)又称为肿瘤特异性抗原,该抗原只在肿瘤细胞内表达而在正常细胞内不表达,并能被人白细胞分化抗原(HLA)I类分子识别、结合并递呈到肿瘤细胞表面,激活特异性T淋巴细胞,引发机体抗肿瘤免疫反应[1]。由于肿瘤患病个体异质性导致肿瘤新抗原具有个体化特点,由此以肿瘤新抗原为靶点为肿瘤个体化免疫治疗提供了科学性和可行性。基于新抗原开发的抗肿瘤的RNA、肽疫苗以及树突细胞疫苗已在黑色素瘤[2-3]、胶质瘤[4]、乳腺癌[5]、肝癌[6]及前列腺癌[7]等的临床应用研究中显示出良好的治疗效果,提示肿瘤新抗原在肿瘤治疗中具有的潜在应用价值。
肺癌是我国发病率及死亡率居首位的恶性肿瘤。肺腺癌是肺癌中最为常见的病理分型[8],其分子突变谱不仅含有当前靶向治疗药物治疗的主要靶点[9],也具有较高的肿瘤特异性突变负荷[10-11],近期两项基于肿瘤新抗原技术对于进展期肺腺癌治疗的临床研究结果显示了具有良好的治疗效果,提示该技术在肺腺癌治疗的应用价值[12-13],这些研究结果将加速肿瘤新抗原在肺腺癌临床治疗的研究进程。
目前,肿瘤新抗原的发现主要是采用全外显子高通量测序筛选出肿瘤细胞特异性基因突变并结合其转录组测序中的基因表达水平,再通过免疫抗原数据库预测与人类白细胞抗原(HLA) I类分子的亲和力,具有高亲和力的肽段体外负载树突细胞,测定激活淋巴细胞的能力,评估新抗原肽段的免疫原性与抗肿瘤效果[14]。该过程虽然实现基于个体化的肿瘤免疫治疗,但相比现有的免疫治疗(特别是免疫检测点及CAR-T细胞治疗),在临床应用较为繁琐、复杂以及昂贵的治疗费用,将限制其在临床应用[15]。分析肿瘤新抗原在人群中的分布情况,发现肿瘤患者可能共有的新抗原,建立适用于不同人群肿瘤治疗的新抗原库,将有助于提升新抗原在抗肿瘤中的应用。
本研究应用在长春肿瘤医院就诊的肺腺癌患者的599个基因全外显子测序结果,选择肿瘤特异性基因突变产生的变异肽段序列,通过pVACtools软件[16]预测变异肽段与HLA分型亲和力。筛选出亲和力分值大于1的肽段作为新抗原进行分析,观察这些新抗原在肺腺癌人群中的分布,并进一步分析其与临床病理特征和基因突变特征之间的关系,为肺腺癌患者的新抗原免疫治疗研究提供实验基础。
1.1 一般资料
以2020年4月至2022年12月长春肿瘤医院进行治疗的41例肺腺癌患者为研究对象。41例肺腺癌患者均进行高通量基因测序用于指导肺癌的分子靶向治疗。41例患者中位年龄为56岁(33-80岁);男性患者22例(53.7%),女性患者19例(46.3%);肿瘤分期:Ⅰ-Ⅱ期15例(36.5%),Ⅲ-Ⅳ期26例(64.5%);有转移(包括淋巴结转移与远处转移)28例(68.3%),无转移13例(31.7%)。
1.2 肺腺癌标本的高通量测序数据获取
41例肺腺癌患者的高通量基因测序结果作为本实验分析的数据来源。检测样本包括肿瘤石蜡包埋组织(29例)与外周血液样本(12例)。检测的靶基因为599个基因的外显子,检测基因突变类型包括点突变、缺失、扩增与基因融合。检测的仪器平台为Illumina Novaseq 6000高通量测序平台,平均测序深度为组织平均5000x(最低≥3000x),血液平均10000x(最低≥5000x对照平均 500(最低≥400x)。基因检测委托金域检验公司完成。高通量测序结果包括基因突变情况以及靶向用药指导,预测肿瘤新抗原序列与肿瘤抗原突变总负荷(TMB)情况等。
1.3 新抗原预测
应用pVACtools软件对新抗原进行预测,具体过程如下:经过质控合格的高通量测序的原始数据,与人参考基因组进行比对,获取突变比例大于1%的体细胞突变;通过与HLA库进行比较,获得HLA-A/B/C的基因型;利用VEP注释,过滤掉无义突变和跟野生型蛋白相同的变异位点;利用pvacseq软件将包含体细胞突变的多肽片段,分别切成8-11 bp的肽段,通过NetMHC、SMM、PickPocket等算法,分别预测与不同HLA分型的亲和力,多肽的免疫原性等,输出亲和力超过野生型的多肽片段。对新抗原肽段进行亲和力进行打分(新抗原亲和力分值=原肽段亲和力分值/新肽段亲和力分值);选择新抗原亲和力分值大于1的新抗原进行统计。
1.4 统计分析
数据采用SPSS 21.00(IBM Corp,USA)统计软件进行统计学分析,P<0.05认为具有统计学差异。预测肿瘤新抗原在人群中分布以及与临床病理特征之间的关系根据数据变量不同分别采取卡方检验及t检验。
2.1 新抗原预测情况
通过对41例肺腺癌患者样本的599个基因的全外显子高通量测序结果进行新抗原预测分析,结果显示共有29例样本(占总样本数70.7%)预测具有新抗原,12例样本(占总样本数29.3%)未发现新抗原;在29例预测具有新抗原的样本中,共预测出57个新抗原,其中1个新抗原13例(44.8%),2个新抗原10例(34.5%),3个新抗原2例(6.9%),4个新抗原2例(6.9%),5个新抗原2例(6.9%)。
2.2 不同样本类型高通量测序结果预测新抗原情况
29例石蜡组织样本高通量测序结果预测具有新抗原21例(占72.4%),12例外周血样本高通量测序结果预测具有新抗原8例(66.7%),二者在新抗原预测检出率上相比无显著差异。29例样本共预测出57个新抗原,其中组织样本预测出新抗原45个(2.14个新抗原/例),外周血样本检测出新抗原12个(1.5个新抗原/例)。
2.3 预测新抗原的基因分布及HLA分型情况
本研究预测57个肿瘤新抗原亲和力打分分值范围1.01-1380.384,分值越高则该新抗原与对应的HLA亲和力越高,能够被递呈到细胞表面,与T淋巴细胞TCR结合能力越强。表1按照分值列出前10个打分最高的患者及相关肽段。这些新抗原来源于47个基因,其中含有预测新抗原数目前5的基因为表皮生长因子受体(EGFR)基因(7个新抗原),丝氨酸/苏氨酸激酶3(AKT3)(3个新抗原),kelch样ECH相关蛋白1(KEAP1)(3个新抗原),钙调蛋白赖氨酸N-甲基转移酶2B(KMT2B )(3个新抗原),丝氨酸/苏氨酸激酶11(STK11)(3个新抗原)。与57个新抗原结合的HLA-I类分子共有19种分型,其中HLA-A*02:01分型最多,其次为HLA-A*02:06型。
表1 预测与HLA I类分子亲和力分值前10新抗原
2.4 新抗原与基因突变类型分析
41例肺腺癌患者的599个基因的全外显子高通量测序结果共检测出306个非同义突变,其中包括260个点突变(85%),15个基因删除突变(5%),12个基因扩增突变(4%),8个删除插入突变(3%),7个基因重复突变(2%),2个基因插入突变(1%),1个基因跳跃突变(0.5%),1个基因融合突变(0.5%);检出的所有突变中,共计260个单核苷酸变异;在所有的306个基因突变中,预测具有新抗原突变为57个(占18.6%),检出的57个新抗原中基因点突变53个(占93.0%),重复突变2个(占3.5%),删除突变2个(占3.5%)。
基因突变数与预测新抗原数目存在相关性(相关系数=0.512,P值<0.05);点突变数与新抗原产生存在相关性(相关系数=0.476,P值=0.002)。
2.5 预测新抗原与临床病理类型相关性分析
肿瘤新抗原发现率在不同性别的肿瘤患者之间没有差异,肿瘤新抗原发现率在有转移的肿瘤患者(78.6%)明显高于没有转移的患者(46.2%),在临床分期上,处于Ⅲ-Ⅳ期的肿瘤患者的肿瘤新抗原发现率(80.8%)明显高于Ⅰ-Ⅱ期患者(42.9%),(P=0.029),有新抗原的患者肿瘤突变总负荷(TMB)明显高于无新抗抗原的患者(P=0.022),见表2。
表2 预测新抗原与临床病理学特征关系
肿瘤新抗原作为疫苗刺激免疫系统并产生抗肿瘤反应已逐渐成为新型肿瘤免疫疗法研究的热点[17]。高通量基因测序技术和生物信息学算法的快速进展,为肿瘤新抗原的分子鉴定提供了必要的支持。本研究应用41例肺腺癌患者高通量测序结果进行肿瘤新抗原的预测,结果发现29例(70.7%)肺腺癌样本可预测具有新抗原,最多预测为5个新抗原。由于本研究基于599个基因外显子测序结果进行的新抗原预测,其预测出新抗原的效率与数量低于基于肿瘤组织全外显子测序的基因结果进行的新抗原预测的研究[18]。
基于高通量测序进行肿瘤新抗原预测的基因突变信息主要来源于肿瘤组织样本包括手术切肿瘤组织、穿刺肿瘤组织以及胸腹水脱落肿瘤细胞等,而来源于循环肿瘤DNA的还未见研究报道。在本研究中用于肿瘤新抗原预测分析的肿瘤细胞基因突变信息不仅来源于肿瘤组织样本,也来自外周血循环肿瘤DNA的样本。预测结果表明肿瘤组织样本与外周血样本检出基因突变均可预测出肿瘤新抗原,预测率二者并无差异,说明通过肿瘤患者外周血DNA分析,也能发现肿瘤新抗原,为无法获取肿瘤组织患者选择外周血进行新抗原的预测提供了理论依据。DNA突变负荷的动态变化的可检测性[19],也为实时实施以个体肿瘤新抗原为基础的肿瘤免疫治疗提供可能。
当前肿瘤新抗原预测是基于突变的肽段被HLA-I类分子识别与结合能力,结合分数越高,该肽段被递呈到肿瘤细胞的表面机会越大[20]。由于识别不同肽段的HLA-I类分子不同以及个体HLA-I类分型不同,使具有同一肿瘤类型肿瘤组织的患者预测新抗原具有差异性。本研究预测57个肿瘤新抗原亲和力打分分值范围从1.01到1380.384,与57个新抗原结合的HLA-I类分子共有19种分型,其中HLA-A*02:01分型最多,其次为HLA-A*02:06型。HLA分型决定新抗原与TCR受体结合的亲和力情况,从而影响新抗原疫苗的疗效。Tran E等报道[21]的一位患者,经过新抗原附载的DC疫苗治疗后,三处病灶均减小或消失,但一处病灶出现了免疫超进展,在对次病灶进行HLAI 类分子表达的检测发现,该患者的HLA I类分子表达缺失,导致新抗原无法被正常递呈到细胞表面。因此肿瘤组织细胞HLA-I类分子表达检测在实施肿瘤新抗原治疗过程中是十分必要的。
通过肿瘤新抗原的预测分析将会明确每个新抗原的基因突变信息、突变肽段的氨基酸信息以及相结合的HLA-I分子的分型。一旦在体内外实验证明应用这些新抗原进行肿瘤治疗的有效性,对于具有同样新抗原以及HLA-I分型的其他患者将或从中受益。一项研究对国际癌症基因组协会数据库的9155个癌症样本体细胞突变进行新抗原预测[22],发现65个常见肿瘤驱动基因存在新抗原,其中最多的新抗原相关基因是KRAS(G12D和G12V)。研究发现K-RAS基因第二外显子G12D突变所在9-10个肽段可作新抗原,与HLA-C*08:02具有高亲和性。应用该抗原肽分别对具有同样K-RAS基因突变以及HLA-I分型的转移性结直肠癌患者及胰腺癌患者进行治疗研,结果显示据具有良好的治疗效果[21,23]。本研究预测新抗原数目最多为表皮生长因子受体(EGFR)基因(7个新抗原),突变位点集中于L858R、C797S、G719S、L747_P753delinsS。该研究结果为以EGFR突变预测存在新抗原进行肺腺癌免疫治疗研究提供前期科研信息。
本研究发现产生新抗原的基因突变类型主要是点突变产生,这与Duksza等的研究新抗原产生基因突变类型相同[24],在新抗原预测结果与临床病理分析上发现有转移及Ⅲ-Ⅳ期患者的肿瘤组织或外周血基因检测获取的新抗原预测阳性率明显增高,说明随着肿瘤进展,肿瘤基因突变频率增多,带来肿瘤新抗原增多。
免疫检查点抑制(ICI)已成为近10年癌症免疫治疗的主要方法[25],高TMB被作为评价ICIs疗效的重要生物标志物[26]。研究表明[27]肿瘤特异性突变会产生新抗原,介导对ICIs的应答,故推测高TMB会导致更多的新抗原产生,增加肿瘤免疫原性,提高肿瘤对ICIs的反应。本研究发现预测出具有新抗原的患者TMB明显高于没有预测出新抗原的患者。一项临床试验表明[28],新抗原疫苗与PD-1抑制剂结合,用于高TMB的转移患者具有较高的可行性和安全性。
总之,本研究应用肺腺癌患者的高通量基因测序结果,探讨了肺腺癌患者预测产生新抗原情况,观察这些新抗原在肺腺癌人群分布,分析其与临床病理特征和基因突变特征的关系,为肺腺癌患者的新抗原免疫治疗研究提供实验基础。