洪 超 ,向旭东 ,李盈甫 ,曹 杨 ,陈雪雅 ,李 帅 ,邢安灏 ,林 牧 ,马千里
(1)中国医学科学院 &北京协和医学院医学生物学研究所,云南 昆明 650118;2)昆明医科大学第三附属医院胸外科,云南 昆明 650118;3)昆明医科大学第一附属医院干疗科,云南 昆明 650032;4)云南省保山市第二人民医院检验科,云南 保山 678000)
2020 年,全球估计有220 万肺癌新发病例和180 万死亡病例,约占癌症诊断的十分之一(11.4%)和死亡的五分之一(18.0%)[1]。2016 年我国癌症统计报告显示,肺癌是男、女性癌症死亡的最常见原因,约占男性癌症死亡的29.71%和女性癌症死亡的22.92%[2],这主要是因为肺癌早期症状隐匿,难以实现早期诊治[3]。肺癌的发生受多种因素影响[4],而其中遗传因素是影响个体间肺癌易感性差异的最主要因素[5]。非小细胞肺癌(non-small cell lung cancer,NSCLC)是常见的肺癌类型,约占肺癌的85%[6],NSCLC 预后较差,且近年来发病趋于年轻化[7]。研究发现,有多条信号通路参与了NSCLC 的发生发展过程,如CDKN2A/RB1、NFE2L2/KEAP1/CUL3、PI3K/AKT、SOX2/TP63/NOTCH1 等[8-10]。这些信号通路相关基因中的单核苷酸多态性位点(single nucleotide polymorphisms,SNPs)可能与NSCLC 的发生发展有相关性[11]。
丝裂原活化蛋白激酶(mitogen-activated protein kinase,MAPK)信号通路在肿瘤发生过程中起关键作用,与肿瘤发生的多个方面有关,包括细胞分化、增殖、侵袭、血管生成、凋亡和转移[12]。细胞外信号调节激酶(ERK)是3 个MAPK 家族(JNK,p38/SAPK 和ERK)之一[13-15]。ERK1/2 通路也被称为经典的MAPK 信号传导途径,约在34%的肿瘤中发生改变[16]。研究发现,位于基因3'非翻译区(3'untranslated region,3'UTR)的SNP可能会影响miRNA-mRNA 相互作用[17-18],进而影响靶基因的表达,可能在肿瘤的发生中发挥关键作用[19]。本研究选取了4 个ERK1/2 信号通路基因3'UTR 区域的SNP 位点(MAPK1基因中的rs9340,NRAS基因中的rs14804,KRAS基因 中的rs712 和rs7973450),探讨其与NSCLC 遗传易感性的相关性,以期为肺癌的分子病理机制的探究提供数据支持。
随机选取在昆明医科大学第三附属医院诊断的478 名NSCLC 患者,纳入标准为:患者经活检或手术诊断为NSCLC、临床资料完整、具有较好的依从性、无其他合并肿瘤、无其他肿瘤既往史、未接受放疗或化疗等抗肿瘤治疗。诊断标准依据《中华医学会肺癌临床诊疗指南(2018 版)》[20]。同时随机选取480 名同期健康体检人员作为健康对照组。采集所有受试者的乙二胺四乙酸(EDTA)抗凝全血4 mL。所有样本收集均获得患者及家人的知情同意,并经昆明医科大学第三附属医院伦理委员会批准(审查编号:KYLX2022180)。为了响应我国对肺癌筛查与早诊早治的倡议,根据《中国肺癌筛查与早诊早治指南(2021,北京)》[21]以及《老年晚期肺癌内科治疗中国专家共识(2022 版)》[22]的推荐,本研究将受试者按照年龄划分为 <50 岁组,50~65 岁组以及>65岁组。
使用全血基因组DNA 提取试剂盒QIAamp DNA Mini Kit(购自Qiagen 公司,Qiagen NV,Venlo,Netherlands),根据试剂说明书完成基因组DNA提取。使用Multiskan GO 全波长酶标仪测定DNA浓度及纯度。将提取到的DNA 样本稀释到25 ng/µL的工作浓度,用于随后的基因分型检测。
使用CAPD 数据库(http://bio-bigdata.hrbmu.edu.cn/CPAD/index.jsp)选取与肺癌相关的候选信号通路,利用GEPIA 数据库(http://gepia.cancerpku.cn/)对信号通路中的候选基因进行表达验证,使用Ensembl 数据库(https://www.ensembl.org/index.html)及UCSC 数据库(https://genome.ucsc.edu/)查找位于候选基因3'UTR 区域的SNP 位点。同时以中国南方汉族人群次要等位基因频率(minor allele frequency,MAF)高于0.04 作为筛选标准。最终选取4 个SNP 作为本次研究的候选SNP,分别是位于MAPK1基因 3'UTR 区域的 rs9340,位于NRAS基因3'UTR 区域的rs14804,位于KRAS基因3'UTR 区域的rs712 和rs7973450,见表1。
表1 所选SNP 位点信息Tab.1 The information of selected SNPs in the current study
使用TaqMan 探针法对上述SNP 进行基因分型检测,所用试剂及探针均购自美国ABI 公司,具体分型方法参见笔者之前的研究[23]。为验证基因分型结果的准确性,本研究随机挑选5%的样本进行重复检测,并随机挑选了3%的样本进行测序验证。
利用GTEx 数据库(https://www.gtexportal.org/home/)评估SNP 和基因表达的相关性,使用miRNASNP 数据库(http://bioinfo.life.hust.edu.cn/mi-RNASNP/#!/)预测基因3'UTR 变异对miRNAmRNA 相互作用的影响。
使用Microsoft Excel 软件整理所有基因分型数据以及临床信息,采用Graphpad Prism 软件和在线软件SHEsis[24]进行统计学分析。研究对象年龄以()表示,性别、病理类型、临床分期、SNP 位点等位基因及基因型以例数和百分比[n(%)]表示。使用独立样本t检验分析病例组和对照组间样本年龄差异;使用χ2检验分析2 组间性别分布差异;采用哈迪温伯格平衡(hardyweinberg equilibrium,HWE)检验分析纳入样本的群体代表性;采用χ2检验分析各SNP 位点等位基因及基因型在各组间的分布频率的差异及优势比(odd ratio,OR),检验水准α为0.05。对于多重比较,使用Bonferroni 校正P值,本次研究设定P值为0.012(0.05/n,n=4)。假阳性报告概率(false positive report probability,FPRP)分析[25]用于评估研究结果中假阳性发生的概率。
本研究共纳入958 名受试者,包括478 名NSCLC 患者,平均年龄为(55.94 ± 10.79)岁,其中男性305 名,女性173 名。健康对照组包含480 名受试者,平均年龄为(55.16 ± 11.35)岁,其中男性277 名,女性203 名。2 组受试者之间的年龄和性别分布比较差异无统计学意义(t=1.09,P=0.275;χ2=3.74,P=0.053),见表2。
表2 受试者临床信息[/n(%)]Tab.2 The clinical characteristics of the subjects enrolled in the current study [/n(%)]
表2 受试者临床信息[/n(%)]Tab.2 The clinical characteristics of the subjects enrolled in the current study [/n(%)]
位于ERK1/2 信号通路相关基因3'UTR 区域的4 个SNP 的基因型在对照组中的分布特征均符合HWE(P>0.05),表明本研究纳入样本是具有群体代表性的随机样本。对4 个SNP 位点等位基因和基因型在对照组与NSCLC 组中分布频率的差异进行分析,结果显示,4 个SNP 的等位基因和基因型在对照组与NSCLC 组中分布频率的差异经Bonferroni 校正后,差异无统计学意义(P>0.012),见表3。
表3 在健康对照组和NSCLC 组中4 个SNP 位点等位基因及基因型频率分布结果[n(%)]Tab.3 Allele and genotype frequencies of four SNPs between the control group and NSCLC group [n(%)]
为了探究ERK1/2 信号通路相关基因3'UTR区域的4 个SNP 与不同病理类型NSCLC 的相关性,本研究按照病理类型将NSCLC 组分为腺癌组(adenocarcinoma,AC)和鳞状细胞癌组(squamous cell carcinoma,SCC),并分析4 个SNP 位点的等位基因和基因型在对照组与AC 组以及对照组与SCC 组中分布频率的差异。结果显示,rs9340 位点的等位基因在对照组与SCC 组中分布频率的差异具有统计学意义(P=0.009),在先验概率水平为0.25 时,rs9340 与SCC 的相关性仍有意义(FPRP=0.045),该结果表明rs9340 位点的G 等位基因可能是非小细胞肺鳞癌的保护性因素(OR=0.67,95%CI:0.50~0.91),而其余位点的等位基因和基因型在对照组与各病理类型组间分布频率的差异经Bonferroni 校正后均无统计学意义(P>0.012),见表4。
为分析ERK1/2 信号通路相关基因3'UTR 区域的4 个SNP 位点与NSCLC 不同临床分期的相关性,本研究按临床分期将NSCLC 组分为I+II 期组以及III+IV 期组,并分析4 个SNP 位点等位基因和基因型在对照组与I+II 期组以及对照组与III+IV 期组中分布频率的差异。结果显示,4 个SNP 位点的等位基因和基因型在对照组与I+II 期组以及对照组与III+IV 期组中分布频率的差异经Bonferroni 校正后差异无统计学意义(P>0.012),见表5。
为了分析ERK1/2 信号通路相关基因3'UTR区域的4 个SNP 位点在不同的年龄组中与NSCLC 的相关性,本研究分析了4 个SNP 位点等位基因和基因型在 <50 岁组、50~60 岁组以及 >65 岁组中分布频率的差异。结果显示,在 <50岁年龄组中,rs9340 位点的等位基因在对照组和NSCLC 组中的分布频率差异具有统计学意义(P=5.07×10-4),在先验概率水平为0.25 时,rs9340与 <50 岁年龄组中NSCLC 的相关性仍有意义(FPRP=2.52 × 10-4),该结果表明rs9340 等位基因G 可能是NSCLC 的保护性因素(OR=0.46,95%CI:0.29~0.72),见表6。
在获得rs9340 位点可能与NSCLC 发生风险具有相关性的结果后,本研究利用生物信息学工具对rs9340 位点的功能进行初步预测,结果显示,rs9340 位点的A 等位基因可使培养的成纤维细胞中MAPK1基因表达升高,见图1。在miRNAmRNA 相互作用方面,rs9340 位点的A 等位基因可能在MAPK1基因3'UTR 区域增加了与hsa-miR-153-3p、hsa-miR-448 的结合位点,同时影响了与hsa-miR-521 的结合。该结果表明,rs9340 位点可能是通过影响MAPK1基因的表达而在NSCLC 的发生过程中发挥作用。
图1 rs9340 调节MAPK1 的表达Fig.1 rs9340 regulates the expression of MAPK1
ERK1/2 信号通路参与多个细胞生物学进程的调控,包括增殖、分化和转化[26],异常激活的ERK1/2 信号通路可以促进癌细胞的增殖、抑制凋亡、促进血管生成和细胞迁移等,从而促进肿瘤的生长和转移[27-28]。更重要的是,ERK1/2 信号通路深度参与癌症治疗中的放射抵抗[29],可能与肿瘤不良预后相关。研究发现,肿瘤相关信号通路基因中的突变在肿瘤发生发展过程中发挥着重要作用[30-31],这些突变通常与信号通路基因表达及功能的改变相关[32-33],其中位于基因3'UTR区域的SNP 可能会通过影响miRNA-mRNA 的相互作用[34],而影响信号通路基因的表达[35],进而产生级联反应[36],并在疾病的发生发展过程中发挥作用[37]。因此,本研究选取了4 个位于ERK1/2信号通路的基因3'UTR 区域的SNP 位点,研究其与NSCLC 发生风险的相关性。
丝裂原活化蛋白激酶1(MAPK1)是研究广泛的MAP 激酶家族成员,也被称为细胞外信号调节激酶2(ERK2)[38]。在正常生理条件下,MAPK1在大多数组织中呈中度持续表达,但在乳腺癌、膀胱癌、肺癌和胃癌等多种恶性肿瘤中表达会发生显著变化[39-40]。Wang 等[41]的实验证实,MAPK1可以双向调控靶基因,从而促进胃腺癌细胞的侵袭和迁移。Zhu 等[42]报道,MAPK1在宫颈癌患者中表达上调,MAPK1逆转了miR-217 对细胞活力、迁移、侵袭和凋亡的抑制。Gagliardi 等[43]的研究结果表明,ERK2可以促进三阴性乳腺癌细胞的迁移和侵袭、肿瘤干细胞表型形成和转移。以上研究资料表明MAPK1基因的表达异常在肿瘤发生中发挥重要作用。而rs9340 位点位于MAPK1 基因的3'UTR,可能参与MAPK1的转录后调控,而与疾病的发生相关。Guo 等[44]对MAPK1基因中的rs9340 的研究结果显示,rs9340 位点的G 等位基因与降低围绝经期冠心病的易感性显著相关。Insodaite 等[45]的结果表明,rs9340 位点基因型A/A 是喉鳞癌患者发生远处转移的风险因素。同样,本研究结果显示rs9340 可能与非小细胞肺鳞癌的发生风险具有相关性,其中等位基因G 可能是非小细胞肺鳞癌的保护性因素。本研究生物信息学相关分析结果提示rs9340 位点可能会影响miRNA 与MAPK1基因3'UTR 区域的相互作用,并与MAPK1基因的表达相关,这可能是该位点与非小细胞肺鳞癌发生风险相关的机制。非小细胞肺鳞癌与其他类型肺癌相比,预后不理想,并且缺乏可用的靶向药物,往往对免疫治疗的敏感性较低[20,46-47],结合本研究的发现,未来应继续在更大规模人群中分析rs9340 位点与非小细胞肺鳞癌的相关性,并通过功能研究探究相关机制,为该位点在非小细胞肺鳞癌早期诊断及预后分析中的应用提供必要的指导。
此外,本研究结果还显示,在 <50 岁人群中,rs9340 位点与NSCLC 发生风险相关。肺癌是全球及我国60 岁以上人群发病率及死亡率最高的恶性肿瘤[48],考虑到我国肺癌发病年龄较早,《中国肺癌筛查与早诊早治指南》建议我国的肺癌筛查起始年龄为50 岁[21]。因此,未来有必要开展更多研究探讨MAPK1基因3'UTR 区域的rs9340 位点在50 岁以下人群的NSCLC 风险预测中的应用。
综上所述,本研究分析了4 个位于ERK1/2信号通路基因3'UTR 区域的SNP 位点与NSCLC发生风险的相关性。研究结果初步揭示了位于MAPK1基因3'UTR 区域的rs9340 位点与NSCLC发生风险的相关性及其可能的机制,未来应在此基础上进一步开展更大样本量的相关性研究以及功能研究,阐明该位点在肺癌发生过程中发挥的作用及其机制,为该位点在肺癌的早期诊断及治疗中的应用提供研究基础。