吕燕萍,吴传城,杨双凤,何陈周,韩仁杰,颜 伟,刘宝英,
(1.福建医科大学公共卫生学院,福建 福州350108;2.福建省莆田市仙游县总医院,福建莆田 351200)
胃癌是全球范围内死亡率最高的消化道肿瘤,美国癌症学会最新数据表明,2018年全球胃癌新发病例100万,死亡病例约78.3万[1]。我国是胃癌大国,前期研究发现福建省仙游县2014~2018 年全死因调查发现胃癌死亡率居恶性肿瘤死亡率之首,达36.20/10 万,明显高于全国一般水平(21.48/10万)。因此,迫切需要寻找有效的生物标志物去准确诊断和精准预测胃癌预后,切实降低胃癌的发病率和死亡率。
微小RNA(microRNA,miRNA)是一类高度保守的、长度为16~29 nt的内源性非编码小RNA,大量研究发现其异常表达可影响癌基因表达及癌细胞增殖、转移和侵袭能力、促进化疗耐药等,有望成为胃癌的生物标志物及预后指标之一[2-5]。单核苷酸多态性(single nucleotide polymorphisms,SNPs)是主要遗传因素之一,miRNA 及其相关基因的SNPs 可能会影响miRNA的调控作用进而改变癌症的进展,产生不同的致癌作用[6]。miRNA 及其相关基因SNPs 数量多,涉及范围广,其中主要包括miRNA 自身、miRNA 靶序列、miRNA 生物合成通路基因以及其他相关的SNPs 位点。前期研究已发现,miRNA靶序列EGFR基因3′非翻译区的rs884225 多态性位点与贲门癌发生存在关联,可能是胃癌患者的特异性生物标志物[7-8]。然而目前关于miRNA及其相关基因SNPs与胃癌病人预后的相关性研究还较少,研究范围也较窄,具体的机制也还不甚了解。本研究通过Affymetrix公司SNP芯片结合生物信息学分析全面系统的挖掘与胃癌关系密切的差异miRNA相关SNPs,采用病例-病例研究进一步探讨胃癌差异表达的miRNA及其相关基因SNPs与胃癌预后的相关性。
胃癌病例来源于福建省仙游县医院的胃癌新发病例。病例组纳入标准为:经手术或内窥镜取得组织标本,经病理确诊的新发病例;确诊日期为2013年4月—2014年3月;在仙游本地居住10年以上。芯片组纳入标准是在此基础上选择男性,年龄50~70 岁之间,经病理确诊为胃腺癌的患者。排除标准:经病理确诊为胃部炎症、良性病变及病情危重或不能清晰回答问题者及肿瘤继发病例和复发病例。芯片健康对照组纳入标准:按性别、年龄、地区与病例进行配对,选择年龄±3 岁、在仙游本地居住10 年以上者与病例进行配对。排除标准为:胃癌或慢性萎缩性胃炎的直系家属。
以上研究对象均签署了知情同意书,采集5 mL外周血,EDTA 抗凝,研究通过福建医科大学生物医学研究伦理委员会的审查及批准。最后SNP芯片筛选阶段我们纳入96 例胃癌患者和96 例对照,均为男性,年龄分布在52~71 岁之间。其中病例组平均年龄(63.8±4.6)岁,对照组平均年龄(63.8±4.7)岁。
所采集的外周血由Affymetrix 公司提取基因组DNA,抽取的血样置于EDTA 抗凝管,3 000 r/min离心10 min 后,分装成血浆、白细胞、红细胞,置-80 ℃低温冰箱保存。
本研究基于Axiom®2.0 Precision Medicine Research Array(PMRA 芯片)、生物信息学方法以及公用数据库全面系统挖掘胃癌差异表达的miRNA相关SNPs。
1.3.1 miRNA 自身多态性位点选择以SNP 芯片注释数据库为基础,筛选出所有miRNA 相关的SNPs 位点并进行卡方检验,选取病例组和对照组中表达差异有统计学意义(P<0.05)的位点。进一步将筛选出的miRNA SNPs 位点逐一在单核苷酸多态性数据库(dbSNP)(https://www.ncbi.nlm.nih.gov/snp/)查询对应位点是否明确注释为miRNA自身SNPs。
1.3.2 miRNA 靶基因多态性位点选择进入MirSNP数据门户主页(http://bioinfo.bjmu.edu.cn/mirsnp/download/),选择“MirSNPInTarget.txt”,将含有miRNA靶基因SNPs的数据汇总,与芯片数据取交集,最后选取其中病例组和对照组中表达差异有统计学意义(P<0.05)的位点。
1.3.3 miRNA 合成通路基因多态性位点选择针对miRNA 合成通路涉及的11 个主要基因(DROSHA、DGCRB、XPOS、RAN、DICER、TRBP、AGO1、AGO2、GEMIN3、GEMIN4、HIWI),利用dbSNP数据库选取这些基因功能性SNPs,纳入位点条件如下:①编码区SNP(同义突变的SNP 和错义突变SNP)和调控区域SNP(5′侧翼区、5′UTR 和 3′UT);②中国人群最小等位基因频率(minor allele frequency,MAF)在 0.05~0.45 之间。与芯片数据取交集,并根据在病例组和对照组中表达是否有差异,筛选出差异具有统计学意义(P<0.05)的SNPs。
1.3.4 二次筛选将上述筛检出的miRNA 自身SNPs、 miRNA 靶 序 列 SNPs 及 miRNA 合 成 通 路 相 关SNPs再结合文献报道和生物信息学分析,进一步筛选与胃癌关系最密切的miRNA-SNPs,筛选条件为:①根据dbSNP 数据库查找各SNPs 位点在中国人群中的MAF,选择MAF 范围在0.15~0.40 之间的位点;②结合PubMed 网站筛选与消化道肿瘤相关的位点,并根据功能性单核苷酸多态性数据库(F-SNP)网站筛选有相应功能的位点。
将筛选得到的11 个SNPs 位点进行基因分型,使用 Sequenom 公 司 Genotyping Tools 及 MassARRAY Assay Design 软件设计待测SNP 位点的PCR 扩增引物及单碱基延伸引物。通过基质辅助激光解吸附电离飞行时间质谱分析质谱技术(MALDI-TOF-MS),检测延伸产物相对分子质量,应用专用的分析软件,通过判断分子大小的差异而进行SNP的基因分型检测。
采用统一编制的调查表,由经过培训并且考察合格的当地医生对胃癌患者或(和)家属解释调查目的,取得病人家属的同意后,进行面对面的访谈式调查。调查内容主要包括患者的病情和治疗情况,如病理类型、大体分型、TNM分期、治疗措施等;生活质量情况,如吸烟、喝酒、饮茶、睡眠、康复锻炼等;饮食习惯,如饮食量、次数、饮食结构、使用腌制食品等。如患者已死亡,则由家属配合调查。
基因型的检测与判读采用盲法。现场流行病学调查通过统一培训调查员、制作调查员手册、严格审核调查员;资料整理通过复核、双录入、逻辑纠错、一致性检验、随访复查、数据分层分析、调整等方式来控制混杂因素对研究结果的影响。此外,本研究的患者病例资料来自医院病案室存档信息,由医院病理科主任协助判定病理结果。
采用统计学软件SPSS 24.0 进行统计学分析,利用寿命表法得出同一多态性位点不同基因型第1、3、5 年的生存率,通过Kaplan-Meier 法取得同一位点不同基因型患者的中位生存时间(中位生存时间),logrank 检测法主要用于对比两个或多个基因模型对胃癌预后的影响,单因素和多因素COX回归分析用于计算风险比(hazard rate,HR)及其95%置信区间(95%confidence intervals,95%CI)以及调整混杂因素。联合分层分析时,将胃癌患者按照年龄和TNM分期进行分层再进一步进行生存分析。基因联合作用分析时,按照患者携带的不良基因型数量进行分组后再进行分析。所有结果的P值选用双侧检验,统计学检验水准α均设定为0.05。
芯片注释数据库中共包括47 960 个与miRNA 相关的SNPs位点,病例组和对照组中有差异的miRNASNPs有1 104个,最后经dbSNP查询后注释为miRNA自身 SNPs 有 12 个。MirSNP 数据库共包含 234 573 个miRNA靶序列SNPs,与芯片中的位点取交集,得到芯片中涉及miRNA靶序列SNPs共4 089个,最终筛选出病例组和对照组中99 个差异性表达的miRNA 靶基因SNPs。根据dbSNP数据库检索人类基因组中miRNA生物合成通路相关基因SNPs共142个,与芯片中的位点取交集,得到芯片中涉及miRNA 生物合成通路相关SNPs共10个,最后筛选出1个病例组与对照组有统计学差异的位点。
上 述 筛 检 到 的 12 个 miRNA 自 身 SNPs、 99 个miRNA 靶序列 SNPs 以及 1 个 miRNA 生物合成通路基因相关SNPs,进一步结合文献报道和生物信息学分析,最终筛选得到11 个miRNA 及其相关基因的SNPs位点(见表 1)。
本次研究共发出问卷401 份,其中因家迁往外地调查困难、拒绝调查者49例,剔除不完整、不合格的问卷8 份,最终纳入本研究的共344 人。其中,男性患者共253 例,女性患者为91 例,年龄36~96 岁,第1、3、5 年生存率分别为73.47%、45.71%、39.67%,中位生存时间为30.73 月。对胃癌患者的一般情况与预后的相关性进行生存分析检验,结果见表2,表明胃癌患者的年龄、TNM分期、手术与否均与胃癌预后相关(P<0.05)。
2.3.1 单因素分析单因素分析结果见表3、4。等位基因模型统计分析结果显示,携带miR-1297 多态性位点rs9536676的A突变基因的胃癌患者相对于携带野生型基因G的患者生存率较低(P<0.05)。隐性模型统计分析结果显示,MSH2的多态性位点rs17502941 基因型为GG 的胃癌患者比基因型为AA/AG 的患者生存率降低(P<0.05),其他位点对应基因型的生存率差异均无统计学意义。
表2 胃癌患者的一般情况与预后关系
2.3.2 多因素分析将上述有统计学意义的位点纳入到多变量逐步COX回归分析中,步进概率按照进入标准为0.05,除去标准为0.10,结果显示,是否手术、TNM 分期、rs17502941 AA/AG 均是影响胃癌预后的独立因素,其中,rs17502941隐性模型中的突变型GG相较于AA/AG 而言为影响胃癌预后的独立危险因素(P<0.05,见表5)。
表1 SNP芯片结合生物信息学分析筛选出的miRNA及其相关基因SNPs
表3 miR-1297的多态性位点rs9536676与胃癌预后的相关性
表4 MSH2的多态性位点rs17502941与胃癌预后的相关性
2.3.3 miRNA 及其相关基因的各多态性位点与胃癌预后的分层分析按年龄TNM分期联合分层后:共显性模型统计分析结果显示,miR-1297 的多态性位点rs9536676 基因型AG 对>65 岁的晚期胃癌患者是危险因素;miR-379 的多态性位点rs7143252 CG/GG 基因型对≤65 的晚期胃癌患者是保护因素;miRNA-519b的多态性位点rs10413288 GT/GG基因型对≤65岁的晚期胃癌患者是保护因素;FAS的多态性位点rs1468063 CT基因型对≤65岁的晚期胃癌患者是危险因素。显性模型统计分析结果显示,miR-1297 的多态性位点rs9536676 AG/AA 基因型对>65 岁的晚期胃癌患者是危险因素;miR-379 的多态性位点rs7143252 CG/GG基因型对≤65的晚期胃癌患者是保护因素;miR-519b的多态性位点rs10413288 GT/GG基因型对≤65岁的晚期胃癌患者是保护因素;FAS的多态性位点rs1468063 CT/TT基因型对≤65岁的晚期胃癌患者是危险因素。隐性模型统计分析结果显示,miRNA-519b 的多态性位点rs10413288 GG 基因型对≤65 岁的晚期胃癌患者是危险因素,而对>65 岁的晚期胃癌患者是保护因素。其余多态性位点均无明显差异,详见表6~10。
表5 胃癌患者生存的逐步COX回归分析
2.3.4 基因联合作用根据以上分析,多态性位点rs9536676(AA/AG)、 rs7143252(CC)、 rs10413288(AA)、rs17502941(GG)、rs10277413(TT)、rs1468063(CC)为导致胃癌预后较差的基因型。为进一步探知SNPs之间可能的交互作用,构建新变量,具体见表11,结果显示 同 时 携 带 rs9536676 和 rs10413288、 rs9536676 和rs17502941、rs10413288 和 rs17502941 不良基因型的胃癌患者胃癌预后不良的风险大(P<0.05),其余基因多态性位点均无明显联合作用。
表6 miR-1297的多态性位点rs9536676与胃癌预后的分层分析
表7 miR-379的多态性位点rs7143252与胃癌预后的分层分析
表8 miRNA-519b的多态性位点rs10413288与胃癌预后的分层分析
表9 EGFR基因的多态性位点rs10277413与胃癌预后的分层分析
表10 FAS基因的多态性位点rs1468063与胃癌预后的分层分析
miRNA 的SNPs 可以通过调节Pri-miRNA 转录、影响Pri-miRNA 到Pre-miRNA 的加工、成熟进而导致miRNA的异常表达。当miRNA靶序列相关的基因出现变异,也可能使得miRNA 与靶基因mRNA 配对出错,继而使原本受调控的靶mRNA 失去结合能力,或原本不受调控的mRNA 成为新的结合靶点,最终作用于疾病的形成和发展进程。本研究发现了6个miRNA 相关SNPs 与胃癌预后相关,即miR-1297 的多态性位点rs9536676、miR-379 的多态性位点rs7143252、miR-519b 的多态性位点rs10413288、MSH2基因的多态性位点rs17502941、EGFR基因的多态性位点rs10277413、FAS的多态性位点rs1468063。
miR-1297是近些年来发现的可抑制肿瘤的一种关键调控因素,其在胃癌组织中表达明显下降,其表达异常影响AEG-1、PTEN、Meg3等基因进而影响肿瘤细胞的增殖、侵袭作用[9-10]。miR-379 位于14q32.31,是多种肿瘤的抑制基因,其主要是通过靶向IGF-1R介导的AKT和ERK途径或者作用于TCF来抑制癌细胞的增殖、浸润、侵袭和转移[11-12],也可借助于靶向FAK/AKT 信号抑制胃癌转移和上皮间充质转移[13]。miRNA-519b可作为抑癌因子,通过翻译后抑制COX-2等调控因子表达而使细胞周期被阻滞在G2/M期,从而抑制细胞生长,阻碍肿瘤进展[14]。
MSH2 是最重要的错配修复蛋白,其相关基因对基因组保持稳定起着至关重要的作用,错配修复功能正常的胃癌患者肿瘤细胞分化程度高,不易出现淋巴转移[15]。本研究发现其多态性位点rs17502941 突变基因型AA/AG均是影响胃癌预后的危险因素,可能是当其发生突变,可使得基因的表达产物——错配修复蛋白的表达量下降,DNA复制过程中的错误率增加,从而导致一些因癌症而错乱的基因无法得到及时的修复,可直接导致胃癌患者的生存时间减少[16]。
EGFR 即表皮生长因子受体,其相关基因在胃癌组织中表达增高,可以帮助肿瘤细胞逃离凋亡并促进其增殖,还与肿瘤微血管生成有关[17]。本研究发现其多态性位点rs10277413 突变基因型GT/GG 对≤65 岁的晚期胃癌患者是保护因素,可能是当其突变后,阻断下游信号级联的激活,使癌细胞增殖和分化进程减缓,肿瘤细胞程序性死亡的量增多[18]。
FAS 是一种表达于细胞表面可诱发凋亡的蛋白,属于死亡受体家族,与其配体结合可传递细胞死亡信号,诱导细胞凋亡[19]。本研究发现其多态性位点rs1468063 CT/TT基因型对≤65岁的晚期胃癌患者是危险因素,可能是因为其基因多态性导致FAS相关因子表达异常,阻碍了转录因子结合而使基因无法表达,此时,FAS 表达减少或增加,都可导致细胞增殖与凋亡平衡打破,从而促进肿瘤的进程,改变肿瘤的侵袭、远处转移程度[20]。
本研究发现了6个miRNA相关SNPs与胃癌预后的关系,也发现了胃癌病人两个miRNA 相关SNPs 同时存在不利于预后的基因型。但基因多态性存在着种族、地区差异,基因检测过程中的检测技术、检测方法的不同,也可能造成检测结果的不同,故还需要在大样本、多中心研究中进一步验证。