林佳辉,闫露露,解敏,王飞,李海波,陈怡博
(1.宁波大学医学院,浙江宁波 315000;2.宁波市杭州湾医院儿科,浙江宁波 315000;3.宁波市妇女儿童医院 a.出生缺陷综合防治重点实验室,b.检验科,浙江宁波315000)
支气管哮喘(bronchial asthma,简称哮喘)是一种遗传和环境因素相互作用导致的多基因遗传病[1],临床症状为喘息、咳嗽、胸闷、呼吸困难。目前全球约有3.34亿人患有哮喘,且哮喘患病率持续上升[2]。研究估计,哮喘遗传度约为50%~90%,且儿童患病率高于成人[3]。从基因组角度考虑,疾病易感基因是指在适宜环境刺激下能够编码遗传性疾病或获得疾病易感性的基因[4]。通过易感基因相关基因频率和影响效应的情况,可将遗传疾病分为复杂遗传性疾病和孟德尔遗传病。常见的复杂疾病如高血压、糖尿病等均具有易感基因。本文就儿童哮喘相关易感基因发现的研究方法、近年来发现的主要易感基因、易感位点间交互作用及环境因素等作一综述,以期为儿童哮喘易感性的基因筛查提供依据。
1.1通过定位克隆发现哮喘易感基因 定位克隆法识别哮喘易感基因主要依靠对哮喘家系进行分析研究,该方法是选择在人类的基因组遗传图谱中大量遗传标记,对家系成员进行全基因组扫描,同时通过连锁分析方法将哮喘的有关基因位点定位到所选染色体区域内再进行精确定位,从而最终识别出哮喘相关易感基因。这些基因位点的基因型是在多个哮喘个体的家庭成员中鉴定的,各成员具有相似临床表现且共同遗传标记位点紧密连锁的区域,在理想状态下可鉴别相关基因或突变基因型。但定位克隆的染色体区域通常较大,也会因目标易感基因的重组等情况而造成定位失败。既往通过这种研究方法确定了8个哮喘易感基因:解整合素金属蛋白酶33(a disintegrin and metalloprotease 33,ADAM33)、二肽基肽酶10(dipeptidyl peptidase 10,DPP10)、PHD 锌指蛋白 11(PHD finger protein 11,PHF11)、哮喘相关G蛋白耦联受体(protein related receptor for asthma,GPRAG)、人白细胞抗原-G(human leucocyte antigen-G,HLA-G)、细胞质脆性X智力低下蛋白结合蛋白2(cytoplasmic FMR1-interacting protein 2,CYFIP2)、精氨酸/丝氨酸富集剪接因子8(splicing factor, arginine/serine-rich 8, SFRS8)和视蛋白基因 3(opsin 3,OPN3)[5-12]。其中ADAM33是第1个被发现的定位克隆的哮喘相关基因[13],并证实其序列变异与哮喘发生有关,同时与支气管高反应性、早期肺功能、整个生命周期的肺功能下降以及慢性阻塞性肺疾病等相关。
1.2通过候选基因关联分析发现哮喘易感基因 候选基因法是将有一定研究基础且感兴趣的基因作为候选基因,择其中的多态性标记,在哮喘病例组和对照组中比较多态性标记的基因型相关频率分布的差异,从而确定与疾病表型有关的基因。但这种研究方法只是在小的、低效能的队列中进行,因而也容易出现假阳性,许多结果不能在其他人群中重复。通过候选基因关联分析,尽管能发现是否存在遗传学的相关性,但也可能遗漏了能够代表疾病病理生物学的真正原因。目前涉及哮喘病因学的候选基因研究有100多个[14],其中只有不到10%的基因在超过10项研究中得到了重复。比较有研究前景的哮喘候选基因包括白细胞介素4(interleukin-4,IL-4)、白细胞介素13(interleukin-13,IL-13)、白介素4受体α链(interleukin 4 receptor alpha chain,IL-4RA)、β2肾上腺素能受体(beta2-adrenoreceptor,ADRB2)、高亲和力IgE受体β亚基(beta subunit of the high affinity IgE receptor,FCER1B)、肿瘤坏死因子A(tumor necrosis factor A,TNFA)、表面抗原基因白细胞分化抗原14(cluster of differentiation 14,CD14)以及组织相容性基因HLA-DRB1和HLA-DQB1。
1.3通过定位克隆与候选基因关联分析发现的价值性哮喘易感基因 Ober等[14]对上述两种方法所发现的哮喘或变应性疾病的易感基因进行检测,共分析118个有关基因,其认为重复在6个及以上独立样本的25个基因是具有价值的易感基因[14],包括:(1)重复>10个样本的基因:IL-13、IL-4RA、IL4、ADRB2、ADAM33、CD14、HLA-DQB1、FCER1B、TNF、HLA-DRB1;(2)重复6~10个样本的基因:CC16、TBXA2R、CCL5、TGFB1、NOS1、NOD1、GSTP1、STAT6、CTLA4、LTC4S、GSTM1、LTA、IL10、GRPA、SPINK5。
其研究还发现独立样本重复率最高的哮喘基因,主要包括IL-13、IL-4RA、IL4、ADRB2和FCER1等。其中IL-13、IL-4、ADRB2和FCER1B基因表达量的改变与IgE相关水平升高有关,而IgE介导的炎症反应是过敏性哮喘的重要环节。关于IL-13基因报道最多的氢核氨酸多态性(SNP)为2044A>G,其降低了IL-13和受体结合间亲和力,促使局部IL-13浓度增加,从而增强与受体结合后的信号转导,引起严重哮喘。IL-4RA基因中E375A和Q551R 2个SNP位点与IgE水平升高、肥大细胞增多有关,造成严重的哮喘恶化及肺功能降低[15]。IL-13与IL-4RA对血浆总IgE水平具有明显的协同影响,二者通过相同的信号转导途径,促使B细胞向合成IgE的途径转换,从而增加哮喘易感性[16]。ADRB2位于B细胞上,可在变应原进入体内后被刺激, 从而促使B细胞分泌IgE[17]。而FCER1中的组合部分β亚单位(FCER1B)在FCER1表达和信号转导过程中起到放大作用,促进肥大细胞和嗜碱性粒细胞活化,从而上调IgE介导的炎症反应。
1.4全基因组关联研究(genome wide association study,GWAS)发现哮喘易感基因 伴随人类基因组技术的发展,高通量基因分型平台使研究成本持续降低,GWAS等关键分析方法的发展使得基因组扫描更加密集。其可对整个基因组中成千上万的SNP进行同步分析,并且这些SNP通常是由独立的病例和对照样本确定的。这种方法的突出优点是在未知疾病的情况下可以检测出致病基因的影响,发现与疾病相关的新的易感基因及通路[18]。GWAS研究方法是将研究对象的DNA在lllumina系列芯片上进行基因分型,所发现的SNPs采用Plink系列软件如(v1.07)进行荟萃(meta)分析,然后采用EIGENSTRAT软件对潜在群体分层进行调查,并对顶级特征向量进行Logistic回归,得出OR值(odds ratio)和用于meta分析的标准误差。但是此方法通常需要较大的样本量及尽可能多的变量的覆盖率,从而有充足的统计能力以检测基因与疾病相关性是否显著。随着全球GWAS的广泛开展,目前已经发现约1 000个哮喘候选基因[19]。一项2007年的GWAS研究[20]发现,在不同的种族中,重复频率最高的哮喘基因簇位于染色体17q12-21上。一项大规模的研究进一步表明,该基因组区域是特定于儿童哮喘发病的原因,其变异能够调节多个基因的表达水平,包括血清类黏蛋白3(orosomucoid 3,ORMDL3)、抗原B(gasdermin B,GSDMB)和抗原A(gasdermin A,GSDMA)[21]。此外,在哮喘发展过程中,17q21位点的基因型与早期呼吸道感染有关[21],且17q21基因变异和早期生活环境中烟草烟雾暴露会增强早期呼吸道感染与早发哮喘和儿童哮喘之间的联系。另有研究发现[22-23],透明带结合蛋白2(ZPBP2)基因是儿童和成年哮喘的共同基因座,这一发现在多个位于ZPBP2和GSDMB基因内SNP及致病变异的研究中得到了证实[22-23]。另有学者通过对来自欧洲人群13 556名儿童和成人进行荟萃分析,发现位于ZPBP2启动子区域的1个SNP(rs11557467)与哮喘显著相关(T的等位基因OR为1.32,P=3.29×10-15)[22]。近年来通过GWAS方法新发现的一些主要与儿童哮喘候选基因及位点见表1。
表1 全基因组关联分析中发现的主要易感基因及位点[22-25]
1.5转录组学发现哮喘易感基因 除了基因组学,其他组学技术也是目前了解哮喘病理生理的重要手段。组学研究主要集中于各种生物来源数据,包括基因组修饰(表观基因组学)、基因组转录(转录组学)、蛋白质水平和化学修饰(蛋白质组学)、内源性和外源性代谢产物(代谢组学)和微生物组(宏基因组学)。与其他疾病相比,转录组学在哮喘中的应用尚处于起步阶段。转录组是所选活细胞中可能转录出的所有RNA的总和,用于研究细胞的表型和功能。转录组学提供定量和定性的表征或RNA转录本,可以提供或证实GWAS识别的哮喘基因位点的机制解释[18]。这些主要是侧重于比较特定控制条件下细胞或组织中的基因表达水平,以识别可能对研究中的疾病有(单独或联合)功能影响的差异表达基因。有学者运用转录组技术在2年内研究133名儿童哮喘患者和11个亚洲血统的健康人对照组外周血单个核细胞(peripheral blood mononuclear cell,PBMC)基因表达,结果发现PBMC基因表达谱有助于鉴别治疗控制不良的TH1/TH17介导的哮喘,且PBMC和CD8+T细胞可能是研究和鉴定重症哮喘的重要靶点[26],并认为外周血是儿童研究中最适合的样本[18,26]。结合完整的临床和组学数据有助于更好地解释哮喘病理生理学生物过程,并帮助定义哮喘亚型,改善对病情严重程度评判和治疗反应,显示出更高的预测能力。
哮喘是多基因病,发病机制复杂,随着研究深入,逐渐证实不同基因位点间存在交互作用,影响哮喘的发病几率。有学者通过追踪1 000例出生队列的研究,发现多个哮喘基因位点组合可预测哮喘的临床发病及临床表现等[27]。国内有学者在汉族儿童中选取报道重复率高的哮喘易感基因中的多个SNP进行研究,结果发现SNP越多,发病风险度增高,单个位点者风险度是无变异者的2倍,而含2个位点者危险度可增至约6倍,9个位点者患病风险甚至达16倍。其进一步研究发现,由IL-13(-1112C>T、+1923C>T、R110Q)、IL4(-590C>T)、ADRB2(R16G)、FCER1B(-109C>T、E237G)、IL-4RA(I75V、Q551R)组成的模型哮喘预测准确率达80%以上。优化所得IL-13(R110Q)、IL4(-590C>T)、ADRB2(R16G)和FCER1B(E237G)构成的4位点哮喘预测模型的准确度为80.00%[28]。国外有学者构建了由EOT2(+1272A>G、+304C>A)、EOT3(+77C>T、+716A>G、+1579G>A)组成的5位点预测模型,并证实其对韩国群众的哮喘易感预测准确性达64.3%[29]。尽管这些模型局限于所针对的目标人群,但它们在一定条件下提示多位点对哮喘发生风险具有一定的预测价值。
尽管基因对哮喘及其相关性状有重要作用,但多种环境暴露也同样影响哮喘的发生。在哮喘预测时,早期生活的暴露具有很高的关联,包括呼吸道感染、肠道和呼吸道微生物影响和烟草烟雾吸入等。人们已通过多种方式识别基因-环境存在相互作用。一项最新的GWAS研究分析了遗传变异与交通相关空气污染的相互作用,证实交通工具排放的二氧化氮会导致哮喘症状的恶化,并可能降低肺功能[30]。另一项欧洲儿童的GWAS研究发现,ADCY2、B4GALT5和DLG2基因与环境相互作用对哮喘的发生发展具有重要意义[31],婴儿出生时NO2暴露会显著影响这3个基因的表达,同时也增加NO2相关的外周血细胞表达水平,从而增加哮喘发作。
目前国内治疗哮喘最常用的药物主要是β2受体激动剂、吸入皮质类固醇(ICS)及白三烯调节剂。尽管大多数患者在使用药物治疗后哮喘症状缓解,但对于不同人群,哮喘的治疗效果有很大差异。研究显示易感基因也同时影响哮喘的治疗效果。因此,哮喘治疗药物反应性与相关基因位点关系的研究,可能更有助于在未来确定特定的药物遗传学特征,将为临床治疗患者带来更精准的治疗方案。有学者通过对患有哮喘的非洲裔美国儿童进行了支气管舒张反应的GWAS研究,发现染色体9q21上存在1个显著相关的SNP位点(rs73650726,P=7.69×10-9),且在非裔美国人和拉丁美洲人的跨种族研究中发现了另外3个SNP与支气管舒张反应显著相关的PRKG1基因的内含子(rs7903366、rs7070958、rs7081864,P=5×10-8),证实了支气管舒张反应的遗传基础可能在种族或民族之间存在差异[32]。也有研究者通过对接受吸入型糖皮质激素(inhaledcorticosteroids,ICS)治疗的哮喘患者的基因型分析,以确定ICS应答的遗传标记,但其并未得到明确结论[33]。目前药物遗传学仍然不能直接应用于预测哮喘患者治疗的临床结果。
目前越来越多的哮喘易感基因逐渐被发现、验证,基因组研究的工具日渐进步,显著提升我们对复杂疾病的认识。哮喘及其易感基因的发现、定位和遗传机制具有重要的科学及临床价值。哮喘受遗传及环境因素共同影响,在深入遗传因素本质的同时,澄清哮喘的相关环境影响也同样重要,从而能直接地识别和重现环境可塑的遗传效应。尽管目前我们对哮喘的相关遗传因素了解有限,药物遗传度还不能直接应用于遗传预测,但随着基因组医学技术的不断进步,对探究哮喘更深的遗传机理、通过基因层面预测哮喘进展和治疗反应带来了更大期待。总之,发现更多的哮喘易感基因及了解其交互作用,将为哮喘的临床预测及治疗带来更多可能。