吐尔逊阿依·买买提 张 秦 郑 宏 (新疆医科大学第一附属医院麻醉科,乌鲁木齐 830054)
过敏性疾病是多基因遗传和多环境因素相互影响的结果[1-3]。根据最新的世界过敏组织的报告:过敏性疾病在全球的高发病率和高死亡率给健康预算带来了巨大的负担。阐明过敏性疾病的发病机制,和提出有针对性、有效的治疗方案是迫切需要解决的问题。2001 年公布人类基因组序列草图后,更多的目光聚焦在个体之间的基因组变异上,大量关于过敏性疾病易感基因的研究陆续展开。用于发现过敏基因的各种手段随着时间的推移而演变,各种基因分型技术提供的数据越来越多,成本越来越低。当我们开始采用21 世纪的新技术如下一代全基因组测序技术,基因的发现将不再局限于基因分型技术,而是依赖计算机和生物信息处理系统,解释这些庞大的数据成了新的需要解决的问题。这一节我们将回顾性地总结这些研究策略。
候选基因法就是将感兴趣的基因定为候选基因,选择候选基因中的多态性标记,然后比较多态性标记的基因型在病例组和合适的对照人群中的频率分布差异,从而找出与疾病表型相关的基因变异。1990 年以来,在不同民族中用候选基因法进行了过敏性疾病的相关研究,大量候选基因的启动区和编码区的单核苷酸多态性已证实与过敏相关疾病的表型有关(见表1)。候选基因的选择是基于大量的证据资料,比如所掌握的生物学功能、发现的疾病的差异性表达、与别的疾病共同的表型、或来源于动物模型和相关的组织等。这种方法是假设驱动的,且结果很容易解释,多态位点选择简单,找到的候选基因有生物合理性,并且展示了对感兴趣疾病有意义的功能序列、总费用低、易于实施。缺点是限制已知或未知的可能参与疾病的基因,从而减少了发现新的可能影响疾病的基因的机会。并且缺乏统计支持和结果重复性差,基因多态性覆盖率不足等。其中,结果重复困难受多因素的影响,主要与不好的研究设计、研究人群样本量小,缺乏足够的对照组人群,群体分层、筛查所选取多态性标记不同,遗传异质性、不同种族间的连锁不平衡模式、研究队列间的不同环境暴露以及统计学分析的自限性等因素有关。
定位克隆的方法是一个假说独立的、依靠对疾病遗传家系的研究分析,最先用于家族调查研究。为找到与研究疾病相关的表型,标记物随机分布在整个基因组。如果发现特定标记物与表型之间存在关联,则进一步分型的遗传标记物将辅助更准确地定义关键区域的致病基因。从此之后,被定位在此区域的基因可以用来检测是否参与某种疾病发病过程及治病基因突变的出现。如果基因组中所有的基因都用这种方法检测,这种方法就被称作定位克隆或基因扫描。虽然这种方法不需要假设某种基因与疾病的易感性有关,但它需要大量的分子遗传研究,需要大量的时间和精力。不像许多候选基因的研究,通过定位克隆技术鉴定的易感基因,在一般情况下,在随后的研究中更容易被重复,尽管定位克隆的基因也可能被证明有时难以复制。
许多过敏性疾病和过敏性疾病易感基因的全基因组扫描已经完成。过敏和过敏性疾病易感基因的全基因组画面的结果反映了遗传和环境异质性,已观察到的基因组的多个区域与不同的表型有关,在相似或不同人群中的可重复性较差。这说明鉴定复杂性疾病易感基因的难度很大。不同的基因位点将说明不同的种族和不同环境中的人群之间的联系。在复杂疾病的研究中,真正的挑战不是确定有关的区域而是对所观察到的有关区域中相关基因和遗传变异的精确识别。过敏性疾病表型的连锁分析是缓慢和昂贵的,大多数研究已经证明,尽管收集几百个家庭样本,找出并证明复杂疾病的易感基因是非常困难的,不够让人信服。一项有关哮喘连锁分析的Mata 分析表明:气道高反应性、过敏原皮肤点刺试验阳性、血清总IgE 水平的易感基因位点,没有一致的统计学上的显著的易感基因位点与哮喘的表型有关,说明了结果的异质性。
迄今为止,通过定位克隆策略的全基因组扫描已认定过敏性疾病表型的几个易感基因,包括与哮喘有关的整合素和金属蛋白酶33 (ADAM33)[4],几丁质酶3 样蛋白-1 (CHI3L1)[5],二肽基肽酶(DPP10)[6],主要组织相容性复合物(MHC),HLAG[7],PHD 锌指蛋白-11(PHF11)[8],前列腺素D2 受体(PTGDR)[9],血纤维蛋白溶酶原激活剂,尿激酶受体(PLUAR)[10];与气管高反应性(BHR)有关的PCDH1[11];与特应性皮炎有关的COL29A1 基因[12]。详见表2。
表1 通过候选基因研究确定的可以复制的基因Tab.1 Well-replicated loci identified through candidate-gene studies
表2 通过定位克隆技术确定的可以复制的基因Tab.2 Loci identified through linkage studies and positional cloning
全基因组关联研究是新近出现的筛查复杂性疾病易感基因的有力工具。近些年来,基于SNP 基因分型技术的应用,革新了复杂疾病的遗传基础研究。使得我们有机会识别巨大数量的SNP,以及通过基因组水平的连锁不平衡,识别了不同种族人群的遗传特征。全基因组关联研究(GWAS 研究)现在已经彻底改变了复杂的常见疾病遗传因素的研究模式。自2005 年Science 杂志报道了首个与年龄有关的视网膜黄斑变性GWAS,随后相继报道了从生理测量如常见的疾病身高和身体质量指数到生物测量如循环血脂水平和血液中嗜酸性粒细胞水平等超过150 个表型,GWAS 为人类基因组的不同位点提供了数百个强有力的、有意义的统计关联[17]。全基因组假设独立的关联研究不像连锁定位克隆法,不需要收集大型家庭为基础的样品和其表型;GWAS 可以分析人类基因组的所有基因,不受候选基因的限制。
最近的GWAS 研究已令人信服地检测到大量的过敏性疾病相关的基因位点,在过敏性疾病的研究中取得了很大的成功。第一个用GWAS 发现的哮喘易感基因位点是在染色体17q12-21.1 上的ORM1-like3 和Gasdermin like(GSDML)基因[18]。一项大规模哮喘的GWAS 研究,收集了10 365 个病例和16 110 个对照,确定了6 个易感基因位点IL1RL1 IL18R1,HLA-DQ,IL33,SMAD3,ORMDL3,GSDMB IL2RB[19]。IL1RL1 的配体是IL-33,这已被证明在Th2 细胞相关的疾病模型中有重要的作用[20]。IL-33 被认为是重要的宿主防御线虫的细胞因子,通过IL-33 受体诱导Th2 细胞产生,也是一个关键的诱导和激活固有淋巴细胞的细胞因子。这些研究结果意味着,参与IL-33 通路的遗传因素在人类支气管哮喘的病理生理机制中发挥了重要作用。
过敏性疾病的中间表型,如IgE 水平,皮肤点刺试验的反应,或连续测量肺功能措施对基因关联研究有更强大的统计学意义。最近的一个全基因组关联研究应用于过敏中间表型的例子是研究冰岛人口血液中嗜酸性粒细胞计数;这项研究表明,基因的序列变异影响嗜酸性粒细胞数,包括白细胞介素1 受体样1 (IL1RL1),WD 重复结构域36 (WDR36),白细胞介素33(IL33),和v-myb 基因的成髓细胞瘤病毒癌基因同系物(MYB),与哮喘和心肌梗死有关[21]。已经提议将IL1RL1 作为湿疹和哮喘的候选基因。GWAS 的方法同样被应用到识别变种调节血清IgE 水平,这项研究确定在染色体1q23 的编码IgE (FCER1A)的高亲和力受体基因的功能变异与血清IgE 水平及过敏致敏有关。以及证实了以前的候选基因研究结果,即信号转导和转录激活因子6(STAT6)基因有关变异调节了总IgE 水平和过敏。
最新用GEWASs 方法发现了哮喘伴花粉过敏的11 个易感基因:HLA-DQB 16p21、TLR14 p14、WDR36 5q22、IL1RL1 2q12、LRRC32 11q13、GSDMA 17q21、TSLP 5q22、IL33 9p24、ZBTB10 8q21、SMAD3 15q22、CLEC16A 16p13[22]。
若想最大限度地发现有影响力的等位基因,可以将GWASs 的结果做成荟萃分析。2011 年报道了种族多元化的北美人群中研究哮喘的荟萃分析,确定了5 个易感基因位点。其中4 个位点,分别是17q21、IL1RL1 附近、TSLP 和IL33,已经有报道,新发现了非洲裔人特有哮喘易感基因PYHIN1[23]。大规模的全基因组荟萃分析发现有过敏性鼻炎和过敏草相关的几个基因位点[24]。在C11orf30 和LRRC32 附近的染色体11q13.5 发现与表型相关,且在全基因组中有意义。LRRC32 是控制人类调节性T 细胞FOXP3 的关键受体,它与免疫耐受有关[25]。11q13.5 区域已经报道是过敏性皮炎和哮喘的易感基因位点[26]。此荟萃分析发现,HLA 区域也与草过敏有关联,且在全基因组水平上有意义。
在过去的五年里全基因组关联研究在基因相关研究中占主导地位,然而测序研究将引领未来五年的发展方向。测序研究目前正在火热进行中,因高通量,大规模并行测序技术的形成而得到快速发展。这项研究的基本原理是:这些罕见的变异与普通的变异相比,对疾病风险影响更大,是解释常见疾病的遗传风险的一个重要部分。有趣的是,理论模型在十年前就建议低频等位基因的多态位点与一个或更多的可能的常见等位基因相比更有助于常见疾病的风险[27]。这种等位基因的异质性不能被运用传统的统计方法的关联研究所发现,包括全基因组关联研究。此外,正如上面提到的,最常用的基因分型平台几乎专门用于普通的变异。相反,检测该罕见的变异需要重新测序基因,外显子,甚至扫描整个大样本中的每个个体的基因组,去发现变异标记基因分型平台没有检测到的罕见的变异。目前正在进行的研究在重新测序成百上千个个体的基因组,比较病例组和对照组来发现罕见变异。然而,显而易见的是,测序基因组或外显的成本下降的很快,这项技术可能在不久的将来取代SNP 分型技术。相比之下,对存储、分析、解释序列数据的需求大,要求高。生物信息学和计算机领域的发展没有跟上这些数据的生成。
表3 各种方法比较Tab.3 Comparison of different methods
使以上研究揭示了过敏性疾病易感基因的位点,提供了新见解,但对过敏性疾病的遗传机制发现的少之又少,相关的变异对疾病整个发病过程起的作用较小。遗传缺失的潜在来源包括稀有变异,拷贝数变异,表观遗传效应,基因-基因相互作用和基因与环境的相互作用[28]。近日,免疫芯片已经发展到进行主要自身免疫性疾病和炎症性疾病的深层复制,对GWAS 研究已确定的位点进行了精细定位[29]。免疫芯片是采用Infinium 技术的Illumina SNP 基因分型芯片,含有从千人基因组计划和其他可用特定疾病的重测序数据中选择的196 524 多态性自定义的高密度阵列[29,30]。该免疫芯片手段可能会提高我们对过敏性疾病的认识,但是,免疫芯片并不覆盖整个基因组,专为欧洲白人使用。因此,它在应用于亚洲人群时受到了限制。
GWASs 研究发现的易感位点上的候选基因提示上皮屏障功能、固有适应性免疫、IL-1 家族信号,调节性T 细胞和维生素D 通道在过敏性疾病病理生理中的重要作用。在免疫学中已证实所有免疫系统中细胞的分子成分在免疫反应中的作用不容忽视。构造一个模仿人类生理学的动物模型,GWAS研究的结果将有助于突出参与人类过敏性疾病的基因。
过敏性疾病是由多种基因变异和多环境因素相互作用而引起的。先前的许多遗传研究已经使用定位克隆和候选基因关联研究,以及最近应用的全基因组关联研究发现了许多与过敏性疾病相关的基因及其位点,但上述三种方法始终没有解决结果重复性差、结果难以解释和很难就此下结论等问题,而且还有许多过敏性疾病的遗传特性未被发现,详见表3。在未来几年内,高通量测序将成为研究过敏性疾病易感基因的新热点,这种方法将使庞大的新信息涌入,以及处理大量数据时将遇到更新的问题。目前面临的挑战是找到更好的发现易感基因的方法,降低成本,精确地找到过敏性疾病的易感基因,阐明相关的变化对基因调控和功能的影响。
[1]Vercelli D.Discovering susceptibility genes for asthma and allergy[J].Nat Rev Immunol,2008,8:169-182.
[2]Ober C,Hoffjan S.Asthma genetics,2006:the long and winding road to gene dis-covery[J].Genes Immune,2006,7:95-100.
[3]Cardon LR,Bell JI.Association study designs for complex disease[J].Nat Rev Genet,2001,2:91-99.
[4]Van Eerdewegh P,Little RD,Dupuis J,et al.Association of the ADAM33 gene with asthma and bronchial hyperresponsive-ness[J].Nature,2002,418:426-430.
[5]Ober C,Tan Z,Sun Y,et al.Effect of variation in CHI3L1 on serum YKL-40 level,risk of asthma,and lung function[J].N Engl J Med,2008,358:1682-1691.
[6]Allen M,Heinzmann A,Noguchi E,et al.Positional cloning of a novel gene influencing asthma from chromosome 2q14[J].Nat Genet,2003,35:258-263.
[7]Nicolae D,Cox NJ,Lester LA,et al.Fine map-ping and positional candidate studies identify HLA-G as an asthma susceptibility gene on chromosome 6p21[J].Am J Hum Genet,2005,76:349-357.
[8]Zhang Y,Leaves NI,Anderson GG,et al.Positional cloning of a quantitative trait locus on chromosome 13q14 that influences immunoglobulin E levels and asthma[J].Nat Genet,2003,34:181-186.
[9]Oguma T,Palmer LJ,Birben E,et al.Role of prosta-noid DP receptor variants in susceptibility to asthma[J].N Engl J Med,2004,351:1752-1763.
[10]Barton SJ,Koppelman GH,Vonk JM,et al.PLAUR polymorphisms are associated with asthma,PLAUR levels,and lung function decline[J].Allergy Clin Immunol,2009,123:1391-1400,e17.
[11]Koppelman GH,Meyers DA,Howard TD,et al.Identification of PCDH1 as a novel susceptibility gene for bronchial hy-perresponsiveness[J].Respir Crit Care Med,2009,180:929-935.
[12]Soderhall C,Marenholz I,Kerscher T,et al.Variants in a novel epidermal collagen gene(COL29A1)are associated with atopic dermatitis[J].PLoS Biol,2007,5:e242.
[13]Laitinen T,Polvi A,Rydman P,et al.Characterization of a common susceptibility locus for asthma-related traits[J].Science,2004,304(5668):300-304.
[14]Noguchi E,Yokouchi Y,Zhang J,et al.Positional identification of an asthma susceptibility gene on human chromosome 5q33[J].Respir Crit Care Med,2005,172(2):183-188.
[15]Balaci L,Spada MC,Olla N,et al.IRAK-M is involved in the pathogenesis of early-onset persistent asthma[J].Am J Hum Genet,2007,80(6):1103-1114.
[16]Sderhll C,Marenholz I,Kerscher T,et al.Variants in a novel epider-mal collagen gene(COL29A1)are associated with atopic dermatitis[J].PLoS Biol,2007,5(9):e242.
[17]White JH,Chiano M,Wigglesworth M,et al,Identification of a novel asthma susceptibility gene on chromosome 1qter and its functional evaluation[J].Hum Mol Genet,2008,17 (13):1890-1903.
[18]Moffatt MF,Kabesch M,Liang L,et al.Genetic variants regulating ORMDL3 expression contribute to the risk of childhood asthma[J].Nature,2007,448:470-473.
[19]Moffatt MF,Gut IG,Demenais F,et al.A large-scale,consortiumbased genome wide association study of asthma[J].N Engl J Med,2010,363 :1211-1221.
[20]Liew FY,Pitman NI,McInnes IB.Disease-associated functions of IL-33:the new kid in the IL-1 family[J].Nat Rev Immunol,2010,10:103-110.
[21]Gudbjartsson DF,Bjornsdottir US,Halapi E,et al.Sequence variants affecting eosinophil numbers associate with asthma and myocardial infarction[J].Nat Genet,2009,41:342-347.
[22]Ferreira MAR,Matheson MC,Tang CS,et al.Genome-wide association analysis identifies 11 risk variants associated with the asthma with hay fever phenotype[J].Allergy Clin Immunol,2013.pii:S0091-6749(13):1643-1646.
[23]Torgerson DG,Ampleford EJ,Chiu GY,et al.Meta-analysis of genome-wide association studies of asthma in ethnically diverse North American populations[J].Nat Genet,2011,43:887-892.
[24]Ramasamy A,Curjuric I,Coin LJ,et al.A genome-wide meta-analysis of genetic variants associated with allergic rhinitis and grass sensitization and their interaction with birth order[J].Allergy Clin Immunol,2011,128:996-1005.
[25]Probst-Kepper M,Geffers R,Krger A.GARP:a key receptor controlling FOXP3 in human regulatory T cells[J].Cell Mol Med,2009,13:3343-3357.
[26]Ferreira MA,Matheson MC,Duffy DL,et al.Identification of IL6R and chromosome 11q13.5 as risk loci for asthma[J].Lancet,2011,378:1006-1014.
[27]Pritchard JK.Are rare variants responsible for susceptibility to complex diseases?[J].Am J Hum Genet,2001,69:124-137.
[28]Trynka G,Hunt KA,Bockett NA,et al.Dense genotyping identifies and localizes multiple common and rare variant association signals in celiac disease[J].Nat Genet,2011,43:1193-1201.
[29]Cortes A,Brown MA.Promise and pitfalls of the Immunochip[J].Arthritis Res Ther,2011,13:101.
[30]Durbin RM,Abecasis GR,et al.A map of human genome variation from population-scale sequencing[J].Nature,2010,467:1061-1073.