冠心病基因组学方法研究进展

2017-04-06 17:12李玫曾志羽
山东医药 2017年1期
关键词:家系外显子连锁

李玫,曾志羽

(广西医科大学第一附属医院,南宁530021)

·综述·

冠心病基因组学方法研究进展

李玫,曾志羽

(广西医科大学第一附属医院,南宁530021)

冠心病(CHD)是导致全球人群死亡和致残的首要原因之一,其遗传发病机制一直备受关注。CHD遗传发病机制的基因组学研究常用方法分为连锁分析、关联分析、全基因组外显子测序三种。连锁分析能发现部分CHD的致病基因,但精确定位性差,与CHD相关研究较少。关联分析,特别是全基因组关联分析可弥补连锁分析的不足,在CHD基因组学研究方面取得了突破性进展,但也存在研究样本量大、遗传度丢失等缺点。全基因组外显子测序具有高通量、高精度、低成本的优点,是研究CHD遗传发病机制的一种较好方法。

冠状动脉疾病;遗传发病机制;连锁分析;关联分析;全基因组外显子测序

目前大量研究证明,冠心病(CHD)是由遗传因素和环境因素共同作用引起的一种多基因复杂疾病[1],其中遗传因素作用占40%~60%[2]。因此从遗传学角度来研究CHD有助于在分子水平探究其发病机制,使其做到早期诊断及个体化基因治疗。长期以来,国内外学者大多应用连锁分析及关联分析两种方法研究CHD相关的基因突变位点。近年来,随着基因组学研究技术的快速发展,推动了一个新的研究方法——全基因组外显子测序(WES)。目前该方法在单基因疾病和肿瘤的研究中已取得巨大的突破,但是对CHD的研究相对较少。现就这三种基因组学方法在CHD的研究进展进行综述。

1 CHD基因连锁分析及关联分析

以往CHD基因组学研究方法大多是通过遗传标记定位寻找与其相关的基因突变位点,采用限制性片段长度多态性或短串联重复序列标记的连锁分析以及单核苷酸多态性(SNP)标记的关联分析,利用PCR和第一代Sanger测序等技术对该染色体区域进行分析或定位克隆。

1.1 连锁分析 连锁分析主要以家系和同胞对为研究对象,通过遗传标记对其进行基因分型,计算遗传标记和性状基因之间的重组率,估算两者的连锁程度和遗传距离,将候选基因定位到染色体某一区间内的位置。连锁分析包括参数连锁分析和非参数连锁分析两种分析方法,参数连锁分析主要以遗传模式确定的大家系为研究对象;非参数连锁分析对多基因疾病的研究有一定优势,主要以同胞对及数百个小的核心家系为研究对象。现连锁分析已成功定位了部分CHD致病基因,如15q26染色体上的MEF2A基因[3]、12q13染色体上的LRP-6基因[4]和13q12-13染色体上的ALOX5AP基因[5]等,但因该方法的局限性,导致仅有少数基因位点在其他研究中得到了重复验证。该方法的局限性有如下几点:第一,该方法因对致病性高,数量少的遗传变异比较敏感,所以对诊断明确、遗传与表型一致的单基因疾病更有效,对复杂性疾病仅提供参考性意见;第二,研究对象主要是目前在世的几代人,而基因重组在几代人中发生的概率较小,所以得到的基因定位区域往往很大,这导致所得结果相对准确、假阳性小,但精细定位较困难;第三,该方法操作繁琐且耗时长使得发现致病基因的效率降低。

1.2 关联分析 关联分析是以散发人群为研究对象,通过比较病例组和对照组等位基因频率之间的差异寻找与疾病相关的基因位点,可用于多基因复杂疾病研究。该方法根据其扫描对象的不同,分为候选基因关联分析和全基因组关联分析(GWAS)。目前使用较多的是GWAS,它是通过一种高通量基因分型技术检测成百上千的SNP,比较病例组和对照组SNP频率之间的差异,筛选出与疾病性状相关联的基因位点。与候选基因相比,GWAS是在全基因组范围内寻找与疾病相关的基因位点,所以不需事先做出假设和筛选出已知的“候选基因”;同时,它具有样本量大、重复性好、可多中心研究且一次性可对上万个SNP进行检测等优点,因此GWAS在人类遗传疾病研究得到了广泛应用。

到目前为止,GWAS在CHD遗传学方面取得了丰富的成果,共发现了59个易感基因位点[6]。2007年,WTCCC通过GWAS首次在欧洲人群中发现了与CHD显著关联的易感基因位点——9p21区域[7]。同年,GerMI协作组通过两阶段的GWAS研究发现了6个新的遗传位点[8]。随后3年,MIGen[9]、心电图协会[10]和CHD遗传协会[11]等协作组分别通过对大型数据整合,一共发现了23个新的基因位点。2012年,Lu等[12]在3.3万余例CHD对照样本中,成功地鉴定出4个全新的基因位点。2013年,欧洲人群进行了更大规模的数据整合,新发现了15个新的CHD遗传位点[13]。2015年,Nikpay等[14]在18.5万病例对照样本中通过Meta分析,发现了10个新的基因位点。

尽管GWAS在CHD研究中取得了突破性的进展,但目前仍存在许多困难和限制。第一,因GWAS在第一阶段研究获得阳性结果后,还需进行多中心的独立样本验证,所以需要大量的样本研究才能获得较准确的结果,这将耗费大量的人力和财力,普通的实验室难以承担;第二,种族差异性使结果难以在不同人群的研究中得到重复验证,导致结果易产生假阳性和假阴性;第三,目前发现的CHD易感基因,只能解释小部分的疾病遗传度,未能解释的遗传变异被称之为遗传度丢失。随着易感位点的最小等位基因频率(MAF)逐渐下降,GWAS需要一定的样本量才能达到足够检验效能,所以GWAS鉴定的基因突变位点多为常见变异(MAF>0.05),而对于检测低频变异(MAF<0.05)、罕见变异(MAF<0.01)和其他结构的变异较差。

2 CHD的WES

2.1 WES的特点 WES是由传统外显子捕获技术和新一代高通量测序联合形成的一种测序方法。由于WES只对外显子进行测序,而外显子包含蛋白质合成所需要的绝大部分信息,虽只占人类基因组约1%,但大约85%的疾病致病突变都位于该区域,因此与全基因组测序相比,WES具有成本低和效率高的优势。同时,WES也弥补了因GWAS研究得到的基因突变多位于基因间或内含子上,很少位于编码区的缺陷。另外,WES还具有高通量、高精度等优点,且对常见变异和罕见变异有高敏感性,能发现外显子绝大部分与疾病相关的变异,尤其是那些基因芯片平台中不涵盖的稀有和低频变异,因此WES既能用于单基因遗传疾病的研究,也能用于多基因变异引起的常见疾病,以揭示这些疾病的遗传致病机理。因该技术在疾病研究领域的广泛应用和突出贡献,在2010年被《Science》评为年度十大科技突破之一。

2.2 WES的基本流程和原理 WES基本流程包括外显子序列的富集、高通量测序及数据的生物信息学分析,最后鉴定出相关基因突变位点。外显子序列的富集包括捕获和扩增两个步骤。目前,常用的捕获方法是杂交法,分为固相杂交或液相杂交,液相杂交因成本低、操作简单,且具有良好的特异性和均一性被采用得更多,现常用的外显子捕获平台有:Nimble Gen和Agilent Sure Select序列富集系统。富集的主要流程是:先碎片化DNA并在碎片末端连接上接头,然后与外显子芯片上的引物进行杂交,杂交后洗去未结合的背景和洗脱杂交的DNA片段,再对富集的DNA片段进行PCR扩增,最后得到目标区域的富集序列文库,经检验合格后进行高通量测序。

DNA测序技术已被广泛应用于生物学研究的各个领域。新一代高通量测序是一种边合成边测序技术,利用循环芯片测序法对布满 DNA样品的芯片进行PCR扩增以及荧光反应来读取序列。目前,常用的测序技术平台有:454基因组测序仪、Illumina测序仪、和SOLID测序。高通量测序的具体流程:利用特定平台在基因组DNA碎片的两侧连上接头,产生几百万个PCR单克隆阵列,所有单克隆同时、独立地进行引物杂交和荧光标记的延伸反应,捕捉荧光标记信号,并经特殊软件处理,获取DNA序列数据。

经过高通量测序产生的庞大原始数据,需要进行数据分析。数据分析主要包括图像信息数据分析以及生物信息学分析。图像信息数据分析是通过特殊的软件对原始数据进行处理,将其转换为序列数据。然后利用生物信息学分析对序列数据进行过滤、评估以及检验其测序深度和覆盖度,筛选出合格序列,再进行序列对比、检测及注释SNP、短小的插入或缺失。经数据分析得到的绝大部分结果为背景变异,不具有致病性,需要研究者采用各种方法综合分析得到最后结果。

2.3 WES在CHD的应用 近年来,WES广泛应用于单基因疾病和多基因疾病的研究,有研究表明,对于复杂疾病而言,散发病例的易感基因多来源于频发的突变或新的突变,而家系的易感基因则大多为可遗传突变[15]。因此WES对多基因复杂性疾病,可通过家系样本进行探究,找出致病基因。CHD有明显的家族聚集性,家族史是其发病的一个重要危险因素,且独立于其他危险因素存在[16]。因此可通过家系研究来寻找其基因突变位点。

迄今,已有多个家系研究利用WES寻找到了CHD的基因突变位点。Erdmann等[17]通过对一个有32例CHD患者的大家系研究发现了GUCY1A3和CCT7两个杂合突变,研究者首先对该家系进行了微卫星连锁分析,但未发现与心肌梗死疾病有关联的染色体区域,然后在家族中筛选出3例有远亲关系的患者进行WES,在两个功能性相关的基因中发现了这两个杂合突变位点,后经过一系列的实验对两个突变位点进行功能性分析,最后得出两个基因突变位点协同作用引起了心肌梗死。InanlooRahatloo等[18]通过对伊朗一个大家系的研究中发现了致病基因ST6GALNAC5,他们首先通过连锁分析得到了三个与候选基因相关联的染色体区域,然后通过对12例家系成员进行了外显子测序,发现了ST6GALNAC5基因突变位点,接下来分别在伊朗160例患者和800例对照组及美国150例患者和800例对照组进行该位点测序验证,最后得到突变位点为引起CHD的一个致病位点。Xu等[19]在一个四代皆有CHD患者的汉族家系中验证了一个EFM2A突变,首先研究者通过对该家系的3例患者进行外显子测序,发现了该突变位点,然后利用Sanger测序在7例患者的11号外显子上发现了一个6bp碱基的缺失,接着在311例早发冠心病患者和323例未患病者进行了验证,没有发现该突变位点,但结合之前相关的研究,研究者认为该位点对冠心病的发生仍具有重要意义。Xie等[20]在一个早发心梗家系中发现了RECQL5基因突变位点,通过对家系中10例成员进行外显子测序,其中4例是CHD患者,在13号染色体上发现了该突变位点,接着利用RT-PCR技术验证由于12号外显子的缺失导致了CHD的发生。

2.4 WES的局限性 目前,WES在研究人类遗传疾病上取得了一定成功,但是该技术也有一定的局限性,主要存在以下问题。首先,WES缺少了对非编码区变异和结构变异的研究,虽然大部分的致病基因位于外显子,但仍有小部分位于非编码区或由结构变异引起,所以有可能会导致致病基因的遗漏;其次,该技术因存在捕获不均、捕获偏差等现象,导致不能完全地捕获变异的外显子序列,现人类通过增加测序深度,获得更多的序列信息进行统计分析,以尽可能的弥补这些偏差;最后,该技术的成本较之前降低了很多,但是在研究复杂疾病的罕见突变时,仍需要庞大的样本量及高额的测序费用。

随着基因组学技术的蓬勃发展,研究基因组的技术手段也日新月异。连锁分析虽然发现了部分CHD致病基因,但因其精确定位性差等局限性,导致与CHD相关研究并不多;关联分析的出现弥补了连锁分析的不足,特别是GWAS,因其各方面的优势,在CHD基因组学方面取得了突破性进展,但也因其样本量大、遗传度丢失等缺点,使得CHD的研究处于“瓶颈期”;WES的出现提供了一个转机,WES具有高通量、高精度、低成本的优点,是一种很好的研究CHD的方法。目前CHD通过GWAS研究在散发人群中已取得了突破性进展,但关于家系的研究仍旧较少,而WES的研究对象既可以是散发人群也可以是家系,因此可以以家系作为研究对象寻找CHD的基因突变位点,现已有研究通过此方法发现了与CHD相关的基因突变位点,证明此方法是可行的。经上述三种方法研究,CHD在基因组学方面取得了一定的成就,但它们都有各自局限性,因此在今后的研究中,需要继续完善各个基因组研究方法,为了解CHD发病机制和实现个体化治疗提供新的见解。

[1] 陈伟伟,高润霖,刘力生,等.《中国心血管病报告2015》概要[J].中国循环杂志,2016,31( 6):521-528.

[2] McPherson R,Tybjaerg-Hansen A.Genetics of coronary artery disease[J].Circ Res,2016,118(4):564-578.

[3] Wang L,Fan C,Topol SE,et al.Mutation of MEF2A in an inherited disorder with features of coronary artery disease[J].Science,2003,302(5650):1578-1581.

[4] Mani A,Radhakrishnan J,Wang H,et al.LRP6 mutation in a family with early coronary disease and metabolic risk factors[J].Science,2007,315(5816):1278-1282.

[5] Helgadottir A,Manolescu A,Thorleifsson G,et al.The gene encoding 5-lipoxygenase activating protein confers risk of myocardial infarction and stroke[J].Nat Genet,2004,36(3):233-239.

[6] Nurnberg ST,Zhang H,Hand NJ,et al.From loci to biology:functional genomics of genome-wide association for coronary disease[J].Circ Res,2016,118(4):586-606.

[7] Wellcome Trust Case Control C.Genome-wide association study of 14,000 cases of seven common diseases and 3,000 shared controls[J].Nature,2007,447(7145):661-678.

[8] Samani NJ,Erdmann J,Hall AS,et al.Genomewide association analysis of coronary artery disease[J].N Engl J Med,2007,357(5):443-453.

[9] Myocardial Infarction Genetics C,Kathiresan S,Voight BF,et al.Genome-wide association of early-onset myocardial infarction with single nucleotide polymorphisms and copy number variants[J].Nat Genet,2009,41(3):334-341.

[10] Schunkert H,Konig IR,Kathiresan S,et al.Large-scale association analysis identifies 13 new susceptibility loci for coronary artery disease[J].Nat Genet,2011,43(4):333-338.

[11] Coronary Artery Disease Genetics C.A genome-wide association study in Europeans and South Asians identifies five new loci for coronary artery disease[J].Nat Genet,2011,43(4):339-344.

[12] Lu X,Wang L,Chen S,et al.Genome-wide association study in Han Chinese identifies four new susceptibility loci for coronary artery disease[J].Nat Genet,2012,44(8):890-894.

[13] Consortium CA,Deloukas P,Kanoni S,et al.Large-scale association analysis identifies new risk loci for coronary artery disease[J].Nat Genet,2013,45(1):25-33.

[14] Nikpay M,Goel A,Won HH,et al.A comprehensive 1,000 genomes-based genome-wide association meta-analysis of coronary artery disease[J].Nat Genet,2015,47(10):1121-1130.

[15] Sebat J,Lakshmi B,Malhotra D,et al.Strong association of de novo copy number mutations with autism[J].Science,2007,316(5823):445-449.

[16] Kim C,Chang HJ,Cho I,et al.Impact of family history on the presentation and clinical outcomes of coronary heart disease:data from the Korea acute myocardial infarction registry[J].Korean J Intern Med,2013,28(5):547-556.

[17] Erdmann J,Stark K,Esslinger UB,et al.Dysfunctional nitric oxide signalling increases risk of myocardial infarction[J].Nature,2013,504(7480):432-436.

[18] InanlooRahatloo K,Parsa AF,Huse K,et al.Mutation in ST6GALNAC5 identified in family with coronary artery disease[J].Sci Rep,2014,4:3595.

[19] Xu DL,Tian HL,Cai WL,et al.Novel 6-bp deletion in MEF2A linked to premature coronary artery disease in a large Chinese family[J].Mol Med Rep,2016,14(1):649-654.

[20] Xie X,Zheng YY,Adi D,et al.Exome sequencing in a family identifies RECQL5 mutation resulting in early myocardial infarction[J].Medicine (Baltimore),2016,95(5):e2737.

10.3969/j.issn.1002-266X.2017.01.036

R541.1

A

1002-266X(2017)01-0099-04

2016-09-05)

猜你喜欢
家系外显子连锁
外显子跳跃模式中组蛋白修饰的组合模式分析
外显子组测序助力产前诊断胎儿骨骼发育不良
专注零售连锁空间打造
外显子组测序助力产前诊断胎儿骨骼发育不良
库里受伤的连锁效应
布拉格Burrito Loco连锁快餐店
马氏珠母贝红色闭壳肌F1代的家系选育及家系评定
一个非综合征型聋家系的分子病因学研究
肝豆状核变性2个家系的基因突变分析
有壹手——重新定义快修连锁