刘 剑 综述 陈 楠 审校
·基础医学·
新一代测序技术在局灶节段性肾小球硬化遗传学研究中的应用
刘 剑 综述 陈 楠 审校
局灶节段性肾小球硬化(FSGS)是我国常见的肾小球疾病之一。近年来,新一代测序技术的出现和发展已广泛应用于基因突变检测、SNP测定和连锁分析,其具有高通量、费用相对低等优势,是研究FSGS遗传学发病机制的良好方法,并为临床遗传学诊断提供了有利的依据。本文对新一代测序技术在家族性FSGS中的研究进展及前景进行综述。
局灶节段性肾小球硬化 测序技术 遗传
遗传变异是影响肾脏疾病发生和进展的重要因素。全基因组连锁分析和全基因组关联分析(GWAS)分别为定位符合经典孟德尔遗传规律的单基因遗传病和复杂性疾病的经典遗传学方法,在过去数十年间其为探索人类疾病遗传机制做出重大贡献。但这些方法尚存在一定局限性,比如连锁分析费时费力,对家系规模要求较高,且受到多种因素影响(如渗透率、表型差异等)。而GWAS代价昂贵,需要大量样本,且往往不能直接定位致病变异。随着高通量二代测序技术(NGS)的出现、发展及成本降低,全外显子测序(WES)、全基因组测序(WGS)、候选基因测序(Gene Panel Sequencing)和目的区域测序(Targeted Sequencing)已经成为遗传学研究的重要工具之一。本文对NGS技术及其在家族性局灶节段性肾小球硬化(FFSGS)中的应用进行综述。
概述 NGS也称为二代测序,高通量测序或新一代测序,指利用序列捕获技术将全基因组或部分基因组DNA捕捉并富集后进行高通量测序的基因组分析方法,可同时对几十万到几百万条短序列进行测序,是一种研究基因组的编码序列的高效策略。NGS在遗传学研究领域的应用主要包括全外显子测序、全基因组测序、候选基因测序及目的区域测序。
基于探针杂交捕获测序原理,NGS过程一般包括捕获、建库、测序及分析步骤。首先应用超声或雾化方法将基因组DNA断裂为250 bp小片段,并与接头连接,进行PCR扩增,制备文库。而后与覆盖全外显子探针进行杂交,未杂交的DNA洗去。杂交的DNA进行高通量测序。高通量测序结果需经过序列组装、比对、SNP标记等过程,一般未处理过的一次测序结果可发现2~5万变异,这些变异需经过一系列筛选,如去除可能为假阳性的变异(每个候选变异至少有5个reads,若为纯合变异需为80%,杂合变异为20%),去除非编码区变异和同义变异,经过初步筛选,可以初步候选5 000个左右变异。其后,将发现的变异与已知单核苷酸多态性库进行比对(如dbSNP),去除非致病变异,对筛选到的候选致病变异可应用sanger测序、sequenom质谱方法、openarray等方法验证[1]。
目前为止,WES是二代测序技术在人类遗传学研究的主要应用之一,WES相对于WGS成本较低,对研究已知基因的SNP、插入缺失突变具有较大的优势。人类外显子序列占全基因组的1%,约30Mb,而以往发现并且经功能研究证实的人类致病突变(孟德尔遗传疾病)大多数位于蛋白蛋白编码区域(85%)。有文献报道,当测序深度为10X时,其发现杂合突变的概率为78.6%,而当深度为20X时概率为95.2%,30X时几乎100%[1]。因此,全外显子测序对于遗传相关性疾病,尤其是孟德尔遗传疾病有一定的优势。
2004年,大规模并行DNA测序技术的引入后,NGS的逐渐应用于遗传学研究。WES最早应用于Miller综合征,在三个家系中解释了DHODH突变导致疾病发生。2009年,Choi等[2]在肾脏疾病中应用Illumina测序平台对39例临床诊断为Bartter综合征的患者(排除NKCC2,ROMK,ClC-Kb和Barttin基因突变)进行全外显子测序,发现5例患者存在SLC26A3突变,最后诊断为Gitelman综合征,为外显子测序在科研和临床上的应用提供了可能性。随后,越来越多的WES技术应用于不同的疾病研究中,截止2012年WES已应用于100多种孟德尔遗传病研究中,其中56%为常染色体显性遗传,37%为常染色体隐性遗传[3]。
影响因素 测序结果受许多因素影响,比如DNA文库构建试剂盒、测序平台。现在应用于WES的外显子捕获试剂盒包括NimbleGen(SeqCap EZ ExomeLibray)、Agilent(Sure Select)、Illumina(TruSeq和NexteraRapidCpatureExomekit)等,不同的建库试剂盒有不同的特性,如SeqCap EZ ExomeLibray对高GC含量的区域有较好地效果,Sure Select对插入缺失突变效果较好。而现有测序平台包括罗氏公司的454基因组测序仪、美国Illumina公司和英国Solexa technology公司开发的Illumina测序仪、美国Applied biosystems公司的SOLID测序仪。尽管大部分建库试剂盒能覆盖50~62 Mb基因,但是有研究显示,SeqCap EZ ExomeLibray V3、Sure Select V4以及Illumina试剂盒建库测序后仅26.2Mb是相互重叠的[4]。
基本策略 WES或WGS在单基因遗传疾病已有较好地应用,对不同遗传方式的家系有不同的策略,包括连锁分析、Homozygosity策略、Double-hit策略、Overlap策略、候选基因策略、de novo策略等。全外显子测序连锁分析适用于家系成员表型较为明确的较大的遗传家系,Homozygosity策略对近亲结婚的小家系较为适用,double-hit策略对隐性遗传的家系较为有效,overlap策略适用于显性遗传的家系[5]。尽管如此,多种策略联合分析亦较为常见。候选区域多与连锁分析联合应用,进行后续的基因精确定位研究。对于已知候选基因的测序研究可采用候选基因测序的方法更为有针对性和节约成本,更适合于临床诊断。
优缺点 相对于传统Sanger测试技术,NGS具有一定的优势:(1)相对成本低。把成本从 0.01美元/bp降低至0.000 1美元/bp甚至更低;(2)高度并行化。可同时检测多至几千万个 DNA 序列;(3)通量高且速度快。一次测序产生的数据量达几~几十Gb,且仅需1周时间,测序结果敏感性达99%,特异性达98%;(4)相对样本需要量小。以WES为例,仅需1~6 μg即可完成全外显子的测序工作,而传统的Sanger测序10 ng仅能完成1 000 bp测序工作。
WES可发现常见变异和频率<5%低频突变,只对基因组的约1%测序,更加经济、高效,在相同预算情况下,可提供更高深度测序。
尽管WGS也为二代测序的重要应用,并且能检测全基因组水平变异。但相较于WES,其价格更高、测序深度不够,虽然能获得更多地变异,但其获得的一大部分变异位于非编码区,且对后期的庞大数据量计算机分析及验证提出了更高的要求。因此,基于现阶段技术和分析能力,WES是更有便于利用的手段。但近来有研究显示在同样的测序深度下,WGS对蛋白编码区的测序结果优于WES[6-7]。因此,随着计算机技术和存储技术的发展,WGS是NGS应用的未来方向。
尽管NGS是一种应用较为广泛的手段,但是也存在不足。首先,由于测序reads较短,所以对重复区域的变异识别能力较弱。此外,测序深度不够、没有捕获的区域的变异容易出现假阴性;在隐性遗传疾病中对利用NGS测序对MAF<1%的变异比较容易比较出现假阴性;且由于NGS前期需经过扩增,因此其对高GC区域的变异识别能力较差。
尽管NGS已在多种肾脏疾病中广泛应用,包括肾小球肾炎、糖尿病肾病、儿童先天性肾脏和尿路畸形(CAKUT)[8]、肾单位肾痨及溶血尿毒综合征[9]等,但近来在FFSGS中的研究取得了较为有意义的成果。
FSGS是一类临床表现为大量蛋白尿和进展性肾功能衰竭,病理特征为局灶节段性肾小球硬化以及足突融合的疾病,分为FFSGS、继发性FSGS和特发性FSGS。以往通过Sanger测序或者连锁分析发现FFSGS致病基因,如ACTN4[10-11]、NPHS2、TRPC6[12-13]、INF2[14]等。随着NGS在FFSGS遗传学研究的开展, FFSGS新的致病基因陆续被发现。
新发现的已知致病基因的新突变 利用NGS在遗传性FSGS的研究发现了一部分已知致病基因的新突变,比如INF2和WT1等。INF2属成蛋白家族,为肌动蛋白的重要调控因子,维持骨架正常结构和功能。早在2010年Brown等[15]在一个较大的FSGS家系中Affymetrix 250K SNP芯片和微卫星方法定位到14q32区域,并首次验证出INF2突变导致家族性FSGS的重要原因,本课题组也通过对一个较大家系进行连锁分析并通过Sanger测序方法和体外功能研究发现INF2 S85W突变导致FFSGS发生[14]。近来,Park等[16]对一个腓肠肌萎缩伴FSGS家系的先证者进行WES,发现INF2的新突变。WT1编码wilm’瘤抑癌基因,参与泌尿生殖系发育,早在1999年即有学者应用候选基因Sanger测序方法发现Fansier综合征和Denys-Drash综合征伴有FSGS改变,存在WT1突变[17]。近来Hall等[18]在一个FSGS家系中应用连锁分析联合WES的方法发现WT1的第三锌指区新的致病突变。
新发现的FFSGS致病基因 NGS研究不仅发现了已知致病基因的新突变,同时也发现了一系列导致FFSGS的新的致病基因。Gbadegesin等[19]应用全基因组连锁分析对一个AD FSGS家系进行分析,定位到2p、5p和7p,联合应用WES和足细胞相关的候选基因测序的方法,发现6个变异,其中ANLN R431C存在于7p,且与疾病存在共分离现象,首次发现actin结合蛋白的基因突变导致FSGS的发生。Esposito等[20]对一个FSGS伴心脏传导阻滞的XR家系进行连锁分析定位于X染色体21.19 cM,其后对2例患者进行外显子测序策略,首次发现NXF5-R113W突变导致FFSGS。Barua等[21]对1个较小的常染色体显性遗传家系的2位患者进行外显子测序,结合功能和蛋白定位分析,发现基因PODXL p.L442R突变,影响其编码蛋白Podocalyxin跨膜区域,但其功能尚需进一步阐述。
最近的NGS研究也发现了一些已知导致其他疾病的基因突变也可引起FSGS,如PAX2、TTC21B、LMX1B、Col4A3等。既往认为COL4A3基因突变主要导致Alport综合征,本课题组通过对40个FSGS家系、50例散发性FSGS和190例正常人进行外显子组测序和Sanger测序[22],在5个家系(12.5%)中发现杂合COL4A3突变与疾病共分离,此外在1例散发患者(2%)中亦发现该基因突变,绝大部分突变均位于Ⅳ型胶原功能域的高度保守区域,这些患者均无明显肾外表现,皮肤及肾组织Ⅳ型胶原染色正常,电镜下可见GBM局部节段性变薄,未见分层、网篮样改变或弥漫变薄等改变。同时,Duke大学报道在70个FFSGS家系中发现7个家系(10%)携带COL4A3或COL4A4杂合突变[23]。PAX2突变既往认为主要与CAKUT相关,而Martin R. Pollak课题组对一个显性遗传的FSGS家系进行外显子测序,发现PAX2与成人起病的FSGS相关[24],将PAX2突变的研究从CAKUT研究延伸到FSGS疾病中。TTC21B主要与肾单位肾痨相关,而Huynh Cong等[25]对2个较小的隐性遗传近亲家系中应用纯合子定位方法mapping到2号染色体,随后应用对2个家系中进行外显子测序,首次发现TTC21B p.P209L突变导致FSGS和间质损伤,TTC21B编码蛋白细胞纤毛内转运蛋白139(Intraflagellar Transport 139,IFT139),功能学研究其可能与微管功能相关,该研究首次报道了纤毛相关基因突变参与FSGS发病过程。LMX1B突变最初在1998年认为与指甲髌骨综合征相关,最近Boyer等[26]在不伴有肾外表现的常染色体显性遗传的迟发型FSGS家系中发现LMX1B突变,且这些突变多位于LIM 区域和homeo结构域。Colin等[27]应用连锁分析联合外显子测序在表现为小头和肾病综合征的Galloway-Mowat综合征家系中检测出WDR73基因突变,而WDR73蛋白主要分布于人的头和肾脏等,且2个家系肾穿刺为FSGS,同时功能学研究显示确实足细胞WDR73基因突变后结构和功能出现异常,进一步证实WDR73突变可以引起Galloway-Mowat综合征。
儿童起病FFSGS 在儿童起病的FFSGS中,外显子测序也发现了一些重要的突变基因。有研究显示病理表现为FSGS的SRNS家系进行纯合子定位,并应用外显子测序,发现CRB2和KANK4基因突变均会引起SRNS发生[28-29]。
NGS是一门飞速发展的新技术。虽然该技术存在其本身的缺陷,但是在对遗传性疾病的研究中,不同的研究策略联合应用对新的突变基因的发现有很大的帮助。在FFSGS中,现仅发现一部分致病基因,仅21%左右的FSGS可由已知致病基因解释,大量未知致病基因亟待发现。而在散发FSGS患者中,尽管鲜有研究利用NGS探索散发性FSGS的遗传学发病机制,但由于NGS发现低频变异(MAF<5%)和罕见变异(MAF<1%)能力强,而这些变异具有生物学功能的可能性更大,弥补了传统GWAS研究多发现常见变异(MAF>5%)的缺陷。不仅如此,NGS是GWAS精定位的重要方法之一。因此,在以后散发性的FSGS研究中, NGS联合GWAS将对散发患者的遗传学研究具有重要的意义。
在临床检测应用中,NGS技术可对患者潜在遗传风险进行全方位评估,从而进行早期预防、早期诊断和早期个性化干预。而与WGS相比,由于候选基因测序和WES成本相对较低,其在开展临床诊断和推广精准医学具有重要意义。
1 Goldstein DB,Allen A,Keebler J,et al.Sequencing studies in human genetics: design and interpretation.Nat Rev Genet,2013,14(7):460-470.
2 Choi M,Scholl UI,Ji W,et al.Genetic diagnosis by whole exome capture and massively parallel DNA sequencing.Proc Natl Acad Sci U S A,2009,106(45):19096-19101.
3 Rabbani B,Mahdieh N,Hosomichi K,et al.Next-generation sequencing: impact of exome sequencing in characterizing Mendelian disorders.J Hum Genet,2012,57(10):621-632.
4 Warr A,Robert C,Hume D,et al.Exome Sequencing: Current and Future Perspectives.G3 (Bethesda),2015,5(8):1543-1550.
5 Gilissen C,Hoischen A,Brunner HG,et al.Disease gene identification strategies for exome sequencing.Eur J Hum Genet,2012,20(5):490-497.
6 Lelieveld SH,Spielmann M,Mundlos S,et al.Comparison of Exome and Genome Sequencing Technologies for the Complete Capture of Protein-Coding Regions.Hum Mutat,2015,36(8):815-822.
7 Belkadi A,Bolze A,Itan Y,et alWhole-genome sequencing is more powerful than whole-exome sequencing for detecting exome variants.Proc Natl Acad Sci U S A,2015,112(17):5473-5478.
8 Hwang DY,Kohl S,Fan X,et al.Mutations of the SLIT2-ROBO2 pathway genes SLIT2 and SRGAP1 confer risk for congenital anomalies of the kidney and urinary tract.Hum Genet,2015,134(8):905-916.
9 Lemaire M,Frémeaux-Bacchi V,Schaefer F,et al.Recessive mutations in DGKE cause atypical hemolytic-uremic syndrome.Nat Genet,2013,45(5):531-536.
10 Dai S,Wang Z,Pan X,et al.ACTN4 gene mutations and single nucleotide polymorphisms in idiopathic focal segmental glomerulosclerosis.Nephron Clin Pract,2009,111(2):c87-c94.
11 Dai S,Wang Z,Pan X,et al.Functional analysis of promoter mutations in the ACTN4 and SYNPO genes in focal segmental glomerulosclerosis.Nephrol Dial Transplant,2010,25(3):824-835.
12 Zhang Q,Ma J,Xie J,et al.Screening of ACTN4 and TRPC6 mutations in a Chinese cohort of patients with adult-onset familial focal segmental glomerulosclerosis.Contrib Nephrol,2013,181:91-100.
13 Zhu B,Chen N,Wang ZH,et al.Identification and functional analysis of a novel TRPC6 mutation associated with late onset familial focal segmental glomerulosclerosis in Chinese patients.Mutat Res,2009,664(1-2):84-90.
14 Xie J,Hao X,Azeloglu EU,et al.Novel mutations in the inverted formin 2 gene of Chinese families contribute to focal segmental glomerulosclerosis.Kidney Int,2015,88(3):593-604.
15 Brown EJ,Schlöndorff JS,Becker DJ,et al.Mutations in the formin gene INF2 cause focal segmental glomerulosclerosis.Nat Genet,2010,42(1):72-76.
16 Park HJ,Kim HJ,Hong YB,et al.A novel INF2 mutation in a Korean family with autosomal dominant intermediate Charcot-Marie-Tooth disease and focal segmental glomerulosclerosis.J Peripher Nerv Syst,2014,19(2):175-179.
17 Denamur E,Bocquet N,Mougenot B,et al.Mother-to-child transmitted WT1 splice-site mutation is responsible for distinct glomerular diseases.J Am Soc Nephrol,1999,10(10):2219-2223.
18 Hall G,Gbadegesin RA,Lavin P,et al.A novel missense mutation of Wilms' Tumor 1 causes autosomal dominant FSGS.J Am Soc Nephrol,2015,26(4):831-843.
19 Gbadegesin RA,Hall G,Adeyemo A,et al.Mutations in the gene that encodes the F-actin binding protein anillin cause FSGS.J Am Soc Nephrol,2014,25(9):1991-2002.
20 Esposito T,Lea RA,Maher BH,et al.Unique X-linked familial FSGS with co-segregating heart block disorder is associated with a mutation in the NXF5 gene.Hum Mol Genet,2013,22(18):3654-3666.
21 Barua M,Shieh E,Schlondorff J,et al.Exome sequencing and in vitro studies identified podocalyxin as a candidate gene for focal and segmental glomerulosclerosis.Kidney Int,2014,85(1):124-133.
22 Xie J,Wu X,Ren H,et al.COL4A3 mutations cause focal segmental glomerulosclerosis.J Mol Cell Biol,2014,6(6):498-505.
23 Malone AF,Phelan PJ,Hall G,et al.Rare hereditary COL4A3/COL4A4 variants may be mistaken for familial focal segmental glomerulosclerosis.Kidney Int,2014,86(6):1253-1259.
24 Barua M,Stellacci E,Stella L,et al.Mutations in PAX2 associate with adult-onset FSGS.J Am Soc Nephrol,2014,25(9):1942-1953.
25 Huynh Cong E,Bizet AA,Boyer O,et al.A homozygous missense mutation in the ciliary gene TTC21B causes familial FSGS.J Am Soc Nephrol,2014,,25(11):2435-2443.
26 Boyer O,Woerner S,Yang F,et al.LMX1B mutations cause hereditary FSGS without extrarenal involvement.J Am Soc Nephrol,2013,24(8):1216-1222.
27 Colin E,Huynh Cong E,Mollet G,et al.Loss-of-function mutations in WDR73 are responsible for microcephaly and steroid-resistant nephrotic syndrome: Galloway-Mowat syndrome.Am J Hum Genet,2014,95(6):637-648.
28 Ebarasi L,Ashraf S,Bierzynska A,et al.Defects of CRB2 cause steroid-resistant nephrotic syndrome.Am J Hum Genet,2015,96(1):153-161.
29 Gee HY,Zhang F,Ashraf S,et al.KANK deficiency leads to podocyte dysfunction and nephrotic syndrome.J Clin Invest,2015,125(6):2375-2384.
(本文编辑 加 则)
Applications of new generation sequencing in the genetic study of focal segmental glomerulosclerosis
LIUJian,CHENNan
DepartmentofNephrology,RuijinHospital,ShanghaiJiaotongUniversitySchoolofMedicine,NephrologyInstituteofShanghaiJiaotongUniversity,Shanghai200025,China
Focal segmental glomerulosclerosis is one of the most important glomerular diseases in China. In recent years, next-generation sequencing technologies have been improving as high-throughput and cost-effective approaches to detect gene mutation, SNP and do linkage analysis. And it has become a good tool to fulfill medical diagnosis and research demands for familial focal segmental glomerulosclerosis. In this review, we describe the development of next-generation sequencing in genetic research of familial focal segmental glomerulosclerosis and discuss the implementation of this novel technology in identified new causal genes.
focal segmental glomerulosclerosis next generation sequencing genetic
10.3969/cndt.j.issn.1006-298X.2016.03.012
国家重点基础研究发展计划(2012CB517604),国家自然科学基金(81570598),上海交通大学医学院博士创新基金(BXJ201409)
上海交通大学医学院附属瑞金医院肾脏科;上海交通大学医学院附属肾脏病研究所(上海,200025)
2015-10-10