张 莹,黄旭升,刘 丽,李 懋,张小兰,陈朝晖,凌 丽
·论著·
目标区序列捕获和第二代测序技术在Duchenne型肌营养不良基因诊断中的应用
张 莹,黄旭升,刘 丽,李 懋,张小兰,陈朝晖,凌 丽
目的 应用目标区序列捕获和第2代测序技术对Duchenne型肌营养不良患者进行基因检测,验证该方法的敏感度和特异度。方法 应用目标区序列捕获和第2代高通量测序技术对19例临床诊断为Duchenne型肌营养不良患者进行基因检测,用Sanger法对8个微小突变患者样本进行测序验证。结果 19例患者均发现遗传病因,大片段缺失11例,微小突变8例,经Sanger法测序验证。其中3个微小突变为首次发现的新突变。结论 目标区序列捕获和第2代测序技术可以1次检测DMD基因几乎全部的突变类型,极大地提高了检测效率,该方法敏感度高、特异性强,具有良好的临床应用前景。
肌营养不良,杜氏;基因检测; 第二代测序
Duchenne型肌营养不良(duchenne muscular dystrophy, DMD)是以骨骼肌进行性萎缩和腓肠肌假性肥大为主要临床特征的X连锁隐性遗传性疾病,是最常见的肌营养不良类型,发病率约占活产男婴的1/3500[1-2],其中约1/3为散发病例。女性大部分为携带者,通常不发病。DMD及其良性病程表现型Becker型肌营养不良的致病基因抗肌萎缩蛋白基因,位于Xp21.2,由79个外显子、78个内含子和8个启动子组成,全长2.5 Mb,约占人类全部染色体长度的千分之一,是已知人类基因组中最大的基因[3],因此具有较高的突变频率和多种多样的突变类型。在过去的几年中,多重PCR(mPCR)[4]、变性高效液相色谱法[5]、多重连接探针扩增技术[6]、微阵列比较基因组杂交技术[7]相继广泛应用,使得占突变类型约70%大片段缺失或重复可以检出,但是仍有约30%的微小突变无法诊断[5,8-12]。近年来,随着分子生物学技术的蓬勃发展,以目标区序列捕获和第2代测序技术为基础的新一代测序平台已然逐步建立,可以同时检测拷贝数个和单个碱基的突变,具有灵敏度高、特异性强、高通量和低成本等突出优势[13-18]。本文中我们进一步提高检测的覆盖区域,对DMD基因的外显子,内含子以及启动子上的所有序列(重复性区域除外),对目标区域总共约98%以上的非重复区域进行基因捕获和高通量测序分析,进一步探索目标区序列捕获和第2代高通量测序技术在DMD中的临床诊断价值,并探讨其基因型与临床表型之间的关系。
1.1 研究对象 选取自2013年12月—2014年12月在解放军总医院神经内科门诊就诊,临床诊断为DMD/BMD的19例男性患者,家族史阴性,父母均为非近亲结婚,所有患者均有运动发育落后,包括学步延迟、易跌倒和跑、跳、上楼困难,病情逐渐进展出现鸭步、典型Gower征、双侧腓肠肌假性肥大,不伴肌束颤动和感觉异常、血肌酸激酶水平显著增高,部分患者曾行肌电图检查提示肌源性损害、部分患者曾行肌肉活检,符合假肥大型肌营养不良改变。本研究获得解放军总医院伦理委员会批准,所有患者的监护人均签署知情同意书。
1.2 方法
1.2.1 目标区序列捕获及高通量测序:先将患者的外周血采用QIAamp血液提取试剂盒(Qiagen,德国)按照产品说明提取基因组DNA,取3 μg DNA经Covaris S2超声仪(Covaris,美国)将其随机打断, 打断样本片段约为150 bp,纯化后的DNA使用T4连接酶和T4碱性磷酸酶及Klenow片段进行末端修复,然后在片段两端加入A尾,通过接头连接形成标准的Solexa测序文库。文库经PCR扩增后,取3 μg DNA与迈基诺基因DMD基因捕获芯片进行杂交,洗脱的杂交文库质控合格后经HiSeq2000 PE100上机测序。用Sanger法对8个点突变患者样本进行测序验证。
1.2.2 生物信息学分析:测序数据经过质量控制后,使用BWA软件对数据进行比对,使用SOAPsnp和GATK软件分析样本突变信息。将得到的样本突变信息与人类基因突变数据库(HGMD)、外显子组测序项目数据库(ESP6500)、千人基因组数据库(1000g)及Mygeno本地人群数据库(Inhouse)进行关联分析。第1步:去掉同义突变,去掉在1000 g、ESP6500和Inhouse数据库中出现频率>1%的突变,HGMD数据库中明确报道过的突变位点在正常人(1000 g、ESP6500和Inhouse数据库)中的频率可以放宽到5%;第2步:对比HGMD数据库中与样本遗传疾病相关的突变热点,分析已报道位点的疾病临床症状与样本临床症状是否一致,如一致则可以考虑该突变为致病突变。第3步:筛选出氨基酸改变为stop gain、frame shift、splicing、stop loss等对蛋白功能影响比较大的突变位点。第4步:结合基因与疾病的关联信息和样本的临床信息,筛选了样本的致病基因突变。利用对DMD全基因组进行site plot作图的方法即对每个或每段位点的测序深度进行统计并作图,找出大片段扩增缺失。
19例患者首诊原因绝大多数为运动发育落后,个别患者(11例)为发现心肌酶增高,所有患者均发现DMD基因突变。8例发现点突变,包括微小插入2例,微小缺失1例、剪切位点突变1例,无义突变4例。其中3例为首次发现的新突变,分别为:例3 chrX31645855-31645856 c.7782dupT (p.A2595fs);例4 chrX32466668-32466669 c.3322delG (p.V1108X) ;例6 chrX31986458-31986459 c.2588dupA (p.K863fs),见表1、图1。所有的单碱基突变均经Sanger法验证,与第2代测序的结果一致。另外11例患者存在大片段缺失,见表2、图2。
表1 8例Duchenne型肌营养不良患者DMD基因点突变
注:DMD为Duchenne型肌营养不良;Mutation Taster预测为仅对未见文献报道的突变进行预测
DMD作为一种致死性遗传性疾病,是儿童期最常见的肌营养不良类型,以进行性加重的近端骨骼肌无力、萎缩,血清肌酶水平增高,腓肠肌假性肥大为主要临床特征。本研究中患者多以走路延迟、易摔倒为最早的临床表现,学会走路的平均年龄为16个月。患者病情进展迅速,先后出现跟腱挛缩,上肢带肌、颈前肌无力,12岁左右不能行走。
表2 11例Duchenne型肌营养不良患者 DMD基因大片段缺失
注:DMD为Duchenne型肌营养不良,BMD为Becker型肌营养不良症
B
C
图1 3例Duchenne型肌营养不良患者首次发现的新突变位点Sanger法测序图
A为例3(c.7782dupT);B为例4 (c.3322delG);C为6 (c.2588dupA)
A
B
C
D
E
F
G
H
I
J
图2 11例Duchenne型肌营养不良患者DMD基因大片段缺失
A为例9,45-47号外显子缺失;B为例10,8-49号外显子缺失;C为例11(51号外显子缺失);D为例12,14-44号外显子缺失;E为例13,48-50号外显子缺失;F为例14,49-52号外显子缺失;G为例15,45-47号外显子缺失;H为例16,3-30号外显子缺失;I为例17,38-43号外显子缺失;J为例18,45-48号外显子缺失;K为例19,45-47号外显子缺失
通过DMD基因序列捕获及第2代测序,19例患者均找到了遗传病因,11例(58%)为大片段缺失突变,8例(42%)为微小突变。例3的c.7782dupT (p.A2595fsC)突变为首次发现,重复的碱基T位于编码区第55号外显子内,导致移码突变,蛋白质的第2595位编码序列由GCC变成TGC,氨基酸由丙氨酸(Ala)变成半胱氨酸(Cys),并在第2595位之后的第5位密码子出现终止密码子TGA,表达只包含前面55个外显子的截短蛋白。例4的c.3322delG(p.Q1109fsR)突变为首次发现,为第27号外显子1个碱基的缺失导致移码突变,造成蛋白质的第1109位编码序列由CAG变成AGA,氨基酸由谷氨酰胺(Gin)变成精氨酸(Arg),并在此后的第2个密码子就出现终止密码子TAA,表达截短的抗肌萎缩蛋白,为致病性突变。例6的c.2588dupA(p.T864Nfs)也为微小插入突变,重复的碱基A位于编码区第17号外显子内,导致移码突变,蛋白质的第864位编码序列由ACA变成AAC,氨基酸由苏氨酸(Thr)变成天冬氨酸(Asn),并在氨基酸序列第864位之后的第3位密码子出现终止密码子TAA,表达只包含前面17个外显子的截短蛋白。以上3个突变在中国健康人群中没有发现,结合患儿病史、临床表现及血清CK水平,符合DMD临床表型,经Sanger测序法验证结果与NGS技术结果相符,因此明确为致病的突变位点。
此外,例2(p.Q869X),例5(p.G1522X),例7(p.Q1588X),例8(p.Q1037X)均为无义突变,单个碱基的突变造成编码氨基酸的密码子变成终止密码子,而表达截短的抗肌萎缩蛋白,患者出现典型的DMD临床表现。国外文献报道TGA是DMD患者中发生频率较高的终止密码子[19],但本研究中的终止密码子中TAA(4/7)占大多数,可能与种族差异有关。
11例大片段缺失突变主要集中在45-54号外显子附近,与既往文献中报道的突变“热区”相符[20]。1988年Monaco等[21]提出的DMD基因突变“阅读框规则”,认为如果突变破坏基因阅读框,则产生截短且无功能的Dystrophin蛋白,导致发病早、症状重的DMD;若突变未破坏阅读框,产生的蛋白则可能有部分功能,导致BMD。但仍有病例与此规则不符,如例16的患者经基因检测证实为3-30号外显子缺失,突变未破坏阅读框,但患者18个月起病,目前有明显颈前肌、下肢肌肉无力,跟腱挛缩,翼状肩胛、腓肠肌假性肥大,为典型的DMD表型。另外,外显子缺失的大小范围与临床疾病的严重程度没有直接的关联。如例11仅缺失第51号外显子,引起典型的DMD。然而,也有部分患者尽管存在大片段缺失症状仍然较轻微,如例9、15、18、19的45-47号/48号外显子整码缺失,但患者平均年龄超过20岁,仍能独立行走,其中例9行肌肉活检免疫组化染色检查未发现膜蛋白缺陷。有学者发现,抗肌萎缩蛋白在正常含量的30%以上就能维持机体的正常状态,因此,这部分患者由必要行肌肉活检测定抗肌萎缩蛋白的表达量。
虽然目前在临床工作中,根据患者的临床表现,生化检查中肌酶显著升高,肌肉活检病理检查,特别是免疫组化或免疫荧光技术直接标记Dystrophin蛋白,可达到确诊的目的,但肌肉活检毕竟是一种有创检查,在儿童期,特别是幼儿期开展有一定的难度,并且确诊后仍无法明确疾病产生的根本原因。而基因检测能为患者提供准确的遗传信息,为遗传咨询和产前诊断提供可靠的理论依据,正逐渐成为患者首选的无创检查手段。自1987年Hoffman等[3]首次定位DMD的致病基因以来,多种基因突变检测技术相继应用,1998年Chamberlain等[4]建立了多重PCR诊断大片段缺失的方法;2002年,多重连接探针扩增技术(multiplex Ligation-dependent Probe Amplification, MLPA)开始应用于临床实践,并一直沿用至今[6,22-24],虽然可以对全部79个外显子进行缺失或重复突变检测,但越来越多的研究表明MLPA诊断技术的局限性,如对单外显子缺失诊断的假阳性[25-27];微阵列比较基因组杂交技术可以精确检测各种拷贝数变异和定位缺失断点甚至内含子的复杂突变,但是仍不能检测不涉及拷贝数改变的微小突变[7]。传统检测DMD基因单个碱基突变的Sanger法,虽然准确可靠,但成本高,效率低且不能同时检测拷贝数变异,极大限制了其在临床诊断中的应用。近年来,新一代高通量测序技术开始应用于遗传性疾病的基因检测,2011年Lim等[15]首先利用第2代测序技术对DMD患者进行测序分析,证明该技术诊断DMD的可行性,2013年戴毅等[28]建立了基于基因芯片捕获和高通量测序技术的DMD微小突变临床检测平台,并报道新突变21种,检测敏感度97.4%,特异度100%。2014年Wei等[18]针对一大样本的研究,首次报道了外显子部分缺失这一新突变类型,并将断裂点精确到碱基水平。但是我们注意到,以上研究中检测范围并没有包含整个基因序列,仅包含了全部外显子区,侧翼序列及部分内含子区域,同时我们发现仍有患者经病理证实确诊为DMD但基因检测未见异常的现象[28],因此,本文研究中,我们进一步增加目标覆盖区域,包含了DMD基因外显子, 内含子以及启动子上的所有序列,总共检测目标区域约2 Mbp中98%以上的非重复区域。力求为患者提供更全面、准确的基因检测结果。19例临床拟诊DMD/BMD的患者均发现相应的突变,并且经过Sanger法验证,实现了一次检测DMD基因的几乎全部突变类型,极大地提高了检测效率,进一步证实新一代测序技术具有灵敏度高、特异性强的显著优势,并且随着这一技术的广泛应用, 检测的成本将进一步降低,周期也将逐渐缩短。目标区序列捕获和第2代测序技术必将成今后遗传病基因诊断的主要检测手段,应用于其他更多遗传病的临床基因诊断、产前诊断、高危人群的筛查,不仅能降低现阶段遗传病的发病率,也为将来遗传病的基因治疗打下基础,提供准确可靠的理论依据。
[1] Bushby K, Finkel R, Birnkrant D J,etal. Diagnosis and management of Duchenne muscular dystrophy, part 1: diagnosis, and pharmacological and psychosocial management[J].Lancet Neurol, 2010,9(1):77-93.
[2] 罗飞,姜海燕,李巍,等.超声引导穿刺活检诊断进行性肌营养不良[J].解放军医药杂志,2011,23(3):59.
[3] Hoffman E P, Brown R H Jr, Kunkel L M. Dystrophin: the protein product of the Duchenne muscular dystrophy locus[J].Cell, 1987,51(6):919-928.
[4] Chamberlain J S, Gibbs R A, Ranier J E,etal. Deletion screening of the Duchenne muscular dystrophy locus via multiplex DNA amplification[J].Nucleic Acids Res, 1988,16(23):1141-1156.
[5] Bennett R R, den Dunnen J, O'Brien K F,etal. Detection of mutations in the dystrophin gene via automated DHPLC screening and direct sequencing [J].BMC Genet, 2001,2(3):17.
[6] Schouten J P, Mcelgunn C J, Waaijer R,etal. Relative quantification of 40 nucleic acid sequences by multiplex ligation-dependent probe amplification[J].Nucleic Acids Res, 2002,30(12):e57.
[7] Hegde M R, Chin E L, Mulle J G,etal. Microarray-based mutation detection in the dystrophin gene [J].Hum Mutat, 2008,29(9):1091-1099.
[8] White S, Kalf M, Liu Q,etal. Comprehensive detection of genomic duplications and deletions in the DMD gene, by use of multiplex amplifiable probe hybridization [J].Am J Hum Genet, 2002,71(2):365-374.
[9] White S J, Aartsma-Rus A, Flanigan K M,etal. Duplications in the DMD gene [J].Hum Mutat, 2006,27(9):938-945.
[10]Flanigan K M, Dunn D M, von Niederhausern A,etal. Mutational spectrum of DMD mutations in dystrophinopathy patients: application of modern diagnostic techniques to a large cohort [J].Hum Mutat, 2009,30(12):1657-1666.
[11]Takeshima Y, Yagi M, Okizuka Y,etal. Mutation spectrum of the dystrophin gene in 442 Duchenne/Becker muscular dystrophy cases from one Japanese referral center[J].J Hum Genet, 2010,55(6):379-388.
[12]Aartsma-Rus A, Van Deutekom J C, Fokkema I F,etal. Entries in the Leiden Duchenne muscular dystrophy mutation database: an overview of mutation types and paradoxical cases that confirm the reading-frame rule[J].Muscle Nerve, 2006,34(2):135-144.
[13]Nasim V, Bohm J, Le Gras S,etal. Next generation sequencing for molecular diagnosis of neuromuscular diseases[J].Acta Neuropathologica, 2012,124(2):273-283.
[14]Shyr D, Liu Q. Next generation sequencing in cancer research and clinical application[J].Biol Proced Online, 2013,15(1):4.
[15]Lim B C, Lee S, Shin J Y,etal. Genetic diagnosis of Duchenne and Becker muscular dystrophy using next-generation sequencing technology: comprehensive mutational search in a single platform[J].J Med Genet, 2011,48(11):731-736.
[16]Xie S, Lan Z, Qu N,etal. Detection of truncated dystrophin lacking the C-terminal domain in a Chinese pedigree by next-generation sequencing[J].Gene, 2012,499(1):139-142.
[17]Wang Y, Yang Y, Liu J,etal. Whole dystrophin gene analysis by next-generation sequencing: a comprehensive genetic diagnosis of Duchenne and Becker muscular dystrophy[J].Mol Genet Genomics, 2014,289(5):1013-1021.
[18]Wei X, Dai Y, Yu P,etal. Targeted next-generation sequencing as a comprehensive test for patients with and female carriers of DMD/BMD: a multi-population diagnostic study[J].Eur J Hum Genet, 2014,22(1):110-118.
[19]Magri F, Del Bo R, D'Angelo M G,etal. Clinical and molecular characterization of a cohort of patients with novel nucleotide alterations of the Dystrophin gene detected by direct sequencing[J].BMC Med Genet, 2011,12:37.
[20]Oudet C, Hanauer A, Clemens P,etal. Two hot spots of recombination in the DMD gene correlate with the deletion prone regions[J].Hum Mol Genet, 1992,1(8):599-603.
[21]Monaco A P, Bertelson C J, Liechti-Gallati S,etal. An explanation for the phenotypic differences between patients bearing partial deletions of the DMD locus[J].Genomics, 1988,2(1):90-95.
[22]Zeng F, Ren Z R, Huang S Z,etal. Array-MLPA: comprehensive detection of deletions and duplications and its application to DMD patients[J].Hum Mutat, 2008,29(1):190-197.
[23]Sansovic I, Barisic I, Dumic K. Improved detection of deletions and duplications in the DMD gene using the multiplex ligation-dependent probe amplification (MLPA) method[J].Biochem Genet, 2013,51(3-4):189-201.
[24]Yang J, Li S Y, Li Y Q,etal. MLPA-based genotype-phenotype analysis in 1053 Chinese patients with DMD/BMD[J].BMC Med Genet, 2013,14:29.
[25]Wang X, Wang Z, Yan M,etal. Similarity of DMD gene deletion and duplication in the Chinese patients compared to global populations[J].Behav Brain Funct, 2008,4(5):20.
[26]Kozlowski P, Jasinska A J, Kwiatkowski D J. New applications and developments in the use of multiplex ligation-dependent probe amplification[J].Electrophoresis, 2008,29(23):4627-4636.
[27]龙飞,孙维,季星,等.多重连接依赖的探针扩增技术在Dystrophin基因外显子拷贝数异常临床检测中的研究[J].中华医学遗传学杂志,2011,28(6):699-704.
[28]戴毅,姚凤霞,魏晓明,等.基因芯片捕获及高通量测序在迪谢内型肌营养不良基因诊断中的初步研究[J].中华神经科杂志,2013,46(3):188-192.
Target Region Sequence Capture and Second-generation Sequencing Technology in Application of Genetic Diagnosis for Duchenne Muscular Dystrophy
ZHANG Ying1, HUANG Xu-sheng1, LIU Li2, LI Mao1, ZHANG Xiao-lan1, CHEN Zhao-hui1, LING Li1
(1. Department of Neurology, General Hospital of PLA, Beijing 100853, China; 2. Department of Neurology, 306 Hospital of PLA, Beijing 100101, China)
Objective To make genetic diagnosis of Duchenne muscular dystrophy (DMD) patients using target region sequence capture and second-generation sequencing technology, and to validate its sensitivity and specificity. Methods Target region sequence capture and second-generation sequencing technology were used to detect the gene mutations of 19 DMD patients, and 8 micromutation samples were confirmed using Sanger sequencing method. Results All the 19 patients had DMD gene defects including 11 having exon deletions and 8 having point mutations. Three of the mutations were firstly found by Sanger sequencing method. Conclusion Target region sequence capture and second-generation sequencing technology can detect almost all types of mutations in DMD patients with better detecting efficiency, sensitivity and specificity.
Muscular dystrophy, Duchenne; Genetic diagnosis; Second-generation sequencing
100853 北京,解放军总医院神经内科(张莹、黄旭升、李懋、张小兰、陈朝晖、凌丽);100101 北京,解放军306医院神经内科(刘丽)
黄旭升,E-mail:lewish301@126.com
R746.2
A
2095-140X(2015)06-0053-07
10.3969/j.issn.2095-140X.2015.06.014
2015-02-03 修回时间:2015-03-10)