李晟辉 冯 帆 褚春芳 骆黎静 李 琳
人类生殖道畸形是女性常见的疾病,通常与苗勒管发育异常有关。子宫异常是生殖道畸形的一个亚类,包括子宫纵隔、始基子宫、双角子宫等类型[1,2]。文献报道女性生殖道畸形的发生率约为4%~7%[3,4]。女性子宫异常的发生率约为1%~6%[5,6]。子宫纵隔是最常见的子宫异常类型[7]。但子宫纵隔患者生育结果较差,患者流产率较高[8]。胚胎发育过程中,如果子宫正常发育,苗勒管生长到泌尿生殖窦后,导管融合进入头侧,形成厚隔,然后中隔的会再被吸收。子宫纵隔的发生与中隔的异常吸收有关。遗传因素、环境因素、及其二者的相互作用是生殖道畸形发生的原因。其中遗传因素在生殖道畸形发病机制中的作用尚不清楚。以往研究发现多个基因的突变或拷贝数变异与生殖道畸形或子宫异常发生相关,包括TBX6、HOXA13、HOXA10、WNT9B、EMX2、TP63、LHX1、PBX1、CRKL、RBM8A、PAX2、DACT1、MYCBP2等[9~25],其中HOXA10和HOXA11基因突变与子宫纵隔的发生有关[26,27]。
以往研究子宫纵隔的遗传致病基因时多应用候选基因重测序的方法,即对子宫纵隔患者的某个基因(例如HOXA10或HOXA11基因)行Sanger测序来发现潜在致病基因突变。近年来全外显子组测序技术的发展使得很多疾病的遗传学致病基因和突变得以被发现。因此本研究使用全外显子组测序技术尝试对6例子宫纵隔患者进行遗传学分析,为了解应用全外显子组测序技术寻找子宫纵隔患者遗传致病突变的可行性。
1.研究对象:本研究纳入6例子宫纵隔患者,分别命名为P1~P6。P1~P5患者均为完全子宫纵隔患者,P6为不完全子宫纵隔。P3患者合并完全阴道纵隔,P4患者合并不完全阴道纵隔,P6患者合并阴道纵隔和宫颈纵隔。所有患者均在首都医科大学附属北京妇产医院就诊,在征得患者知情同意后,将患者入组,并抽取患者EDTA抗凝外周血5ml。所有入组患者染色体核型分析均为正常的46;XX核型。
2.DNA提取:基因组DNA的提取使用康为世纪公司的血液基因组柱式小量提取试剂盒(货号:CW2087S),并按照说明书步骤提取DNA。
3.全外显子组测序分析:全外显子组测序由安诺优达基因科技(北京)有限公司完成,实验方法参考本课题组以往发表文献[28]。实验流程:使用AgilentV6外显子靶向序列富集系统对全外显子组序列进行捕获,富集到的序列通过HiSeq测序平台进行双端测序(PE150)。目标区域覆盖度为99%以上,目标区平均深度高于20×的比例占所有测序深度的98%。患者原始测序数据通过比对软件BWA定位到人参考基因组UCSC hg19中,得到BAM格式比对结果文件。通过使用突变分析软件GATK分析出所有变异位点,并通过ANNOVAR软件对于所有变异位点进行功能注释。
4.Sanger测序验证突变位点:Sanger测序是为了再次确认WNT9B突变在患者中存在。验证c.71A>G上游引物序列为:5′-TGAGCGGCGCGAGGAGATGCTA-3′;下游引物序列为:5′-CATCAGAGAG-CGGGACTGACGCCT-3′。验证c.832T>A上游引物序列为:5′-TCCCCCACAGGCTGTGAAGAGTG-3′;下游引物序列为:5′-GGCTTGCTGGGCAGTAGGCCTAG-3′。PCR扩增使用上海翊圣生物科技有限公司的高保真DNA聚合酶,PCR退火温度为61℃。Sanger测序反应交由北京睿博兴科生物技术有限公司完成。
5.蛋白质序列比对分析:蛋白质序列比对分析使用CLC基因组工作台软件(第10版本)。每个物种的NCBI蛋白质序列号如下:人,NP_003387;大鼠,NP_001100525;小鼠,NP_035849;斑马鱼,NP_001131132;非洲爪蟾,NP_001096553。
6.在线突变蛋白致病性预测分析:Polyphen-2 (http://genetics.bwh.harvard.edu/pph2/):预测值的范围是从0~1,数值越高致病可能性越大。Sorting Intolerant From Tolerant(SFT)(https://sift.bii.a-star.edu.sg/),预测值从0~1,数值越接近或等于0被认为越致病。PROVEAN(http://provean.jcvi.org/index.php):预测值<-2.5被认为该变异是有害的。Mutation Taster(http://www.mutationtaster.org/):数值代表预测的可能性,数值越接近1代表预测越准确。SNPs&GO(http://snps.biofold.org/snps-and-go/snps-and-go.html):数值>0.5被认为可能致病。PhD-SNP(http://snps.biofold.org/phd-snp/phd-snp.html):数值>0.5被认为可能致病。
7.在不同数据库中查看等位基因频率:外显子聚集数据库(ExAC,http://exac.broadinstitute.org/);千人基因组数据库(1000 Genomes,http://browser.1000genomes.org/);基因组聚集数据库(gnomAD,http://gnomad-old.broadinstitute.org/)。
8.蛋白质二级结构预测:本研究应用PSIPRED进行蛋白质二次结构预测。PSIPRED使用多达4个前馈神经网络和PSI-BLAST输出生成二级结构预测,PSI-BLAST用于查找相关序列并构建位置特定评分矩阵。序列概况的产生由PSI-BLAST完成。此配置文件由PSIPRED规范化。初始二级结构的预测由神经网络完成。第二神经网络用于过滤第一网络的预测结构。PSIPRED预测结果为得分最高的二级结构。
9.蛋白质同源模建:SWISS-MODEL是一种基于网络的蛋白质结构同源建模过程,模型搭建过程基于ProMod3。构建同源蛋白模型主要包含以下4个步骤:①目标序列与模版序列的比对;②模版结构序列的确定与鉴别;③模型搭建;④模型质量评估。这些步骤需要经过与最新的蛋白质结构数据库进行比对,同时在每一步都需要交互式的反复地进行筛选优化,从而得到一个令人满意的模型搭建结果。
1.全外显子组测序分析:本研究对6例子宫纵隔患者行全外显子组测序,测序数据比对后,对结果进行筛选。只保留等位基因频率>3%的错义变异、无义变异、移码变异及剪接位点变异。在这些基因中,本研究重点关注以往研究中发现的与生殖道畸形有关的基因,即TBX6、HOXA13、HOXA10、WNT9B、EMX2、TP63、LHX1、PBX1、HOXA11、HOXA7、PAX2、RBM8、CRKL、HNF1B等。因此查看这些生殖道畸形相关基因在6例患者中的突变情况,发现WNT9B基因在患者P2和P6中分别发生罕见变异c.832T>A;p.S278T和c.71A>G;p.Y24C。然后使用Sanger测序验证了这两个变异,发现患者P6携带c.71A>G变异(图1A),患者P2携带c.832T>A变异(图1B)。
图1 WNT9B变异的Sanger测序分析和保守性分析A.Sanger测序确认患者P6携带c.71A>G变异,对照不携带该变异;B.Sanger测序确认患者P2携带c.832T>A变异,对照不携带该变异;C.变异的保守性分析。Y24位点在从人到非洲爪蟾的不同物种中非常保守,但S278位点在演化中不保守。红色箭头指示差异位置
查询ClinVar数据库(https://www.ncbi.nlm.nih.gov/clinvar/),但在该数据库中未发现本研究发现的WNT9B突变。由于无法获取患者父母的样本,因此无法分析突变是如何遗传的。
2.变异的致病性分析:首先这两个变异非常罕见,c.71A>G变异ExAC、gnomAD和千人基因组数据库中的频率均为0。多个在线的突变蛋白致病性预测软件认为p.Y24C是致病性突变,但p.S278T可能为非致病性变异(表1)。保守性分析亦支持上述观点,显示Y24位点在不同物种中非常保守,但S278位点并不保守(图1C)。因此,以上分析表明p.Y24C很可能是致病性突变,但p.S278T的致病性较弱。
表1 WNT9B变异的致病性分析
Polyphen-2.第2版多态性表型工具;SIFT.从耐受突变中筛选不耐受的突变工具;PROVEAN.蛋白质变异效应分析工具;MutationTaster.突变鉴别工具;SNPs&GO.用GO术语预测疾病相关变异工具;PhD-SNP.人类有害单核苷酸多态性的预测因子工具;ExAC.外显子组聚集数据库;1000G.千人基因组数据库;GnomAD.基因组聚集数据库。D代表致病;N代表中性变异;P代表基因多态性;B代表良性变异
3.变异的结构生物学预测分析:经过检索未发现WNT9B蛋白有已知结构,因此本研究只能通过蛋白质二级结构预测和三级结构同源模建来对突变位置进行预测和模拟。首先研究通过PSIPRED方法对WNT9B蛋白质二级结构进行预测,发现Y24位点位于1个α-螺旋中,S278位于1个β折叠中(图2)。接着对WNT9B进行三级结构同源模建,但由于该蛋白N端没有同源已经解结构的模型,无法进行同源模建,因此Y24位点无法得到三级结构预测图像。进而通过SWISS-MODEL软件对WNT9B蛋白C端结构进行同源模建。通过模拟结构可以发现S278位于接触面上(图3A),S突变为T之后碳链会延长,因此可能会导致新生成的T氨基酸与其下面的α-螺旋上的氨基酸残疾侧链产生新的相互作用(图3B)。
图2 WNT9B蛋白的二级结构生物学分析WNT9B蛋白的二级结构分析,蓝色圆筒代表α-螺旋,长方形代表β折叠,红色星号*代表突变氨基酸位点。Y24C位于一个α-螺旋中,S278T位于一个β折叠中
图3 WNT9B蛋白的三级结构生物学同源模建分析A.WNT9B蛋白的C端的同源模建分析(表面图)。红色箭头指示S278位点。B. WNT9B蛋白的C端的同源模建分析(卡通图)。红色线条显示放大区域,红色箭头指示S278位点
本研究通过对6例子宫纵隔患者行全外显子组测序,发现两例患者分别携带WNT9B基因罕见变异。其中p.Y24C变异被预测为致病性突变,而p.S278T变异被认为可能是非致病性变异。
人WNT9B基因位于染色体17q21.32区域,由6个外显子组成。WNT基因家族由高度保守的发育控制基因组成,该基因编码分泌的糖蛋白在胚胎发育过程中参与胚胎建成的信号转导。小鼠Wnt9b基因在沃尔夫管上皮中表达,并且对缪勒氏管的尾部延伸至关重要。研究还发现Wnt9b在发育中的泌尿生殖系统中作用于Wnt4的上游。Wnt9b对于早期诱导后肾间质是必需的。此外表达Wnt9b的细胞可以在功能上替代输尿管芽。输尿管芽通过分泌可溶性生长因子Wnt9b向后肾间质发出信号,Wnt9b通过β-catenin诱导后肾间质中Fgf8、LIM同源盒基因Lhx1和Wnt4的表达。Wnt4诱导后肾间质细胞进行间质-上皮转化(MET)并分化为肾单位上皮。在沃尔夫管中Wnt9b诱导的MET受到HNF1B基因的调控。除了在MET中的作用外,Wnt9b对于后期肾脏形态建成是必须的。因此综上所述,Wnt9b来源于沃尔夫管,并且对于管的延伸是必须的。
Wnt9b基因敲除雌性小鼠缺乏子宫和上阴道,但卵巢正常,这与人类MRKH综合征表型相近。因此WNT9B基因突变亦可能与女性生殖道畸形发生有关。Wang等[29]在MRKH患者中发现两个WNT9B突变。Waschk等[14]在109例MRKH综合征和117其他子宫畸形患者中发现5例MRKH患者和1例双角子宫患者携带不同的WNT9B基因突变。而本研究则首次在子宫纵隔患者中发现WNT9B基因突变。子宫纵隔的发生多是因为子宫中隔的异常吸收而导致的畸形,较MRKH综合征(先天性无阴道无子宫)的畸形程度轻微。由于本研究使用全外显子组测序技术,通过测序结果可以得知携带此WNT9B基因突变的患者未发现同时携带可能导致子宫纵隔的其他基因突变。其中p.Y24C突变被6个在线功能预测程序中的5个认为是致病性变异,结构生物学预测发现Y24位于一个α-螺旋中,Y24突变为C,可能会产生新的分子内或分子间二硫键从而影响蛋白质三维结构。因此p.Y24C突变可能为致病性基因突变。p.S278T变异则被所有程序认为是非致病性变异,但三维结构同源模建发现S278突变为T之后碳链会延长,可能会导致新生成的T氨基酸与其下面的α-螺旋上的氨基酸残疾侧链产生新的相互作用。因此虽然p.S278T被生物信息学预测为非致病性变异,但结构生物学预测其有可能产生不良影响。
本研究认为全外显子组测序的强大之处在于其高通量性,这比候选基因重测序每一次只能关于一个基因或少数几个基因要高效很多。本研究仅通过对6例患者测序就发现2例携带WNT9B基因变异,这表明全外显子组测序在发现疾病致病基因突变上是一个强大的工具。对于另外4例患者,目前尚未发现可疑基因突变,但是随着生殖道发育生物学的发展,更多基因功能逐渐被阐明,亦可能在4例患者中鉴定到新的基因突变。当然,本质上不是所有患者都是因为遗传因素发病,全外显子组测序甚至全基因组测序的应用则是尽可能地找到那些遗传致病因素。本研究的不足之处在于未对p.Y24C和p.S278T变异的致病性做更深入的分子细胞生物学等功能性研究。因此本课题未来的研究重点是揭示这两个变异是否引起WNT9B蛋白功能的改变。
综上所述,本研究通过使用全外显子组测序技术在6例子宫纵隔患者中发现两个WNT9B基因的罕见变异。通过生物信息学及结构生物学预测分析笔者认为p.Y24C可能是致病性基因突变。