于丽丽,马 瑞,马 坚,郭飞行,胡 晨,董 文,阮文彦,迟丹丹,黄永清
唇腭裂(CLP)为人类最为常见的一种先天性发育畸形,在世界的发病率为1/500~1/1 000[1]。根据其是否伴有其他先天性出生缺陷,可将唇腭裂分为综合征型唇腭裂(SCL/P)和非综合征型唇腭裂(NSCL/P)[2]。NSCL/P是其中较常见的一类,包括单纯唇裂(CL)、唇裂伴腭裂(CLP)以及单纯腭裂(CP)。因种族、地区、社会经济状况、环境暴露因素以及基因的不同而呈现差异性。 本课题组在前期研究中,利用全基因组外显子捕获测序方法,对NSCL/P遗传17个大家系样本进行易感基因筛查,在其中一个家系中发现受体络氨酸激酶A3(EPHA3,EPH Receptor A3)基因的点突变可能与非综合征型唇腭裂的发病相关。EPH分为EPHA和EPHB 2个亚型。有报道研究发现,EPHB与颅额鼻综合征(CFNS)有关,CFNS综合征可表现为唇裂、上颚及鼻部发育不全与颅面不对称的临床表现[3]。基于EPHB与唇腭裂的关系,推测EPHA有可能与CLP也存在相关性。本研究选取该基因上常见的88个SNP,基于病例-对照研究,以期验证EPHA3基因多态性与NSCL/P之间的相关性。
1.1 一般资料:收集2013年1月-2019年12月就诊于宁夏医科大学总医院口腔颌面外科的唇腭裂患儿血样504例,其中男302例,女202例。纳入标准:患儿患先天性非综合征性唇裂伴或不伴腭裂(NSCL±P),不伴有其他系统器官的先天性疾病,患儿家庭无其他遗传病家族史、家庭至少三代为宁夏籍。对照样本DNA来源于同期宁夏地区宁夏籍健康新生儿脐带血,共455例,其中男214例,女241例。样本采集均征得患者或其监护人知情同意,并签署知情同意书,研究经宁夏医科大学总医院伦理委员会审批通过后进行。
1.2 研究方法
1.2.1 DNA提取:采集受试者外周静脉血5 mL,经EDTA抗凝。采用Wizard基因组DNA纯化试剂盒(美国普洛麦格Promega公司)提取纯化基因组DNA,琼脂糖凝胶电泳,采用微量紫外分光光度计(美国/Equl-Thermo SCIENTIFIC)对样本DNA进行浓度及纯度的检测。
1.2.2 基因位点选取:查询NCBI的SNP数据库,选取EPHA3基因上MAF>0.05的88个SNP进行研究。
1.2.3 基因分型:基因分型基于Ion Torrent测序平台,运用AgriSeqTM靶向测序技术。准备10 ng DNA,在单一PCR反应中扩增多个SNP靶标,局部消化引物序列,清洗准备模板制备,自动化构建AgriSeqTM文库,模板制备和芯片上样,测序及基因分型。该过程于北京博奥生物有限公司进行。
1.3 统计学方法:用Haploview软件对对照组的所有位点进行Hardy-Weinberg(H-W)平衡检验,P>0.05为符合H-W平衡。对等位基因频数进行χ2检验,并计算等位基因频数的比值比(OR)及95%可信区间( 95%CI)。如OR<1,且95%CI区间上限<1,说明该等位基因可能为NSCL/P的保护因素;如OR=1,说明该等位基因与NSCL/P无关;如OR>1,且95%CI区间下限>1,说明该等位基因可能是NSCL/P的危险因素。用SPSS统计软件对基因型频数进行χ2检验,对所有SNP位点进行连锁及单倍型分析[4],以P<0.05为差异有统计学意义。
2.1 H-W平衡检验:经过H-W平衡检验,对照组样本中rs7637670、rs9866959、rs7619025、rs7644070、rs7646842、rs9873281的6个SNP位点不符合H-W平衡(P<0.05),其余位点均符合H-W平衡(P>0.05),对符合H-W平衡的位点进行下一步分析。
2.2 等位基因频数和基因型频数比较分析:经过H-W平衡检验,筛选出EPHA3基因上的8个符合H-W平衡且等位基因频数在病例组和对照组之间差异有统计学意义的SNP位点,其中rs907713OR=0.624,95%CI为0475~0.819,可能为保护因素。筛选出7个SNPs可能均为危险因素,见表1。对这7个位点的基因型进行进一步分析,其中病例组与对照组中rs7428598和rs79843236的基因型频数差异有统计学意义(P<0.05),见表1-表2。
表1 2组等位基因频数的比较
表2 2组基因型频数的比较
位点基因型病例组(n=504)对照组(n=455)χ2值P值rs7429534 CC1461185.198>0.05 TC265226 TT90108rs9868686 CC851035.456>0.05 CT255223 TT162128rs78776790 CC774.717>0.05 CT117133 TT379313 rs79843236 AA147.168<0.05 AG6784 GG435366rs34986288 AA13145.252>0.05 AG142157 GG346279
2.3 连锁及单倍型分析:连锁分析后得到了7个单体型块,其中共2个单体型块中的4个单体型在病例组和对照组之间差异有统计学意义(P<0.05),见表3。单体型块 1中的单体型TA(P<0.05),单体型块3中的单体型CTTACATGCTGCGTCGAAGCCTCTATTT(P<0.05);CTGCGCCTTGGTCTAGTGTATCGAGCATACC(P<00.5)和单体型CTGCGTATTAACTGAATGCGTAGGGCGCGCC(P>0.05),组成单体型块(Block)的SNP,见图1(目录后)。
表3 2组单体型块与单体型频数的比较
单体型块单体型频率单体型频数病例组对照组χ2值P值单体型块3 ACGTGCCGCAGCTTGACATGCATGGCGTACT#0.35366.8:607.5287.2:579.04.036<0.05 ACGTGCCGTAGCTTGACATGCATGACGTACT0.135120.8:853.5131.6:734.63.037>0.05 CTGCGCCTTGGTCTAGTGTATCGAGCATACC#0.08164.9:909.385.9:780.36.464<0.05 CTGCGTATTAACTGAATGCGTAGGGCGCGCC#0.07890.8:883.553.9:812.36.055<0.05 ACATGCCGTAGCTTGACATGCATGACGTATT0.06766.3:908.058.3:807.90.004>0.05 ACGTTCCGCAGCTTGACATGCATGGCGTACT0.06657.5:916.765.3:800.91.958>0.05 CTGCGCCTTGGTCTAGTGTGTCGAGCATACC0.0549.1:925.245.1:821.10.026>0.05 CTGTGCCTTGGTTTAATGTGTCGAGTATACC0.0548.0:926.345.0:821.20.069>0.05 CCGTGCCGCAGCTTGACATGCATGGCGTACT0.03134.2:940.123.0:843.21.114>0.05 CTGCGTATTAGCTGAATGCGTAGGGCGCGCC0.02118.0:956.320.7:845.50.65>0.05 ACGTGCCGTAGCTTGACATGCATGGCGTACT0.01919.1:955.215.9:850.30.042>0.05 CTGCGCCTTGGTCTGACATGCATGACGTACT0.01110.0:964.310.0:856.20.070>0.05单体型块4 CGCT0.631635.6:370.4570.6:335.40.008>0.05 AACC0.278279.0:727.0253.0:653.00.009>0.05 CGTT0.08184.3:921.770.3:835.70.246>0.05单体型块5 AGACCGT0.485495.9:502.1422.7:473.31.195>0.05 GGACCGT0.175164.0:834.0168.0:728.01.753>0.05 AGGTCGA0.117125.0:873.096.0:800.01.502>0.05 AAACTGT0.113101.8:896.2111.9:784.12.472>0.05 AAACTTT0.07777.0:921.068.4:827.60.005>0.05 AGACTGT0.02828.2:969.825.0:871.00.003>0.05单体型块6 GG0.751751.0:255.0687.7:222.30.217>0.05 AA0.126135.0:871.0106.0:804.01.363>0.05 AG0.123120.0:886.0116.3:793.70.319>0.05单体型块7 GGTGGC0.806808.9:195.1731.0:175.00.004>0.05 GACGGC0.07982.0:922.068.0:838.00.288>0.05 AGCTAT0.07374.0:930.066.0:840.00.005>0.05 GGCGGC0.03935.0:969.039.0:867.00.847>0.05
随着新一代高通量测序技术(NGS)的迅速发展、测序费用降低和时间缩短,对人群遗传疾病的研究采用全基因组外显子测序成为热点的研究方法。外显子组在人类全基因组中占1%,其含有蛋白质合成需要的关键信息,使外显子区域的变异能够较好体现个体表型相关的多数功能变异。酪氨酸蛋白激酶受体(RTKs)是能够调节细胞生长、分化和迁移能力的Ⅰ型跨膜糖蛋白。EPH受体是受体酪氨酸激酶中最大的家族,可分为EphA和EphB 2个亚类[5]。Eph受体最初被认为是轴突引导的中介,参与了许多过程,特别是癌症的发展和进展[6]。EPHA3基因属于蛋白酪氨酸激酶家族的Eph受体亚家族,位于人类染色体3p11.1。相关受体参与细胞调节发育,特别是在神经系统中,在生长发育时期可通过细胞黏附、运动和收缩调节轴突导向与形态发生变化[7]。酪氨酸激酶的Eph受体家族及其ephrin配体可通过“反向信号”——即ephrin作为受体,Eph作为配体—它们也可以在黏附中发挥作用[8]。编码EFNB1的基因突变可导致颅额鼻综合征(CFNS),其表型包括CL/P[9-10]。EFNB1/小鼠存在CP[11],同源受体EphB2和EphB3的双突变体也存在CP[12]。多项研究表明,ephrin-B1的反向信号功能对MEE黏附至关重要。此外,小鼠上颚培养中的EphB反向信号可以挽救转化生长因子(TGF)-β3抑制引起的腭裂缺陷[13]。目前,国内外学者均发现, EPHA3与唇腭裂具有相关性,郭思远等学者发现,EPHA3 基因rs7650466可以导致唇裂的发生,而与单纯腭裂发病无明显相关性[14]。有人等也证明了其与CL/P的相关性,动物实验表明,EPHA3表现在第一、第二鳃弓和其在次腭突中高度表达,因此,认为EPHA3是CLP的候选基因[15]。本研究未筛选出rs7632427位点,可能因不同种族及人群的差异性所致。
本研究通过对宁夏地区17个遗传大家系进行全基因组外显子捕获测序,筛选出997个突变SNP,其中EPHA3位于一个大家系中。本次研究选取该基因上常见的88个SNP,基于病例-对照研究,验证EPHA3基因多态性与NSCL/P的相关性。经过H-W平衡检验、连锁及单倍型分析,筛选出EPHA3 基因rs7428598和rs79843236的等位基因频数(P<0.05)和基因型频数(P<0.05)在病例组和对照组之间差异有统计学意义。连锁分析后得到了7个单体型块,其中共2个单体型块中的4个单体型在病例组和对照组之间差异有统计学意义(P<0.05),分别为:单体型块 1中的单体型TA(P<0.05),单体型块 3中的单体型CTTACATGCTGCGTCGAAGCCTCTATTT(P<0.05);CTGCGCCTTGGTCTAGTGTATCGAGCATACC(P<0.05)和单体型CTGCGTATTAACTGAATGCGTAGGGCGCGCC(P>0.05)。
本研究通过对EPHA3的等位基因频数进行分析,筛选出7个SNPs等位基因频数差异具有统计学意义,其中rs7428598和rs79843236基因位点与NSCL/P存在较强的相关性。本研究基于特定人群的小样本,还需要进一步进行大样本及功能验证,以确定EPHA3基因其与NSCL/P的相关性。