许 静,张 霞,刘志朋,王淑燕,李洪林,李小伟,王 配*,霍金龙*
(1.云南农业大学动物科学技术学院,昆明 650201;2.吕梁学院生命科学系,山西 吕梁 033001)
DAZL(Deleted in Azoospermia Like,类无精症缺失)基因在雄性生殖细胞的增殖、发育、成熟以及精子发生中发挥重要功能[1],它是DAZ基因家族的重要成员,该家族基因编码具有RNA结合基序和DAZ重复序列的蛋白质,且都在哺乳动物生殖细胞中特异性表达[2-3]。DAZL的表达是脊椎动物生殖细胞发育和分化的标志[4],且在两性配子发生中都必须[5]。DAZL几乎在雄性动物精子发生整个过程均有表达[2],在原始生殖细胞的发育和迁移、精原细胞分化以及减数分裂的开始和进行过程中都发挥重要作用[6]。DAZL 还是精子发生所必需的主要翻译调节因子,可通过调节对精子发生各阶段重要靶转录物蛋白的表达来促进精子发生[4]。DAZL的缺失或突变会使雄性动物生殖细胞逐渐丧失、联会失败、减数分裂停滞等[4,7-8],从而导致不育。另外,有研究表明DAZL基因启动子DNA甲基化模式的改变与雄性精子缺陷有关[9]。
版纳微型猪近交系(Banna mini-pig inbred line,BMI)是具有高纯合基因和明确遗传背景的大型哺乳动物近交系,被广泛应用于生物医学研究领域[10-11]。我们先前已证明DAZL在BMI 成年猪的睾丸组织中特异性表达,并在猪睾丸细胞(ST)的细胞核中发挥重要功能[12]。本研究克隆获得DAZL启动子序列,获悉其CpG 岛、核心启动子区域及转录因子结合位点,全转录组测序获得DAZL在BMI 睾丸中的表达量,注释DAZL基因并了解其重要功能,构建DAZL的ceRNA 转录调控网络并分析其表达调控;分析各物种DAZL及其相邻基因获悉保守同源性,构建DAZL 的互作蛋白网络并分析各蛋白的作用。研究结果可为深入探索DAZL在精子发生过程中的重要功能奠定基础。
选用4头来自版纳微型猪近交系昆明原种猪场的12月龄成年BMI 公猪,活体去势取睾丸组织样品。
在NCBI 数据库检索猪DAZL基因5'端侧翼区序列;使用Prime3 PLUS 筛选长度17~25 bp、GC 含量40%~60%、Tm值60~65 ℃、ATCG 分布均匀的一对引物(F:CCTGAGTTTCCGCACATGACAC;R:CTCCACTCACCATTACTGCGACA),由昆明擎科生物科技有限公司合成。以提取的BMI 基因组DNA为模板,PCR 扩增DAZL启动子序列。随后琼脂糖凝胶电泳检测,并使用TaKaRa 胶回收试剂盒回收片段并送昆明擎科生物科技有限公司测序。利用BDGP 的Neural Network Promoter Prediction(https://fruitfly.org/seq_tools/promoter.html)工具查询DAZL基因的核心启动子区,MethPrimer 工具(www.urogene.org/methprimer)查询CpG 岛,AliBaba2.1(generegulation.com/pub/programs/Alibaba2/index.html)工具查询转录因子结合位点。
提取BMI 睾丸组织RNA 进行建库,使用Illumina Hiseq 4000 和Illumina novaseq 6000 平台分别进行RNA-seq和small RNA测序。利用Fastp软件对获得的测序数据进行质量分析,随后采用bowtie2-2.1.0 软件将处理后的RNA-seq 数据与猪核糖体数据库以及猪参考基因组(Sus scrofa 11.1)比对。使用featureCounts[13]和salmon[14]计算DAZL基因的原始表达量和矫正表达量。使用bowtie2[15]软件去除质控后small RNA 数据中的rRNA、tRNA、snRNA 和snoRNA,将剩余数据与miRBase数据库中每一个物种的miRNA序列比对,从而得到miRNA的表达量。
利用Uniprot 数据库对猪DAZL进行功能注释,使用所测RNA-seq数据分析miRNA和lncRNA的表达量,用miRanda(hhttp://www.mirbase.org)和RNAhybrid2.1.2(https://bibiserv.cebitec.uni-bielefeld.de/rnahybrid/submission.html)网站分析调控DAZL的miRNA 和lncRNA,使用Cytoscape 3.9.1[16]将高表达的miRNA和lncRNA可视化。
利用MegAlign软件对多物种DAZL氨基酸序列进行相似度分析并用R中的ggplot2包进行可视化,利用WebLoge网站分析DAZL结构域在各物种中的保守性,利用Genomicus-99.01 网站分析DAZL邻近基因组区域的保守性及同源性。
利用String v11.0b 进行互作蛋白分析,并用Cytoscape 3.9.1 可视化。利用R 中clusterProfiler 包将互作蛋白进行GO和KEGG富集分析,并用ggplot2包可视化。利用转录组测序数据分析DAZL与这些蛋白编码基因之间的表达量相关性,并用R 中circlize 包进行结果可视化。
以BMI 基因组DNA 为模板,PCR 扩增获得DAZL基因5'侧翼区长度为2 378 bp 的启动子区域(图1A)。利用MethPrimer 分析发现,在DAZL基因5'侧翼区-1 932~-2 272 bp 区存在一个长度为341 bp 的CpG 岛(图1B),其GC 百分比大于50%。核心启动子分析发现,序列中存在3 个核心启动子(图1C 红色部分),其可信度分别为97%、98%和99%;转录因子结合位点预测结果显示,启动子区序列上存在Oct-1、HSE-bind、Pit-1a、GCN4、c-Rel、NF-kappa、Sp1、IRF-1、YY1和Krox-20等10种转录因子的潜在结合位点,其中Sp1结合位点有5个(图1C蓝色部分)。
图1 DAZL启动子序列克隆与分析Figure 1 Cloning and analysis of DAZL promoter sequence
转录组测序结果表明,DAZL基因在BMI睾丸组织样品中的原始平均表达量为898.67,经过进一步矫正后的平均表达量(TPM)为653.50,其转录本与Ensembl数据库中的DAZL转录本ENSSSCT00000078185相一致,定位在猪13 号染色体。DAZL基因在4 个BMI睾丸组织样品中均具有较高的正表达(图2)。
图2 DAZL所处染色体位置,转录组测序的外显子、内含子丰度分析Figure 2 Chromosome location,abundance of exons and introns of DAZL based on transcriptome sequencing
功能注释结果发现,DAZL共参与15 个GO:其中生物学过程(Biological process)主要包括翻译启动的正向调控(GO:0045948-positive regulation of translational initiation)、3'-UTR 介导的mRNA 稳定(GO:0070935-3'-UTR-mediated mRNA stabilization)、生殖细胞发育(GO:0007281-germ cell development)、细胞分化(GO:0030154-cell differentiation)、翻译调控(GO:0006417-regulation of translation)和精子发生(GO:0007283-spermatogenesis)等6 个GO;细胞组分(Cellular component)主要包括细胞质(GO:0005737-cytoplasm)、细胞核(GO:0005634-nucleus)和蛋白质复合物(GO:0032991-protein-containing complex)等3 个GO;分子功能(Molecular function)主要包括翻译激活活动(GO:0008494-translation activator activity)、mRNA 3'-UTR 结合(GO:0003730-mRNA 3'-UTR binding)、核酸结合(GO:0003676-nucleic acid binding)、RNA 结合(GO:0003723-RNA binding)、mRNA 结合(GO:0003729-mRNA binding)、蛋白结合(GO:0005515-protein binding)等6 个GO(图3)。
图3 DAZL的功能注释及ceRNA调控网络Figure 3 Functional annotation and ceRNA regulatory network of DAZL
ceRNA调控网络图显示,BMIDAZL受ssc-miR-199a-5p、ssc-miR-199b-5p、ssc-miR-17-5p、sscmiR-103、ssc-miR-24-3p 和ssc-miR-107 等6 个miRNAs 靶向调控(图3)。其中有多个lncRNA 与DAZL竞争性结合其对应的miRNA。
BMI DAZL 与其他9 个哺乳动物的氨基酸序列比对发现它们的相似度均超过90%,其中与猫(XP_006936507)、狗(XP_025304761)、驴(XP_014697651)、马(XP_005600968)的相似度高达到97%以上(图4A),WebLoge 图显示结构域RRM_DAZL 在各物种中较为保守(图4B),说明DAZL 在各物种中具有较高的保守性和序列同源性。对各物种基因组中的DAZL相邻基因进行同基因分析(图4C),结果表明虽然不同物种的DAZL位于不同染色体,但是猪与其他哺乳动物都具有较高保守的相邻基因,尤其与偶蹄目动物(山羊、绵羊、骆驼)的相邻基因以高度保守的方式分布。
图4 DAZL氨基酸及其邻近基因的保守性分析Figure 4 Conservation analysis of DAZL and its neighboring genes
蛋白互作分析显示DAZL与多种蛋白相互作用(图5A),互作紧密程度从高至低分别为PUM2、DAZAP2、SYCE1、SYCE2、PUM1、DDX4、NANOS3、DND1、STRA8 和PABPC1L 等。将这些蛋白进行KEGG 富集分析发现,主要参与细胞过程(cellular processes)、人类疾病(human diseases)、有机系统(organismal systems)和环境信息处理(environmental information processing)等。其中包括调控干细胞多能性的信号通路(ssc04550:signaling pathways regulating pluripotency of stem cells)、卵母细胞减数分裂(ssc04114:oocyte meiosis)、脊髓小脑的共济失调(ssc05017:spinocerebellar ataxia)、癌症蛋白聚糖(ssc05205:proteoglycans in cancer)、细胞因子-细胞因子受体的相互作用(ssc04060:cytokine-cytokine receptor interaction)等通路(图5B);GO 富集分析发现这些蛋白主要参与有性生殖(sexual reproduction)、精子发生(spermatogenesis)、卵子发生(oogenesis)、超分子复合物(supramolecular complex)、mRNA 结合(mRNA binding)和RNA 结合(RNA binding)等条目(图5C)。利用转录组测序数据分析DAZL与这些蛋白编码基因之间的表达量相关性,结果显示在BMI 睾丸组织中,DAZL的表达量与SOHLH1显著相关(图5D)。
本研究以BMI基因组DNA为模板扩增了DAZL基因5'侧翼区长2 378 bp 的启动子序列,包括3 个核心启动子以及10 种转录因子结合位点。研究表明哺乳动物中大约60%的启动子与CpG 岛共定位[17],而CpG 二核苷酸上的胞嘧啶甲基化是真核生物中必不可少的表观遗传修饰[18]。DAZL基因5'端上游-1 932~-2 272 bp 启动子序列存在一个CpG岛,该CpG岛可能参与了DAZL的表观调控。
转录组测序获得睾丸中DAZL基因原始及矫正后的平均表达量,DAZL基因的转录本与Ensembl数据库中DAZL的ENSSSCT00000078185转录本一致,且DAZL在BMI睾丸组织样品中高度表达。氨基酸序列相似性分析显示猪DAZL 与其他9个物种的相似度均大于90%,保守结构域分析发现该RRM_DAZL结构域在各物种间十分保守,说明BMI DAZL在各物种世代演化的进程中具有较高的保守性以及序列同源性。对各物种基因组中的DAZL相邻基因分析表明,虽然不同物种的DAZL位于不同染色体,但是都具有较高保守的相邻基因,尤其与山羊、绵羊及骆驼的相邻基因以高度保守的方式分布。
功能注释结果表明DAZL主要参与翻译启动的正向调控、蛋白结合、RNA 结合、mRNA 结合、细胞分化、翻译调控和精子发生等。靶基因预测表明DAZL被ssc-miR-103、ssc-miR-107、ssc-miR-17-5p、ssc-miR-199a-5p、ssc-miR-199b-5p 和ssc-miR-24-3p靶向调控,这些miRNAs参与了猪精子发生、结构完整性、运动性和代谢等过程[19]。其中ssc-miR-103参与猪的多种生物学过程,包括大脑发育、脂质代谢、脂肪细胞分化、造血和免疫[20]。ssc-miR-107 参与有性生殖、雄性配子生成、精子发生及GnRH、Wnt和MAPK信号通路[21]。miR-17-5p在睾丸早期精原细胞和精母细胞中表达最低,随生殖细胞的成熟表达不断增高,并在精子发生中起重要作用[22]。sscmiR-199a-5p 和ssc-miR-199b-5p 可影响猪的胚胎着床[23]。ssc-miR-24-3p 在猪精子和精浆中表达丰富,并在精子和精浆之间穿梭,与精子运动功能有关[24]。这6个重要的miRNAs可为深入研究DAZL在猪生殖方面的调控机制提供依据和方向。
蛋白互作网络分析显示DAZL与PUM2、DAZAP2、SYCE1、SYCE2、PUM1、DDX4、NANOS3、DND1、STRA8 和PABPC1L 等多个蛋白相互作用。这些蛋白几乎都在与精子发生相关的细胞中表达,并在精子发生过程中发挥重要作用[25-34]。其中SYCE1 和SOHLH1 还与生育能力有关,其突变导致两性或雄性不育[35-36]。转录组测序数据和蛋白编码基因的表达量相关性分析表明,在BMI 睾丸组织中,DAZL的表达量与SOHLH1显著相关,为SOHLH1和DAZL的进一步互作研究指明了方向。上述互作蛋白的GO和KEGG 富集分析发现,这些蛋白主要参与精子发生、卵子发生、有性生殖等重要生殖相关通路,为深入研究DAZL在BMI中的功能奠定了基础。
综上所述,本研究克隆了猪DAZL基因的启动子序列并分析了其结构特征;获得DAZL在睾丸组织中的表达量;注释基因功能,并构建了ceRNA 转录调控网络;比对各物种DAZL氨基酸序列及DAZL邻近基因,解释了其保守同源性;分析蛋白功能,并构建了蛋白互作网络。研究结果为后期深入研究DAZL在BMI 精子发生过程中的作用机制奠定了基础。