王天琦,刘紫雯,史晓渊,王永晖,王鑫瑞,任 薇,黄炳舰,王长法,2*
(1.聊城大学 黑毛驴高效繁育与生态饲养研究院,山东 聊城 252000;2.山东省驴产业协同创新中心,山东 聊城 252000)
随着人们生活水平的提高,驴肉高蛋白、低脂肪的特性越来越受人们喜爱,更多的人开始食用驴肉,但国家统计数据表明近十年来驴的存栏量已经从510.1万头降至2020年的232.43万头(中国统计年鉴,2002-2020)。和猪、禽等经济动物相比,驴生长周期长、孕期长,这也限制了驴养殖数量的快速恢复。
本课题组前期研究发现德州驴胸椎骨数目有三种类型,分别为17、18、19根,腰椎骨数目有两种类型,分别为5根和6根,进一步研究发现德州驴多一根椎骨,其体长、胴体重均有一定的正增长,胸椎数增加一根,体长平均增加5.14 cm,胴体重平均增加11.17 kg;腰椎数增加一根,体长平均增加 2.0 cm,胴体重平均增加2.83 kg。因此,在驴分子育种领域进行与胸腰椎数相关的分子标记研究,选育多胸腰椎数驴个体,对于提高驴产肉及产皮量具有重要意义。先前研究表明基因其多态性与多个物种的体重、体高、骨骼以及体型有关,然而该基因对驴生长性状和胸腰椎数性状的影响没有相关研究报道。基于基因在其他动物中的研究成果,推测该基因极可能与驴胸腰椎数性状相关。基于此,本文综述了基因及其对家畜生长性状影响的研究进展,期待为基因对驴胸腰椎数性状影响的下一步研究奠定理论基础。
在NCBI数据库检索到了人、牛、马、小鼠、羊、猪的基因,但未检索到驴基因,在Ensembl数据库检索到了驴的该基因信息(见表1)。在驴上,该基因有两个转录本,分别由6、7个外显子组成,在其他物种中该基因转录本都较多,这可能与该基因序列长,核苷酸序列均在1.4~1.9 bp,外显子数目多相关。除驴外,基因在其他物种中外显子数目均在10个以上,因此发生可变剪切的可能性也就更大。驴基因编码区核苷酸序列结构简图见图1,对驴基因两个转录本的基因结构进行对比,结果发现两个转录本外显子数目不同,转录本1无外显子7;此外两个转录本的第1外显子序列也存在差异,转录本2的第1外显子比转录本1多91个核苷酸。
表1 不同物种中的LCORL基因的信息Table 1 Information of LCORL genes in different species
图1 驴LCORL基因编码区核苷酸序列结构简图Fig. 1 Nucleotide sequence structure of the coding region of the Donkey LCORL gene
利用Psipred在线程序预测驴LCORL蛋白二级结构(见图2),图2A为转录本1翻译得到的蛋白质的二级结构模式图,图2B为转录本2翻译得到的蛋白质的二级结构模式图。转录本1翻译得到的蛋白质由318个氨基酸残基构成,二级结构以α-螺旋和无规卷曲为主,其中α-螺旋由153个氨基酸残基组成,占整个二级结构的48.11%;无规卷曲由151个氨基酸构成,占整体的47.48%;伸展链由14个氨基酸残基构成,在整体中所占比例为4.4%。转录本2翻译得到的蛋白质由518个氨基酸残基构成,二级结构以无规卷曲为主,由271个氨基酸残基组成,占整个二级结构的52.32%;α-螺旋由211个氨基酸构成,占整体的40.73%;伸展链由36个氨基酸残基构成,在整体中所占比例为 6.95%。
图2 驴LCORL蛋白转录本1和转录本2二级结构模式图Fig. 2 Secondary structure pattern of transcript 1 and transcript 2 of donkey LCORL protein
由于PDB数据库没有收录该蛋白三维结构,因此利用 Phyre2在线工具中Normol模式对LCORL三级结构进行预测, LCORL蛋白三级结构如图3所示,图3A为转录本1翻译得到的蛋白质三级结构预测图,图3B为转录本2翻译得到的蛋白质三级结构预测图,显示两个转录本翻译得到的蛋白质三级结构相似,均含有多种二级结构单元,以α-螺旋和无规卷曲为主,这与预测的二级结构相符。
图3 驴LCORL蛋白三级结构预测图Fig. 3 Predicted tertiary structure of donkey LCORL protein
用NCBI中的CDD数据库(https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)预测转录本1翻译得到的蛋白质的功能结构域,未发现有任何结构域;对转录本2翻译得到的蛋白质功能结构域进行预测,发现第196到229个及第442到487个氨基酸区域为HTH psq超家族(HTH psq super family)结构域。HTH psq超家族结构域为DNA结合域,是一个约由50 个氨基酸组成的螺旋-转角-螺旋(HTH)结构域。Psq在果蝇中是重要的发育调节因子,Glehmann等研究表明,Psq在卵子发生、胚胎模式形成和成虫发育过程中发挥重要作用。
大量研究表明基因与家畜的体重密切相关。Purfield等检测与胴体重相关的基因组区域,结果表明包含基因的区域与胴体重显著相关。Lindholm-Perry等发现牛基因区域中的位于38255270、38284737、38376731 bp处的三个单核苷酸多态性(single nucleotide polymorphism,SNP)与胴体重和脂肪厚度显著相关。Tozaki等发现基因与日本纯种赛马体重显著相关。Han等结果表明,位于内含子1的SNP g. INT+52098A>G位点与秦川牛胴体重显著相关。
对不同性别牛基因与采食量以及平均日增重的关系也有一定的研究,Lindholm-Perry等研究发现,公牛和母牛肌肉组织中基因转录本丰度均与平均日采食量(ADFI)呈正相关,LCORL蛋白水平也与ADFI呈正相关;而在母牛的脂肪组织中,基因转录本丰度与ADFI呈负相关,在公牛脂肪组织中该基因转录本丰度与ADFI未发现相关性,这表明该基因还可作为评估生长性能的一个重要遗传标记。
在马上有大量研究表明该基因与体高之间的相关性。Tozaki等通过对322匹纯血马基因附近的BIEC2-808543位点(位置见图4)基因型与体尺性状进行关联分析,发现公马和母马的体高均与该位点基因型显著相关,与基因型的马相比,具有基因型的马体高更高,两种基因型的公马体高的最大差异为1.8 cm,母马为2.1 cm。Metzger等通过对包含42个不同品种在内的1851 匹马进行GWAS,结果发现体高在130 cm和160 cm之间的马在BIEC2-808543位点为基因型和基因型,而体高在160 cm以上的马则主要表现出基因型。在伊犁马上也证明了具有C等位基因的马比没有该等位基因的马体高更高,基因型的马体高显著大于和基因型马,Signer-Hasler等的研究同样证明了这一点。
图4 马LCORL基因及其临近基因以及BIEC2-808543位点分布图Fig. 4 Distribution of horse LCORL gene, its proximategenes and BIEC2-808543 locus
缅甸本地马和宁强矮马均为小型马,在这两种小型马基因上游发现的BIEC2-808543 SNP位点存在明显的优势等位基因。Okuda等研究了7个缅甸本地马群体中的基因上游BIEC2-808543 SNP位点的基因型分布和等位基因频率,基因分型结果显示与体高相关的C等位基因频率为0.08~0.27,平均为0.13,在缅甸本地马中C等位基因频率极低。Bai等对22匹宁强矮马的基因上游的BIEC2-808543 SNP位点进行分析,结果显示该SNP位点T等位基因与宁强矮马的体高显著相关。表明基因的SNP突变可以作为缅甸本地马和宁强矮马体高的筛选标记,为稀有种质资源的选育和保护提供新的方法。
综上所述,BIEC2-808543位点可以作为马体高的遗传诊断标记,BIEC2-808543位点TC突变破坏了转录因子TFIID的一个特定结合位点,从而导致基因转录过程发生改变。转录因子TFIID是一种大型多蛋白组装体,可作为真核生物RNA聚合酶II转录起始的通用转录因子,Metzger等的研究发现该转录因子对基因的转录过程非常重要。因此BIEC2-808543位点的突变破坏了转录因子TFIID的结合位点,造成基因转录过程发生改变,最终导致基因表达量发生改变,从而影响体高的差异。
基因的表达还与骨骼发育之间存在相关性。Chen等通过对31头婆罗门牛和131头云岭牛进行GWAS,发现与体型性状有关的重要位点20个,其中与尻宽最显著相关的SNP位于基因,该SNP位于38272802 bp处。Jennifer等在利木赞牛的6号染色体中鉴定了与胸宽、胸深具有高度关联的数量性状基因座(quantitative trait locus,QTL),该QTL包含 NCAPG/LCORL 复合体,且鉴定了该QTL与利木赞牛的尻宽显著相关。Staiger等发现在基因3'末端的候选位点与马的骨骼大小相关。野猪的驯化和随后的选择导致家猪包括体长和椎骨数目等许多性状发生了显著变化,Carl-Johan等利用全基因组重测序来探究影响这一变化的基因座,结果表明基因与体长和椎骨数目密切相关。Miao等为了确定骨重的遗传决定因素,对1225头西门塔尔牛骨重性状进行了GWAS,结果表明包括基因在内的7个基因是影响骨重的候选基因,Chang等的研究也表明了同样的结果。Silvia等发现了基因与皮埃蒙特牛的难产显著相关,骨盆狭窄是造成牛难产的一大因素,这可能是由于髋骨小造成的,可以推测该基因与髋骨大小具有相关性,但还需进一步研究。Soranzo等发现基因与人髋关节轴长显著相关。Healey等发现基因与犬的胫骨长度、外侧胫骨骨干宽度、胫骨结节长度相关。
软骨病在马中是一种常见的疾病,主要影响马关节/骨骺复合体的软骨生长,患马的软骨可增厚、塌陷,严重情况下软骨会发生断裂,导致解剖性软骨病。Naccache等通过GWAS确定了基因上游的BIEC2-808543位点与跗关节软骨病密切相关。Sevane等探究了与 144 匹西班牙纯种马体型大小相关的基因座并寻找与软骨病病变相关的基因座之间的关联,结果发现在BIEC2-808543位点,和基因型的马相比基因型的马体高和体长分别平均增加了3.6%和4.5%,这也导致了粗大的膝关节和管围,使软骨病发生的风险大大提高。
在马上已发现少量对体型具有较大影响的等位基因位点,这些基因在驯化过程中被反复选择,作为极端体型多样化的主要驱动因素,其中,多个研究表明基因与马的体型显著关联。Makvandi-Nejad等研究发现,基因上游的BIEC2-808543 SNP位点与马的体型大小显著关联。Grilz-Seger等利用基因分型技术,对来自12个品种的1476匹马进行连续纯合片段(runs of homozygosity, ROH)分析,通过品种间比较鉴别出具有选择特征的ROH岛,并对种群间的相似性和差异性进行评估,确定了与毛色、奔跑能力、环境适应能力以及体型等性状相关的基因,其中基因与体型大小显著相关。Abri等研究发现,基因在六个不同品种中均与体型大小显著相关。另外Gurgul等结果也证实了基因与胡克尔马和科尼克马体型的关联性。
建昌马和安宁果下马都属于中国矮马。周凡莉等随机选取了16头建昌马和4头安宁果下马,检测已经报道的的SNP,结果发现建昌马和安宁果下马基因的上游的BIEC2-808543位点存在明显的优势等位基因,该位点的T等位基因占明显优势,等位基因频率在0.8以上,可推测基因上游的BIEC2-808543位点 T 等位基因与建昌马和安宁果下马的小体型性状相关。
基因除在马上研究较多外,在其他动物上也有研究。Saif等研究发现,5个中大型巴基斯坦山羊品种在6号染色体上的一个区域有一个共同的选择标志,而基因也位于此区域。Signer-Hasler等对来自8个瑞士本土绵羊品种的939只绵羊个体进行特征基因筛选,发现基因是与体型最显著相关的选择信号。He等对635头中国美利奴羊的ROH运行的数量、长度和频率进行了估算,并使用OvineSNP50全基因组基因分型芯片确定了基因是与体型相关的候选基因。Sahana等的研究表明基因与北欧红牛新生犊牛和成年后体型均具有显著相关性。在驴上,Shen等对包含体型大小不同的12个品种在内的78头驴进行选择性扫描、基因注释、功能富集和差异表达分析,发现了包括基因在内的与快速生长和大体型相关的选择性信号,在基因上发现了11个非同义位点,这些非同义位点的基因型在大小体型驴之间存在显著差异。此外,对基因的SNP位点进行连锁不平衡分析,结果表明该区域的SNP具有强连锁,因此该基因可作为影响驴生长性状的遗传标记。
国内外关于基因在各组织器官中表达水平的研究存在大量报道,这些研究对于进一步验证基因的功能具有重要意义。Metzger等利用RT-qPCR探究基因在马毛囊中的表达量时发现该基因的表达水平与BIEC2-808543位点的基因型有明显的关联,相对于基因型马,在基因型马中基因的表达水平降低了40%,在基因型马中降低了56%,结合上文描述的该SNP位点的基因型与体型之间的关联,进一步证明基因为较有希望的体型性状候选基因。
对睾丸、毛囊、大脑、肾脏、肌肉和肝脏组织的半定量表达分析表明,基因及邻近基因和16(位置见图4)在这些组织和毛根的表达量基本相同,因此可选择马这6个组织中的任一个组织进行该基因的表达水平分析。La等采用RT-qPCR对基因在湖羊组织中的分布进行研究,结果表明该基因在湖羊组织表达广泛,在心、肝、脾、肺、肾、瘤胃、十二指肠、肌肉、脂肪、下丘脑、垂体11个组织中均有发现,其中在脾脏、十二指肠和肺部表达水平最高。Liu等使用RT-qPCR分析确定了成年秦川牛和受精后135 d的胚胎背腰最长肌中、和16三个基因的相对表达水平,结果发现这三个基因在胎儿肌肉中表达量均高于成年牛,且在三个基因中基因表达量最高。在驴上,Wang等对驴包括心、肝、脾、肺、肾等在内的16个组织进行了RNA-seq,确定了基因在各组织相对表达量,其中附睾和夜眼的表达水平最高,在血液表达水平最低,其次为肝脏。
综上所述,基因可作为影响椎骨发育的候选基因之一,目前对该基因结构以及功能的研究较成熟,还发现该基因对家畜生长性状具有影响。尽管基因对生长性状影响的大量研究都是该基因与单一性状之间的关联性,但也有一些研究描绘了该基因与多个生长性状之间的关联性,这是目前研究的一个新热点。驴生长速度慢、养殖利润低等成为产业发展的瓶颈,基因对驴椎骨数量的影响以及作用机制还需要大量的研究,从而可以提高产皮量及产肉量,获得更大的经济效益。