蒙古牛线粒体DNA全基因组遗传多样性与起源研究

2022-07-08 10:25陈嘉磊夏小婷肖正中陈宁博雷初朝
中国牛业科学 2022年3期
关键词:碱基蒙古线粒体

陈嘉磊,夏小婷,肖正中,陈宁博,雷初朝*

(1.西北农林科技大学动物科技学院,陕西杨凌 712100;2.广西壮族自治区畜牧研究所,广西南宁 530001)

中国黄牛品种资源丰富,是世界牛品种资源库的重要组成成分,目前,我国共有53个地方黄牛品种和8个培育品种[1]。关于中国家牛的驯化,最早的考古记录可追溯到距今4 500到4 000年左右,普遍认为是通过文化交流从西亚或中亚进入中国国内[2]。中国的普通牛群体主要分布在北方地区,瘤牛群体则在南方地区广泛存在,至于中间地带的家牛则为普通牛和瘤牛的混合血统[3]。

蒙古牛原产于蒙古高原地区,现广泛分布于蒙古国、俄罗斯,中国内蒙古、东北、华北北部和西北地区,是一个古老的黄牛品种[4-5]。蒙古高原地处内陆,属于温带大陆性气候,气候寒冷干燥,冬季漫长[6]。在极端寒冷的冬季,蒙古牛仍可以在自然放牧且无补饲条件下正常生长生存,具有较高的生产性能和遗传稳定性[7]。在漫长的自然选择和人工培育下,逐渐形成了抗寒耐病、耐粗饲和适应性强等特点的蒙古牛品种[8]。

线粒体是细胞中进行生物能量代谢的细胞器,是细胞进行有氧呼吸的主要场所,能产生细胞生命活动所需的能量[9]。mtDNA有以下特性:(1)结构简单稳定,在世代传递中不发生重组[10];(2)严格遵循单性母系遗传方式,因而驯化后仍能保持其野生祖先的mtDNA类型,而不受外来公畜杂交改良的影响[11];(3)在不同的物种间、种内的不同群体间具有广泛的多态性,因而能作为可靠的母系遗传标记,用以研究畜种的起源、演化和分类。家畜的mtDNA存在于细胞质中的线粒体内,是共价闭合的环形双链DNA分子[9]。对牛mtDNA的研究发现,现代家牛的线粒体支系主要是T和I支系,分别属于普通牛和瘤牛支系[12]。普通牛的线粒体支系主要有T1、T2、T3、T4和T5,单倍型多样性从驯化地近东地区向周边地区递减[13-14];瘤牛的线粒体支系主要有I1和I2,线粒体和考古学证据均显示印度河谷是瘤牛最初的驯化地[14-15]。

目前,就蒙古牛单个品种而言,mtDNA 全基因组遗传多样性、单倍型类型及系统发育进化研究较少,本研究对10头蒙古牛进行三代测序及mtDNA全基因组序列的分析,结合早先发表的26头蒙古牛线粒体数据,从母系遗传角度鉴定蒙古牛的遗传多样性,厘清蒙古牛的母系起源,并为其保种选育提供理论依据。

1 材料与方法

1.1 数据来源

本研究使用的10头蒙古牛三代数据(NMG02-05,NMG07-10,NMG12,NMG16)来源于本团队的蒙古牛全基因组重测序原始数据;另外从GenBank下载26头蒙古牛线粒体全基因组序列(表1),并下载T1-T5,I1和I2共7个mtDNA全基因组单倍型组标准序列(EU177841,AY676856,EU177839,AB074964,EU177862,EU177868,AF492350)作对照。

表1 蒙古牛36个mtDNA基因组的个体号

1.2 数据分析

使用NGMLR软件[16]将clean reads比对到普通牛参考基因组(ARS-UCD1.2)上获得BAM文件,再通过SAMtools软件[17]从基因组BAM中提取线粒体基因组。将线粒体基因组的BAM比对转化为FASTQ文件,再使用Mapping Iterative Assembler v1.0 (MIA,https://github.com/mpieva/mapping-iterative-assembler)组装mtDNA序列。

使用DnaSP v5.10软件[18]对蒙古牛的mtDNA序列进行分析,对蒙古牛的单倍型和可变位点数量进行统计,并计算单倍型多样度(Hd),核苷酸多样度(Pi)和平均核苷酸差异数(k)等遗传多样性参数。利用MEGA 5.0软件[19]对蒙古牛mtDNA序列进行比对分析,之后进行人为校正,构建蒙古牛mtDNA单倍型IQ-Tree。

2 结果与分析

2.1 蒙古牛线粒体DNA全基因组的序列特征

对36头蒙古牛的线粒体全基因组数据进行统计,其平均比对率为99.82%,平均深度为4241.06 ×(18253.70×-190.22×)。碱基组成分析表明,A+T的含量(63.4%)明显高于G+C的含量(36.6%)。在蒙古牛群体中共检测到962个变异位点,有808个单一多态位点,115个简约信息位点。778个单一多态位点为两碱基突变,28个为三碱基突变位点;简约信息位点中有108两碱基突变,7个三碱基突变位点。

2.2 蒙古牛线粒体DNA全基因组遗传多样性

使用DnaSPv 5.10 软件对蒙古牛的36个mtDNA全基因组序列进行比对分析,36个mtDNA基因组全序列可定义为22种单倍型,其单倍型多样度(Hd±SD)为0.997±0.010,核苷酸多样度(Pi±SD)为0.01281±0.010,平均核苷酸变异数(K)为87.230,表明蒙古牛有丰富的mtDNA遗传多样性。

2.3 蒙古牛线粒体DNA全基因组系统发育树

使用iTOL v5工具[20]构建蒙古牛的IQ-Tree,将7条已知单倍型组信息的mtDNA基因组序列(包括单倍型 T1-T5和I1-2支系),与36个蒙古牛的mtDNA基因组单倍型构建IQ-Tree(图 1)。发现蒙古牛有普通牛和瘤牛两个母系起源,其中32头属于普通牛,4头属于瘤牛,说明蒙古牛群体中,线粒体支系以普通牛为主。IQ-Tree展示了蒙古牛mtDNA基因组的两个大单倍型组:普通牛T单倍型组和瘤牛I单倍型组。单倍型组 T3 在蒙古牛中所占频率最高47.2% (17/36),其次是T2,频率为22.2% (8/36),再次是T4,频率为19.4% (7/36),最后是I1,频率均为11.1% (4/36),没有发现T5和I2单倍型。

3 讨 论

早先的研究发现,普通牛的线粒体支系包括T1-T4等,呈现出较为明显的地理分布规律:T3单倍型主要在欧亚地区,T2支系主要在意大利、巴尔干半岛和亚洲地区,T1在非洲地区有很高的特异性[12,21]。瘤牛的线粒体支系主要是I,分为I1和I2两大分支,其主要驯化地在印度次大陆北部[12,15]。本研究所涉及的36头蒙古牛中,共检测到22种单倍型。具有普通牛起源的32个个体中有19种单倍型组,表现出丰富的遗传多样性;而在4头具有瘤牛起源的个体中,仅检测到3种单倍型组,遗传多样性较贫乏。推测形成这种单倍型分布格局的原因有二:一是普通牛分布地域较广,在强大的受选择压力和外部环境的作用下,碱基突变的频率相对较高;瘤牛分布范围相对有限,且气候环境较为适宜;二是普通牛的野生祖先单倍型类型较多,野牛驯化为家牛后仍保留了较多的单倍型类型;而瘤牛间的基因交流可能比较频繁。此外,大量的历史和考古记录指出,瘤牛在公元前两千年引入中国新疆,印度瘤牛则在公元二世纪出现在中国内陆地区,推测对蒙古牛品种的渗入可能发生在古代中国“丝绸之路”时期,贸易网络东起长安,西至地中海地区,向南延申到印度,连接起了中国内陆与中东、南亚各国,大规模的贸易往来与人员迁徙伴随着瘤牛的流动,引发了中国内陆牛品种的血统交融[22]。

雷初朝等[23]研究了中国8个黄牛品种共22个个体mtDNA D-loop区的碱基组成,A+T和G+C的含量分别为61.65%和38.35%。通过分析10头蒙古牛的mtDNA全基因组碱基组成,发现A+T(63.4%) 的含量明显高于G+C含量(36.6%),这与其他物种的研究结果一致,说明普通牛群体中,无论是mtDNA基因组全序列还是D-loop区,碱基含量都相似,符合脊椎动物mtDNA碱基组成的特点,也与哺乳动物mtDNA碱基组成基本比例相一致[24,25]。单倍型多样度(Hd)和核苷酸多样度(Pi)常用作衡量群体mtDNA变异程度的重要参考,其数值越高,群体遗传多样性就越丰富[26]。本研究中36头蒙古牛的单倍型多样度为1±0.0045,遗传变异程度高于黄牛平均水平,反映出蒙古牛有很高的遗传多样性,这可能与其所处的地理位置有关。蒙古牛主要分布在蒙古高原及其毗邻地区,牧草丰美、地理开阔,为牛种的基因交流带来极大的便利,使蒙古牛群体拥有丰富的遗传多样性。mtDNA在牛上的研究与应用较为广泛,本研究首次应用三代测序技术构建蒙古牛母系遗传图谱,对厘清蒙古牛群体内的血缘关系和制定培育方案有着积极的育种效用。

猜你喜欢
碱基蒙古线粒体
线粒体质量控制在缺血性脑卒中的作用研究进展
特发性肺纤维化中的线粒体质量控制
线粒体自噬在纤维化疾病中作用的研究进展
线粒体自噬在蛛网膜下腔出血中的研究进展
基因“字母表”扩充后的生命
《蒙古秘史》中的奶食文化研究
创建新型糖基化酶碱基编辑器
蒙古靴
生命“字母表”迎来新成员
生命“字母表”迎来4名新成员