王文涛,刘 娣,*,张东杰,何鑫淼,田 明
(1.东北林业大学野生动物与自然保护地学院,哈尔滨 150040;2.黑龙江省农业科学院畜牧研究所,哈尔滨 150086)
猪是最早由人类从野生驯化为家养的动物,地域和文化差异造成世界猪种遗传多样性非常丰富[1],目前认为存在2个以上猪集中驯化区域[2-3]。野猪驯化成为家猪是长期自然和人工选择结果,从分子遗传学角度分析猪起源和进化方面认为,人类需求性选择影响不同区域猪种群分化程度,猪品种呈表型和生产性状差异。韩洪金等研究酪氨酸酶基因外显子序列发现,中国地方猪由东亚区域野猪驯化形成[4],但目前对于东亚区域野猪进化方面研究较少,因此开展黑龙江野猪系统进化研究对阐述东北区域家猪起源和进化历史具有重要意义。
世界野猪共有5个属、8个种、23个亚种,中国野猪有1个种和7个亚种,按照地理位置划分,黑龙江省野猪应属于中国野猪东北亚种(Sus scrofa ussuricus)。Alves等通过线粒体DNA研究发现,不同类型野猪分别被驯化为欧洲、亚洲地区家猪[5];Chen等研究欧洲区域家猪和野猪之间线粒体DNA发现,兰德瑞斯猪和欧洲野猪酶切图谱无差异,说明兰德瑞斯猪可能由欧洲野猪驯化而成[6]。黑龙江省位于我国东北区域,北、东部与俄罗斯相邻,西部与内蒙古、南部与吉林省接壤,黑龙江野猪与内蒙古、吉林、辽宁、韩国野猪之间进化关系一直受研究人员关注。
目前,在开展物种起源、进化和驯化方面研究时,常用线粒体DNA检测技术,尤其是线粒体细胞色素b基因(Cytochrome b,Cyt b)和线粒体D-loop区域分析,随着高通量测序技术发展和大规模使用,Cyt b基因和线粒体D-loop区域仍广泛作为起源进化重要标记。Cyt b基因具有在动植物种群中进化速度适中特点,适合在野生动物群体水平差异检验,Meenakshi等研究发现,猪Cyt b基因有7个SNP位点,揭示Cyt b基因变异对繁殖性状影响显著,认为其可作为母猪繁殖性能标记[7];Wang等利用Cyt b基因分析山东省地方猪品种与国外猪品种遗传多样性及系统发育关系,发现不同地方猪品种之间遗传距离较小,可能起源于共同祖先[8]。线粒体D-loop区为线粒体基因组控制区,位于tRNA-Pro和tRNA-Phe基因之间,线粒体D-loop区一般包括左、右功能区和中间保守区3个区域,Larso等研究发现,不同区域家猪和野猪在遗传方面共同特征较多,从侧面证明不同国家区域家猪是由野猪驯化而来;Hongo等研究越南家猪和野猪线粒体DNA发现,亚洲野猪和亚洲家猪共同形成越南本土家猪[9];Kim等对济州猪(韩国)、中国猪、澳大利亚野猪和欧洲猪等猪种开展研究,在最大似然距离基础上分析其线粒体D-loop区序列多态性和不同猪种间系统发育关系,获得不同猪种起源进化关系[10]。综合前人研究思路,本研究通过Cyt b基因和线粒体D-loop区测序、发育分析和单倍型组成分析研究黑龙江野猪系统进化路径具有可行性。
目前,关于我国东北地区野猪起源与进化研究报道较少,东北地区野猪在全国野猪进化分支地位尚待确定,因此,本研究通过采集黑龙江地区野猪样本,与NCBI提供其他地区样本Cyt b基因和线粒体D-loop区整合,开展分子进化研究,旨在从线粒体水平检测与阐释黑龙江野猪系统演化。
1.1.1 供试动物
黑龙江野猪样品23个,来自黑龙江省小兴安岭地区,采集耳组织样品,液氮保存于黑龙江省农业科学院畜牧研究所分子遗传实验室。
1.1.2 供试药剂
DNA Marker DL2000、4种脱氧核苷酸(dNTPs)、rTaq DNA聚合酶、pMD18-T载体均购自大连宝生物工程有限公司;胶回收试剂盒和质粒提取试剂盒购自上海华舜生物工程有限公司;其他试剂均为国产或进口分析纯。
1.2.1 DNA提取
取野猪耳组织样品50~100 mg,使用酚抽提法提取DNA,使用分光光度计和琼脂糖凝胶电泳法测定和检测DNA质量,样品DNA的OD260/280为1.70~1.90,1%琼脂糖凝胶电泳检测时,应满足条带清晰、整齐、无拖尾,点样孔附近无残留等条件,符合后续试验要求,样品DNA于-20℃保存备用。
1.2.2 引物设计与合成
参照NCBI上猪Cyt b基因序列(NC_000845)设计引物(Forward:5'ATG ACC AAC ATC CGA AAA TCA CAC C 3';Reverse:5'TCA CTT TAA TAG GTT GTT TTC GAT G 3'),预期扩增长度为1 137 bp。
参照NCBI上猪线粒体DNA序列(NC_000485.1)设计引物(Forward:5'CAA GCA TTC CAT TCG TAT GCA 3';Reverse:5'TGT ACG TTA TGT CCT GTA ACC ATT G 3'),扩增区域为D-loop区150~591 bp,预期扩增长度为441 bp。
1.2.3 PCR反应体系
PCR反应体系:基因组DNA(50 ng·μL-1)1 μL,上、下游引物(10 pmol·μL-1)各1 μL,rTaq DNA聚合酶(5 U·μL-1)1 μL,dNTPs(10 mmol·L-1)2 μL,10 × PCR Buffer 2 μL,ddH2O 11 μL,共计20 μL。
PCR反应条件为:95℃,5 min;30个循环:95℃,30 s;退火,30 s;72℃,60 s,循环结束;72℃,10 min;16℃,30 min,其中Cyt b基因退火温度为60℃、线粒体D-loop区退火温度为57℃。
1.2.4 克隆测序
PCR扩增产物通过1%琼脂糖凝胶电泳对目的片段胶回收,连接pMD18-T载体,转化大肠杆菌DH5α感受态细胞,提取阳性克隆质粒后,送至北京华大公司测序。
1.2.5 遗传多样性分析
将所测得序列使用DNAMAN软件作拼接和人工比对,应用MEGA 7.0软件比对整理后序列,并生成.meg格式文件。使用DNASP 5.10打开.meg格式文件,统计分析该比对序列SNP位点、单倍型数、单倍型多样性、核苷酸多样性、平均核苷酸差异数、保守区间等。
1.2.6 序列比对和系统进化分析
自GenBank下载16条野猪Cyt b基因序列、457个已注释线粒体D-loop区序列(D-loop数据集:PopSet:735861597, 1002342824, 1408588029,526162927),结合实验室获得黑龙江野猪序列,17条Cyt b基因用于构建分子进化树,480条线粒体D-loop区序列用于单倍型鉴定与系统发育分析。
单倍型鉴定采用DNASTAR lasergene11的Seq-Man Pro分离,SNP保留依据为最小等位基因频率(Minor allele frequency,MAF)>0.05,所有序列均采用Mega-X的Clustalw作比对,采用邻接法建立进化关系,使用500次重复的bootstrap分析评估每个分支的统计支持。
2.1.1 PCR扩增及克隆测序
以黑龙江野猪线粒体DNA为模板,获得黑龙江野猪Cyt b基因条带,PCR扩增结果见图1,与预期片段长度相符。
图1 黑龙江野猪Cyt b基因PCR扩增结果Fig.1 PCR amplification of the Cyt b gene in Heilongjiang wild boar
获得23条黑龙江野猪Cyt b基因序列,23条Cyt b基因全序列长度均为1 140 bp,见图2,其中A、T、C、G含量分别为30.2%、26.9%、29.4%和13.5%,平均A+T含量57.1%,平均C+G含量42.9%,A+T含量略高于C+G含量,未出现明显偏差。
黑龙江野猪23条Cyt b基因序列共存在2个变异位点,全部为简约信息位点(Parsimony informative sites),分别位于693 bp和1 045 bp处,无单一变异位点(Singleton variable sites)。使用Dna SP 5.1软件分析发现,黑龙江野猪23条Cyt b序列共检测出3种单倍型,单倍型多样性(Hd)为0.605,核苷酸多样性(π)为0.00067,平均核苷酸差异数(K)为0.69203;利用Tajima's D和Fu's Fs检验得到中性检测结果表明,黑龙江野猪Tajima's D和Fu's Fs值均呈正值,分别为0.64237和0.90198,且差异不显著(P>0.05),表明黑龙江野猪群体符合中性进化假说,种群呈较为稳定状态。
2.1.2 黑龙江野猪Cyt b基因系统进化分析
从NCBI数据库中共收集整理16条野猪Cyt b基因序列,其中9条为欧洲、亚洲和非洲野猪序列,7条为中国不同地区野猪序列,见表1。
图2 黑龙江野猪Cyt b基因完整编码区序列区Fig.2 Complete sequence region of Cyt b gene in Heilongjiang wild boar
表1 野猪类群具体情况Table 1 Specific situation of wild boar group
构建不同野猪群体Cytb基因分子进化树,见图3,结果表明欧洲和非洲野猪聚在一个分支,而亚洲野猪聚在另一个分支,彼此间亲缘关系符合地理分布特征。
2.2.1 PCR扩增与测定
以黑龙江野猪线粒体DNA为模板,获得黑龙江野猪线粒体D-loop高变区(150~591 bp)条带,PCR扩增结果见图4,与预期片段长度相符。
成功获得23条黑龙江野猪线粒体D-loop高变区基因序列,其中A、T、C、G含量分别为28.7%、30.0%、25.5%和15.8%,平均A+T含量58.7%,平均C+G含量41.3%,A+T含量略高于C+G,但未出现明显偏差,序列信息见图5。
图3 基于不同野猪群体Cyt b基因序列系统发育分析Fig.3 Phylogenetic analysis of Cyt b gene sequence in different wild boar
图4 黑龙江野猪线粒体D-loop区PCR扩增结果Fig.4 PCR amplification of the mtDNA D-loop in Heilongjiang wild boar
黑龙江野猪23条D-loop序列共存在4个变异位点,分别位于280 bp、388 bp、453 bp和561 bp处,全部为简约信息位点使用Dna SP 5.1软件分析发现,黑龙江野猪23条D-loop序列共检测出3种单倍型,单倍型多样性(Hd)为0.755,核苷酸多样性(π)为0.00377,平均核苷酸差异数(K)为1.668;利用Tajima's D和Fu's Fs检验得到中性检测结果表明,黑龙江野猪Tajima's D和Fu's Fs值均呈正值,分别为1.493261和2.096753,且差异显著(P<0.05),表明黑龙江野猪群体符合中性进化假说,种群呈较为稳定状态。
图5 黑龙江野猪线粒体D-loop高变区序列Fig.5 Sequence of hypervariable region in mitochondrial D-loop of Heilongjiang wild boar
为探讨东北亚地区野猪种群分化,首先通过整合NCBI的Popset子库中包括内蒙古、吉林、辽宁、韩国两个野猪子数据集(popset735861597、popset1002342824),采用邻接法构建基于D-loop区核苷酸序列邻接法分子进化树,东北亚地区野猪群体线粒体D-loop区系统发育关系见图6。
由图6可见,东北亚地区野猪主要分3个类群,其中内蒙古、黑龙江、吉林省野猪分为两个主要类群,一支由黑龙江和内蒙古野猪构成,另一支由黑龙江、吉林、内蒙古野猪组成,第三支由辽宁省和韩国野猪组成,说明东北亚地区野猪亲缘关系符合地理分布,但存在地区差异。
为进一步探索黑龙江野猪起源与进化,整合来自NCBI已注释西亚野猪、欧洲野猪、东南亚野猪以及中国其他地区野猪序列,构建包括480个样本的欧亚野猪D-loop区序列集,并以猯和疣猪为两级进化外类群,通过SeqMan Pro过滤掉MAF小于0.05位点,获得27个有效SNPs,其中包括19个简约信息位点和8个单一变异位点,最大简约信息位点为452:C/T,根据外类群提供信息,T为后天突变,见表2,共组成21个单倍型,欧亚野猪和外类群D-loop单倍型序列比对与进化见图7。
由图7可见,所有野猪单倍型可分成两个类群:类群I和类群II,类群I主要包括单倍型Hap 1、Hap 2、Hap 4、Hap 8、Hap 9、Hap 11、Hap 13、Hap 14和Hap 18,类群B则包含Hap 3、Hap 5、Hap 6、Hap 7、Hap 10、Hap 12、Hap 15、Hap 16和Hap 17。在类群I中,除单倍型4,其余单倍型拥有外类群代表24T和49C。黑龙江野猪包括3种单倍型,分别为Hap 7、Hap 9和Hap 15,其中Hap 9和Hap 15处于类群I,Hap 7处于类群II。
图6 东北亚地区野猪群体线粒体D-loop区系统发育关系Fig.6 Phylogenetic relationship derived from mitochondrial D-loop region sequences of wild boar population in Northeast Asia
表2 欧亚野猪mtDNA D-loop突变位点分析Table 2 Analysis of mtDNA D-loop mutation loci in Eur-asian wild boar
图7 欧亚野猪和外类群D-loop单倍型序列比对与进化Fig.7 D-loop haplotype sequence alignment and evolutionary of Eur-asian wild boars and outgroups
基于欧亚野猪D-loop区序列单倍型情况,对包括中国黑龙江野猪、内蒙古野猪、吉林野猪、辽宁野猪和韩国野猪在内东北亚地区56个野猪线粒体D-loop区高变序列作单倍型归类,发现东北亚地区野猪种群共涉及5个单倍型,分为两个类群,类群I组包括Hap 3、Hap 7、Hap 9和Hap 15,类群II组仅包括Hap 1,采用邻接法重新构建分子进化树,每个单倍型所包含不同地区野猪群体见图8。
图8 东北亚地区野猪D-loop单倍型系统发育关系Fig.8 Phylogenetic relationship derived from D-loop haplotype sequences of wild boar population in Northeast Asia
由图8可见,黑龙江野猪具有3个单倍型,分别为Hap 7、Hap 9和Hap 15,同时具有24C、24T和49T,内蒙古野猪具有2种单倍型,分别为Hap 3和Hap 7,具有24C和49T,辽宁和韩国野猪仅一种单倍型,为Hap 1,具有与外类群一致24T和49C。
线粒体DNA呈母系遗传特性,同时具有相对稳定、背景清晰、结构简单、分子质量较小、数据来源广泛、数量众多等特点,为研究生物母系起源重要标记基因,同时试验材料要求相对低、获得结果清晰,在群体遗传学、基因组学、系统与进化生物学等方面研究应用广泛[11-12],但因其无法反应父系遗传情况,不遵守孟德尔遗传定律,具有一定局限性,猪线粒体DNA编码Cyt b基因等37个基因,而D-loop区为非编码区,主要作用为调控线粒体DNA复制、转录。本研究利用Cyt b基因和D-loop区开展黑龙江野猪系统进化研究,从母系遗传角度获得其规律,但同样受线粒体DNA局限性制约,需深入研究。
现代野猪在全球各地皆有分布,研究人员利用线粒体DNA检测技术,在野猪和家猪起源方面开展大量研究,认为不同地区家猪间在线粒体DNA上遗传差异较大,相同地区家猪和野猪间共同遗传特征较多,证明不同地区家猪由当地野猪驯化而来。本课题组前期在对民猪和大白猪Cyt b基因作遗传多样性研究时发现,民猪60条Cyt b基因序列共存在5个变异位点、5种单倍型,单倍型多样性为0.638,核苷酸多样性为0.0011,平均核苷酸差异数为1.11356,中性检测结果表明,民猪群体符合中性进化假说,种群呈较为稳定状态;大白猪Cyt b基因序列共存在14个变异位点、4种单倍型,单倍型多样性为0.581,核苷酸多样性为0.00599,平均核苷酸差异数为6.05419,中性检测结果表明,大白猪群体不符合中性进化假说,种群经过扩张。本试验在对黑龙江野猪Cyt b基因研究中同样通过单倍型多样性、核苷酸多样性和平均核苷酸差异数分析其遗传多样性,与民猪和大白猪群体比较发现,所采集黑龙江野猪Cyt b基因群体遗传多样性相对贫乏,其核苷酸多样性远低于民猪和大白猪,与野生状态下黑龙江野猪不同血统个体交流受限有关,大白猪核苷酸多样性最高,可能与商品化养殖为避免近交而不断引入外缘血统或与其他猪种杂交改良有关,利用Tajima's D和Fu's Fs检验得到中性检测结果表明黑龙江野猪和民猪均符合中性进化假说,种群呈较为稳定状态,而大白猪群体不符合中性进化假说,种群经历扩张,所得结果与3个种群实际情况相符,黑龙江野猪长期处于自然繁衍状态,民猪市场竞争力低于进口商品猪种,近年一直处于保种状态,未经历快速扩群,处于相对稳定状态,而大白猪则是目前世界范围内大规模养殖品种;系统进化分析表明欧洲和非洲野猪聚为一类,而亚洲野猪聚为另一类,彼此间亲缘关系符合地理分布特征。
张怡研究发现野猪种群遗传结构,有27个单倍型为东亚野猪线粒体DNA D-loop区序列独有,东亚野猪遗传多样性显著高于欧洲野猪,认为东亚野猪由12个独立分支构成,朝鲜野猪和韩国野猪分散在3个亚支中,东亚野猪在不同地理区域经历不同种群历史[13]。本研究针对23头黑龙江野猪样品,展开线粒体D-loop高变区150~591 bp测序分析,所构建系统进化树表明,黑龙江野猪和吉林野猪、内蒙古野猪亲缘关系较近,与辽宁野猪和韩国野猪相对较远,符合地理分布特征,与黑龙江野猪Cyt b基因系统进化分析一致,也与张冬杰等对黑龙江野猪分子进化分析结果相同[14]。
在世界家猪进化领域,部分研究人员认同传统二元论观点,即现代家猪有欧亚两大母系起源,因此野猪也被称为欧亚野猪[15]。野猪根据地理和形态学标准则可区分为4个“亚种群”,分别为欧洲亚群,包括欧洲野猪、萨丁岛野猪、北非野猪、中东野猪、高加索野猪和里海野猪;印度亚群,包括印度野猪和斯里兰卡野猪;远东亚群,包括西伯利亚野猪和乌苏里野猪、日本的日本野猪和琉球野猪、中国台湾野猪、华南野猪和高丽野猪;印尼亚群,包括印尼野猪,目前已记录野猪有20个亚种,黑龙江省内野猪,按地理位置分应属于远东亚群。倪攀研究欧亚野猪线粒体DNA发现,东北野猪出现在欧洲家猪和野猪分支,部分欧洲家猪出现在亚洲分支,说明存在母系渗入现象[16];李崇奇等研究中国野猪线粒体DNA发现,中国华南区域野猪通过自然迁徙或人口流动,由华南地区向北部区域移动,到达中国东北区域形成东北区域野猪[17];徐秋良等在对淮南猪、东北野猪单倍型Network网络研究中发现,东北野猪虽与淮南猪拥有部分共同单倍型,但与国外猪种亲缘关系较近[18];杨国伟等在东北野猪线粒体DNA研究中发现,东北区域野猪可能从欧洲方向迁移而来[19]。因黑龙江省与俄罗斯接壤有关,其地理区域横跨欧亚大陆,部分欧洲野猪参与东北区域野猪形成。
本研究依据线粒体D-loop高变区单倍型筛选,欧亚野猪主要有21种单倍型,根据图6可看出,外类群代表性SNP为24T和49C,由此类群I应为最古老野猪种群,Hap9和Hap10则为24C和49C,属于向类群II过渡的代表性单倍型,类群II为后续演化野猪种群,该类群可能为第二轮进化扩散结果,为欧亚野猪驯化起源提供理论依据。由单倍型组成分析可知,东北亚地区野猪共存在5种线粒体D-loop单倍型,根据图7单倍型分子进化关系,内蒙古、黑龙江、吉林野猪属于类群II,而辽宁省和韩国野猪则属于类群I,黑龙江野猪3种单倍型Hap 7、Hap 9和Hap 15中,具有24C、24T和49T,内蒙古野猪2种单倍型Hap 3和Hap 7中,具有相同24C和49T,辽宁野猪和韩国野猪唯一单倍型Hap 1,D-loop区在此处为24T和49C,与外类群猯和疣猪一致,说明辽东半岛地区野猪可能为最古老野猪进化分支之一;由于样本收集有限,本研究及NCBI数据库辽宁野猪、吉林野猪、黑龙江野猪和内蒙古野猪线粒体DNA序列中,并未发现过渡单倍型Hap9和Hap10,说明吉林野猪、黑龙江野猪和内蒙古野猪并非从辽东半岛演化而来,可能从另外一条迁徙路线形成当地野猪,在吉林、黑龙江和内蒙古等地发生分化,而黑龙江野猪线粒体D-loop区单倍型种类最多(3种),包括内蒙古野猪和吉林野猪所有单倍型,说明黑龙江地区可能为中国东北部野猪分化中心之一,研究结果为东北亚地区野猪起源与进化提供理论依据。
①获得黑龙江野猪Cyt b基因序列,其遗传多样性相对较低;分子进化树显示不同地区野猪亲缘关系远近符合地理分布特征,与其线粒体D-loop区序列进化分析结果一致。
②黑龙江野猪线粒体D-loop区序列单倍型系统进化分析表明,黑龙江野猪单倍型种类最多(3种),包括内蒙古野猪和吉林野猪所有单倍型,黑龙江地区可能是野猪分化中心之一。
本研究虽整合大量来自NCBI野猪线粒体D-loop区数据,但仍难以保证野猪样本覆盖度,线粒体DNA属于母系遗传的鉴定手段,后期需开展大样本采集与全基因组测序,揭示东北亚地区野猪真正进化途径。