范欢欢,王天骄,张然然,邢秀梅
(中国农业科学院特产研究所,特种经济动物分子生物学重点实验室,吉林 长春 130112)
梅花鹿(Cervus nippon)和马鹿(Cervus elaphus)为偶蹄目(Artiodactyla)鹿科(Cervidae)鹿属(Cervus)的两个种,由于这两种鹿染色体具有高度的同源性,生殖隔离和遗传隔离的程度较浅[1],还未进化到“限制或停止基因交换”的阶段[2],不论在野外[3]还是家养情况都可以产生可育的后代[4]。近十余年,我国鹿茸市场混乱,养鹿企业及个体养殖户为了追求杂交带来的利益,盲目地将杂交公鹿作为种用,加之人工受精技术的应用,无序进行种间杂交,使得纯种梅花鹿数量锐减,给梅花鹿的良种繁育带来了挑战,也给纯种梅花鹿的保护带来了压力和困难。优良的梅花鹿种质资源被消耗,将会导致杂交改良难以继续进行,这与杂交的初衷相矛盾。自然界中杂交的后代从体型上接近梅花鹿;在人工圈养状态下,以梅花鹿为母本、马鹿为父本杂交产生F1,再以梅花鹿公鹿与F1 代母鹿交配,这样得到的F2代杂交鹿其体型外貌与梅花鹿极为相似,肉眼难以将二者区分。
随着科技的快速发展,高通量基因分型技术和全基因组测序技术成本逐渐降低,单核苷酸多态性(single nucleotide polymorphism, SNP)在种源鉴定的应用已成主流趋势,Kim等[5]利用SNP 标记技术,构建了由90 个SNP 标记组成的集合,用于鉴别韩国本地牛、杂交牛和外来品种牛,同时随着基因芯片技术的发展,全基因组SNP 芯片应运而生[6]。目前比较成熟的SNP 芯片公司是Illumina 公司的Infinium 技术[7]和Affymetrix 公司的Axiom 技术[8]。
Illumina Infinium 芯片是基于微珠的Bead Array生物芯片[9],Affymetrix 芯片制作是通过“光蚀刻”完成的[10],目前,全基因组SNP 芯片种类非常多,如猪[11]、牛[12]、绵羊[13]、三文鱼[14]和鸡60 K[15]。基因芯片为遗传多样性分析、品种关系分析、全基因组关联分析(Genome-Wide Association Studies, GWAS)和定量性状鉴定提供了重要工具[16]。另外,SNP 芯片技术广泛应用于动物遗传追溯体系,SNP 标记在追溯体系中不仅能做到物种识别和品种鉴别,例如陆地棉的基因芯片[17]包含17 954 个种间SNP,可以准确地区分陆地棉和海岛棉。水稻60 K[18]可以对粳稻、籼稻及其杂交群体进行准确地鉴别,鸡55 K[19]基因芯片可以准确地对中国13 个地方品种进行鉴别。
本团队对249 只梅花鹿、206 只马鹿、一代杂交鹿(F1)23 只、二代杂交鹿(F2)20 只和三代杂交鹿(F3)20 只共518 个个体(表1)进行全基因组重测序(F1 是梅花鹿母鹿和马鹿公鹿产生的后代,F2 是花马杂交后代的母鹿和梅花鹿公鹿杂交产生的后代,F3 是梅花鹿公鹿和F2 代母鹿杂交产生的后代),共产生14.03 T有效数据(Cleandata),以染色体级别梅花鹿基因组为参考序列,对所有个体进行变异检测,共产生130 306 923 SNP 位点,经过质控过滤剩余32 940 536 个位点,同时结合所有个体的表型信息确认梅花鹿和马鹿参考群体,计算所有SNP 在两个参考群体中的遗传分化指数(Genetic differentiation index, FST),根据定制算法和严格的筛选原则,最终选取1 000 个马鹿特异性SNP位点用于1K梅花鹿基因芯片的开发(即鹿芯壹号)[20],该芯片可以准确对待测样本的种源(即梅花鹿纯度)进行鉴别。
表1 鹿全基因组测序样本信息Table 1 The information of the whole genome sequencing samples
本研究利用梅花鹿基因芯片对284 只待测样本进行基因分型,同时对芯片的准确性进行评估,为纯种梅花鹿的保护和利用提供技术支持。
1.1.1 试验材料 从盘锦、阿城和西丰采集的284 只鹿的待测抗凝血液样本,见表2。
表2 血液样品信息Table 2 The information of the blood samples
1.1.2 主要试剂与仪器 血液基因组DNA 提取试剂盒(DP348-03)购自天根生化科技(北京)有限公司;异丙醇、无水乙醇、琼脂糖、50 TAE、6 Loading Buffer、DL15 000 DNA Marker 均购自生工生物工程(上海)股份有限公司。电泳仪(EPS-300)购自上海天能科技有限公司,凝胶成像系统(SYSTEMGelDocXR+IMAGELA)购自伯乐生命医学产品(上海)有限公司。
1.2.1 DNA 的提取与质量检测 对试验动物进行颈静脉采血,使用血液基因组DNA 提取试剂盒(DP348-03)对血液样品的基因组DNA 进行提取。DNA 3.5L(2L DNA 样品,1.5L 6 Loading Buffer,混匀)上样于1%琼脂糖凝胶,120 V 电泳18 min,然后将凝胶取出,放入凝胶成像系统观察结果。
1.2.2 1 K SNP 芯片分型及质控 本研究所有群体样本均按照Illumina 公司提供的扫描方案进行1 K芯片扫描和基因分型。其主要步骤为:①样本DNA定量,按照要求提供稀释至50ng/L 的样本DNA;②全基因组DNA 扩增;③样本DNA 片段化、沉淀和重悬;④与1 K 芯片杂交;⑤芯片扫描和数据读取分析。基因分型后剔除SNP 检出率小于95% 的SNP 及个体和次要等位基因频率(minor allele frequency,MAF)小于0.05的SNP 标记[21]。
1.2.3 系谱、表型鉴定 虽然待测个体都有系谱记录,但是现场工作的复杂性可能会出现系谱记录不准确,并且F2 代仅靠表型无法对其进行准确地鉴定。因此,本研究根据待测个体的系谱记录及表型对其进行综合鉴定。梅花鹿属于中型鹿,背面为黑色,腹面为白色,背部中央多有明显的暗褐色背线(有些品种背线不明显或无背线),臀部有明显白色臀斑,围绕臀斑有一圈或半圈黑色被毛,尾长9~15 cm;夏季毛色呈棕黄色或棕红色(因品种不同而有所差异),遍布白色斑点,状似梅花;冬季毛色呈灰褐色,白斑不明显[22]。F1 代个体的体型多大于马鹿,被毛颜色多为淡黄色或灰色,斑点不明显或无斑点,臀斑颜色为白色,无黑色毛圈,明显区别于梅花鹿,另外F1代个体的鉴别可参考Ward等[23]建立的四点视觉评分系统;F2 代个体体型外貌类似梅花鹿。本研究在梅花鹿资源研究领域专家对待测样本的头长、毛色、背线、尾斑、喉斑和臀斑综合评定后完成个体表型鉴定,同时结合系谱记录对待测个体进行综合鉴定。
1.2.4 种群结构分析 根据样本的基因分型数据利用R-4.0.2 中的prcomp 函数进行主成分分析,然后使用ggplot2 包进行作图。
图1 为血液基因组DNA 提取部分结果。经琼脂糖凝胶电泳检测,大部分DNA 样品的质量可以满足要求,个别样品DNA 电泳条带出现严重拖尾、条带过暗或无条带现象。不合格的样品重新进行基因组DNA 的提取并进行质量检测,直至达到测序要求。
图1 血液基因组DNA 琼脂糖凝胶电泳结果Fig.1 DNA agarose gel electrophoresis results of the blood genome
284 个样本的芯片检测数据进行分析发现有974个位点具有多态性,经过过滤条件(见方法1.2.2)的筛选剩余833 个SNP 位点用于后续的分析,剩余位点的MAF 平均值为0.38,SNP 位点的平均检出率为98.7%,3 个群体的平均检出率,见表3。
表3 芯片质控信息Table 3 The information of the chip quality control
根据系谱、表型鉴定方法(见方法1.2.3 和1.2.4),284 只待测个体中F1 共有48 只,F2 有50 只,梅花鹿186 只。根据这些样本的芯片分型数据进行PCA 分析,见图2。结果表明,F1 和梅花鹿分别紧密地聚集在一起并且聚集在PC1 的两端,F2 个体较为分散,但是整体上和F1、梅花鹿区分明显,这和系谱、表型鉴定的结果基本一致,说明芯片的检测结果是准确的。
图2 待测样品的种群结构分析Fig.2 The population structure analysis of the samples to be tested
目前梅花鹿及其鹿产品的鉴别技术主要分为物理化学方法和生物学方法两大类,其中物理化学有质谱、红外线光谱等技术。尹冬冬[24]选择近红外光谱在7 500~4 500 cm-1信息段对鹿血和伪劣鹿血近红外光谱进行分析,结果表明该方法鉴别真正鹿血样本和未知鹿血样本准确率分别达到100%和93%。郭晓涵等[25]将主成分分析(PCA)和OPLS-DA 相结合的UPLCQTOF-MS 法成功地应用于中国药典规定鹿茸的鉴别。利用主成分分析(PCA)和OPLS-DA 对原发生QI 处理后的数据进行分析,并从大样本中发现两个标记肽。根据产品离子模型,选择了具有较好响应的两个片段离子以建立适当的多响应监测(MRM),其可用于鉴定驯鹿鹿茸,即使在浓度较低的情况下也是可以对驯鹿鹿茸的真伪进行定性鉴别,为规范鹿茸市场提供有力的技术支持。生物学方法是蛋白质和DNA 分析方法,蛋白质分析方法包括电泳法[26]和免疫学方法[27],DNA分析方法如PCR、qPCR 和SNP 等。刘春生等[28]根据鹿科鹿属种动物Cytb 全序列比对分析,设计1 对可以鉴定正品鹿茸(包括梅花鹿和马鹿)和其他近源种鹿茸的特异性引物,并且结合PCR 的方法可以快速准确地鉴别出马鹿和梅花鹿的产品。Fajardo[29]提出了一种四重实时荧光定量PCR 检测方法,可以同时测定马鹿和梅花鹿成分的含量。四重分析法显示与密切相关物种的中等交叉反应性,优化后,四重分析法对四种鹿的每种检测限为0.1%,定量限为0.5%。董世武等[30]基于GBS 测序技术以组装到染色体的梅花鹿基因组为参考,检测173 个梅花鹿、209 个马鹿、113 个一代杂交鹿(F1)、38 个二代杂交鹿(F2)以及1 个未知个体共534个样本的SNP变异,经过严格的筛选原则,筛选出40295个SNP位点用于分子进化树的构建,根据分子进化树显示的样本间进化关系确定参考群体,识别马鹿有而梅花鹿没有的特异性SNP 位点760 个,梅花鹿有而马鹿没有的特异性SNP 位点501 个。本研究利用的1 K梅花鹿基因芯片是在整个基因组范围内寻找马鹿和梅花鹿基因组的不同点,GBS 测序只是对基因组的1%进行测序。因此,基因芯片的结果要更加准确。
主成分分析结果表明,主成分1(principal components 1,PC1)可以将梅花鹿、马鹿、F1、F2 区分出来,F2群体较为分散分布在PC1 的中间位置,但大体上可以和其他两个群体区分开来,这可能是因为F2 群体中个体血缘纯度不均一[21]。另外F2 群体中还有3 个表型鉴定为F1 的个体,可能是因为采样季节(换毛季节)对人为判断造成影响,3 个F1 实际为F2 群体。