嵊县花猪全基因组选择信号检测

2018-10-23 01:53陈究成毛海光郭晓令潘玉春徐宁迎
中国畜牧杂志 2018年10期
关键词:基因组位点测序

陈究成,彭 静,毛海光,郭晓令,潘玉春,徐宁迎*

(1.浙江大学动物科学学院,浙江杭州 310058;2.上海交通大学农业与生物学院,上海 200240)

嵊县花猪产于浙江省绍兴市的嵊州、上虞等县市,2006年列入首批国家级畜禽遗传资源保护名录[1],其具有耐粗饲、早熟、产仔多、母性好、杂交配合力、抗病力强和肉质鲜嫩等优良特性,是浙江省宝贵的地方猪良种资源。不同品种猪在体型外貌、生长性能、肉质性状、繁殖性能等方面存在的表型差异是自然选择与人工选择对一些目标基因强烈定向选择的结果,而选择信号是与选择相对应的基因组信息。随着第二代测序技术的飞速发展,测序成本越来越低,在全基因组层面上检测选择信号成为可能,而利用选择信号分析来揭示造成猪性状表型差异的遗传机制的相关研究已广泛开展。Yang等[2]基于猪60K芯片数据,利用REHH方法扫描通城猪及大白猪的基因组,找到了关于生长、繁殖及免疫应答相关的候选基因;Ai等[3]利用猪基因组芯片找到了18个中国地方猪种的选择信号区域,发现中国地方猪在繁殖、免疫相关基因上有人工选择的痕迹;Li等[4]利用全基因组测序技术的选择信号检测发现了巴克夏猪和藏猪一些经济性状和携氧相关的基因;Kim等[5]利用XP-EHH方法,找到尤卡坦微型猪在体型上的信号选择区域;Xiao等[6-7]利用GGRS建库方法发现浦东白猪在高繁殖力和抗病力上有选择信号检出。因此,本研究利用群体遗传分化指数(FST)和核苷酸多态性(θπ)方法,通过对嵊县花猪和其他猪种群体间的选择信号差异分析,找到嵊县花猪相比于其他猪种群体的选择信号区域,从而对嵊县花猪特性形成原因进行研究,为嵊县花猪的保护和利用提供参考价值。

1 材料与方法

1.1 实验动物以及样品 本研究采用10个猪种共517头猪作为实验动物,其中浙江省地方猪种包括嘉兴黑猪、金华猪、嵊县花猪、淳安花猪、兰溪花猪、碧湖猪和岔路黑猪7个品种共计390头,外来猪种包括长白、大白、杜洛克3个品种共计127头(表1)。所有样本均采集耳组织样,并浸没于80%的酒精,置于-80℃冰箱保存备用。基因组DNA提取自采集的耳组织样本,质控合格后进行后续文库构建。

1.2 测序数据 本研究基于简化基因组GGRS方法[8]进行基因组文库构建,采用Illumina公司Hiseq2000平台测序,测序方法为Paired-end。测序数据已经上传到NCBI的 SRA数 据 库(https://www.ncbi.nlm.nih.gov/sra)。SRA号为SRP067498。

表1 实验猪群信息

1.3 SNP检出和基因型填补 本研究采用bwa和samtools软件进行SNP检出,检出条件:①每个SNP 位点最少有30%个个体被检测判型(当1个位点的分型质量值Q>30时,该个体才被认为检测判型);②最小等位基因频率(MAF)大于0.05;③每个位点的平均测序深度大于5 X。

1.4 Fst群体遗传分化是指群体间的等位基因频率存在明显差异。FST是检测群体遗传分化程度的重要指标之一,其主要反映亚群体间的平均杂合性相较于整个群体的平均杂合性大小的差异。本研究采用Weir等[9]提出的无偏估计FST的方法对检测到的SNP位点进行计算,具体计算公式:

其中,MSP和MSG分别为检测的亚群间和整个群体内的位点的误差均方,nc是指校正后的群体间的平均样本数量,计算公式:

其中,S是总亚群体数,ni代表第i个群体的样本大小,i=1,2,3,……,S;PAi代表第i个群体SNP中等位基因A的基因频率;PA是各群体的PA的加权平均值。

1.5 θπ一个不依赖于样本大小m的DNA多态性的测度是2个序列间每个位点上核苷酸差异的平均值或是核苷酸多样性。

其中,q是等位基因的总数,xi是第i个等位基因的群体频率,dij是第i个和第j个等位基因间每个座位的核苷酸差异数或者代替数。在一个随机交配的群体中,π代表核苷酸水平上的杂合度,可由下式估算:

其中,m代表所研究的DNA序列的总条数,dij代表第i条序列和第j条序列的核苷酸差异数或者代替数,c代表序列总数的 [m×(m—1)/2]。

1.6 群体间选择信号检测 本研究采用FST/θπ的方法对浙江省地方品种间的选择信号进行选择。在基因组上以20 kb为单位,以10 kb为步长进行划窗,计算窗口的平均FST/θπ值。一般认为,当FST值处在前5%以及θπ处在后5%区域有可能是选择信号所在的区域,公式:

其中,θπA和θπB分别代表A群体和B群体的θπ值。

2 结果与分析

2.1 浙江省地方猪SNP检测结果 依据材料方法部分给出的SNP检测标准,对样本进行了过滤,共有491个个体经过筛选进行后续SNPs分型。在经过填补和质控后,共计得到152 006个SNPs位点,其中MAF<0.05共计11 048个,哈迪-温伯格平衡检验(HWE)<10-6共有32 355个。将以上位点过滤之后,最终得到分型完的SNP标记共计108 603个。SNP位点在染色体上的分布见图1。

2.2 SNP 注释结果 利用Python脚本,将获得的SNPs和已经下载的猪的基因注释信息数据进行映射,得到SNPs在基因组上的区间分布。根据基因的不同功能,将基因区间分为基因间和基因内2类,基因内按基因的结构区域分类又包括起始/终止密码子、外显子、内含子、UTR区。SNPs映射结果见表2,SNPs在基因内的数量为34 293个,占SNPs总数的31.6%,其中分布在内含子上的SNPs有20 158个,占SNP总数的18.6%。由表2可知, 绝大多数SNPs分布在基因间,约占总数的68.4%,在基因内的34 293个位点中,大多数分布在内含子上,占到基因内位点总数的58.8%,另一部分分布在UTR区,占33.9%,只有少部分分布在外显子和起始/终止密码子上,分别占到7.3%和0.03%。

图1 SNP位点个数在染色体上的分布

2.3 嵊县花猪与其他群体间选择信号分析

图2 嵊县花猪与浙江省其他地方猪群体的FST/θπ统计分布结果

表2 SNPs在基因区间上的分布

2.3.2 嵊县花猪与浙江省地方猪群体间选择信号分析由图2可知,嵊县花猪与浙江省其他地方品种共检测到正向选择区域111个,兰溪花猪最多,共29个,嘉兴黑猪最少,只有9个。这些区域主要分布在2号染色体和12号染色体上。

为进一步了解这些信号选择区域的功能,对选择信号落入的基因及基因的功能进行了分析。经统计,选择信号落入的基因一共有9个,分别是SYT1、FAM135B、GLIS1、GALNT2、BIN1、LOC100627093、TG、SOX9、CH25H。嵊县花猪与嘉兴黑猪群体比较信号选择区域落入的基因数最多,有5个,与金华猪群体比较信号选择区落入的基因数有2个,与其他浙江省地方猪群体比较都只有1个基因落入信号选择区域(表3)。

2.3.2 嵊县花猪与外来猪群体间选择信号分析 由图3可知,嵊县花猪与外来猪群体共检测到正向选择区域70个,杜洛克、大白、长白分别有28、26和26个信号选择区域。经注释分析,选择信号落入的基因一共有8个,分别是MGAT5、MAPK4K4、KSR2、RBP5、HDLBP、KCNE2、KIRREL3、BTBD11,这些基因大多与免疫、繁殖以及肉质性状相关(表4)。

3 讨 论

本研究利用FST/θπ法对嵊县花猪和浙江省其他地方猪品种以及外来猪品种进行了选择信号分析,一共检测到179个选择信号区域,落入选择信号区域的基因一共有17个。其中,与浙江省其他猪种群体比较,在选择信号区域共落入基因9个,分别是SYT1、FAM135B、GLIS1、GALNT2、BIN1、LOC100627093、TG、SOX9、CH25H。GLIS1被证实和卵巢发育和早期胚胎发育相关,是一种在卵细胞和受精卵一、二细胞期的高表达蛋白,在胚胎发育中起着重要的作用[10-11]。SYT1被认为是作为钙离子在囊泡运输和胞吐的过程传感器突触小泡的膜蛋白,其和卵母细胞减数分裂过程和皮质反应的影响[12]。GALNT2基因属于多肽-N-乙酰氨基半乳糖转移酶家族,其主要功能是参与O-糖基化的第一步反应。根据最新的GWAS研究报道GALNT2基因单核苷酸多态性可影响高密度脂蛋白胆固醇及甘油三酯水平,其可能参与脂肪代谢,该基因的突变会导致胆固醇脂沉积,而且其在卵巢中也有较高的表达,可能和繁殖力相关[13]。BIN1基因则和背最长肌生成相关,突变也会导致背最长肌生成[14]。SOX9基因属于SOX家族,在哺乳动物个体发育中扮演重要角色,广泛存在于各种组织,主要在睾丸组织表达,在下丘脑-垂体-睾丸生殖轴中发挥重要作用,并与睾丸细胞的增殖及分化过程有密切的关系[15-16]。因此,嵊县花猪相比与浙江省其他地方猪群体检测出的这些选择信号区域可能和脂肪分解,繁殖力以及背最长肌肉生成相关。与外来猪种群体比较在选择区域共落入基因8个,分别是MGAT5、MAPK4K4、KSR2、RBP5、HDLBP、KCNE2、KIRREL3、BTBD11。其中,MAPK4K4被报道和脂肪生成相关,KCNE2基因在其他物种的研究中发现和胃酸的分泌密切相关,因此可推测该基因和嵊县花猪的消化功能有一定关系[17]。MGAT5基因被发现与肿瘤细胞转移相关,且对T细胞的激活以及自身免疫具有一定的调节作用[18]。KSR2基因作为MAPK信号通路的支架蛋白,正向调节 Ras/MAPK信号通路促进肿瘤形成和肿瘤细胞增殖,促进T细胞的分化,调节细胞的能量代谢并在炎症中起到保护作用[19-20]。这暗示嵊县花猪可能在免疫相关过程经历了一定的选择作用,对揭示嵊县花猪免疫性状的遗传机制具有一定意义。这也说明相比于外来猪群体,嵊县花猪在抗病力强、耐粗饲这些优良性状上经历了较强的人工选择。

表3 嵊县花猪与浙江省其他地方猪群体信号选择区域

图3 嵊县花猪与外来猪群体的FST/θπ统计分布结果

表4 嵊县花猪与外来猪群体信号选择区域

4 结 论

本研究利用10个猪种共计517个个体的测序数据,对嵊县花猪群体选择信号进行了检测分析,检测到选择信号的区域共计179个,落入这些区域的候选基因有17个。结果表明,相比于浙江省其他地方猪群体,嵊县花猪在脂肪代谢、高繁殖力等性状上经历了人工选择;相比于外来猪群体,嵊县花猪在免疫相关、耐粗饲等性状经历了人工选择。

猜你喜欢
基因组位点测序
“植物界大熊猫”完整基因组图谱首次发布
镍基单晶高温合金多组元置换的第一性原理研究
牛参考基因组中发现被忽视基因
CLOCK基因rs4580704多态性位点与2型糖尿病和睡眠质量的相关性
基于网络公开测序数据的K326烟草线粒体基因组RNA编辑位点的鉴定与分析
外显子组测序助力产前诊断胎儿骨骼发育不良
科学家找到母爱改变基因组的证据
血清HBV前基因组RNA的研究进展
中草药DNA条形码高通量基因测序一体机验收会在京召开
基因测序技术研究进展