朱程程,马大君,程占军,曹锦和,孙勇,万宁,李翔
(公安部南京警犬研究所/警犬技术公安部重点实验室,江苏 南京 210012)
随着我国警犬技术的快速发展,警犬的使用范围从过去的刑事侦查、维护治安扩展到血迹搜索、搜毒搜爆、安检和消防搜救等领域,而史宾格犬由于兴奋性高、体型小、嗅觉灵敏、耐力持久等特点,在这些新兴领域的使用中发挥着不可替代的作用。但是在胆量方面,史宾格犬的胆量天生较小,容易表现出恐惧行为,以至于部分史宾格犬不能被训练成工作犬投入到实战工作中去。
犬的恐惧行为与遗传、环境、表观因子等多种因素有关,欲想提高犬的胆量,降低恐惧行为,可以通过传统育种和分子育种2种方法。虽然通过传统育种方法可以在一定程度上提高胆量,但是传统育种方法具有周期长,且一旦品种育成就不易引入其他新的遗传性状等缺点。而随着现代生物技术的发展,分子育种显示出越来越强大的生命力,逐渐成为动物育种的趋势和主流。降低犬天生的恐惧行为,就要寻找与犬胆量性状相关的基因,探索犬胆量性状遗传机理,这能为从分子水平上对史宾格犬胆量性状进行遗传改良提供理论依据。
基因组遗传变异形式主要有单核苷酸多态性(single nucleotide polymorphism, SNP)、插入缺失(insertion-deletion, InDel)等,对基因组内遗传变异的发掘和研究是开发分子标记和功能基因定位的基础。SNP是最常见的遗传变异形式,约占全部变异的90%左右,各物种内都已经鉴定出海量的SNP,这些SNP被广泛用于基因遗传定位和群体进化研究。InDel是基因组中数量仅次于SNP的第二大类遗传变异,如果按照总长度计算,InDel甚至和SNP相当。
目前对于恐惧行为方面的研究主要集中在小鼠上。有研究表明,终纹床核和内侧杏仁核都是与啮齿类动物天生恐惧行为相关的大脑区域,抑制大脑这2个区域的活动能够减少啮齿类动物天生的惧怕感[1]。酸敏感离子通道(acid-sensing ion channels, ASICs)是一类可被胞外H+激活的非选择性阳离子通道,ASIC1a参与突触可塑性、学习记忆及条件性恐惧情绪等生理过程[1]。过表达ASIC1基因会使小鼠条件性恐惧行为增强[2]。另一方面,ASIC1a在小鼠天生恐惧感的形成等过程中,同样发挥重要作用[3]。Zhu等[4]研究证明,杏仁核EphB2信号调控小鼠先天性恐惧行为。Shumyatsky等[5]研究报道,敲除小鼠微管解聚蛋白(stathmin)基因后,会显著减少先天性恐惧行为。
分离群体混合分析是基因定位的有效手段之一。20世纪末,研究人员将具有多态性的分子标记与极端表型材料的DNA混池结合,能够成功鉴定与目标性状相关联的位点[6-7]。随着生物技术的不断发展,研究人员将分离群体混合分析与高通量测序技术相结合,开发混池测序方法,目前该方法已在水稻[8]、大豆[9]等作物以及鸡[10]、奶牛[11]等畜禽中得到广泛应用。然而,混池测序在动物行为相关基因挖掘方面的研究较少,在犬恐惧行为相关变异位点和基因的挖掘方面未见报道。因此,本研究采用了混池测序方法对犬全基因组与恐惧行为相关的SNP和InDel进行筛选,以期发掘与犬恐惧行为相关的功能基因。
本研究所用犬由公安部南京警犬研究所提供。对6~8月龄的犬进行严格的恐惧行为测试,根据测试结果选取恐惧行为极端差异的史宾格犬20条。采用前肢静脉采血的方法,将采集的全血收集在含有EDTA抗凝血的采血管中,处理后保存至-80 ℃的冰箱。
1.2.1 恐惧行为测试
恐惧行为测试包括5个项目,陌生人测试、光滑地面和枪声测试[12]、雨伞测试和金属易拉罐测试[13]。具体参考文献[14]的研究方法。
1.2.2 DNA提取及检测
使用Solarbio全血基因组DNA提取试剂盒从采集的犬全血中提取全基因组总DNA,依照说明书的要求及步骤提取血样DNA。通过Nanodrop检测DNA纯度,OD260/280比值在1.6至1.8之间。利用1%的琼脂糖凝胶对提取的DNA进行电泳,电压为150 V,电泳时间为30 min,分析DNA质量。通过Qubit 2.0检测样品浓度。
1.2.3 样品DNA分组混池
将采集的恐惧行为极端差异的20头犬分为2组,其中恐惧行为极高的10头设为高恐惧组(terrified group, FBH)组,恐惧行为极低的10头为低恐惧组(slight fear group, FBL)组,并将2组群体的基因组DNA分别等量混合。
1.2.4 DNA池重测序筛选SNPs和InDels
DNA提取、检测和混池结束后,送至奥维森基因科技有限公司,公司质量检测合格后,构建插入片段为200 bp的测序文库,再进行文库检测。文库质检合格后,选择Hiseq TM 2500测序仪上机测序。
1.2.5 数据分析
1.2.5.1 数据质量控制
本研究使用FastQC软件对原始数据进行质量评估,分别查看单碱基测序质量分布、测序错误率分布和序列GC含量分布等方面的信息,若某评估项目不合格,需要依据情况进行过滤,直到评估合格后进行后续数据分析。
1.2.5.2 序列比对参考基因组
本研究使用BWA把有效测序数据比对到参考基因组,然后用SAMtools[15]来检测SNP,只保留测序产生的短序列(reads)支持数大于等于4,比对质量值≥20的结果,且过滤Gap附近5 bp范围内的SNP,过滤SNP位点链偏向性(Pvalue<10-4)。本研究利用ANNOVAR软件[16]对SNP和InDel进行注释分析。
1.2.5.3 与史宾格犬恐惧行为相关SNP和InDel位点挖掘
由DNA混池全基因组重测序技术可得到大量SNPs和InDels,为保证准确性,将对筛选出的SNPs和InDels进行进一步的筛选。筛选条件[11]为排除FBH组和FBL组相同SNPs和InDels;SNPs和InDels位点位于外显子区域;SNPs和InDels位点变异类型选取非同义突变;1个基因出现多个位点变异的SNPs和InDels;样本基因型为杂合变异;测序深度大于40,测序深度越深,变异位点准确性越高。
20条史宾格犬基因组DNA检测结果如图1所示,由图可知犬基因组DNA长度为21 kb。条带亮度尚可,基因组DNA可用于后续试验。
M1、M2.DNA Marker;1~20.第1~20号犬的基因组DNA
根据公司提供的数据资料,使用FastQC软件对原始数据进行质量评估,结果表明,2组测序数据碱基质量值均在Q30~40之间,测序数据错误率在0.1%以下。FBH和FBL2组的AT,GC含量,基本上处于接近状态。测序数据过滤后,FBH组可用reads数为95.68%,FBL组可用reads数为95.16%。所有样本的数据量足够,测序质量合格,GC分布正常,建库成功。
将样本序列与参考基因组序列进行相似性比对,覆盖深度和覆盖度可以直接反应测序数据的均一性及参考序列的同源性。
由表1可知,2组样本的比对率为100%,对参考基因组的平均覆盖深度分别为10.06X和12.67X,1X覆盖度在99.58%和99.63%。由此可知,reads与参考序列比对结果正常,可用于后续的试验。
表1 测序深度及覆盖度统计
由表2可知,FBH组外显子区域发生突变位点31 226个,其中非同义突变13 232个。FBL组外显子区域发生突变32 698个,其中非同义突变13 808个。
表2 SNP检测和注释结果
由表3可知,FBH组外显子区域InDel位点共有1 697个,FBL组外显子区域InDel位点共有1 794个。
表3 InDel检测和注释结果
根据SNP和InDel筛选条件筛选出以下SNP和InDel位点。具体信息见表4和表5。通过1.2.5.3中筛选条件,共筛选出14个SNP位点,2个InDel位点,这16个位点位于9个基因上。
表4 SNP信息
表5 InDel 信息
混池测序结果的分析对犬恐惧行为相关变异位点的筛选至关重要,其影响因素也较多。犬恐惧行为强弱的精准判断是混池测序的基本要求,若判断不准确,则会影响混池测序的分析结果。此外,测序数据产出过程中文库构建、文库质检等每个环节都会对数据质量产生影响,而高质量的测序数据是得到可靠分析结果的必要保障。因此,在混池测序数据分析之前,应首先根据一定的筛选条件对原始数据进行筛选,并且对测序数据的质量进行评估,若评估出现问题,则应进行适当处理。
SNP选择时是根据特定的条件进行的筛选,主要考虑的是非同义突变。非同义突变是指DNA链上的碱基发生改变会导致氨基酸序列的改变,进而导致蛋白质的变化。非同义突变会导致蛋白功能发生变化。而同义突变的碱基并不会引起氨基酸的变化,从而也不会影响蛋白质的功能,因此,筛选会导致非同义突变的SNPs意义更大,非同义突变的SNPs是首要选择。
虽然目前的高通量测序技术的准确度相对较高,但仍存在一定程度的测序错误[17]。因此,在筛选测序数据结果的时候需要选择合适的测序深度的数据。本研究选择测序深度大于等于40的SNP和InDel位点,与李金霞[11]在筛选中国荷斯坦奶牛SNPs位点的测序深度筛选条件相一致。
本研究通过混池测序的方法筛选出的14个SNP位点和2个InDel位点中,大部分突变位点位于新基因上,其中有2个SNP位点位于MUC6基因上。MUC6是一种编码黏蛋白的基因,肿瘤组织中MUC6多出现异常表达[18]。有研究发现,慢性神经退行性疾病阿尔茨海默病与MUC6基因的遗传多态性相关[19]。本研究结果表明,MUC6基因上有2个SNP位点与犬恐惧行为相关,关于MUC6基因对犬恐惧行为的影响需做进一步的验证。
近年来,人们主要采用芯片杂交技术筛选犬特定性状和疾病差异表达基因[20-22],很少利用混池测序的方法来筛选犬特定性状相关变异位点。本研究利用DNA混池测序的方法分析恐惧行为极端差异史宾格犬的差异变异位点,共获得14个SNP位点和2个InDel位点,由于DNA混池测序的样本量每组只有10个,样本量较少,试验结果可能不具备足够的说服力。因此,关于筛选位点对犬恐惧行为的影响还需要深入研究,并通过扩大群体进行验证,以确定与犬恐惧行为遗传效应相关的SNPs,为犬遗传育种改良提供理论依据。