1 株西藏牦牛巴氏杆菌全基因组测序与比较基因组学分析

2019-08-20 07:06罗润波陈建春王一飞索朗斯珠
中国兽医杂志 2019年4期
关键词:氏杆菌牦牛基因组

贡 嘎,罗润波,陈建春,王一飞,索朗斯珠

(西藏农牧学院动物科学学院,西藏 林芝860000)

巴氏杆菌是革兰阴性小杆菌,该病原菌分布广泛。主要引起牛和水牛出血性败血症,主要为头部和颈部水肿,淋巴结肿胀、出血。根据荚膜多糖抗原不同,多杀性巴氏杆菌可分为A、B、D、E 型和F型5 个血清型;根据脂多糖抗原不同,可以分为1 ~16 个血清型[1]。本研究拟以本实验室临床分离的1 株牦牛巴氏杆菌菌株为研究材料,利用SMRT 方法对分离菌株进行全基因组测序,解析了西藏牦牛源巴氏杆菌菌株的全基因组序列。通过基因组学和比较基因组学对该菌株的基本特征进行了分析,为牦牛巴氏杆菌病的进一步研究提供数据支撑。

1 材料与方法

1.1 材料

1.1.1 菌株 测序菌株:牦牛巴氏杆菌1 株,由本实验室2016 年12 月从西藏林芝某地病死牦牛肺脏中分离,通过生化及PCR 鉴定,同时进行KM 小鼠致病性实验和菌株荚膜血清分型(A),保存。

1.1.2 主要试剂 ExTaqDNA 聚合酶,dNTPs,DNA Marker、10%新生牛血清、TSA 培养基、细菌基因组提取试剂盒等试剂,购自武汉科前动物试剂有限公司。

1.2 方法

1.2.1 细菌全基因组的提取、测序及序列组装 用细菌基因组提取试剂盒进行基因组的提取。通过SART法对牦牛源巴氏杆菌全基因组测序、应用组装软件Canu[2-4]对过滤后的Subreads 数据进行组装。组装工作由北京百迈客生物科技有限公司完成。

1.2.2 牦牛巴氏杆菌完整基因组注释与分析

(1)编码基因预测:通过软件Prodigal[5]对组装后的基因组进行编码基因预测;(2)重复序列预测:使用Repeat Masker[6]软件对细菌基因组进行重复序列的预测;(3)非编码RNA 预测:使用软件tRNAscan-SE[7]预测基因组中的 tRNA,使用软件 Infernal 1.1[9]基于Rfam[9]数据库预测基因组中的rRNA;(4)假基因预测:通过软件GenBlastA[8]比对,在基因组上寻找同源的基因序列(可能的基因),然后利用软件GeneWise[9]寻找基因序列中的不成熟的终止密码子及移码突变,预测测序菌株的假基因。

1.3 牦牛巴氏杆菌比较基因组学分析

1.3.1 基因组共线性分析 使用软件MCScanX[10]根据共线性关系对测序样品与参考基因组进行分析。

1.3.2 基因家族与特有基因分析 使用OrthoMCL软件对测序菌株预测出的蛋白序列和参考基因组的蛋白序列进行家族分类,之后对于基因家族进行分析,包括统计分析菌株特有的基因家族,菌株共有的基因家族。

1.3.3 物种间进化关系分析 使用测序物种与参考物种均为单拷贝的基因家族中的基因,利用PhyML[11]软件构建进化树,研究物种间的进化关系。

2 结果

2.1 所测牦牛巴氏杆菌的基本特征 本研究测定的巴氏杆菌菌株于2016 年分离自西藏牦牛,为A 型荚膜牛巴氏杆菌。

2.2 测序及组装结果 组装得到总长2 297 457 bp完整基因组,其GC 含量为40.3%。

2.3 基因组注释与分析结果 (1)编码基因预测结果:预测编码基因数量2096,预测基因序列总长度2 047 410 bp;(2)重复序列预测结果:原核生物基因组中重复序列含量极少。本次测序菌株中预测出的重复序列总长度为4 739 bp,基因组中重复序列含量0.21%;(3)非编码RNA 预测结果:非编码RNA 即不编码蛋白质的RNA,本次测序菌株中预测出19 个rRNA 非编码数量,59 个tRNA 非编码数量;(4)假基因预测:假基因是具有与功能基因相似的序列,但由于插入、缺失等突变以致失去了原有的功能。本研究得到的假基因数量为3,假基因总长度为736 bp。

2.4 牦牛巴氏杆菌比较基因组学分析

2.4.1 基因组共线性分析 将测序样品的蛋白序列分别与每一个参考基因组的蛋白序列进行BLAST比对,然后根据同源基因在基因组序列上的位置信息得到核酸水平上的共线性关系分析,共线性良好。

2.4.2 基因家族与特有基因分析 共得到2 105个基因族。1 株测序菌株与2 株参考菌株共有的基因族类(核心基因族)有1 483 个,占总基因组的70.45%。分析同时只在两株菌中共有的基因族发现,参考菌株Pasteurella multocida 与测序菌株Xizang Pasteurella 共有的基因族(394 个)明显多于其他组合。本次分离菌株与参考菌株共有的功能1 964 个,分离菌株特有的基因数量有132 个。部分结果的统计信息和维恩图见表1 和中插彩版图1。

表1 基因家族分类统计

根据上述聚类的基因家族的结果,分别统计测 序菌株和参考菌株的菌株特有基因(菌株特有基因家族中的基因和未参与到上述聚类的基因之和),统计结果见表2。

表2 测序菌株和参考菌株的菌株特有基因统计

2.4.3 物种间进化关系分析 使用测序物种与参考物种均为单拷贝的基因家族中的基因,通过物种间进化分析显示,与参考的Pasteurella multocida 较近。见图2。

图2 物种间进化关系分析

3 讨论

本研究提取分离菌株的全基因组,通过SMRT测序,其基因组大小为2.3 Mb。使用Canu 软件进行组装,达到细菌基因组比较基因组分析要求。

在细菌的基因组中,基因在进化过程中可能会发生突变,导致原有的基因功能丧失而产生的一类基因,这类基因则被称为假基因。我们利用已预测得到的蛋白序列与Swiss-Prot 数据库中收录的细菌的蛋白序列,通过软件GenBlastA 比对,在基因组上寻找同源的基因序列(可能的基因),然后利用软件GeneWise 寻找基因序列中的不成熟的终止密码子及移码突变,得到假基因。杜慧慧等[12]对不同毒力的牛源A 型Pm 菌株进行假基因预测,得出假基因数目越多其毒力相对较弱,反之假基因数目越少则毒力相对越强。本次得到假基因数目为3,数目相对较少,因此怀疑本次分离菌株毒力相对较弱。

本次测序的菌株和参考菌株(Mannheimia haeemolytica、Pasteurella multocica)基因组进行全基因组共线性分析,参考菌株与测序菌株之间共线性良好。

对测序菌株预测出的蛋白序列和参考基因组的蛋白序列进行家族分类,共得到2 105 个基因族。各个族在3 株菌种的分布如中插彩版图1 所示,3株菌共有的基因族类(核心基因族)有1 483 个,占总基因组的70.45%。分析同时只在两株菌中共有的基因族发现,Pasteurella multocida 与Xizang Pasteurella 共有的基因族(394 个)明显多于其他组合。本次分离菌株与参考菌株共有的功能1 964 个,分离菌株特有的基因数量有132 个。

基因组学是当前生命科学领域最前沿的学科之一,是研究病原微生物的分子致病机理,筛选有效的免疫原性因子和药物紀标等的基础。本研究测序牦牛源巴氏杆菌全基因组序列,在基因组测序的基础上,进一步开展编码基因、重复序列、非编码RNA、假基因等进行预测,最后对基因组共线性、基因家族与特有基因以及物种间进化关系分析,为牦牛巴氏杆菌病的防治提供新的思路。

猜你喜欢
氏杆菌牦牛基因组
“植物界大熊猫”完整基因组图谱首次发布
赛牦牛(布面油画)
牦牛场的雪组诗
猪布鲁氏杆菌病的流行病学、诊断与防控
美仁大草原的牦牛(外一章)
牛参考基因组中发现被忽视基因
羊巴氏杆菌病的流行病学、临床特征、实验室诊断和防控措施
多杀性巴氏杆菌细胞分裂相关基因的筛选
跟着牦牛去巡山
科学家找到母爱改变基因组的证据