蜜蜂属生物的物种分子诊断标签:动物DNA条形码

2017-10-23 08:17李兴安牛庆生薛运波
中国蜂业 2017年9期
关键词:信息学条形码线粒体

李兴安 牛庆生 薛运波

(吉林省养蜂科学研究所,吉林 132108)

蜜蜂属生物的物种分子诊断标签:动物DNA条形码

李兴安 牛庆生 薛运波

(吉林省养蜂科学研究所,吉林 132108)

蜜蜂属生物构成了膜翅目昆虫一个代表属,蜜蜂属生物的物种分子诊断标签普遍选用动物DNA条形码;蜜蜂属生物的物种DNA条形码经过生物信息学数据分析,成为动物DNA条形码数据库一组不可或缺的生物样本分类学资源。本文从如下三个方面综述了蜜蜂属生物的物种DNA条形码研究进展,即蜜蜂属生物的物种DNA条形码含义,蜜蜂属生物的物种DNA条形码生物信息学数据分析方法,以及蜜蜂属生物的物种DNA条形码分类学地位。

蜜蜂属生物;动物DNA条形码

Amot等(1993)在从事镰状疟原虫孢子体分泌蛋白质(circumsporozoite,一种保守蛋白质或管家蛋白质)基因多态性研究中,从基因组提取物中发现了一组可变串联重复DNA序列,并将其命名为DNA条形码(DNA barcode)[1]。Folmer等 (1994)通过比对棘皮动物等动物界11个水生无脊椎动物门的线粒体细胞色素氧化酶亚基-1(cytochrome oxidase subunitⅠgene,CO-Ⅰ)基因座等位基因,认为CO-Ⅰ基因近5′端、长度约710碱基对的一个DNA片段可以区别所有待测样本[2]。该DNA标记在相同研究领域的一些后续文献中被形象地命名为 CO-Ⅰ基因“Folmer”片段(或 5′端“Folmer”片段,或“Folmer”片段)。Saccone等(1999)通过分析后口动物线粒体基因组组成,认为线粒体基因组编码区(占据线粒体基因组绝大多数序列份额)的主要变异形式是碱基置换,这种变异仅改变DNA碱基序列秩序而不改变DNA序列长度;而线粒体基因组非编码区(占据线粒体基因组极少数序列份额)的主要变异形式是碱基缺失和插入(线粒体基因组变异的另外一种形式),这种变异既改变DNA碱基序列秩序又改变DNA序列长度[3]。基于此,不同动物物种的线粒体基因组被限制于相对狭窄的长度波动范围,例如,多数动物物种的线粒体基因组长度约为16 K至17 K碱基对。Hebert等(2003)依据“Folmer”片段单核苷酸多态性谱图,先后鉴定了鳞翅目200多个近缘物种[4]。多数作者认为,Hebert等最先使用了动物DNA条形码(animal DNA barcode)这个表述;鉴于Hebert等的出色工作,多数文献追捧“Folmer”片段为标准动物DNA条形码。

此后短短十多年里,在“国际生物DNA条型码发展计划”推动下,诸多国家相继建立了哺乳动物纲、硬骨鱼纲、鸟纲、昆虫纲等动物物种的DNA条形码数据库;其中,昆虫纲35个目、近8万个物种兑现了各自特有的DNA条形码[5]。近几年来,伴随高通量基因组测序平台开发、大规模DNA平行测序数据解析以及宏基因组学筛选方法尝试等二代测序技术的广泛应用,动物DNA条形码或动物DNA条形码测定(barcoding)被赋予了新的含义,即DNA小条形码(DNA mini-barcode)或宏 DNA 条形码测定(meta-barcoding)[6]。

毫无疑问,蜜蜂属生物构成了膜翅目昆虫一个代表属,蜜蜂属生物的物种分子诊断标签普遍选用动物DNA条形码;蜜蜂属生物的物种DNA条形码经过生物信息学数据分析,成为动物DNA条形码数据库一组不可或缺的生物分类学资源。那么,蜜蜂属生物的物种DNA条形码含义、物种DNA条形码生物信息学数据分析方法以及物种DNA条形码分类学地位分别是什么呢?本文综述了这个方向的研究进展。

1 蜜蜂属生物的物种DNA条形码含义

蜜蜂属生物的物种分子诊断标签为什么采用动物DNA条形码这个DNA标记呢?在理论上,动物DNA条形码具有众多后口动物CO-Ⅰ基因相应序列的所有结构特征:首先,变异形式主要是碱基置换,碱基置换产生单核苷酸变异;其次,碱基序列越是靠近5ˊ端,其单核苷酸变异数量占总碱基变异数量的比例越大;最后,在线粒体35个编码基因或基因片段涉及的单核苷酸变异中,动物DNA条形码涉及的单核苷酸变异程度最大(或最为丰富)[3]。就实验技术而言,动物DNA条形码侧翼序列极端保守,PCR实验不需要严格的设置条件,这非常有利于PCR特异性扩增目标产物。

不仅如此,动物DNA条形码尚有一段DNA序列,其位置位于CO-Ⅰ基因近5′端,其长度约130碱基对[7]。一些学者甚至认为,这个DNA标记的物种鉴定分辨率毫不逊色于标准动物DNA条形码的物种鉴定分辨率。在基于文库构建的二代测序技术路线中,该DNA标记有效地解决了PCR扩增DNA序列的技术瓶颈:第一,短DNA片段在PCR扩增过程中趋向于不形成非特异扩增产物;第二,陈旧型生物样本基因组存在不同程度DNA降解,不规范DNA提取操作极易导致DNA片段化,它们均不利于PCR扩增完整DNA序列;第三,碱基插入、缺失突变容易导致CO-Ⅰ基因移码,这通常导致PCR扩增DNA序列效率下降。在蜜蜂属生物的DNA条形码数据库中,多数DNA条形码长度为691碱基对,而小蜜蜂的DNA条形码长度仅为489碱基对(表1)。这很有可能说明小蜜蜂的DNA条形码是标准动物DNA条形码的一部分。

表1 蜜蜂属生物的物种DNA条形码长度值统计表

2 蜜蜂属生物的物种DNA条形码生物信息学数据分析方法

蜜蜂属生物的物种DNA条形码涉及了哪些生物信息学数据分析方法?在物种DNA条形码基因分型研究的发展动态中,相似序列系统发生树重建和序列差异距离测算是最常用的两种生物信息学数据分析方法。在基于邻位相连算法构建的同属物种系统发生树树形结构中,1个动物DNA条形码能否成为物种分子诊断标签,取决于待测数据能否被聚类为一个完全(甚至于部分)独立的进化分枝;在基于K2P遗传距离计算模块比较的遗传距离差异矩阵中,1个动物DNA条形码能否成为物种分子诊断标签,取决于遗传距离测算值是否同时分布于种内同质性差异阈值规定范围和种间异质性差异阈值规定范围[5]。

目前,伴随动物DNA条形码数据库数据量的海量增长,蜜蜂属生物的物种鉴定工作高度依赖于动物DNA条形码数据库。在基于BLAST搜索引擎检索的候选DNA条形码数据列表中,1个动物DNA条形码能否成为物种分子诊断标签,取决于鉴定参数设置水平和候选DNA条形码检索数量[8]。

3 蜜蜂属生物的物种DNA条形码分类学地位

蜜蜂属生物的物种DNA条形码具有哪些动物分类学贡献?动物形态和动物DNA条形码是动物分类学为明确动物类型学物种(typological species)经常使用的两个关键词。而且,比之于动物形态学针对连续型计量资料以反映动物群体的性状表现型,动物DNA条形码测定针对离散型计量资料以表征动物群体的线粒体基因组单倍型。鉴于动物DNA条形码能够鉴别98%以上动物物种,一个动物物种在采用传统的形态聚类簇(morphocluster)表述甚至于形态物种(morphospecies)表述的同时,也可以采用现代的物种DNA条形码聚类簇(barcodecluster)表述或者DNA条形码目录物种(barcode for tracking species)表述。

然而,绝大多数DNA条形码显示的物种鉴定错误率小于5%[9]。这说明,如同形态变异分析方法,DNA条形码测定技术也存在局限性。事实上,动物DNA条形码的物种鉴别力取决于动物DNA条形码的单核苷酸变异分布和数量。对于不同属以下物种,DNA条形码的物种鉴别力不等同,种间遗传多样性丰富程度是影响DNA条形码鉴别力的主要因素[5]。例如,相对于熊蜂属160多个物种DNA条形码,蜜蜂属仅有8个物种DNA条形码(图1)。显然,熊蜂属生物的物种DNA条形码鉴定错误率可能要远大于蜜蜂属生物的物种DNA条形码鉴定错误率。而且,有趣的是,迄今为止,昆虫形态变异分析将蜜蜂属生物划分为9至12个物种,而动物DNA条形码数据库仅收录了蜜蜂属8个物种DNA条形码。那么,是动物DNA条形码数据库无意“漏掉了”黑大蜜蜂的DNA条形码数据记录,还是有意排除了相应的数据记录?我们该如何解释这个事实?

图1 蜜蜂属生物的物种DNA条形码示范性“条形图”

最近发表于“Insect Science”(中国科学院双月期刊)的一篇论文有助于回答这个问题[10]。那就是,对于绝大多数动物物种,形态学分析结果与DNA条形码测定结果是一致的,因此,一个动物DNA条形码就应该对应一个动物物种;而对于个别动物物种,形态学分析结果与DNA条形码测定结果可能不一致,它们就类似一个硬币的正反面,不能够过分强调一面而完全忽视另一面,不能够简单地理解为“一种动物,一个DNA条形码”,还需要补充必要的动物形态学分析数据。

[1]Arnot DE,Roper C,Bayoumi RA.Digital codes from hypervariable tandemly repeated DNA sequences in the Plasmodium falciparum circumsporozoite gene can genetically barcode isolates[J].Mol Biochem Parasitol,1993,61(1):15-24.

[2]Folmer O,Black M,Hoeh W,et al.DNA primers for amplification of mitochondrial cytochrome c oxidase subunit I from diverse metazoan invertebrates [J].Mol Mar Biol Biotechnol,1994,3(5):294-299.

[3]Saccone C,Giorgi C D,Gissi C,et al.Evolutionary genomics in Metazoa:the mitochondrial DNA as a model system[J].Gene,1999,238(1):195-209.

[4]Hebert PD,Cywinska A,Ball SL,et al.Biological identifications through DNA barcodes[J].Proc Biol Sci,2003,270(1512):313-321.

[5]Jinbo U,Kato T,Ito M.Current progress in DNA barcoding and future implications for entomology[J].Entomological Science,2011,14(2):107-124.

[6]Brandon-Mong GJ,Gan HM,Sing KW,et al.DNA metabarcoding of insects and allies:an evaluation of primers and pipelines[J].Bulletin of Entomological Research,2015,105(6):717-727.

[7]Meusnier I,Singer G AC,Landry JF,et al.A universal DNA mini-barcode for biodiversity analysis[J].BMC Genomics,2008,9(1):214.

[8]Chakraborty M,Dhar B,Ghosh SK.Design of character-based DNA barcode motif for species identification:A computational approach and its validation in fishes[J].Mol Ecol Resour.,2017(doi:10.1111/1755-0998.12671)[Epub ahead of print].

[9]Fiser Pecnikar Z,Buzan EV.20 years since the introduction of DNA barcoding:from theory to application[J].J Appl Genet,2014,55(1):43-52.

[10]Stepanovic S,Kosovac A,Krstic O,et al.Morphology versus DNA barcoding:two sides of the same coin.A case study of Ceutorhynchus erysimi and C.contractus identification [J].Insect Sci.,2016,23(4):638-648.

Review on animal DNA barcode serving as a diagnostic character of molecular species belonging to Genus Apis

Li Xing’an,Niu Qingsheng,Xue Yunbo
(Jilin Provincial Institute of Apicultural Science,Jilin 132108)

Bees,Genus Apis,is special representative among Order Hymenoptera.Identification of their species has been carried out by animal DNA barcode as a diagnostic molecular character.After generated through bioinformatics,the indespensible datasets of bee DNA barcodes are integrated into the data repository of animal DNA barcodes for any forms of sampling taxonomy.Here,threes aspects on bee DNA barcodes are reviewed,including definition in bee DNA barcodes,generation of bee DNA barcodes through bioinformatics and promise of DNA barcode for taxonomy.

Genus Apis;animal DNA barcode

吉林省科技发展计划项目(20150623024TC;20160623015TC);国家蜂产业技术体系(CARS-45-KXJ2;CA2S-45-SYZ4)

李兴安(1965-),男,研究员,E-mail:Lxingan@sina.com

猜你喜欢
信息学条形码线粒体
线粒体质量控制在缺血性脑卒中的作用研究进展
线粒体自噬在纤维化疾病中作用的研究进展
创意条形码
棘皮动物线粒体基因组研究进展
鸡NRF1基因启动子区生物信息学分析
生物信息学辅助研究乳腺癌转移相关lncRNA进展
PBL教学模式在结构生物信息学教学中的应用
从条形码到二维码
研究发现线粒体“黑洞”吞噬与否的抉择规律
药用植物黄花蒿ATP合成酶电子克隆及生物信息学分析