李 琪,冉 轲,孔令锋
(1. 海水养殖教育部重点实验室(中国海洋大学),山东 青岛 266003;2. 青岛海洋科学与技术试点国家实验室 海洋渔业科学与食物产出过程功能实验室,山东 青岛 266237)
贝类属于软体动物门(Mollusca),是无脊椎动物中最重要的门类之一,其物种数量仅次于节肢动物门(Arthropoda),是动物界中第二大门,物种数量在13万种以上[1]。贝类的绝大部分物种为海洋贝类,其种类和数量极为丰富,不仅具有重要的经济价值,而且具有生态和工艺价值。海洋贝类的分类鉴定是海洋生物多样性研究的重要组成部分,也是渔业资源调查和自然资源评估的参考依据。目前,海洋贝类的物种鉴定主要依靠传统的形态学特征。然而,贝类种类众多,形态特征多样,绝大多数种类在不同生长阶段具有不同的形态特征。此外,趋同进化(Convergent evolution)和表型可塑性(Phenotypic plasticity)也会导致贝类形态特征的改变,从而导致一些不同种个体之间的形态特征相似、而同种个体之间的形态特征具有差异,这对传统的形态学分类方法提出了很大的挑战[2]。对海洋贝类进行准确地鉴定和分类是极为重要的,这不仅是理解和认识海洋贝类多样性的需要,也是海洋环境保护、海水养殖、贝类渔业资源合理利用和食品安全等行业的迫切需求。
近年来,随着全球气候变化、环境问题和能源问题的加剧,人类可持续发展对理解和认识生物多样性的要求日益迫切,物种的准确和快速鉴定作为对生物多样性保护和持续利用的基础,成为全球性的重大需求。DNA条形码通过一个标准化、较短的基因序列变异来鉴定物种,是近年来生命科学和生物技术领域进展最迅速的学科前沿之一。DNA条形码不仅是传统物种鉴定的强有力补充,而且使标本鉴定过程实现自动化和标准化,突破了对经验的过度依赖,能够在较短时间内建立形成易于利用的应用系统。
本文主要综述了DNA条形码的产生、原理、分析步骤、优势、局限性及其在海洋贝类种质资源保护中的应用进展,并阐述了DNA条形码技术未来的发展。
对物种进行准确鉴定和分类是种质资源保护的基础,也是生物学研究的基本条件。人类对生物的研究具有悠久的历史。而分类学作为一门古老的学科,从林奈、拉马克时代就已经开始了,这些分类学家的工作为后来生物系统发育的深入研究奠定了基础。近年来,随着科学技术的不断提高,越来越多的新纪录种和新种被发现和报道。尽管在地球上生存的生物种类多、数量大、分布广,但是由于气候变化、环境污染和过度采集等原因,导致一些生物物种的数量急剧下降,甚至一些种类可能还没被人类发掘就已经灭绝。如果仅仅依赖分类学家采用传统的形态学方法来大量鉴定物种,其工作难度较大。此外,对物种准确的鉴定和分类是进行种质资源保护、生物学研究、充分的利用生物资源和维持全球生态系统平衡的基础,尤其是对于具有重要生态价值和经济价值的种类[3]。因此,对大量生物进行准确快速的鉴定和分类是至关重要的。2003年,受到“商品条形码”的启示,Hebert等[4]第一次提出“DNA条形码”的概念,即通过选择一段DNA基因序列片段作为条形码进行物种的鉴定。自此以后,DNA条形码迎来了黄金时代。Hebert等[5]探讨和分析了采用线粒体细胞色素 c 氧化酶 I(Cytochrome c oxidase subunit I, COI)基因序列作为条形码来进行物种鉴定的可行性。随后,Hebert等[6]将DNA条形码技术用于北美260种鸟类的鉴定中,并取得了成功。这些工作为后来采用DNA条形码技术在生物物种鉴定和分类中的应用奠定了基础,对物种种质资源保护起到了关键作用。
DNA条形码其实是一段短的基因序列,其目的是用这一序列作为快速鉴定物种的标记,同时希望与生物物种建立一一对应的关系。DNA条形码由四种碱基(A、T、G、C)组成,通过每个碱基的变异和组合,一段序列可以有很多种情况,以此来区分和鉴定不同的生物。在理论上,一段长度为几百个碱基的DNA序列,其四种碱基可能的组合多达数十亿个,这完全可以涵盖全球所有生物的物种数量,理论上可以通过DNA条形码区分所有生物[7]。然而,并非所有的基因序列都可以用来作为DNA条形码,该基因序列必须要具备两个最基本的特征:(1)为了将每个物种准确地区分和鉴定,所选的基因片段具有足够的变异度。(2)基因序列要有一定的保守性,以便引物的选择和基因片段的扩增[8]。核基因和线粒体基因都可被用作DNA条形码,但是线粒体基因用的较广,其主要原因是该基因具有以下几个特点:其一,在细胞中,线粒体的数量较多,达数百个,从而选择线粒体DNA比较方便;其二,线粒体基因无内含子(Intron),并且绝大多数动物为母系遗传,重组现象较少,更适合作为通用条形码;其三,线粒体DNA具有很快的突变速率,而核DNA的突变速率较慢,线粒体DNA的突变速率大约是核DNA的10倍,这有利于线粒体DNA条形码能更加高效精确地区分物种[9]。研究表明,在动物的物种鉴定中,有超过95%的动物种类可以用COI基因进行种水平上的鉴定[10]。
DNA条形码技术的操作步骤如下:(1)样品采集。根据研究所需的物种,对物种进行采集,同时记录样品采集的时间、地点和底质环境等。(2)样品保存。采集完成后,对样品进行保存,一般通过95%酒精或冷冻保存。(3)样品DNA提取。(4)PCR扩增及测序。(5)数据分析。首先使用序列分析软件(如SeqMan)对序列进行校正,保证每条序列准确无误,然后使用序列比对软件(如BioEdit v.7.2.6.软件中内置的 Clustal W)对序列进行比对,最后计算遗传距离和构建系统进化树,并分析结果。(6)样品信息的上传。将所研究样品的分类地位、照片、采集地点、时间、环境以及序列等上传到相关的DNA条形码数据库,做到数据共享。
1.4.1 DNA条形码的优势 与传统的形态分类方法相比,DNA条形码技术具有很多优势:(1)鉴定个体不完整的生物。DNA条形码技术可以利用物种的组织片段进行物种的鉴定,例如,可以鉴定一些海产品或通过动物胃里的食物残渣来分析食物来源等[11]。(2)鉴定形态特征相似的生物。尽管一些个体属于不同的种,但是它们具有极其相似的外部形态特征,例如自然界中的一些拟态现象,使用形态学方法很难鉴定。(3)鉴定处于不同生长阶段的物种。受性别和不同发育阶段的影响,许多物种在不同的生长阶段具有完全不同的外部形态特征,如果在不了解其生活史的情况下,仅仅使用形态特征很难对其进行鉴定和分类。(4)鉴定形态可塑性强的物种。一些物种的外部形态具有很强的可塑性,为了适应所处的生长环境,同种个体在不同的环境中呈现出完全不同的形态特征,传统方法很难对其进行鉴定。(5)鉴定物种更加快速而高效。据统计,地球上总共被鉴定的种类大约有200多万种[12],这只占全球生物的一小部分,如果使用传统方法来鉴定和分类,一些种类可能还没有被人类发现就已经灭绝。(6)对系统发育方面的贡献。通过辅助传统分类方法,丰富和完善系统发育树等[13]。DNA条形码数据库丰富了生物种类的遗传信息,这有助于研究和分析生物种类间的系统发生关系。(7)有利于发现隐存种和新种。(8)数据共享性。DNA条形码数据库的构建,不仅共享了每个国家和地区生物的信息,而且对保护全球生物多样性的工作做出了很大贡献,有利于物种种质资源的保护与利用。
1.4.2 DNA条形码的局限性 DNA条形码在提出后得到了学者的高度关注和广泛应用,尤其是在物种区分和鉴定、隐存种和新种的发现等方面发挥了非常重要的作用。然而,在其推广的过程中也引起了很大争议。争议点可以概括为以下几个方面:(1)基于单基因的DNA条形码能否鉴定每一种生物。由于假基因和异质性等现象的存在,使用单基因的线粒体DNA序列进行种的分类很容易出现错误。另外,在动植物中由于基因渐渗杂交(Introgressive hybridization)和祖先多态性不完全分支(Incomplete lineage sorting of ancestral polymorphism)导致多系(Polyphyly)发生和旁系(Paraphyly)发生的现象很常见,仅仅使用线粒体DNA序列来区分物种和发现新种可能导致错误的鉴定结果[14]。(2)基于COI基因的DNA条形码技术能否用于所有生物的鉴定。Hebert等[5]将基于COI基因的DNA条形码用于腔肠动物的物种鉴定时发现,该类动物中大部分种类的种间差异小于2%,不能有效地区分该类群。Moritz等[15]曾质疑使用COI基因能否区分和鉴定北美鸟的近缘种。此外,由于植物和动物COI基因的进化速率差异很大,通常植物的COI基因的进化速率慢。因此,一些学者认为基于COI基因的DNA条形码技术不能鉴定大部分植物[16]。(3)DNA条形码的方法是否可取。开展DNA条形码技术的前提是需要获得所研究物种标本的组织,这容易损坏样品的完整性,尤其是一些稀有物种或难采集的标本,不利于形态学的研究。此外,Cameron等[17]认为进行DNA条形码研究的成本较高,构建一个涵盖全球所有生物的DNA条形码数据库的成本远高于预期,对公众来说无直接应用价值。尽管如此,DNA条形码技术作为一种新兴的分子技术仍然得到了高度的关注,已经在很多生物类群中得到了应用,在分类学研究中潜力大,研究价值高。
海洋贝类种类丰富、数量庞大、分布广,形态特征极为多样。近年来,DNA条形码技术已经广泛用于海洋贝类的物种鉴定、隐存种和新种的发现、系统发育及物种多样性保护等研究,对海洋贝类种质资源保护与利用起到至关重要的作用。Meyer等[18]选取宝贝科的 2 026 个个体作为研究对象,获取了每个个体的COI序列,尽管结果显示宝贝科的一些种的种内和种间不存在条形码间隙,种间和种内遗传距离存在重叠,但是基于COI基因的DNA 条形码技术的鉴定效率还是高达96%,可以用于该类群物种的鉴定。宝贝科贝类形状奇特,色彩瑰丽,具有收藏和研究价值,尽管已经获得了好多种类的COI序列,并可以将其鉴定,但是宝贝科各类群之间的系统发生关系有待进一步研究。Mikkelsen 等[19]通过分析 12 种双壳贝类的 COI 基因序列,发现种间和种内存在条形码间隙,种间和种内的序列具有显著的差异度,结果表明使用COI基因可以用于对双壳类物种的鉴定。陈军等[20]为了验证DNA条形码物种鉴定的可行性,获得了中国沿海11种缀锦蛤亚科贝类51个个体的COI基因序列,最终发现使用DNA 条形码技术能够将所研究的约 98%的缀锦蛤亚科贝类鉴定到种的水平。Liu等[21-23]首次验证了 DNA 条形码技术在贻贝科和牡蛎科种类鉴定中应用的可行性,同时,在对从中国沿海采集的 16 个及日本沿海采集的1 个栉江珧 (Atrinapectinata)群体进行分析时使用COI基因、核 ITS基因以及形态特征标记,从而为研究海洋物种的分类、物种多样性的保护和演化等问题提供参考。Zou等[24-26]使用基于多基因序列的DNA 条形码技术对新腹足目贝类,尤其是一些经济种类,如织纹螺科和骨螺科贝类,进行了全面的物种鉴定和系统发育研究,并验证了 DNA 条形码及其分析方法的有效性,进一步表明大量的分析样本及分析多基因序列对新腹足目的系统发育研究非常关键。Feng等[27-28]将 DNA 条形码技术用于珍珠贝亚目和蚶目物种的鉴定中,然后用多个分子标记研究了这两大类群的系统发生关系,验证了 DNA 条形码技术的可行性。尽管DNA条形码技术不能完全取代传统的形态学分类方法,但将两者有效结合进行物种的鉴定是非常必要的。Sun等[29]分析了采自中国沿海的45种110个新进腹足目动物个体的COI基因序列,结果发现科内、属内、种内遗传距离分别为22.27%、13.96% 和 0.44%,表明使用DNA条形码能够有效精确地鉴定该类动物,丰富了海洋贝类的DNA条形码数据库。Dai等[30]利用基于COI 基因的DNA条形码对采自中国沿海的34种132个头足类进行了物种鉴定,并研究和探讨了基于 COI 和 16S rRNA 基因序列的系统发育关系,验证了DNA条形码技术对头足类物种鉴定和系统发育关系研究的可行性,证实该技术可以发掘传统形态方法难以区分的隐存种的存在。Ni等[31]利用基于COI与16S rRNA基因的DNA条形码有效的鉴定了蛤蜊科贝类,并对其系统进化关系进行了分析研究。Yu等[32-33]利用 DNA 条形码技术和相关标记对异齿亚纲贝类进行了全面的物种鉴定和系统发育研究,最终验证 DNA 条形码技术及其分析方法在异齿亚纲贝类中的可行性。Lin等[34]对采自中国沿海真帽贝(花帽贝科和笠贝科)13个种135个个体进行基于COI基因的DNA条形码研究,结果证明了使用DNA条形码技术能够快速准确地鉴定真帽贝物种,为真帽贝的系统演化研究奠定了基础。Barco等[35]对采自北海的113种软体动物进行了DNA条形码分析,并获得579条序列,极大的丰富了软体动物DNA条形码数据库。Sun 等[36]首次系统而全面的分析了来自中国、日本和韩国的569种软体动物,总共2 801条DNA条形码序列,显示了西北太平洋软体动物的物种多样性。Ran等[37]成功构建了海南岛120种腹足纲贝类的DNA条形码数据库,为当地腹足纲贝类的渔业管理、种质资源保护提供了参考资料。截至目前,DNA条形码技术在腹足纲、双壳纲和头足纲的物种鉴定方面得到了广泛的应用,而在无板纲、单板纲和掘足纲中的研究较少,今后应加强这3个纲贝类的DNA条形码研究,从而系统全面地构建海洋贝类DNA条形码数据库。
近年来,随着高通量测序技术的不断发展以及测序成本的持续降低,其测序通量保持指数增长,对样品的测序开始从单个物种到多个物种发展[38-39]。在此背景下,通过将DNA条形码鉴定技术与高通量测序技术结合,随之出现了DNA宏条形码(DNA metabarco-ding),即可以一次性大批量检测混合样本中多个种类的条形码序列。目前,该技术已经应用于动物多样性鉴定研究和物种种质资源保护等方面,并且在评估环境中类群的生物多样性以及复杂的群落结构方面具有很大潜力[40]。Sarkissian等[41]通过提取海洋软体动物贝壳中的DNA,并采用高通量测序技术、线粒体DNA基因组、条形码等方法,进一步证明了对软体动物物种的分类和鉴定是正确的。周天成等[42]分析了基于18S rDNA条形码技术的珊瑚礁区塔形马蹄螺(Tectuspyramis)的食性组成,使用高通量测序技术,最终测得了41个OUT,分别属于11个门类,准确鉴定了其消化道中的食物组成,这在清除珊瑚表面藻类基质、促进珊瑚幼体附着过程中发挥一定的作用, 对于维护珊瑚生态系统的健康和稳定具有积极意义。Bakker等[43]通过分析深海的环境DNA宏条形码,评估了热带大陆架真核生物群落的生物多样性,这有助于促进快速生物监测手段的发展,并对目前海洋生物多样性的现状有了进一步的认识。施军琼等[44]利用高通量测序探讨了大宁河不同水华期真核浮游生物的群落组成,发现水华末期双壳纲和颚足纲的丰度明显降低,通过高通量测序的方法,获得了大宁河不同水华时期真核生物群落结构变化特点,克服了其从形态特征上进行准确分类的困难。Schroeder等[45]为了评估DNA宏条形码对海洋浮游动物多样性和生物监测的适用性,在亚得里亚海北部进行了季节性的采样,结果发现与传统形态学方法相比,DNA宏条形码技术的鉴定结果具有更高的类群丰富度,能更好地区分季节浮游生物,表明该技术是一种评价生态系统生物多样性的有效工具。
然而,为了实现利用DNA宏条形码技术进行高通量、准确、快速地鉴定物种,最为重要的前提条件是构建权威的物种 DNA 条形码数据库、物种的信息资料库及信息共享平台,这更加有利于对物种种质资源的保护。
海洋贝类与人类息息相关,既能供人类食用和药用,又可以作为养殖生物的饵料。由于环境污染和过度捕捞等原因,海洋贝类数量急促下降,必须加快对其进行种质资源保护。尽管随着DNA条形码技术的不断发展和应用,涵盖各类生物的DNA条形码数据也在不断地补充和完善,但是目前各平台生物信息上传的审核制度还不完善,数据库中生物信息错误百出。因此,为了准确区分和鉴定各生物种类,保护物种的种质资源,构建一个涵盖各类生物的权威DNA条形码数据库已经成为必然趋势。
近年来,DNA条形码技术也提供了可信息化的分类标准和行之有效的分类学手段,并为系统分类学、系统发育、生物多样性研究、生物检测和保护、数字化平台建设、食品质量检测及医学等方面的研究开辟了一个新的思路。DNA条形码技术不仅已经成为传统形态物种鉴定方法的强有力辅助手段,而且通过以数字化形式呈现,使样品鉴定的过程实现了标准化和自动化。同时,DNA条形码技术摆脱了对分类学专家的过度依赖,为种质资源保护与利用、保护生物多样性、建设生态环境提供了准确且快速的物种信息服务。使用DNA条形码对海洋贝类种质资源进行遗传多样性分析具有重要意义,一方面通过揭示科内不同种之间的亲缘关系,确定近缘类群,为发掘优质基因和改良品种提供重要参考;另一方面通过比较不同海区的种质资源的基因多样性,从而发现不同类群的分布规律,为收集和保护海洋贝类种质资源提供重要指导。因此,建立一个主要海洋贝类的DNA条形码数据库是非常有必要的。
随着宏条形码(Metabarcoding)、微条形码(Minibarcoding)、细胞器条形码(Organelle-barcode)以及超级条形码(Ultra-barcode)等技术的出现,DNA条形码技术的潜力巨大,通过与其他分类学方法相结合,在种质资源保护等方面会起到非常关键的作用。