张浩博,陈建威,徐大有,高天翔,王晓艳
(1.浙江海洋大学国家海洋设施养殖工程技术研究中心,浙江舟山 316022;2.青岛华大基因研究院,山东青岛 266555;3.浙江海洋大学水产学院,浙江舟山 316022)
随着现代分子生物学的发展和高通量测序技术的成熟,高通量测序技术以其对生物物种鉴别具有高效、简便、客观等特点,已被广泛应用于水生生物的鉴定和多样性评估。新兴的环境DNA metabarcoding 技术将DNA 条形码和高通量测序技术相结合,对提取的环境DNA(environmental DNA,eDNA)使用通用引物扩增并进行高通量测序,所得到的可操纵分类单元(operational taxonomic units,OTUs)与物种数据库比对获得物种信息,从而进行物种多样性分析[1-2]。环境DNA metabarcoding 由于高灵敏度、快速高效以及对生物无损伤等优势,被广泛应用于水生生物多样性监测,逐渐成为物种监测的重要工具[3-4]。然而在实际应用中,污染、引物偏好性[5]、腐殖酸抑制[6]、假阳性[7]、假阴性[8]以及数据库不完善[9]等问题都可能会对最终结果造成一定的影响,因此高通量测序的结果是否能够准确反应物种生物量和丰度尚不明确。
大黄鱼Larimichthys crocea 属鲈形目Perciformes、石首鱼科Sciaenidae、黄鱼属Larimichthys,曾是我国四大海产之一,由于过度捕捞、生境恶化等原因,大黄鱼资源接近枯竭[10]。花鲈Lateolabrax maculatus 属鲈形目Perciformes、花鲈科Lateolabracidae、花鲈属Lateolabrax,为东北亚特有种,俗称鲈鱼、七星鲈等,在我国沿海各省广泛养殖[11]。黑鲷Acanthopagrus schlegelii 属鲈形目Perciformes、鲷科Sparidae、棘鲷属Acanthopagrus,俗称海鲋、黑加吉、铜盆鱼等,是我国沿海各省理想的增殖放流种类[12]。褐菖鲉Sebasticus marmoratus 属鲉形目Scorpaeniformes、鲉科Scorpaenidae、菖鲉属Sebastiscus,是近海常见的岩礁性卵胎生鱼种[13-14]。眼斑拟石首鱼Sciaenops ocellatus 属鲈形目Perciformes、石首鱼科Sciaenidae、拟石首鱼属Sciaenops,俗称美国红鱼,原产于美国大西洋沿岸和墨西哥湾,1991 年由国家海洋局第一海洋研究所引进,但在其养殖过程当中,因美国红鱼逃逸而成为入侵鱼种[15-16]。2004 年6 月至2006 年10 月,在浙江沿海捕获了156 个总长度超过45 cm 的标本[16]。眼斑拟石首鱼可能会成为世界上第3 个海洋鱼类入侵的例子[17]。本研究分别将这5种海水鱼类的肌肉和DNA 按照一定比例混合,探究高通量测序所得各鱼种reads 数、肌肉样品质量以及DNA 浓度的关系,不仅为高通量测序技术用于海水鱼类定性鉴定分析提供技术支持,同时可为今后用于环境DNA metabarcoding 技术进行物种生物量评估提供理论依据。
选取5 种海水鱼类,分别为:大黄鱼、花鲈、黑鲷、褐菖鲉和眼斑拟石首鱼,充氧带回实验室,暂养3 d。使用丁香酚麻醉,处死后取肌肉(统一选取左侧背部肌肉)。
按照表1 肌肉和DNA 比例分别进行2 组正交试验。
将5 种鱼类的肌肉按照表1 正交梯度比例进行混合,混合好的各组样品采用标准的苯酚-氯仿方法分别提取DNA 并混匀,记为Muscle 组。
表1 基于正交试验的肌肉与DNA 正交梯度混合表Tab.1 Muscle and DNA gradient mixing table based on orthogonal experiment
称取5 种鱼的肌肉组织各2 g,提取DNA,Nanodrop 测定各样品DNA 的浓度。将DNA 样品按照表1各组实验的比例混匀,记为DNA 组。
将混合好的各组样品,使用通用引物MiFish-U-F:GTCGGTAAAACTCGTGCCAGC 和MiFish-U-R:CATAGTGGGGTATCTAATCCCAGTTTG[1]扩增建库,MGISEQ-2000 平台进行高通量测序。拼接的reads 经过优化后,每个样品截取25 000 条拼接后的reads,利用UPARSE 在97%相似度下进行聚类,得到OTU(operational taxonomic units)的代表序列。将聚类得到的OTU 去除嵌合体后统计每个样品中每个OTU 的丰度信息,并用于后续物种分类。使用Blast+(v2.2.31) 将OTU 代表序列与NCBI NT 数据库比对,进行物种注释,比对阈值设置为“E-value<1e-5,identity>99%,coverage>95%”。
使用R(v4.0.3)对数据进行处理分析,线性拟合使用“basicTrendline”包,使用“ggplot2”包,“pheatmap”包进行绘图。对肌肉混合实验丰度结果和DNA 比例实验丰度结果进行单因素方差分析。
2.1.1 肌肉混合实验测序结果
肌肉混合实验所有样品共得到5 个OTU(表2),392 738 条reads。其中OTU 1 为大黄鱼,共72406 条reads;OTU 2 为花鲈,共110 623 条reads;OTU 3 为黑鲷,共98 121 条reads;OTU 4 为褐菖鲉,共53872 条reads;OTU 5 为眼斑拟石首鱼,共57 716 条reads。各肌肉混合实验组OTU 相对丰度见图1。
图1 肌肉混合实验各物种相对丰度Fig.1 Relative abundance of each species in muscle mixing experiment
表2 肌肉混合实验各OTU 相对丰度Tab.2 OTU relative abundance in muscle mixing experiment
2.1.2 DNA 混合实验测序结果
DNA 混合实验所有样品共得到5 个OTU(表3),395 679 条reads。其中OTU 1 为大黄鱼,共82 961 条reads;OTU 2 为花鲈,共102 769 条reads;OTU 3 为黑鲷,共99 439 条reads;OTU 4 为褐菖鲉,共48 962 条reads;OTU 5 为眼斑拟石首鱼,共61 548 条reads。各DNA 混合实验组OTU 相对丰度见图2。
图2 DNA 混合实验各物种相对丰度Fig.2 Relative abundance of each species in DNA mixing experiment
表3 DNA 混合实验各OTU 相对丰度Tab.3 OTU relative abundance in DNA mixing experiment
统计每个样品在每个OTU 中的丰度信息,36 个样品共得到5 个OTU,分别对应实验选取的5 种海水鱼类,无其他鱼种污染。肌肉比例组和DNA 比例组检测到的物种丰度情况如图3 所示。多数混合比例相同的DNA 组和Muscle 组聚为一类,仅有少数组别与其混合鱼种比例相近的小组聚类(图4)。
图3 各实验组物种相对丰度Fig.3 Relative abundance of species in each experimental group
以肌肉比例为横坐标,高通量测序结果注释的各OTU reads 数为纵坐标,绘制肌肉比例与高通量测序reads 数的函数关系,高通量测序的reads 数与鱼类肌肉占比呈一致变化的趋势(图5),reads 数与鱼类肌肉占比均呈显著线性关系(OTU 1:R2=0.90,P<0.01;OTU 2:R2=0.75,P<0.01;OTU 3:R2=0.47,P<0.01;OTU 4:R2=0.70,P<0.01;OTU 5:R2=0.68,P<0.01)。
图5 各OTU 肌肉比例与reads 数关系Fig.5 The relationship between the muscle ratio of OTUs and the number of reads
绘制鱼类DNA 比例与高通量测序reads 数的函数关系,reads 数与鱼类DNA 占比也呈一致变化的趋势(图6),序列reads 数与鱼种占比呈显著线性关系(OTU 1:R2=0.92,P<0.01;OTU 2:R2=0.56,P<0.01;OTU 3:R2=0.64,P<0.01;OTU 4:R2=0.71,P<0.01;OTU 5:R2=0.62,P<0.01)。
图6 各OTU DNA 比例与reads 数关系Fig.6 The relationship between the proportion of OTU DNA and the number of reads
高通量测序技术的发展极大地推动了DNA 宏分类学(DNA metasystematics)的发展[18]。传统的水生生物调查耗时费力[19-20]、成本高[19,21],且高度依赖于研究人员的分类学知识[2,22],而基于高通量测序的DNA metabarcoading 方法具有高效、低耗、高精度以及操作方法简单等优点,可以弥补传统调查方法的不足[23]。近年来,基于高通量测序的环境DNA metabarcoading 技术已应用于水生生物监测的研究和应用中,逐渐成为水生生物监测的重要手段。研究者利用水体中的DNA 对海洋中鱼类群落进行了评估[24],通过高通量测序的结果绘制了海洋和淡水鱼种群丰度随时间(月份)变化的时序图[25],使DNA metabarcoading 技术成为鱼类鉴定、洄游、群落评估等相关研究的便利工具。此外,鱼类发育过程中存在同种异形和异种同形以及变态等诸多复杂多样的现象,许多鱼类的早期发育过程极其相似,导致了稚鱼分类鉴定难度较大,加剧了传统形态学分类鉴定的困难,高通量测序技术为解决这些难题提供了重要保障[26]。本研究中高通量测得的数据与实际进行混合的鱼种一致,5 种鱼类均被检出的同时没有其他污染,聚类产生的5 个OTU 分别对应了大黄鱼、黑鲷、花鲈、眼斑拟石首鱼以及褐菖鲉,体现了高通量测序在定性检测方面的准确性。
高通量测序技术在定性方面的应用广泛,THOMSEN,et al[27]利用高通量测序技术在水体中提取的DNA成功地检测到了5 种欧洲濒危水生生物。VALENTINI,et al[28]对稀有种和隐蔽种进行阳性检测,证明了高通量测序是快速了解水生生态系统物种组成最有效的工具。LIM,et al[29]使用eDNA metabarcoading 方法在城市的水库中发现了一种入侵蜗牛—锯齿冠螺Serrated crownsnail,并且提供了一种罕见的本土鱼类—大嘴虎溪鱼Pseudogobiopsis oligactis 存活的证据。在沿海鱼类群落结构的评估结果中,YAMAMOTO,et al[30]发现与水下目测普查相比高通量测序可以检测到更多难以用肉眼观测到的本土鱼类。可以看出高通量测序技术不仅可以用于检测本研究使用的常规且较为普遍的经济鱼种,对于濒危种、入侵种和隐蔽种也可以进行良好的定性检测。
我国拥有大量的海洋鱼类资源,这其中包括已发现的物种与未被发现物种或隐存种。高通量测序技术可以快速鉴定物种,在海洋鱼类物种的定性分析方面实现了信息化和精确化,有助于及时发现稀有、珍贵的鱼种和入侵种,加速对海洋生物多样性的认知,提升对海洋生物资源的监测、保护以及利用能力。
高通量测序技术不仅有助于对物种多样性的认识,还对物种生物量评估的研究提供了有力工具。研究表明高通量测序各物种reads 数随该物种生物量增加而增加[24,31-33],而且与鱼类相对丰度之间有很好的相关性[9,34]。例如:HÄNFLING,et al[9]对英国3 个湖区进行了鱼类多样性分析,将各个鱼种reads 数和丰富度与长期刺网调查数据进行了对比,发现基于高通量测序技术的环境DNA metabarcoding 方法在鱼类定性与定量分析均有可靠性。GOUTTE,et al[32]对法国马恩河和塞纳河的鱼类结构组成进行了分析,发现这种基于高通量测序的方法所得到的结果与14 年来电鱼调查效率相差无几,而且测序所得的各个物种的相对丰度与传统调查中该物种的相对丰度一致。本研究通过对5 种海洋经济鱼类肌肉和DNA 进行梯度混合,进行高通量测序,发现5 种海水鱼类的DNA 和肌肉占比与高通量测序的reads 数均呈线性函数相关关系,这与EVANS,et al[31]的研究结果一致。对于不同的DNA 或肌肉比例,鱼类的丰度变化与其DNA 或肌肉比例的变化一致,但在具体的OTU 丰度值上还有所差异,而各OTU 在肌肉混合实验和DNA 混合实验物种丰度的结果中并没有表现出差异(OTU 1 ∶P=0.900;OTU 2 ∶P=0.860;OTU 3 ∶P=0.719;OTU 4 ∶P=0.968;OTU 5 ∶P=0.487)。整体来看,肌肉比例和DNA 比例与物种丰度均有对应的关系。对于相同比例的DNA 和肌肉混合丰度,其检测到的物种丰度变化具有一致性。在物种丰度热图中多数比例相同的样品聚为一组,少数同比例的肌肉和DNA 样品以及比例相近的样品聚为一组,证实了高通量测序技术应用于海水鱼类多样性和定量分析具有可靠性。
高通量测序技术为水生生物多样性和相对定量研究带来信心[35-36],但在实际应用中,污染、引物偏好性[5,37]及假阴性和假阳性[7-8]都可能会对测序结果的准确性造成一定的影响。在实验过程中,可以进行添加去抑制剂、使用多对通用引物和增加测序重复次数等操作以提升测序结果的准确性。虽然本研究证实了高通量测序技术在5 种海水鱼类定性检测和定量分析方面都具有可行性。但就目前来看,该技术只能作为传统水生生物调查的补充,而不能作为独立的监测方法[38-39]。随着数据库的完善和更为适宜的分子标记的发现和优化,基于高通量测序的环境DNA metabarcoading 技术将有望成为水生生物监测的主要手段。