环境DNA宏条形码监测水生态系统变化与健康状态

2019-01-19 01:51李飞龙杨江华杨雅楠张效伟
中国环境监测 2018年6期
关键词:高通量测序物种

李飞龙,杨江华,杨雅楠,张效伟

污染控制与资源化研究国家重点实验室,南京大学环境学院,江苏 南京 210023

人类活动产生的水体污染、栖息地破坏、资源过度开发、外来生物入侵等环境压力,造成生物多样性锐减,引发水生态功能严重退化并影响人类健康[1]。据2016年《地球生命力报告》统计,1970—2012年,淡水生物数量整体下降了81%。而且,在全球气候变化的大背景下,人类活动对水生态系统的扰动越来越大,环境压力愈加普遍和强烈[2]。面对日益恶化的水生态状况,环境管理者、科学家及社会环保组织在进行水环境保护时面临巨大挑战。实际上,水生态环境保护措施的有效性在于对生态系统变化快速可靠的识别。然而,传统形态学生物监测存在费时费力、物种分辨度低、成本高等诸多缺陷[3],一直以来饱受诟病,无法在流域尺度开展大规模、高频率的生态监测。因此,迫切需要更加便捷且准确的水生态监测技术,用于生物多样性及水生态系统的保护。

从水、土壤、沉积物和冰芯等环境介质中提取DNA(以下简称环境DNA)进行高通量测序,可同时实现对自然生态系统中多生物群落的监测,被认为是一种快速且有效的监测技术,通常被称为环境DNA技术[3]。在水生态系统中,环境DNA主要源于生物有机体释放到水体的粘液、唾液、粪便、尿液、血液、内含物、孢子、花粉或脱落的器官等[3-5]。环境DNA普遍存在,加上该技术具有的监测所有生物的潜能,促使其形成了一个新兴的研究领域[4]。在欧美等发达国家,基于环境DNA技术的底栖动物[6]、鱼类[7]、两栖动物[8]、外来入侵物种[9-11]和濒危稀有物种[12]监测已有广泛研究。此外,环境DNA技术与机器学习、遥感等技术结合来评价水生态系统健康也已成为生态学的研究热点[13]。但相比于欧美等发达国家,中国开展的环境DNA研究相对较少,仅被用于鱼类[14-15]和入侵小龙虾[16]等的监测。尽管已有文献对环境DNA的研究进行了总结,但其更偏重于讨论该技术在特定物种的有无或丰富度监测和生物多样性评估等方面的应用[17-18]。作为对已有文献综述的补充,笔者将从生态环境监测及跨学科联用的角度思考环境DNA的应用前景,希望为中国开展相关研究提供一些启示和思路。

研究重点分析以下几个方面:①简要总结环境DNA技术在生物监测方面多元化的应用;②着重讨论环境DNA技术与机器学习、遥感等技术跨学科协调合作进行水生态监测的潜在机遇;③探讨作为水生态环境保护的主体,社会公民(特别是“公民科学团体”)在未来环境监测中可发挥的作用及潜力,这将对中国开展基于环境DNA技术的流域生态监测提供一定的参考。

1 环境DNA技术的原理及应用

1.1 环境DNA技术的原理及发展

环境DNA技术是指通过从环境介质(水、土壤、沉积物等)中提取DNA,对基因组的特定DNA片段进行PCR扩增和高通量测序,从而实现对环境样品中多生物群落监测的技术[3-5]。该技术基本操作流程主要包括环境样品采集、DNA提取、PCR扩增、DNA文库构建、DNA高通量测序、生物信息学分析和生物多样性分析等环节(图1)。

图1 环境DNA技术基本操作流程图Fig.1 The basic operational flowchart of environmental DNA approaches

早在20世纪80年代,环境DNA技术就已被提出用于微生物研究[19],通过获取DNA序列推断微生物的分类及其赋有的生化意义[20],从而实现对不可培养微生物的认识。自2003年DNA条形码概念[21]提出以来,环境DNA技术在短短的10多年间发展迅速。生命条形码联盟(CBOL)将DNA条形码定义为生物基因组中普遍存在的一段能够高效鉴定物种的 DNA 标准区域。其建立在2个前提之上:①每个物种应有唯一的 DNA 条码序列;②物种间的基因遗传变异应大于物种内的基因遗传变异。DNA条形码最初目的是进行生物种分类鉴定及数据的储存,以期快速准确地鉴定物种,并发掘新种及隐匿种,现已在动植物和微生物等各类生物中得到广泛的应用[21-25]。受益于DNA条形码的研究,2008年FICETOLA等[10]提出利用特异性的DNA片段检测水域内美国牛蛙的入侵,自此开启了环境DNA技术在水环境监测中研究与应用的先河。近年来,对环境DNA的研究在不断发展和深化,已从单一化的靶向物种(外来物种入侵、珍稀及濒危物种)监测到非靶向多元化生物群落调查,再到作为新型的高通量分子指纹用于环境污染物的诊断、水环境健康评价及污染物生态阈值推导等(表1)。

表1 环境DNA技术在生态监测领域主要研究Table 1 Main research of environmental DNA approaches in the field of ecological monitoring

此外,环境DNA技术较高的成本效益也是促进其发展与应用的重要因素之一。据研究发现[50],相比于传统生物监测技术,仅单个监测位点环境DNA技术就可以节省超过40%的成本投入。而且,随着监测位点数量的增加,成本效益的优势会更加凸显。随着大数据、云服务和人工智能领域的快速发展,环境DNA技术在多学科、跨领域间的交流与合作也值得期待。

1.2 物种丰富度和相对丰度评估

对物种丰富度和相对丰度评估是探索、认识物种和保护生物多样性的基础。传统基于物理、声学和视觉观察的生物监测是当前评估物种多样性的主要方式[51],但它们存在很大的局限性。即使是高水平的物种鉴定专家,对某些生物类群的错误识别也很常见。而且,传统监测方法对环境和生物群落会造成破坏性的影响[3]。对于许多两栖动物和爬行动物,传统方法可能需要专门的设备或特定的观察时间,从而使物种多样性评估难以进行[52]。由于环境DNA技术可同时监测多生物群落且具有较高的物种辨识度等,很好地弥补了传统监测方法的不足。已有研究发现环境DNA对两栖动物的监测要优于传统方法[53]。此外,通过对食血水蛭体内宿主血液的收集,可实现对濒危和隐匿的脊椎动物的有效监测[54]。对植物的研究也发现,相比于视觉方法,分离空气中的DNA可以提高对花粉的分类辨识度[55]。

环境DNA技术还可以用于物种的相对丰度评估。大量的研究发现,通过使用特异性引物或定量PCR(qPCR)技术,可以实现单物种相对丰度的测量[7,43]。虽然这些研究都需要进行大量的控制实验,以确定在qPCR中所观察到的物种相对丰度与基因拷贝数之间的关系,但至少可以证明环境DNA包含了物种相对丰度的信息。目前,虽然利用环境DNA度量生物群落丰度仍缺乏结论性证据,但已有研究认为,DNA序列的相对丰度与传统方法评估的物种丰度存在明显正相关。如在中宇宙模拟实验中发现,鱼类和两栖动物的个体数与相对丰度均与DNA序列数存在相关性[56]。类似结果也出现在自然湖泊中,传统刺网的渔获量与同时开展的环境DNA监测结果存在正相关[57]。对海洋的研究也指出,将DNA序列在科级水平进行统计时与传统拖网捕获的鱼类相对丰度及生物量有相关性[58]。

1.3 靶向与非靶向的生物监测

环境DNA技术最初被用于法国池塘中北美牛蛙的监测[10],随即引起了研究人员和环境监管部门的极大兴趣,目前已被成功用于亚洲鲤鱼[37]、克氏原螯虾[11]、娃娃鱼[12]等入侵生物的监测。以上这些研究均以物种特异性引物为基础,目的是为入侵生物监测提供新证据。这种靶向的方法在入侵生物学领域被称为“主动”监视[59]。尤其在自然资源管理中,为避免未来引进及减少现有外来入侵生物的传播时,这种“主动”监测至关重要。但是,环境DNA技术还存在一个重要挑战,即入侵物种检测的假阳性和假阴性,这2种情况都会引起生物监测结果的不确定性,为入侵生物的根除和控制带来巨大负担。因此,仍需要继续开展研究,减少或了解产生假阳性和假阴性的原因,提高环境DNA对外来入侵生物监测的准确性。

与“主动”监视相对应的,环境DNA技术还能同时利用不同引物进行多生物群落的监测,从而快速了解环境中生物群落组成,这种被广泛应用的非靶向方法被称为“被动”监视[59]。在分析环境变化对水生态系统的影响时,除了进行靶向的生物监测,仍然需要在多生物群落和不同营养水平上进行生物多样性的研究,分析并预测生物多样性改变对生态功能的影响。环境DNA具有促进生物多样性和生态系统功能研究的潜力[42],提高研究人员对捕食者和被捕食者关系的认识(如植物与传粉者的相互作用)[60],以及在高度多样化的系统中了解小型隐匿物种组成的食物网[61]。这些研究可以揭示物种共生作用和相互作用,将进一步促进研究人员对复合生态系统的理解,并提供用于指导大生态系统尺度的管理决策。环境DNA 技术还可以为评估人为污染的影响提供一个强有力的工具,如在“河北精神”号溢油事件发生后7年,环境DNA被用于表征表层沉积物微观和宏观生物群落结构的变化。该研究结果表明原油泄漏污染对微生物群落和后生动物群落产生了长期的影响,这些影响体现在生物多样性、优势物种的相对丰度和结构变化上[32]。

1.4 古生态学领域的应用

研究生态系统演替规律和污染物的生态群落效应时,传统毒性实验、微/中宇宙模拟和全流域的生态调查都存在监测周期短的缺陷[62]。虽然依据考古或古湖沼学知识可以克服上述问题[63],但仍然存在效率低和缺乏历史资料等因素限制。近年来,从湖泊沉积柱或冰芯中获得的DNA(常被视为“古DNA”)可记录几十年至上万年的生物信息[64]。对湖泊沉积柱中动植物研究发现,早在1.26万年前的陆地生物和水生生物可以被监测[65],而从冰芯中获取的DNA已经成功用于对2000年前生物群落的重建[66]。此外,从冰川径流中提取的环境DNA,也可用来监测生活在冰川和冰下栖息的动物和植物的多样性[67]。由于气候变暖,这些栖息地正经历着巨大的变化。与之类似,垂直运输到海洋中的沉积物也会保存大量的DNA,因为这些DNA被直接吸附到泥沙颗粒上,使其可以避免核苷酸被氧化和水解等过程降解,有助于在大时空尺度上保存遗传信号。该研究还发现,海洋沉积物DNA的浓度是海水中DNA的3个数量级[68],海洋沉积柱也积累着大量的近海和远洋生物群落遗传信息。因此,沉积柱中的DNA是研究长时期动植物群落演替的有力工具,同时也提供了重建过去营养级关系的机会。如在食草动物中发现的小颗粒的环境DNA已经被用于古动物和古植物的鉴定[69],利用粪便化石中的微生物和植物DNA痕迹可重建稀有和已灭绝的古鸟类饮食关系[70]。

沉积柱或冰芯不仅可以反映长时期生物群落演替动向,还能通过追踪污染物的沉积历史[71],提供长期暴露于污染物下的群落生态效应信息[62]。因此,将环境DNA和古生态学/湖沼学有机结合起来,对理解长期人类活动及其产生的生态系统影响具有重要价值。

1.5 存在问题及解决建议

虽然环境DNA技术在生物监测中应用越来越多,但该技术仍存在一些不足。如在分析河流生物群落的空间分布时,尽管环境DNA技术可以检出更高的物种丰富度,但DNA会沿着水流向下游迁移,导致识别的物种并非全部来自本地[72]。还有研究指出,环境中物种基因拷贝数受DNA来源、状态和传输速率等影响[73],使环境DNA反映的物种丰度与真实的物种丰度存在差异。此外,引物偏好性已经被证明会错误评估样品中DNA序列的相对丰度[74],而且在样品处理过程中,过多的子样本数量可以导致稀有的DNA序列丢失[75]。这些因素的结合可能会进一步放大任何已知物种DNA序列的偏差,并将完全抑制稀有物种的监测。

实际上,当一个物种的监测结果被怀疑时,可以使用qPCR来验证结果的真实性,因为单物种特异性的qPCR不会存在引物偏好性的问题。此外,增加重复样品数量和去除低丰度数据可以在一定程度上克服假阳性问题[76]。为确保样品的完整性,实验室阴阳对照样本的设置极为重要。使用阳性对照样本可以帮助评估环境DNA的测序效率和错误率[77],而在实验室操作过程每个阶段(如样品过滤、DNA提取、PCR和测序)设置的阴性对照可通过统计模型等方法检测高通量多通道测序过程中产生的错误,以排除假阳性检测。最后,由于数据处理过程也会影响研究的结果和结论,生物信息学工具的选择和参数设置也必须要慎重。

2 环境DNA技术跨学科合作潜在机遇

2.1 机器学习——智能化的生态监测

大数据和云服务时代的到来对数据的探索、分析和预测提出了更高的要求。作为探索和分析数据的基础理论和工具,机器学习及数据挖掘成为当前热门的技术。机器学习的核心是通过数据统计和逻辑推理让计算机将海量信息转化为可行的情报并做出正确反应的科学。这种方法在社会科学和分子/遗传学科已得到了广泛的应用,但直到最近才被应用到生态学领域[34,78]。对于生态监测数据,研究人员通常使用统计模型(如回归模型)来研究生物群落繁殖、迁移和捕食等作用关系。但是,机器学习可以根据数据运算和逻辑推理完成数据集中相互作用的生态网络关系重建。只要方法合适,机器学习能快速地从生态监测数据中重建生态网络,显著提高建立生态作用网络的效率。

当前,高通量测序一次可完成10~100 G的测序数据。这一优势使得环境DNA生态监测成为名副其实的大数据监测,传统的数据分析方法显然无法适应高通量数据分析。如果将环境DNA技术与机器学习、云服务进行耦合,可以构建一个系统性、全球化、网络化的快速生态监测体系。但是这种基于逻辑推理从高通量测序数据中重新构建生态网络的研究仍需进一步完善。有研究指出,对高通量测序数据使用统计推理方法构建的微生物网络在精确度和灵敏度上存在很大的差异[79],而且这种生态网络与现有的知识存在矛盾。但是在一项关于浮游生物的研究中发现,利用机器学习可以很好地从高通量测序数据中重构生物网络关系[80]。因此,这些研究结果的差异也说明基于机器学习的高通量测序数据分析还存在很大的提升空间。

环境DNA生物监测也是一把“双刃剑”,虽然可以获得传统形态学监测无法获取的群落大数据信息,但同样面临如何理解这些数据的困境。由于全球范围内DNA参考数据库并不完善,测序产生的大量DNA操作分类单元(OTUs)无法完成序列注释,特别是宏基因组的测序,有时85%以上的序列是未知的[26]。在进行数据分析时如果丢弃这些未知的OTUs,将会造成海量信息的遗失。机器学习正成为克服这一困难的有效工具。最近有研究提出,使用监督式机器学习可以完成非注释性OTUs的生物指数计算,而且这些新型的分子生物指数具有很好的水生态健康评价潜力[34]。在细菌和硅藻研究中,这种方法也被用于污染水平的预测和生态风险评价[34-35]。

2.2 遥感——实现全球化的监测网络

遥感技术是指从远距离感知目标反射或自身辐射的电磁波、可见光、红外线等,完成对目标探测和识别的技术。该技术具有获取全球性数据的优势,而且遥感数据具备在时空尺度上标准化和可重复性。尽管遥感最初的开发和部署成本很高,但稳定的卫星传感器将持续提供最具成本效益的长期监测能力。最近,传感器技术的发展为水生态系统监测开辟了新思路。通过地球观测平台可获得越来越高的空间和光谱分辨率数据,这些数据可以用来度量生物指标的变化(如水生植被覆盖面积和叶绿素a浓度)[51,81]。目前,卫星遥感技术已被应用于湖泊中生物多样性的监测,如Diversity II(www.diversity2.info)和Globolakes(www.globolakes.ac.uk)等监测项目已经分别覆盖了全球340、971个湖泊。此外,新型的高光谱技术,通过分析数百个狭窄的光谱带可提供水体中藻青素、叶绿素a、悬浮物、浮游植物功能类型和底栖生物组成等更多的信息[82]。还有,在无人机等小型机载设备上搭载轻型高光谱相机,可弥补卫星无法监测的河流源头信息[83]。利用历史航空图像和地图的存储库,遥感也可用来评估过去的环境压力(如历史航拍照片被用来量化大坝建设和人类用水对河道的影响)。

遥感技术与环境DNA的结合将为未来环境监测提供更多可能性(如将历史卫星图像与古环境DNA结合,可以重建过去生物群落对环境压力的响应,评估生物多样性随时间的变化趋势[84])。此外,利用卫星光谱图像解译的水生植被覆盖面积、叶绿素a浓度等信息,与环境DNA的高通量监测信息结合,可用于预测富营养型湖泊藻华的暴发,该领域的研究将会有很好的发展前景[81,85]。特别是在当前人类活动产生的多元化环境压力下,监测数据的丰富性和连续性是分析生物多样性和生态系统变化的一个关键因素,这主要是因为对生物多样性造成威胁的环境压力范围广泛,而且往往会跨越很长一段时间。

2.3 公民科学团体的参与

环境DNA技术的便捷和可操作性,使其为推广全民参与的生态环境保护监测项目创造了新途径。特别是环境DNA分析试剂盒商业化(如NatureMetrics,Spygen,QIAGEN等)更推动了公民科学项目的发展。公民科学团体是收集或处理数据的志愿者,通常是在科学项目的支持下进行的。涉及公民科学的研究项目正随着公众对生态环境的保护兴趣日益增加而增长。因此,公民科学团体正越来越多地扩大对不同时空范围的水环境监测。如基于公民科学的全球湖泊生态观测网(GLEON,http://gleon.org/)已建立了一个全球范围内的数据采集网络,收集不同湖泊的数据以记录对不同的环境压力的响应,包括水温、溶解氧和浮游植物叶绿素荧光等。与此类似的,国际河流组织(www.internationalrivers.org/worldsrivers)开展了全球范围内50个主要河流的健康状况评价。尽管大部分指标都与环境驱动因素有关(如水坝数量和入侵鱼类的百分比),但也存在一些生物指标(如关注哺乳动物和鸟类)。在英国,由公民科学家组成的Riverfly Partnership(http://www.riverflies.org/),其成员都接受了简单的无脊椎动物监测技术培训,开展英国河流的健康评价。在南非,miniSASS(http://www.minisass.org/)采用了类似的方法进行水环境保护。重要的是,这些团体组织和他们的在线数据存储库都在不断扩大。如果这样的项目(计划)扩展到其他国家,并将这些数据在全球数据库中分享,将会使整个河流健康状况得到改善。

在中国,人们对水环境质量的理解正在不断深入。单纯的水化学污染控制显然不能满足新时期水生态环境保护的需求。对应于中国尚不完善的生物监测体系,基于公民科学的全民水环境保护计划也处于发展的新阶段。为了吸引更多的公民参与其中,环境管理者和科研人员相继做出了很多的努力。如由生态环境部与住房和城乡建设部共同发起的城市黑臭水体整治环境保护专项行动(http://www.hcstzz.com/),每周会定期发布《全国城市黑臭水体整治公众监督及回复情况周报》,目的是加强社会公众对水污染治理的监督和参与度。此外,以鼓励公众参与为目的的河流生态地图项目(http://nju.erivermap.com/water/)日益得到社会群众的关注,该项目旨在利用环境DNA技术对全国各地的水体进行生态监测,提供河流、水库、湖泊等生态系统的生物多样性分布地图,建立水生态健康评估报告,完成全国水环境健康状况的评价。这些项目的实施将会逐步增加公众的水环境保护兴趣和热情,进而推进公民科学在中国的发展。

3 结论

水生态系统变化的早期识别和对人类活动压力的诊断可有效保护水生态环境。同样,对水生态环境治理与修复措施的评估也需要精确监测生态系统质量的变化。对生态系统中物种多样性、结构及组成的观测,可以用于研究这些物种如何塑造生态系统。迄今为止,大多数研究都集中在较小时空尺度上,而许多与大尺度和长时间跨度有关的问题都没有得到解答,但是这种在时空尺度上的研究限制正在被改变。基于高通量测序的环境DNA技术与遥感、机器学习、云服务等技术耦合,产生的监测大数据将会为未来几十年生态学研究带来巨大的机遇。这些新技术除了提供新颖的数据获取方法外,还可以提供从局部到全球范围以及多层次(如单一群落到生态作用网络等)的生态系统动态信息,进而改变人们对生态系统变化的理解,还可以更准确地预测环境变化造成的生态后果。此外,作为水生态环境保护的主体,社会公民应该被鼓励加入进来。这一便捷和可标准化操作的环境DNA技术,将会为推广全民参与水环境保护行动创造新途径。

猜你喜欢
高通量测序物种
外显子组测序助力产前诊断胎儿骨骼发育不良
高通量血液透析临床研究进展
Ka频段高通量卫星在铁路通信中的应用探讨
中草药DNA条形码高通量基因测序一体机验收会在京召开
回首2018,这些新物种值得关注
基因测序技术研究进展
外显子组测序助力产前诊断胎儿骨骼发育不良
电咖再造新物种
中国通信卫星开启高通量时代
世界上的15个最不可思议的新物种