李静超,佘 容,杨晓燕,2,3
(1大理大学东喜玛拉雅研究院,云南大理671003;2中国三江并流区域生物多样性协同创新中心,云南大理671003;3大理大学三江并流区域生物多样性保护与利用云南省创新团队,云南大理671003)
作为人类赖以生存和发展的基础,土壤拥有丰富的微生物资源,其数量巨大、种类繁多。据估算,1 g土壤中有数千乃至数万种、约数十亿个微生物个体[1-5]。土壤微生物是土壤生态系统的重要组成部分,在土壤的物质循环和能量流动、生态平衡以及植物的养分转换中发挥着举足轻重的作用[6-8]。因此,土壤微生物受到了土壤学、生态学、微生物学等领域学者的普遍重视,逐渐成为当代生命科学中最前沿的研究内容之一[9]。
过去,土壤微生物的研究一般是通过传统培养法进行,但目前能够使用培养方法培养的土壤微生物只占其总量的0.1%~1%[10]。依赖培养法获取的信息有限,不能完全反映样本中微生物群落的真实状况,而这会导致对微生物的认知局限性[11]。随着科学技术的进步,特别是以DNA为基础的分子生物学技术以及454焦磷酸测序仪的问世(2005年),测序技术迅速发展,其通量和读长都得到了极大的改善,而以此为基础发展起来的宏基因组技术也越来越受到微生物研究者的青睐[12]。宏基因组(metagenome)也称环境微生物基因组或元基因组,是环境中全部微小生物(目前主要包括细菌和真菌)DNA的总和[13]。宏基因组技术不依赖传统的微生物分离培养过程,以高质量的样品总DNA为研究材料,以DNA深度测序和功能基因筛选为研究手段,实现了对各样品内微生物群落多样性、物种丰度、基因功能以及代谢通路的分析[14]。基于此,利用宏基因组技术研究土壤中大量未知的微生物基因序列,跨越了微生物研究的初始瓶颈,很有可能改变人们对土壤微生物世界的认识,并在农业、林业、环保等领域发挥巨大的应用潜力。因此,近年来利用宏基因组技术进行土壤微生物研究的报道逐年增加[15-16]。
文献计量学分析是应用数学及统计学的方法对某领域的文献进行量化的分析方法,能客观、定量地反映学科宏观发展态势,是探究学科发展的一种有效途径[17]。另外,文献计量学对评估科研机构的竞争力也很重要,可以帮助科研机构进行科技评价,战略规划,制定决策,挖掘其潜在竞争力和需求[18]。因此,该方法目前已被广泛应用于对各领域研究进展的分析。基于此,本研究对Web of Science核心数据库和中国知网(CNKI)中利用宏基因组技术进行土壤微生物宏基因组研究的文献进行计量学统计分析,以了解宏基因组技术在土壤微生物研究领域中的应用现状,并综合分析应用中存在的问题,提出在该技术应用中应注意的问题及可能的解决办法,旨在为研究者们更好地利用宏基因组技术进行土壤微生物研究提供参考。
数据来源于中国知网(CNKI)和Web of Science核心数据库。Roche 454测序仪的出现时间为2005年,所以2个数据库检索时间均以2005年为起点。选择CNKI期刊论文数据库进行检索时,检索式SU=‘土壤’AND SU=(‘宏基因组’+‘宏基因文库’+‘宏基因组学’+‘宏基因’+‘宏基因测序’+‘高通量测序’+‘高通量’+‘扩增子’+‘扩增子测序’)AND SU(‘微生物’+‘真菌’+‘细菌’+‘放线菌’+‘微生物组’),检索共获得文献1770篇,经过筛选,去除会议论文65篇、学位论文947篇、成果论文5篇,最后纳入分析的文献共计753篇。选择Web of Science数据库进行检索时,检索式为TS=‘soil’AND TS=‘(metagenom*’OR‘highthroughout*’OR‘amplication*’)AND TS=‘(Microb*’OR‘bacteria’OR‘fungi*’OR‘actinomycete*’OR‘microorganism’),检索共获得文献2024篇。
利用CiteSpace 5.7 R2软件,对检索所得文献进行机构和与作者的合作网络关系分析、关键词共现网络分析,并将分析结果导入Gephi软件中进行绘图;另外,利用HistCite软件对发文机构、文献来源期刊进行统计,统计结果进一步利用Excel进行数据分析和图形绘制。
发文量表征科学界对本领域的关注程度,其增长趋势在一定程度上反映了该领域的发展速度和发展程度[19]。在所分析的文献中,英文文献发文量自2005年开始就持续增长,而中文文献在2005—2013年发文量基本没有大幅度增长,直至2013年后才持续增长,并在2019年达到最高(年发文量221篇),且该年增长幅度高于英文文献(图1)。
图1 2005—2020年土壤微生物宏基因组研究发文量趋势
国家和地区的发文量分布和引用次数可以在一定程度上说明该国家和地区在某一学科上的研究规模和水平[19]。在Web of Science核心数据库检索到的文献中,美国的发文量位居第一,发文量为647篇,占30.72%;中国位居第二,发文量为406篇,占比19.28%;第三是印度,发文量为187篇,占比8.88%(表1)。
表1 英文文献中土壤微生物宏基因组研究领域发文量排名前10位的国家
2.3.1 研究机构分析 通过对英文文献中不同机构发文量的分析,可了解全球利用宏基因组学技术进行土壤微生物研究的重点机构。分析结果显示,发文量第一的是中国科学院,发文量为119篇,占所分析文献的5.88%;其次是Univ Calif Berkeley(加利福尼亚大学伯克利分校),发文量为51篇,占所分析文献的2.52%;Tsinghua Univ(清华大学)排名第三,发文量为43篇,占所分析文献的2.13%。发文量排名前10位的机构中,中国机构的发文量占比接近60.00%,说明中国机构在利用宏基因组技术进行土壤微生物研究方面多于其他国家(表2)。从机构合作来看,国内机构联系密切,美国各机构之间也联系密切。另外,中国科学院引领国内其他机构与其他国外机构有密切的联系,只有CSIC(西班牙国家研究委员会)、CNRS(法国国家科学研究中心)、Univ Waterloo(加拿大滑铁卢大学)3个机构和其他机构没有任何联系(图2)。
图2 英文文献的机构合作网络关系图
表2 英文文献中土壤微生物宏基因组研究领域发文量排名前10位的机构
通过对中文文献的分析发现,发文量排名第一的研究机构是中国科学院大学,发文量为64篇,占总发文量的8.51%(表3);排名二、三位的是中国科学院南京土壤研究所、宁夏大学农学院,分别是39、38篇,占比5.19%和5.05%;其他机构中,中国科学院生态环境研究中心、中国科学院沈阳应用生态研究所、中国矿业大学环境与测绘学院和中国农业科学院农业环境与可持续发展研究所等机构发文量排名也比较靠前。但除排名前三的机构发文量较多外,其他机构的发文量均少于30篇。从机构合作来看,以中国科学院及其分属机构为一个体系,中国矿业大学为一个体系,中国热带科学院为一个体系,各体系之间的联系不密切(图3)。2.3.2核心作者分析 英文文献中,发文量最多的是Zhou Ji-Zhong,发文量为33篇,其次为He Zhi-Li,发文量为20篇,其余作者发文量均没超过20篇。另外,在英文文献中,发文量前三的作者均来自中国,说明国内利用宏基因组技术进行开展的土壤微生物研究的较多(表4)。国际合作关系来看,以Zhou Ji-Zhong为中心的作者体系网络与国内外作者都有密切联系,只有少数作者与该体系网络没有联系(图4)。
图4 英文文献作者合作网络关系图
表4 英文文献中土壤微生物宏基因组研究领域发文量排名前10位的作者
图3 中文文献的机构合作网络关系图
表3 中文文献中土壤微生物宏基因组研究领域发文量排名前10位的机构
在所分析的中文文献中,第一名是秦华,发文量26篇,其他作者发文量均未到20篇。从研究者合作关系来看,国内只有一个以秦华为中心的作者合作体系网络,其余作者均没有超过3个的合作网络(表5,图5)。
图5 中文文献作者合作网络关系图
表5 中文文献中土壤微生物宏基因组研究领域发文量排名前10位的作者
在中文文献中,收录文献位居第一的是《生态学报》,共收录41篇,占比5.45%;排名第二、三的是《环境科学》、《应用生态学报》,收录文章数量分别为32、25篇,占比分别为4.26%、3.32%;随后是《土壤学报》、《中国农业科学》、《中国中药杂志》、《林业科学》、《中国生态农业学报》、《草业学报》和《中草药》,但其文献收录量很少,均在10篇以下(表6)。
表6 中文文献中收录土壤微生物宏基因组研究文献数量排名前10位的期刊
在英文文献中,《Frontiers in Microbiology》以122篇的文献收录量位居首位,占比6.03%;《Plos One》的文献收录量为95篇,居第二,占比4.70%;第三是《Applied and Environmental Microbiology》,文献收录量为86篇,占比4.25%(表7)。
表7 英文文献中收录土壤微生物宏基因组领域文献数量排名前10位的期刊
被引频次是衡量论文质量的最直接指标,同时也能反映科研人员的科研水平和学术影响力[20]。
通过中国知网的数据统计,被引次数第一的文献是《土壤微生物多样性的科学内涵及其生态服务功能》[21],该文章于2008年9月发表于《土壤学报》,主要从物种多样性、遗传多样性、结构多样性及功能多样性4个方面探讨微生物与环境之间相互作用的多样化程度;其被引次数为554,下载次数达到9563。排名第二的文献为《高通量测序和DGGE分析土壤微生物群落的技术评价》[22],该文章于2014年12月发表于《微生物学通报》,该文主要比较了高通量测序与传统变性的梯度凝胶电泳(DGGE)指纹图谱技术,并评价2种技术研究土壤微生物群落结构的优缺点;其被引次数400,下载次数10747。排名第三的文献为《高通量测序技术在土壤微生物与多样性研究中的研究进展》[23],该文于2014年5月发表于《中国农学通报》,主要介绍了Solexa、454和Ion Torrent等常用高通量测序技术的原理和优点,并综述了近年高通量技术在土壤微生物多样性研究中存在的问题、进展以及发展趋势;其被引次数251,下载次数达到8382(表8)。
表8 土壤微生物宏基因组研究相关中文文献分析
将英文文献导入HistCite软件中分析得到文献被引数据。其中,引用频次排名第一的文献为《Cloning the soil metagenome:a strategy for accessing the genetic and functional diversity of uncultured microorganisms》,该文章于2000年6月发表在《Applied and Environmental Microbiology》,主要探讨了将环境DNA克隆到大肠杆菌BAC文库中的可行性,该方法为研究宏基因组的系统发育和功能特性提供了一条途径[24],其LCS为164,GCS为729(表9)。排名第二的文献为《Cross-biome metagenomic analyses of soil microbial communities and their functional attributes》,该文于2012年12月发表在《PNAS》,证明了在跨陆地生物群落中,宏基因组学方法可用于建立对微生物多样性和功能如何变化的预测性理解[25],其LCS为135,GCS为679。排名第三的文献为《Molecularbiologicalaccessto the chemistry of unknown soil microbes:A new frontier for natural products》,该文章于 1998年发表在《Chemical&Biology》,探讨了克隆宏基因组以获取土壤微生物区系的集体基因组和生物合成机制的概念,其LCS为125,GCS为880[26]。整体来看,LCS排名前10的文献中70%来源于美国,说明美国在该研究领域的影响力最高。
表9 土壤微生物宏基因组研究相关英文文献HistCite分析
利用CiteSpace软件对文献进行关键词共现分析,可以反映出本领域的主要研究内容及其相互关系,进而对未来的发展做出合理的预测。从中文文献的关键词共现网络图谱来看,目前以宏基因组技术进行的土壤微生物研究主要是研究土壤细菌群落结构,其次是土壤真菌群落结构。研究所选的生境主要有根际、亚热带森林以及秸秆还田和香蕉枯萎病所影响的生境,并重点关注了comammox(全程氨氧化细菌)、amoa(氨氧化细菌)基因和cbbl(固碳细菌)基因。从英文文献的关键词共现网络图谱看,目前宏基因组技术进行的土壤微生物研究主要是细菌群落,所研究的生境包含了根际、沉积物等相关的生境,并关注了抗生素耐药相关的问题。另外,从关键词的共现关系看,中文文献中各关键词共现的联系频次没有英文文献密集,说明中文文献在研究内容上显得较单一(图6~7)。
图6 土壤微生物宏基因组研究中文文献的关键词共现网络图谱
图7 土壤微生物宏基因组研究英文献的关键词共现网络图谱
通过中英文文献的国内外机构发文量、影响力的比较分析可见,国内科研人员对于新技术的采用态度是开放、积极的,积累了大量的研究报道[27],但是高频引用文献较少,而论文的被引频次是反映科研成果受关注程度和影响力的基本指标[28],说明国内学者对于新技术的使用仅是简单的应用,缺少创新,无论是对方法的创新还是应用目的上都需要不断的完善与进步。基于本研究中关键词共现图谱中所呈现的结果,不论是国内还是国外的研究,对于土壤微生物的功能探索仍然较为缺乏,而土壤微生物的研究目标是了解并运用其功能,服务于整体生态系统的维持与修复[29]。因此,建议科研工作者在应用高通量测序技术进行土壤微生物研究的同时,综合考虑遗传多样性与功能多样性的关系、土壤微生物多样性与动植物多样性的关系等内容。
在中英文文献发文机构以及作者的合作网络关系分析中可以看出,英文文献对应的研究机构及研究人员之间有紧密的合作,而中文文献所对应的国内研究机构及研究人员中主要是围绕中科院体系的机构及人员形成了一定的合作,而其他机构与人员之间合作较少。究其原因,一方面可能是因为不同机构与作者所关注的研究对象和研究内容不同;另一方面,是国内研究者在交叉学科领域的研究不足所致。近年来,交叉学科研究被认为是最容易产生新的科学和重大突破的研究领域,也是国内双一流建设的基础与核心[30-31]。而为了更好地推动世界一流学科的建设,相关管理部门也正在为学科交叉创设良好的环境,鼓励和推动交叉学科研究的开展,为此,国家自然科学基金在时隔11年后于2020年再次成立新的科学部——交叉科学部,与目前的八大学部并列。由此可见,交叉学科研究是科研创新的新思路,而不同机构与人员之间的合作是交叉学科研究的基础,加强不同学科、领域中机构与人员之间的合作与联系,有利于创新成果的产出,同时也利于提高中国科研人员的国际影响力。
土壤微生物包括细菌、真菌、放线菌,但从文献所关注的类群来看,CNKI数据库中对于细菌的研究几乎占了7成,WOS数据库基本只有关于细菌的研究,由此可见,在土壤微生物的宏基因组研究领域,对不同物种的关注度是不平衡的。另外,当分别以细菌、真菌、放线菌为主题词检索中国知网和Web of Science数据库时,获得的文献数量分别是95.96万、29.86万、3.91万和64.34万、23.42万、0.52万,这也说明当前对于微生物的研究,在类群选择上比较侧重于细菌类群。从文献报道来看,土壤微生物中细菌的数量是最多的,放线菌次之,真菌最少[32],因此,人们首先将目光投向细菌也是可以理解的,但是近年来的研究发现,在受干扰的生态系统中,真菌网络稳定性强于细菌,可能在生态恢复中发挥着重要作用[33],而放线菌是近来发现的诸多新型抗生素的产生菌[34],因此,在进行细菌研究的同时,应加强对真菌、放线菌的研究。
另外,不同的生境栖息着差异显著的土壤微生物类群[35],而由目前2个数据库中相关文献所呈现的结果发现,在环境的选择方面中文数据库重点关注了森林和农田的相关研究,英文数据库则重点关注于植物根际土壤微生物的研究,对其他环境如温泉、极地的关注较少,而往往正是在这些特殊生境中,人们发现了大量新物种和新代谢产物[36]。因此,在土壤微生物高通量测序分析中应加强对这些特殊生境的研究,这将有可能扩展人们对于微生物遗传多样性、物种多样性、结构多样性和功能多样性的认识[37]。
高通量测序技术的广泛应用,极大地推动了土壤微生物研究,可以预见,该技术将继续在土壤微生物的研究中发挥重要作用。同时,基于测序技术本身的局限,未来的研究应同时结合其他研究手段,如宏蛋白质组学、宏转录组学、宏病毒组学和宏代谢组学技术进行功能研究,但也不能忽视传统纯培养技术的作用。