何子伟,张 琦,徐延浩,张文英
(1.主要粮食作物产业化湖北省协同创新中心/长江大学农学院,湖北荆州 434025;2.长江大学图书馆,湖北荆州 434025)
小麦是主要粮食作物,其大多数重要农艺性状和经济学性状属于数量遗传性状,受多基因控制且易受环境影响。解析这些性状基因座(quantitative trait locus,QTL)的数目、位置及其遗传效应,开发与目标基因紧密连锁的分子标记,可为阐释遗传基础[1-4]、挖掘优异基因[5-8]及分子标记辅助选择[9-10]奠定坚实基础。
文献计量学是一种统计分析文献的方法,能够从多维度客观定量地梳理学科研究的整体布局、学科优势、研究中心、优势团队,挖掘研究热点[11-13],已被广泛应用于作物科学研究领域。其中,有代表性的报道包括超级稻研究发展态势的定量分析[14-15]、作物分子标记辅助育种的国际发展态势分析[16]、中国科研机构在作物科学研究领域的竞争力分析[17]、转Bt基因抗虫水稻研究的发展动态分析[18]、小麦总体研究态势的计量分析[19]、分子标记在植物研究应用的趋势分析[20]等。近年来,越来越多的小麦相关性状QTLs被定位,尚未见有关此方面研究的计量文献报道。
本文利用Web of Science核心合集数据库,对2008-2017年发表的小麦QTL定位的文献进行计量统计,从刊文数量、期刊分布、发文国家、研究机构、论文影响力和研究方法等方面分析小麦QTL定位研究的现状和发展趋势,有助于了解全球小麦研究的发展状况,明确未来研究方向,以期为我国该领域进一步发展提供科学参考。
数据来源为Web of Science核心合集数据库,检索期限为2008-2017年。
在Web of Science核心合集数据库中,采用高级检索模式,以“TS=(wheat and QTL mapping)”作为检索词,限定语言为“English”,论文类型为“Article”,时间跨度为“2008-2017”。对检索结果利用Web of Science自带的引文报告分析和文献计量在线分析网站(http://bibliometric.com/results.html)对数据进行处理,采用Microsoft Excel 2013、Cite Space、VOSviewer和Sigma Plot 12.5等软件制作图表。
在Web of Science核心合集数据库中,共检索到2008年至2017年10年间收录的小麦QTL定位论文1 292篇。统计分析可知,全球每年刊发小麦QTL定位的文献数量和被引用频次整体上呈上升趋势(图1)。自2011年开始,全球年刊发小麦QTL定位的论文数量保持在100篇以上,总引用频次在1 000次以上,且对小麦QTL 定位研究的热度和关注度在近四年呈稳步上升态势。
图1 2008-2017年小麦QTL 定位文献刊文数量及引用频次年度走势
2008-2017年全球刊发小麦QTL定位论文数量排名前10位国家、机构、出版物和研究方向列于表1。按照国家排序,中国发文数量最多,为390篇,占总数的30.19%;美国居第二,为358篇,占总数的27.71%。按照机构分类,美国农业部农业研究局发文最多,为108篇,占所有记录的8.13%;排名第二位是中国农业科学院,为102篇,占7.90%。刊文期刊中以《Theoretical and Applied Genetics》、《Euphytica》和《Molecular Breeding》三种期刊发文数量最多,分别占记录总数的18.36%、10.80%和9.57%。小麦QTL定位研究的学科领域主要集中在Plant sciences、Agriculture和Genetics heredity,分别占记录总数的63.31%、57.82%和42.80%。
表1 2008-2017年全球刊发小麦QTL定位论文数量前十的国家、机构、出版物和学科领域Table 1 Top ten countries, institutions, publications and research directions with the most publications on the QTL mapping in wheat from 2008 to 2017
在2008-2017年,从小麦QTL 定位研究被引用频次最多的10篇文献(表2)看,被引用频次最高的一篇论文出自日本,其引用频次为409次。在这10篇论文中,来自中国的有3篇,但中国引用频次最高的一篇论文仅排名在第5位,为104次。由此可以看出,中国在小麦QTL定位研究领域具有很大的提升空间,与世界上其他国家的顶尖科研水准相比还存在较大差距。
2008-2017年刊发小麦QTL定位论文位居前十的期刊均来自欧美发达国家(表3)。这些国家近现代以来科技起步较早,在科学研究上一直处于国际前沿,是全球分子生物学、基因组研究的发源地,底蕴深厚。这些上榜期刊在学术界享誉度较高,办刊水平较高。
通过利用文献计量在线分析网站(http://bibliometric.com/results.html)对Web of Science检索结果的分析,发现在被引用论文较多的前十位作者中,有四位来自中国,其中三位作者发表论文总被引用次数名列前茅,来自中国农业科学院作物科学研究所的陈新民研究员以论文总被引频次271次居第一位(表4),说明中国在小麦QTL研究领域的研究成果已得到同行关注和认同。但与此同时,也可以看到中国作者论文的平均被引用频次普遍较低,结合表2中中国论文单篇引用频次低的结果表明,中国仍然缺乏高影响力研究成果。另外,中国学者以通讯作者发表论文的被引频次明显低于美国的学者,说明中国在小麦数量性状基因定位领域的竞争力有待进一步提升。
统计结果(图2)表明,RIL(recombinant inbred lines)和DH(doubled haploid)这两种作图群体在近些年采用最多。在被使用的所有QTL定位统计分析软件中,MapChart、WinQTLCart、JoinMap、MapMaker、MapQTL的使用较与其他软件频繁,MapChart和JoinMap的使用次数呈逐年递增趋势。SIM(single-index model)、MQM(multiple-QTL model)、IM(interval mapping)、CIM(composite interval mapping)、ICIM(inclusive composite interval mapping)和MIM(multiple interval mapping)是常用统计分析模型,其中MQM、CIM以及ICIM使用次数呈逐年递增趋势。在分子标记方面,STS(sequence tagged sites)、SSCP(single-strand conformation polymorphism)、RFLP(restriction fragment length polymorphism)、SNP(single nucleotide polymorphism)是近三年使用频率最高的分子标记类型。
表2 2008-2017年被引频次前十的文献Table 2 Top ten cited papers from 2008 to 2017
表3 SCIE数据库中刊发小麦QTL定位论文期刊(前十)Table 3 Periodicals of the QTL mapping in wheat since 2008 to 2017(top 10)
表4 2008-2017全球刊发小麦QTL定位论文作者引用情况(前十)Table 4 Authors in the literature of the QTL mapping in wheat since 2008 to 2017(top 10)
图2 小麦QTL定位研究作图群体、分析软件、统计模型及分子标记统计
根据VOSviewer分析图(图3),resistance、yield、height、length、field等词汇处于联系中心的位置,在热点分布图中这几个词颜色最深,表明抗性、产量和形态相关性状是小麦QTL定位研究热点,这些性状与小麦的生产实践息息相关。
从利用CiteSpace软件以出版年为标准分类制作的引用关系图(图4)可以看出,从2008到2017年(色彩由蓝至红)论文之间的引用越来越密切,表明研究者越来越关注同行的研究成果。
图3 小麦QTL定位研究热点分布图
图4 论文引用关系图
在利用文献计量在线分析网站(http://bibliometric.com/results.html)制作的国家间合作关系图(图5)中,存在合作关系的两个国家间以彩色线条连接,一个国家的彩色阴影面积越大说明与其合作存在和关系的国家数目越多。目前,在小麦QTL定位研究领域全世界的国家/地区间的合作关系十分紧密,其中以美国、中国、加拿大、澳大利亚、印度和德国与其他国家联系最为密切,这几个国家近年的刊文数量均居于全球前列,这也与这些国家的刊文数量较多相一致。
根据CiteSpace软件分析(图6)的结果,全球2008-2017年间刊发的小麦QTL定位论文都存在学科交融,即针对同一问题利用不同学科的知识与技术手段共同研究。结合表2可知,在小麦QTL定位研究领域,分子生物学、植物生理学、生物化学、遗传学、栽培学、育种学等联系十分密切。另外,由于QTL定位需要使用到数量遗传模型,因此数学与计算机编程也是常用知识之一。
图5 国家间合作关系图
从2005年开始国际小麦基因组测序联盟(international wheat genome sequencing consortium, IWGSC)启动小麦基因组测序计划,到2017年底美国约翰霍普金斯大学Steven L Salzberg课题组二代(Illunina)和三代测序(PacBio)技术的应用[21],麦类基因组测序发展十分迅速。受此影响,2008-2017年全世界小麦QTL定位研究的论文成果在整体数量上呈现逐年增长趋势,虽然2013年的论文数量比2012年有所减少,但2013年后增长趋势更加迅猛。2008年以来,中国实施海外高层次人才引进计划、青年千人计划和国家高层次人才特殊支持计划等优秀人才吸引计划,各科研院校,工作单位也大量吸收优秀海外留学人员,提高了行业的整体技术水平。2009年至2017年,中国发表的小麦QTL定位论文数量不断增加,在2014年论文数量首次超越美国成为全球第一,2008-2017年小麦QTL定位研究领域影响力前十名的研究机构和作者中,来自中国的科研单位、作者占据了记录总数的30%左右,在数量上与美国并驾齐驱。然而,中国的发表论文的数量但存在“大文章少,小文章多”的现象,论文总体学术影响力与世界顶尖水平相比仍存在较大差距[22]。
图6 小麦QTL定位领域学科交叉关系图
本研究针对文献中涉及的作图群体、软件、分子标记和统计分析模型种类进行了分析,结果显示,近年来用于研究的分子标记种类越来越多,如SSR、STS、SNP等。同时,由于QTL定位研究是一种遗传概率的统计分析,不同的遗传模型、不同的算法公式往往适用于不同的研究对象,不适当的算法、模型会导致遗传概率计算错误或者假阳性现象,所以科研人员在利用特定统计分析模型时会倾向性采用某些软件进行数据分析,利于精确计算和降低假阳性,例MQM模型与MapChart、WinQTLCart、JoinMap、JMP、MapMaker、MapQTL这几种软件的配套使用,这与苏成付等[23]研究结果基本一致。
从图3可以看出,目前小麦QTL定位的研究热点依然与小麦生产实践紧密联系,侧重于产量、逆境、生产环境、基因定位等方面。这与近年来分子标记辅助育种[16]、水稻热点研究指标[24]、棉花高频引用论文[25]的研究趋势相符合。与此同时,近年来中国在水稻[14-15]、果树[26]、蛋白[27]、昆虫[28]等领域刊发的论文均出现数量占优、质量不高的现象,缺乏高影响力、高质量的论文。这与目前国内的科研评价体系及科研人员对科研成果数量的片面追求有关。“大文章”除了需要科学研究的长期积淀与积累外,还需要合作。已发表的“大文章”绝大多数由多名成员、多家研究机构合作完成,跨领域、跨国别组建科研团队联合攻关是大势所趋[29]。因此,我国在小麦QTL定位领域需要进一步加大与其他国家的交流与合作,我国各学科之间也需要加强交叉与交流。