基于CiteSpace的格氏栲知识图谱分析

2021-07-12 02:23柯志成连海峰何中声刘金福
中国农学通报 2021年16期
关键词:发文图谱聚类

柯志成,连海峰,何中声,刘金福,5,陈 奕

(1福建农林大学计算机与信息学院,福州 350002;2生态与资源统计福建省高校重点实验室,福州 350002;3福建省资源环境空间信息统计研究中心,福州 350002;4福建农林大学林学院,福州 350002;5福建农林大学海峡自然保护区研究中心,福州 350002)

0 引言

格氏栲(Castanopsis kawakamii)又名青钩栲、吊皮锥等,是分布于中亚热带地区南缘的第三纪孑遗植物。位于福建三明市的格氏栲森林公园是目前世界上绝无仅有的大面积、高纯度的格氏栲林[1]。格氏栲是国家二级保护植物,同时也是亚热带珍贵稀有树种之一,其树皮、果壳具有丰富的单宁素,可提取重要的工业原料——栲胶。栲果甘甜可食,富含淀粉,有“小板栗”之称。由于材质良好、全身是宝,这片天然栲材弥足珍贵,具有重要的研究意义和价值[2-3]。近年来,学者们对格氏栲的生物学特性、群落组成与结构、生态系统特征、遗传多样性、森林培育等方面进行了广泛研究,主要结果有:(1)格氏栲林群落主要种群相似性比例比热带森林种群高,种群间存在复杂的相互关系,对环境资源表现出一定程度的共享;(2)在福建三明格氏栲自然保护区中格氏栲群落符合随机分布,其物种多样性指数介于南亚热带季风常绿阔叶林和中亚热带常绿阔叶林之间[4];(3)从碳吸存的角度看,格氏栲是一个比杉木更加优良的人工林树种[5];(4)格氏栲林土壤微生物群落结构有较强的区域分异特征[6];(5)格氏栲林林窗的存在,增加林分的物种丰富度,为格氏栲林不同物种的共存提供了生态基础,即林窗是维持格氏栲林物种多样性的重要机制[7];(6)凋落物是影响格氏栲种子萌发及胚根生长的重要因素,主要通过阻碍种子与土壤接触而抑制萌发,影响格氏栲林更新[8-11]。

中国知网(CNKI)是中国最大的且不断更新的学术文献数据库,全面展示了中国各领域的研究状况,而Web of Science核心合集数据库是国外权威的数据库,全面展示了国外各领域的研究现状,结合国内外文献对格氏栲研究进行分析,可以更加全面地展示格氏栲研究领域当前的热点趋势和研究前沿。CiteSpace V软件针对学科发展过程中出现的关键节点,以及研究领域的主题热点,通过算法聚类分析绘制多种网络模型图谱,从而挖掘该研究领域发展的历程和探索该研究领域的前沿[12],其先进便捷的功能和清晰明了的分析结果在文献计量学中备受青睐。笔者利用文献计量学知识和CiteSpace V软件对格氏栲进行知识图谱分析,以166篇CNKI的格氏栲研究文献为样本,对整个格氏栲研究领域进行全面系统的分析,旨在探究研究热点及趋势,归纳研究主题,了解当前国内研究现状,并对年度发文数量、研究机构、发文作者、文献关键词进行网络模块分析。笔者通过知识图谱展现该研究领域的热点趋势、主题演进、研究概况,旨在为未来的格氏栲研究提供有益的参考及启示。

1 研究方法与数据来源

1.1 研究方法

CiteSpace是基于JAVA环境下的一个信息可视化分析程序,可以科学分析文献中包含的潜在知识。先采用文献计量学研究方法,对文献的年度发文量、基金分布、期刊来源、研究机构等信息进行统计分析,再结合CiteSpace(版本为5.6.R3)软件对所选取的166篇文献进行可视化分析,设置时间分区为1980—2019年,选择时间切片为1年,Top N(阈值)设为50,然后在Node Types中选取Author、Institution、Keyword作为分析聚类依据,绘制科学知识图谱,并通过关键词聚类和关键词突现检测来识别前沿领域和当前热门话题,通过时间线视图来描述关键词的发展进程和趋势[13-15]。

1.2 数据来源

以“格氏栲”为主题词,CNKI和Web of Science为数据库,选取检索时间为1980—2019年,检索CNKI和Web of Science核心合集数据库中关于格氏栲领域研究的相关文献。在CNKI数据库中共得到189条文献记录,为了保证结果的准确性,在格式转换后,对CNKI数据进行筛选,去除重复项、书评及会议相关文献,最终得到166条文献记录,将其导出为Refworks格式,保存并命名为download_gsk的形式,然后应用CiteSpace软件对文献进行格式转换,得到CNKI的文献数据。在Web of Science核心合集数据库中共搜索得到17条SCI文献记录,经过筛选后得到15条文献记录,结合CNKI数据库中得到的166条文献记录,构成初始数据源。

2 CNKI中格氏栲领域研究分布情况

2.1 发文量总体趋势分布

知识领域的年发文量是衡量科学研究发展的重要指标[16]。图1为1980—2019年格氏栲研究领域的年发文量趋势变化图。该领域发文量较多的年份为1999年(14篇)、2005年(12篇)、2012年(11篇)、2004年(10篇)。发文数量波动起伏较大,在1980—1999年整体呈波动上升趋势,并在1999年达到峰值,但2000年(6篇)同比下降了57.14%,2000—2005年文献发文量又呈现出上升趋势,而2005—2010年文献发文量则呈现逐年下降的趋势,之后近10年的年平均发文量为5.5篇,2012年达到最高11篇,而2016年则只有2篇。在发文数量看,对格氏栲的研究有减弱的趋势。

图1 1980—2019年度格氏栲研究发文量趋势变化

2.2 发文作者分布

发文作者指的是第一作者与其合作作者,研究领域内的核心作者和其他作者之间的协作关系及合作程度可通过发文作者共现图谱来体现。图谱中的节点表示发文作者,圆环大小代表该作者发文量,节点与节点之间的连线的粗细代表发文作者之间的合作强度[17]。格氏栲研究领域发文量的作者分布情况(表1)可以看出,发文量最多的是福建农林大学的刘金福(46篇),其次是福建农林大学的洪伟(45篇)、福建师范大学的杨玉盛(23篇)。在发文作者共现图谱(图2)中,包含232个节点、234条连线,网络密度为0.0087,各项数据反映出国内格氏栲研究团体较为集中,学者之间的合作也比较密切。其中可以看出有2个文献高产团队,一是洪伟、刘金福、何中声、郑世群团队,二是杨玉盛、陈光水、谢锦升、吴承祯、何宗明团队。笔者调查研究发现,同单位间的学者联系较为密切,导师及其学生构成了研究团队的核心部分,除这2个团队合作网,其他发文量高的学者均与自己的学生或其他学者建立了较为良好的合作关系。

表1 格氏栲研究领域发文量≥4的作者分布情况

图2 发文作者共现图谱

2.3 研究机构分布

研究机构共现图谱可以从中间层面揭示格氏栲研究的实力分布,通过发文作者所在的研究机构可以侧面剖析在格氏栲研究领域的核心机构情况。从格氏栲研究领域发文量的机构分布情况(表2)可以看出,发文量最多的机构是福建农林大学(72次),福建林学院是福建农林大学的前身,发文量达32次。其他发文量在10次及以上的机构有福建师范大学(25次)、福建三明格氏栲自然保护区(10次)。在研究机构共现图谱(图3)中,福建农林大学和福建师范大学是该研究领域的核心机构,以福建农林大学林学院和福建师范大学地理科学学院为核心,与其他的合作机构展开较为密切的合作,这2所学校各自校内机构间的合作也较为密切。

图3 研究机构共现图谱

表2 格氏栲研究领域发文量≥3的机构分布情况

2.4 期刊来源分布

学术期刊是学术传播的重要纽带与载体,可以体现格氏栲研究的发文质量。从格氏栲研究领域发文量的期刊分布情况(表3)可以看出,格氏栲研究领域的发文作者在《福建林学院学报》发表的篇数最多(18次),在《生态学报》发表的篇数次之(16次)。其中CNKI数据库中所选的166篇文献中包含博士论文3篇、硕士论文17篇、被北京大学《中文核心期刊总览》来源期刊收录84篇,占文献总数的62.65%,表明格氏栲研究领域的文献发表的质量相对较高。

表3 格氏栲研究领域发文量≥3的期刊分布情况

2.5 科研基金分布

科研基金在一定程度上推动着学科的发展。从格氏栲研究领域的基金分布情况(表4)可以看出,福建自然科学基金排名最高,篇幅达到50篇。其次是福建省教育厅科技项目基金(21篇)、高等学校优秀青年教师教学科研奖励计划(17篇)、国家自然科学基金(14篇)。说明国家十分重视该领域的研究,福建省相关部门也对格氏栲的研究给予了很大的支持,给研究者提供了良好的科研环境。

表4 格氏栲研究领域基金频次≥3的分布情况

2.6 文献被引量分析

研究领域的文献影响程度和贡献度可以通过文献被引量来体现。从国内格氏栲研究领域文献被引量排名前5的文献分布情况(表5)可以看出,文献被引用量前5名均被权威期刊《生态学报》收录,文献引用量最高的是福建农林大学的刘金福发表的《格氏栲群落生态学研究——格氏栲林主要种群生态位的研究》,被引次数高达270次,第2~5名都是由福建师范大学的杨玉盛所写的文章,累计被引用量高达718次,可见刘金福和杨玉盛2位作者对格氏栲研究做出的贡献度极大,也侧面反映出福建农林大学和福建师范大学在格氏栲研究领域的水平显著,具有较高的学术影响力。

表5 国内格氏栲研究领域文献被引用量排名前5的文献分布情况

3 CNKI中研究热点及趋势分析

3.1 关键词共现分析

关键词是文章中心内容的精简表达,它是对文章内容的高度概括[18-19]。研究领域的热点信息可以通过关键词共现图谱体现,分析各年份共现关键词数量的变化不仅可以判断研究领域扩展的丰富程度,还可以判断该领域内容的更新速度和学科研究活力[20]。通过研究领域高频关键词(表6)可以看出,出现关键词最多的是格氏栲(77次),其次是人工林(32次)、天然林(27次)、杉木(17次)、林窗(15次),说明这些关键词为格氏栲研究领域的主题。中心性是测度节点在网络中重要性的一个指标,CiteSpace中使用此指标来发现和衡量文献的重要性[21],其中心性较强(>0.1)的关键词有11个。关键词中心性排名前6的分别是格氏栲(0.38)、天然林(0.38)、土壤肥力(0.30)、物种多样性(0.26)、格氏栲林(0.24)、林窗(0.22)。在关键词共现图谱(图4)中,包含407个节点、687条连线,网络的密度为0.0083,每个节点代表不同关键词,关键词出现的频次和节点大小呈正比,关键词之间的共现程度较为显著。

图4 关键词共现图谱

表6 格氏栲研究领域频次≥4的关键词

3.2 关键词聚类分析

研究领域内的基本知识结构可通过关键词聚类图谱体现。通过CiteSpace V软件的对数似然算法对关键词进行聚类分析,根据陈超美等[17]的说明,Q值也叫做聚类模块值,是网络模块化评价指标,一般认为Q>0.3意味着划分出来的聚类结构是显著的。从关键词聚类图谱(图5)可以看出,Q值为0.8759,说明该聚类网络结构显著。关键词共现网络聚类后形成了10个具有代表性的模块,包括#0格氏栲、#1土壤肥力、#2福建三明、#3人工林、#4增温、#5空间异质性、#6碳密度、#7非线性化、#8格氏栲林、#9凋落物。图中以#标示的是代表性聚类词。在这10个聚类中,#0、#1、#2、#3、#4这5类包含的关键词的个数30个以上,构成了主要聚类,也是目前该领域的研究热点。#1土壤肥力和#6碳密度有较多板块面积重叠部分,表明有较强的文献共现关系。

图5 关键词聚类图谱

3.3 突现关键词分析

相对于传统的高频主题词分析,突现关键词更适合探测格氏栲研究领域的新兴趋势和突然变化。在分析突现关键词时,可利用突现词探测技术和算法,通过考察关键词词频时间分布,探测频次变化率高的关键词[23]。在格氏栲研究领域突现关键词图谱(图6)中,可以看到10个突现关键词,分别是自然保护区、空间格局、格氏栲、格氏栲林、人工林、杉木、林窗、格氏栲天然林、青钩栲、凋落物。20世纪80年代初,三明小湖自然保护区格氏栲天然林的起源和演替发展分析最先成为研究前沿。从突现词影响的周期来看,“自然保护区”突现性最高(10年),“空间格局”影响时间为9年,“格氏栲天然林”领域影响时间为8年,“杉木”的影响时间为5年,其突现强度最强,为4.1235。近期突现的关键词为“凋落物”,突现强度为3.4949,突现时间为3年。由此可以看出“杉木”、“林窗”、“凋落物”领域的研究可作为该领域的研究前沿。

图6 格氏栲研究领域突现关键词

3.4 关键词时间线图分析

关键词聚类时区线图分析,可以进一步分析格氏栲研究前沿随着时间变化的演进特征,从而发现该领域不同时期的研究热点。在关键词聚类时间线图(图7)中,每个节点都代表不同的关键词,其出现频次越高则显示的节点越大;连线表示不同关键词在同一篇文章中出现,同一聚类中的连线较紧密,不同聚类之间的关键词也有较多的连线。从图7可以看出,#1土壤肥力这一个聚集类的关键词较多,并且贯穿的时间线在这10个聚类集中最长,表明格氏栲的土壤肥力问题是该研究领域的核心问题,也是研究者密切关注的热点问题,大部分学者在研究格氏栲的时候会考虑到土壤肥力问题。而从最新出现的#9凋落物聚集类中可以看出,对格氏栲天然林凋落物的深入研究将成为新兴的热议话题。

图7 关键词聚类时间线图

4 Web of Science中格氏栲领域研究文献分析

在Web of Science核心合集数据库中,以“Castanopsis kawakamii”主题进行检索,检索时间同样为1980—2019年。通过检索得到17篇SCI文献。经过筛选后,得到与格氏栲主题相关的15篇文献。由于该数据库关于格氏栲的文献篇数较少,笔者采用文献计量学的方法以图谱的形式将关键信息列出。从Web of Science中格氏栲研究领域文献分析图谱(图8)分析,从发文量看,近2年对格氏栲的研究有增长的趋势;从发文作者看,发文量较高的作者是杨玉盛、陈光水、刘金福、何中声,发文篇数都是7篇,其团队合作作者与CNKI数据库中类似;从发文机构来看,福建农林大学和福建师范大学是主要发文机构,也侧面反映出这2所大学对格氏栲研究的重视;从关键词看,天然林、碳储量、土壤微生物、单一种植园出现的频次较高。综合来看,通过Web of Science数据库文献分析的结果与CNKI数据库分析的结果相似,也间接说明通过CiteSpace软件分析的准确性较高。

图8 Web of Science中格氏栲研究领域文献分析图谱

5 结论

通过对格氏栲领域研究热点及趋势分析发现,在格氏栲研究领域初期阶段,自然保护区、空间格局、格氏栲林等关键词曾经是该领域的热点词,之后热点转向杉木、林窗、凋落物等;土壤肥力(包括土壤呼吸、土壤微生物、土壤温度等方面)是该研究领域的核心,发表的文章中一直都有涉及,可见土壤肥力的重要性;格氏栲凋落物目前是该领域的研究前沿,其原因主要是格氏栲凋落物的浸提液会对格氏栲种子的发芽率和胚根生长产生影响。

通过对格氏栲研究领域的分布情况分析可以发现,CNKI数据库中格氏栲研究领域的年发文量起伏不定,伴有减弱的趋势,但在Web of Science核心合集数据库中,近2年发文量有增长的趋势;福建农林大学和福建师范大学在该领域具有较高的学术影响力,都具有国际水平的研究团队。从共现图谱中也可以看出,发文量高的学者集中在上述2个单位,但这2个单位之间的合作较少。建议加强各高校、研究院、大型企业跨区域之间的交流与合作,为格氏栲研究提供更多的研究思路与研究方法。

6 展望

随着科学技术的发展,无人机航测技术在格氏栲研究中得到广泛应用。学者可以从不同角度、研究方向探讨格氏栲林。当前格氏栲研究主要集中于格氏栲生态学特性[24]、格氏栲树木叶片碳氮磷化学计量[25]、格氏栲林土壤微生物多样性等方面[26],有关格氏栲林保护研究仍存在尚未解决的问题。如格氏栲种子萌发机理、繁育特征、生活史和遗传结构特征等方面的研究尚未全面展开;格氏栲天然林凋落物覆盖方式及厚度对格氏栲种子萌发及胚根生长的影响方面研究较少,没有对格氏栲更新能力进行深入分析等[27]。

未来格氏栲研究可能在以下方面有较大的发展潜力:(1)关于格氏栲凋落物研究,探讨林窗与非林窗凋落物综合效应对格氏栲种子散布与萌发的影响机制,研究林窗—凋落物—种子更新的反馈机制,为解除格氏栲种子更新障碍提供理论依据,更有效保护这一珍稀森林群落类型。(2)从格氏栲经济价值及其濒危现状出发,开展格氏栲快繁与高效栽培技术研究,旨在有效地保护其种质资源,复壮其种群,为福建省中亚热带珍贵阔叶树种的保护与恢复提供技术参考。(3)针对林窗微环境异质性如何影响群落内树种组成、格氏栲及其他物种的功能性状特征与林窗微环境因子是否存在耦合关系、决定群落演替的驱动力因子等问题进行研究,解决这些问题,有助于加深认识群落结构动态对林窗微环境的响应,揭示小尺度生物多样性动态分布格局与维持机制,明确格氏栲天然林演替方向。(4)基于无人机影像分析格氏栲天然林林窗数量特征、空间分布及其影响因素,建立统计模型对格氏栲种群进行判别和统计,对其分布区进行适宜性评价。

猜你喜欢
发文图谱聚类
绘一张成长图谱
10条具体举措! 山东发文做好返乡留乡农民工就地就近就业
基于DBSACN聚类算法的XML文档聚类
补肾强身片UPLC指纹图谱
基于高斯混合聚类的阵列干涉SAR三维成像
主动对接你思维的知识图谱
一种层次初始的聚类个数自适应的聚类方法研究
自适应确定K-means算法的聚类数:以遥感图像聚类为例
杂草图谱