郭祥云 张京京 刘杰
摘要:采用文献计量和社会网络分析的方法,将1997—2016年划分为3个阶段(1997—2005年,2006—2012年,2013—2016年),以农业工程领域9个重要英文期刊和2个重要中文期刊数据为样本,分析并比较国内外农业工程领域研究进展及趋势演化。结果显示,1997—2005年,国内外研究关注重点均为精细农业,采用的主要技术有神经网络、图像分析和处理、地理信息系统、机器视觉、模型、仿真模拟、遥感等,其后2个阶段国外农业工程领域研究对农业工程技术的关注度逐渐下降,对研究领域的关注逐渐提升,国内研究对农业工程技术的关注较高且相对稳定;国外的研究领域更关注生物相关领域,如精油、抗氧化活性、木质素,国内研究集中在温室、冬小麦、水分利用效率、农业机械化、水稻、车辆、玉米、保护性耕作、土地整理和土地利用、土壤、灌溉、产量等领域;国内外农业工程研究中关键词网络集聚系数变化趋势相反,国内在农业工程研究领域的重点趋向集中和一致,以农业机械、土地利用和土壤为重点,而国外研究领域则趋向分散。
关键词:农业工程;发展趋势;国内外研究异同;文献计量;共词分析;社会网络分析;趋势演化
中图分类号: S-058 文獻标志码: A 文章编号:1002-1302(2019)12-0001-08
我国是个农业大国,农业发展是我国生产力提高的关键之一。农业工程是工程科技在农业领域内的应用,农业工程科技的研究将强力支撑农业生产力的发展。1978年全国第一次科学技术大会以后,农业工程作为一个丰富而较为完整的学科在中国诞生[1]。2017年2月5日,新世纪以来指导“三农”工作的第14份中央一号文件发布,指出我国农业的主要矛盾由总量不足转变为结构性矛盾,突出表现为阶段性供过于求和供给不足并存,矛盾的主要方面在供给侧,农产品供求结构失衡、要素配置不合理、资源环境压力大、农民收入持续增长乏力,如何解决增加产量与提升品质、成本攀升与价格低迷、库存高企与销售不畅、小生产与大市场、国内外价格倒挂的矛盾[2],农业内部结构和外部环境都发生了重大变化,农业工程学科面临着资源、环境、生态等各方面的压力[3]。
任何一门学科的研究方向和研究领域都将随着社会经济环境的变化和科学技术自身的发展而不断地得到更新与发展,是学科发展的必然规律[3]。农业工程学科要在我国农业现代化、乡村振兴建设中提供技术支撑,面临着专业改造的压力,密切关注国内外农业工程学科发展的主流方向和前沿方向,跟踪世界农业工程学科的最新发展,遵循农业工程学科自身发展的内在规律[3],准确把握与判断农业工程学科发展方向,对加快我国农业科技创新进程与促进农业现代化发展具有重要意义[4]。
针对农业工程领域的热点研究方向,师丽娟等应用科学计量的方法研究了1957—2014年我国农业工程学科的研究热点,总结了不同阶段研究热点的组成与基本特征,探讨了研究发展总体趋势[4],同时以工业革命为主线,从定性分析的角度总结了欧美农业工程学科发展与研究规律[5]。贾文吉等对农业工程类SCI和中文核心刊源2016年的文献进行了分析,主要包括期刊载文量、关键词共现、不同国家发文量等[6]。叶春蕾等采用文献计量和主题模型的方法从载文量、研究作者、研究机构等角度分析了国内近10年植物和畜牧-动物医学领域农业科学技术的态势[7]。丁恩俊等采用文献计量的方法研究了国内外农业信息化领域的研究态势,认为中国应该加强国际合作,推进农业信息化领域实践的发展[8]。以上研究基于文献计量方法从不同角度分析了不同农业领域研究机构、作者、期刊情况、研究热点等,为本研究提供了开阔的思路,本研究在前人研究的基础上,融入社会网络分析方法,以期发现中外农业工程学科研究发展趋势及国内外研究的异同。
1 数据获取与方法选择
1.1 数据获取
本研究数据获取以Web of Science (WoS)核心数据库为准,选择在WoS中归类为Agricultural Engineering并且影响较为广泛的期刊,最终选择的期刊为Transactions of the ASABE,Applied Engineering in Agriculture,Biosystems Engineering,Computers and Electronics in Agriculture,International Journal of Agricultural and Biological Engineering,Precision Agriculture,Industrial Crops and Products,Journal of Irrigation and Drainage Engineering ASCE,Aquacultural Engineering,检索日期为2017年10月5日,文献类型为Article,语种为English,时间为1997—2016年,查询到文章 16 025篇,经过数据去重,最终获得文献记录15 525条。为进一步了解与国内农业工程研究的异同,本研究选取国内农业工程领域的领军期刊《农业工程学报》、《农业机械学报》[4,9]作为数据源进行对比分析。
1.2 分析方法
1.2.1 共词分析法 关键词作为期刊论文核心内容的浓缩与提炼,是表达文献研究主题概念的自然语言词汇,一定程度上能够代表文献的研究主题,如果某一关键词在其所在领域文献中多次出现,则可说明该关键词或主题词所表征的研究主题是该领域的研究热点[10]。关键词出现在同一文献中的现象称为关键词共现,以关键词在同一文献出现的频率为基础进行聚类分析,常被用于探索潜在主题和学科间的发展联系及学术趋势演化[11-12]。因此,本研究选择关键词进行共现分析,同时结合“共词可视化”技术直观展示农业工程研究的结构[13-15]。
1.2.2 社会网络分析 社会网络分析源自复杂网络,是一种综合图论和数学模型的定量分析法,主要针对网络成员间的社会关系进行量化分析。目前社会网络分析软件较多,如UCinet、Pajek、NetMiner和StCNET等,本研究借助BICOMB2软件生成关键词共现矩阵,使用Pajek辅助分析矩阵数据,构建关键词间的特征关系网络,依据链接网络结构的统计特性,分析归纳出农业工程研究领域的主题演化过程和结构变化规律,并通过Pajek强大的可视化功能将网络及分析结果展示出来[16]。网络结构特性可以从中心性、聚集度系数和网络平均度刻画描述[17-19]。本研究更关心各节点距离中心的程度,故选用接近中心度(closeness centrality)描述节点中心性,在构建的无向连通图中,节点vi到节点vj的距离为dij,则接近中心度计算公式如公式(1)所示:
2 研究结果
2.1 基本统计
2.1.1 外文论文数量统计 分析发现,文献由103个国家和区域的33 501位学者完成,其中论文量前10位的国家年度发文量如图1所示,前10位国家发文量占总发文量的79.77%,统计结果是全球大部分论文来自少数几个高产国家。
从总体来看,9种期刊合计发文量在20年中呈现上升态势,其中2006年和2013年增长迅速,经查询WOS数据库发现,2006年是由于Transactions of the ASABE和Precision Agriculture的加入;2013年是由于International Journal of Agricultural and Biological Engineering新进入Web of Science核心数据集,而Journal of Irrigation and Drainage Engineering ASCE退出Web of Science核心数据集,造成2013年和2014年总体发文量起伏较大,2013年,美国、中国、印度、巴西、西班牙发文量有明显增长,呈现小高峰。除中国外,2014年各国发文量均有下降。美国论文数量稳中有升,20年中发文量稳居第一,但是目前基本处于稳定状态。印度发文量平稳前行,2013年发文量突增,随后又开始下降,但是发文量比2013年之前有所增加。中国发文量从2008年开始持续增加,2013年迅猛增加,增长速度明显高于其他国家。为了分析不同阶段农业工程学科的研究热点,本研究采用Dehdarirad等的方法[20],根据年发文量的变化,将农业工程领域的研究划分为3个阶段:1997—2005年发文量稳定增长,稍有波动;2006—2012年发文量迅速增加随后稳步增长;2013—2016年发文量波动剧烈。
2.1.2 关键词统计 关键词是文献研究内容特征的高度概括和总结,通过文献中关键词共现可以较为有效地获取该领域的研究热点[21]。为比较不同阶段农业工程研究领域的变化,同时避免不同阶段因样本量不同而引起的误差,从每个阶段的文章中选取被引频次最高的1 000篇文献作为样本进行分析,采用软件BICOMB 2提取关键词,并对其进行数据清洗,通过人工判读手动修改关键词列表,将大小写、单复数、同义词、缩写等具有相同含义的词汇进行合并处理以保持检索词汇一致性,通过BICOMB 2软件进行词频汇总统计并排序。
经过分析发现,在外文文献中,1997—2005年共出现 2 442 个关键词,词频≥2的共有530个,占21.88%;2006—2012年共出现3 062个关键词,词频≥2的共有517个,占16.88%;2013—2016年共出现3 355个关键词,词频≥2的共有615个,占18.33%。中文文献中,1997—2005年共出现关键词2 542个,其中词频≥2的共有506个,占19.91%;2006—2012年共出现關键词3 124个,词频≥2的有647个,20.71%;2013—2016年共出现关键词2 969个,词频≥2的共有668个,占22.50%(表1)。由此可以看出,中外文献中,词频≥2的关键词数量约占关键词总数量的20%左右。
表2显示了不同阶段中外文献前20位的高频关键词,高频关键词可以粗略分为2类,一类为技术方法,一类为研究领域。从3个阶段的高频关键词可以看出,在1997—2005年间,精准农业是主要的发展方向。中外文献研究都非常关注精准农业的信息技术、方法,如neural networks(神经网络)、image analysis and processing(图像分析和处理)、geographic information systems (GIS)(地理信息系统)、machine vision(机器视觉)、modelling(模型)和simulation(模拟)等,此时国外文献关注的remote sensing(遥感)、sensors(传感器)在国内文献中并未大量出现。国外文献研究领域多集中在aquaculture(水产)、lignin(木质素)、evapotranspiration(蒸散发)、mechanical properties(机械属性)、nitrification(硝化作用)、water quality(水质)、vegetable oils(植物油)、cellulose(纤维素)、wheat straw(小麦秸秆)、particleboards(木屑板)、ammonia(氨);国内文献的研究领域多集中在温室、冬小麦、水分利用效率、农业机械化、水稻、车辆、玉米、保护性耕作、土地整理、无损检测。在国外文献的高频词汇中,技术类高频关键词共8个,占总词频的4.52%,领域类高频关键词12个,占总词频的4.52%(表2),累积词频9.04%,中文文献中技术类高频关键词共8个,占总词频的4.59%,领域类高频关键词共12个,占比4.89%,累积词频10.00%。
2006—2012年间,精细农业仍旧是农业的发展方向。国外文献技术类高频关键词有remote sensing(遥感)、image analysis and processing(图像分析与处理)、neural networks(神经网络)、SWAT(水文分析模型)、modelling(模型)、NIRS(近红外光谱仪)、principal component analysis(主成分分析)、hyperspectral imaging(高光谱成像)、machine vision(机器视觉),与前一阶段相比增加了SWAT(水文分析模型)、NIRS(近红外光谱仪)、principal component analysis(主成分分析)和hyperspectral imaging(高光谱成像);中文文献中技术类除了1997—2005年出现的技术外,新增加了遥感和无线传感网络。国外领域类的高频关键词有essential oil(精油)、water quality(水质)、lignin(木质素)、biomass(生物量)、antioxidant activities(抗氧化活性)、evapotranspiration(蒸散发)、chemical composition(化学组成)、mechanical properties(机械属性)、biodiesel(生物柴油)、watershed(流域)。除了水质、木质素、机械属性持续被关注外,其他研究领域都发生了变化,其中对essential oil(精油)的研究最为热点。中文文献研究领域主要集中在土壤、灌溉、产量、温室、温度、作物、农业机械、玉米。国外文献技术类关键词共9个,占总词频的4.01%,领域类关键词共11个,占总词频的5.08%,累积词频9.09%;中文文献中技术类高频关键词共10个,占总词频的5.87%,领域类高频关键词共10个,占总词频的5.39%,累积词频11.26%。
2013—2016年,国外文献技术类的高频关键词有response surface methodology(响应面法)、optimization(优化)和pretreatment(预处理);领域类的高频关键词有essential oil(精油)、antioxidant activity(抗氧化活性)、antioxidant(抗氧化剂)、phenolic compounds(酚类化合物)、mechanical properties(机械属性)、lignin(木质素)、extraction(提取)、biodiesel(生物柴油)、enzymatic hydrolysis(酶水解)、chemical composition(化学组成)、flavonoids(黄酮类)、antimicrobial activity(抗微生物活性)、biomass(生物量)、antibacterial activity(抗菌活性)、polyphenols(多酚类)、sugarcane bagasse(蔗渣)、ethanol(乙醇)。中文文献技术类高频关键词有模型、试验、遥感、优化、设计、图像处理、机器视觉、主成分分析、数值模拟,领域类高频关键词有土地利用、土壤、农业机械、作物、灌溉、产量、秸秆、农村地区、水分、温度、温室。国外文献中技术类高频关键词共3个,占总词频的1.25%,领域类高频关键词共17个,占总词频的8.44%,累积词频9.68%;中文文献中技术类高频关键词共8个,占总词频的5.68%,领域类高频关键词共12个,占总词频的9.71%,累积词频15.39%。
从高频关键词可以看出,3个阶段中,国外文献对技术的关注逐渐下降,对研究领域的关注逐渐提升,2006—2012年则为承前启后的阶段,既有对具体方法的关注,也有对具体研究领域的关注;中文文献中对技术的关注相对稳定。国外的研究更关注生物相关领域研究,如精油、抗氧化活性、木质素等,而国内研究集中在温室、冬小麦、水分利用效率、农业机械化、水稻、车辆、玉米、保护性耕作、土地整理和土地利用、土壤、灌溉、产量等领域。前20位高频关键词的累积频次百分比一般占总词频的10%左右,国外文文献高频关键词的累积频次略低于国内。
2.2 基于网络中心性的比较
为了保证网络结构的清晰,本研究选取词频≥9的关键词,根据公式(1)计算各个阶段关键词的中心性,借鉴文献[22]的方法将节点根据中心性大小划分为核心节点、半边缘节点和边缘节点。图2、图3、图4显示了3个阶段的关键词中心性层次分布网络,其中核心节点用灰色圆表示,半边缘节点用黑色圆表示,边缘节点用白色圆表示。
第1阶段(1997—2005年),外文文献中词频≥9的关键词共34个,其中核心节点15个,占比44.12%,半边缘节点16个,占比47.06%,边缘节点3个,占比8.82%。中文文献中词频≥9的关键词共39个,其中核心节点有14个,占比 35.90%,半边缘节点17个,占比43.59%,边缘节点8个,占比20.51%。
第2阶段(2006—2012年),外文文獻中词频≥9的关键词33个,其中核心节点11个,占比33.33%,半边缘节点19个,占比57.58%,边缘节点3个,占比9.09%。中文文献中词频≥9的关键词共57个,其中核心节点6个,占比10.53%,半边缘节点24个,占比42.11%,边缘节点27个,占比47.37%。
第3阶段(2013—2016年),外文文献词频≥9的关键词共36个,其中核心节点21个,占比58.33%,半边缘节点11个,占比30.56%,边缘节点4个,占比11.11%。中文文献中词频≥9的关键词共82个,其中核心节点有2个,占比2.44%,半边缘节点40个,占比48.78%,边缘节点40个,占比48.78%。
从表3可以看出,外文文献词频≥9的关键词数量相对稳定,各类节点的变化没有明显的趋势。中文文献词频≥9的关键词数量不断上升,核心节点数量及占比呈现明显的下降趋势,边缘节点数量及占比则呈现不断上升的趋势,半边缘节点数量有所上升,但是占比相对稳定。外文文献中边缘节点数量及占比明显少于中文文献的边缘节点。
图2、图3、图4展现了中外文献3个阶段关键词中心性层次分布网络,网络图中节点的大小表示节点在网络中中心性的大小,节点越大表明在网络中的中心度越高,线条的粗细表示两关键词共现次数,线条越粗表明节点间关系越强[23-24]。接近度这一指标主要用来描述网络中的节点通过网络到达其他节点的难易程度,也是节点中心性的标准测度之一,反映了节点通过网络对其他节点的一种间接影响力[25]。
第1阶段(1997—2005年),如图2-a所示外文文献中核心节点有re-circulating aquaculture systems(可循环水产养殖系统)、sensors(传感器)、geographic information systems(地理信息系统)、modelling(模型)、nitrification(硝化作用)、cellulose(纤维素)、ammonia(氨)、biofilter(生物过滤器)、aquaculture(水产养殖)、remote sensing(遥感)、image analysis and processing(图像分析与处理)、neural networks(神经网络)、precision agriculture(精细农业)、classification(分类)、nitrogen(氮)。共现次数较多的核心节点为biofilter(生物过滤器)和nitrification(硝化作用),precision agriculture(精细农业)和sensors(传感器),precision agriculture(精细农业)和geographic information systems(地理信息系统),neural networks(神经网络)和classfication(分类),neural networks(神经网络)和image analysis and processing(图像分析与处理)。中文文献中核心节点有农业机械化、数学模型、精准农业、仿真、机器视觉、农业机械、图像处理、计算机视觉、神经网络、土壤、温室、分级、模型(图2-b)。图像处理和计算机视觉共现系数
较高,其次是计算机视觉和分级、神经网络和图像处理、神经网络和模型。精准农业、神经网络、模型、图像处理在中外文献中同为核心节点,表明在农业工程领域的热点研究方向是精准农业,关键技术神经网络、模型、图像处理。
第2阶段(2006—2012年),如图3-a所示,外文文献核心节点有modelling(模型)、water quality(水质)、biomass(生物量)、neural networks(神经网络)、image analysis and processing(圖像分析与处理)、remote sensing(遥感)、machine vision(机器视觉)、precision agriculture(精细农业)、physical properties(物理属性)、computer vision(计算机视觉)、aquaculture(水产养殖)。共现次数较多的是computer vision(计算机视觉)和aquaculture(水产养殖),computer vision(计算机视觉)和precision agriculture(精细农业),water quality(水质)和modelling(模型)。中文文献核心节点有产量、土壤、优化、作物、模型、试验,共现频次较高的有模型和优化、模型和作物、模型和土壤、土壤和产量(图3-b)。此阶段中外文献共同的核心节点只有模型,可见模型在农业工程类研究的重要性,同时也说明了中外研究内容差别较第1阶段更加显著。
4 结论与讨论
外文文献来自103个国家和区域33 501位学者完成,其中论文量前10位的国家年度发文量,前10位国家发文量占总发文量的79.77%。统计结果是全球大部分论文来自美国、西班牙、加拿大、意大利、德国、中国、印度、巴西、法国、伊朗等少数几个高产国家。
根据外文文献发文量特点,将1997—2016年划分为3个阶段,即1997—2005年,2006—2012年,2013—2016年,各阶段国内外词频≥2的关键词占关键词总量的20%左右。前20位高频关键词中国外文献对技术的关注度逐渐下降,对研究领域的关注逐渐提升;中文文献中对技术的关注相对稳定。国外的研究领域更关注生物相关领域研究,如精油、抗氧化活性、木质素等,这与文献[3-4,6]的研究结果相同。而国内研究集中在温室、冬小麦、水分利用效率、农业机械化、水稻、车辆、玉米、保护性耕作、土地整理和土地利用、土壤、灌溉、产量等领域。前20位高频关键词的累积频次百分比一般占总词频的10%左右,国外文文献高频关键词的累积频次略低于国内。
采用社会网络分析方法对3个阶段词频≥9的关键词进行可视化,划分出核心节点、半边缘节点和边缘节点,外文文献词频≥9的关键词数量相对稳定,各类节点的变化没有明显的趋势。中文文献词频≥9的关键词数量不断上升,核心节点数量及占比呈现明显的下降趋势,边缘节点数量及占比则呈现不断上升的趋势,半边缘节点数量有所上升,但是占比相对稳定。外文文献中边缘节点数量及占比明显少于中文文献的边缘节点。根据对网络结构特性的分析显示国内在农业工程研究领域的重点趋向集中和一致。
本研究在分析外文文献分析时,未剔除中国作者的研究成果,为了更精准地比较中外研究,后续研究可以考虑将外文文献中中国专家的文献排除。
参考文献:
[1]齐 飞,朱 明,周新群,等. 农业工程与中国农业现代化相互关系分析[J]. 农业工程学报,2015,31(1):1-10.
[2]中共中央、国务院关于深入推进农业供给侧结构性改革加快培育农业农村发展新动能的若干意见[Z]. 2016-12-31.
[3]赵文波,应义斌. 综合性大学农业工程学科发展的机遇与挑战[J]. 农业工程学报,2003,19(1):11-15.
[4]师丽娟,杨敏丽. 基于科学计量的中国农业工程研究热点探析[J]. 农业工程学报,2016,32(增刊2):430-438.
[5]师丽娟,杨敏丽. 欧美发达国家农业工程学科发展规律与趋势[J]. 中国农机化学报,2014,35(2):330-336.
[6]贾文吉,王宝济,师丽娟. 2016年农业工程学科学术论文统计分析[J]. 中国农业文摘-农业工程,2017(2):6-8.
[7]叶春蕾,宁 璐. 基于文献计量和主题模型的近十年中国现代农业科学技术研究态势分析[J]. 农业图书情报学刊,2016,28(10):77-82.
[8]丁恩俊,谢 佳,申丽娟,等. 基于文献计量的国内外农业信息化研究态势分析[J]. 西南大学学报(自然科学版),2017,39(8):116-125.
[9]刘丽英,魏秀菊,王 柳,等. 2003—2012年中国优秀科技论文外流状况定量分析——以农业工程领域论文为例[J]. 中国科技期刊研究,2014,25(4):478-484.
[10]尹相旭,张更平,李晓菲. 基于关键词统计的情报学研究现状分析[J]. 情报杂志,2009,28(11):38-41.
[11]Bonchi F,Castillo C,Gionis A,et al. Social network analysis and mining for business applications[J]. ACM Transactions on Intelligent Systems and Technology,2011,2(3):1-37.
[12]Callon M,Law J,Rip A. Mapping the dynamics of science and technology:sociology of science in the real world[M]. London:the Macmillan Press,1986:89-106.
[13]张 勤,马费成. 国外知识管理研究范式——以共词分析为方法[J]. 管理科学学报,2007,12(6):65-75.
[14]钟 镇. 知识图谱分析方法的可靠性检验研究——以共词分析为例[J]. 科學学研究,2015,33(5):647-653.
[15]周静怡,孙 坦,陈 涛. 共词可视化:以人类基因组领域为例[J]. 情报学报,2007,26(4):532-537.
[16]孟 微,庞景安. Pajek在情报学合著网络可视化研究中的应用[J]. 情报理论与实践,2008,31(4):573-575.
[17]王宗水,赵 红,刘 宇,等. 社会网络研究范式的演化、发展与应用——基于1998—2014年中国社会科学引文数据分析[J]. 情报学报,2015,34(12):1235-1245.
[18]孙玺菁,司守奎. 复杂网络算法与应用[M]. 北京:国防工业出版社,2015:32-63.
[19]De Nooy W. Exploratory social network analysis with Pajek:attributes and relations[M]//Exploratory social network analysis with Pajek. Oxford City:Cambridge University Press,2011:605-608.
[20]Dehdarirad T,Vjllarroya A,Barrios M. Research trends in gender differences in higher education and science:a co-word analysis[J]. Scientometrics,2014,101(1):273-290.
[21]李 贺,袁翠敏,李亚峰. 基于文献计量的大数据研究综述[J]. 情报科学,2014,32(6):148-155.
[22]Ronda-Pupo A G,Guerras-Martin L A. Dynamics of the evolution of the strategy concept 1962—2008:a co-word analysis[J]. Strategic Management Journal,2012,33(2):162-168.
[23]刘海燕,王宗水,汪寿阳. 我国系统科学与工程研究的演化与发展[J]. 系统工程学报,2017,32(3):289-304,345.
[24]杨海华,彭 洁,赵 辉. 国家自然科学基金对纳米材料的资助领域分析——基于共词网络法[J]. 科技管理研究,2012,32(1):23-26.
[25]谢丽斌,董 颖,吴德志. 基于Pajek的科研领域合作关系网络特征分析[J]. 图书馆,2016(7):62-65.杜保国,王金玲,毛艳萍,等. 桤木抗旱性及其混交效应研究现状及展望[J]. 江苏农业科学,2019,47(12):9-12.