王克平,洪安东,吴国栋
(海军研究院 天津 300061)
海洋测绘是测绘科学与技术的一个重要分支,是研究和解决在海洋环境下各种测绘理论、技术、方法、装备及相关问题的工作,包括海洋上的定位、海底控制网的建立、海面形状、海底地形测量、海洋重力测量以及海图编制等[1-2]。新中国成立70 多年来,我国海洋测绘事业由小到大,从弱到强,取得了辉煌成就,研究成果丰硕,积累了丰富的数据和文献资料[3-4]。随着现代科技的快速发展,我国海洋强国战略的持续推进,海洋测绘步入了一个崭新时代。本文力图在对现有海洋测绘文献资料计量分析的基础上,从一个新的角度,立体认识我国海洋测绘领域研究的全貌,关注海洋测绘领域的研究动态,分析其知识演进特征和属性,为后续研究提供有益的借鉴和参考。
科学知识图谱分析是一种建立在科学计量基础上,对文献资料进行挖掘分析的方法,以数学方法表达科学知识发展进程和结构关系,将抽象的计量信息形象化,以图谱方法进行可视化分析[5-7],既具有计量分析的科学性、客观性优势,同时具有图形展示方法的易于理解认知优势,该方法在文献挖掘领域得到广泛应用。具体的分析内容包括对作者、期刊、学科、关键词等要素的引文分析、共现关系分析、多维尺度分析、词频分析、聚类分析、社会网络分析等[6]。
Cite Space 是一款着眼于分析科学文献中蕴含的潜在知识,在科学计量学、数据和信息可视化背景下,逐渐发展起来的一款多元、分时、动态的知识图谱可视化分析软件[8]。自2005 年Cite Space 引入中国以来,科学知识图谱分析方法在科学学、医学、管理学等领域得到广泛应用[9-10],然而,对海洋测绘文献的知识图谱分析基本属于空白状态。鉴于此,本文以海洋和测绘为主题,检索获取中国知网(CNKI)数据库的相关文献,综合利用知识图谱分析方法进行科学文献分析,揭示国内海洋测绘领域的研究现状和未来发展趋势,厘清其发展脉络,填补海洋测绘研究的文献计量分析空白,以期为海洋测绘研究发展提供借鉴。
本研究以1990—2020 年中国知网数据库中的SCI 来源期刊、EI 来源期刊、中文核心期刊、CSSCI和CSCD 来源期刊为样本数据来源,以“海洋”和“测绘”作为主题,检索获得相关学术期刊文献资源共384 篇,通过人工筛选方式剔除期刊会议征稿、新闻报道、个人学术成果介绍、科研机构介绍、测绘词条解释以及无作者文献等条目后,最终获得256 篇有效的文献资源作为研究对象。
文献记录了科学发展的轨迹,在传播和促进科学发展中发挥着重要作用。文献的特征项描述包括内部和外部特征,如题名、作者、关键词、摘要、机构以及参考文献等。利用发展趋势分析方法研究海洋测绘的发文量,利用共现关系分析方法研究海洋测绘的文献关键词动态。
共现是指文献特征项描述的信息共同出现的现象,共现分析是对共现现象的定量研究,以揭示信息的内容关联和特征项隐含的知识。常见的共现类型包括文献耦合、文献同被引、作者同被引和共词等。该方法的前提假设是:词汇对在同一篇文献中出现的次数越多,则代表这两个主题的关系越紧密。由此,统计一组文献的主题词两两之间在同一篇文献出现的频率,形成共词网络,网络内节点之间的远近反映主题内容的亲疏关系。
本研究主要借助Cite Space 软件,绘制海洋测绘研究领域的知识图谱,通过文献资料可视化分析海洋测绘领域研究现状和热点。
通过分析海洋测绘领域论文数量的时间分布,有助于了解该领域的研究历史和现状,揭示海洋测绘在理论体系建设和研究发展方面的总体趋势。经统计分析,1990—2020 年海洋测绘发文情况见图1。
图1 1990—2020年海洋测绘领域发文量示意图Fig.1 Schematic diagram of amount of publications in field of marine surveying and charting from 1990 to 2020
对时间分布进行分析,发现海洋测绘领域的文献发表数量总体呈现上升趋势。在1990—2003 年间,年发文量整体平稳且有小幅波动,处于低位徘徊期。在2004—2011 年,经历了比较大的波动期,2012 年以后,海洋测绘研究的发文数量开始进入快速增长期。整体而言,尽管海洋测绘研究起步相对较晚,并经历了一个较大的波动期,但近年来由于我国海洋强国战略的持续推进,以及国民经济和国防建设对海洋测绘需求的增强,海洋测绘领域的发文量也快速增长。未来随着国家建设海洋强国和海上丝绸之路战略的持续推进,海洋测绘必将迎来更大的发展机遇。
关键词对文章内容发挥着标签的作用,能够充分体现出文章的核心内容和学术价值,因此对关键词进行分析,可以有效把握海洋测绘领域的研究动态和热点内容。
2.2.1 关键词聚类图谱
利用Cite Space 以关键词为节点进行可视化分析,可以得到关键词的共现图谱。Cite Space 提供了多种阈值设置方法,用来设定在各个时间窗内所提取的对象的数量,如g-index、Top N、Thresholds、Citations 等。
经过反复试验,这里采用g-index 方法。g-index是软件的知识单元提取方式,该算法是在增加规模因子k 的基础上,按照修正后的g 指数排名,抽取知识单元。g 指数计算公式如下:
式中:k(k Z+∈)为规模因子,k 值取20;ic 为文章被引用的次数。计算网络连接强度的常用方法有以下3 种:
式中:si为i 出现的频次;sj为j 出现的频次;cij为i和j 的共现次数。
当网络比较密集时,可以通过保留重要的连线,以提高网络的可读性,Cite Space 提供了2 种网络裁剪方法,分别是MST(minimum spanning tree)法和PFNET(pathfinder network)法。
本研究采用Cosion 算法,计算网络连接强度,采用PFNET 法对网络进行裁剪,最后得到的关键词共现图谱见图2。
图2 1990—2020年海洋测绘关键词共现图谱Fig.2 Co-occurrence atlas of key words in marine surveying and charting from 1990 to 2020
Cite Space 依据网络结构和聚类清晰度,提供了模块值Modularity 和平均轮廓值Mean Silhouette,作为评判图谱绘制效果的依据[11]。
Modularity 表示网络模块化指标,其值Q 越大表示网络的聚类结果越好,Q 值介于0~1 之间,通常Q >0.3 表示划分的聚类结构是显著的。
Mean Silhouette 是用来衡量网络同质性的指标,其值S 越接近1 反映网络同质性越高,通常S 值在0.5 以上,即可认为该聚类结果是合理的。
图中节点大小反映关键词出现的频次,节点间的连线表示共现关系,其粗细度表示共现强度,颜色对应节点第一次共现时间。图中有317 个节点475 条连线,网络密度为0.009 5,图中仅标记1.0%的节点。这里Q 值为0.811 8,S 值为0.643 6,表示聚类结果显著且合理。
通过关键词共现图谱显示,在1990—2020 年间,我国海洋测绘的研究热点主要围绕海岸带、重力测量、无人机测绘、信息化测绘、电子海图、数字海洋、数据融合、地理信息标准、技术体系及基准等方向展开。
2.2.2 演化路径分析
关键词时区图将海洋测绘研究的高频关键词投射到以时间为横坐标的图谱中,可以展示我国海洋测绘研究热点主题变化的时间序列,见图3。从图中可看出海洋测绘领域研究热点的演化和趋势:从左下角到右上角的高频词中,反映1990—2020 年间海洋测绘研究的基本演化路径,右上角的关键词代表该领域近期的研究热点。
图3 1990—2020年海洋测绘关键词时区示意图Fig.3 Schematic diagram of time zones for keywords in marine surveying and charting from 1990 to 2020
突现词解释了某一研究方向发生的重要变化,代表了本领域的研究趋势和新主题,弥补了时区图中难以表现频次低但突现性强的关键词的缺陷。因此本文进一步利用Cite Space 计算作突现分析,选取了前17 个突变词,按照突变开始时间排序,见图4。
图4 1990—2020年海洋测绘突现词分析结果示意图Fig.4 Schematic diagram of analysis results of emergent words in marine surveying and charting from 1990 to 2020
从时间划分来看,以2016 年为节点,在此之前,突变词出现较少,这一时期我国海洋测绘研究基础较为薄弱,理论研究体系尚不够完善。2016 年以后,突变词频繁出现,表明海洋测绘领域的研究主题开始逐渐丰富,关注度得到提升,实现了与国际前沿接轨,研究范围朝着多元方向发展,进入快速发展时期。关键词“海岸带”作为研究热词出现的跨度最长,在2006—2015 年间一直保持较高的使用频次,突变强度是1.64,且占文献比重为4.30%,这与海岸带独特的战略地位有关,海岸带处于海陆交互地带,作为第一海洋经济区,拥有丰富的自然资源。
时区图与突现词列表图共同表现了海洋测绘研究的演化路径。
2.3.1 作者分析
通过作者分析,能够识别出该领域的核心作者及其之间的合作关系。这里是对论文所有署名作者进行分析,结果显示:在1990—2020 年,海洋测绘领域发文数量最多的作者是翟国君,共发表文献24 篇;欧阳永忠、陆秀平、邓凯亮、黄谟涛、吴太旗等共计11 位作者发文数量在10 篇以上,具体见表1。
本研究采用Cosion 算法计算网络连接强度,PFNET 法进行网络裁剪,图谱中共有节点数298 个,连线为219 条,网络密集程度为0.004 9,Q 值为0.919 2,S 值为0,表示聚类结果不显著。海洋测绘研究作者合作图谱(局部)见图5。由于作者比较多,图中仅列出存在合作关系的作者合作群,图中连线表示作者之间存在合作关系。海洋测绘研究作者分布相对集中,表现出明显的团队合作特点,主要合作群是海军海洋测绘研究所团队、海军大连舰艇学院团队和国家海洋局团队。
2.3.2 发文机构分析
这里仅统计第一作者所在机构。统计机构发文信息显示,军队研究所和高校为主要发文机构,见表2。海军作为我国海洋基础测绘的主管部门,我国海洋测绘的开展最早是由海军来完成。通过表2 可知,海洋测绘研究发文的机构主要是海军海洋测绘研究所和海军大连舰艇学院,地方高校主要是山东科技大学、武汉大学以及上海海洋大学,皆为海洋测绘事业的发展做出了突出贡献。
表2 1990—2020年间海洋测绘研究高产机构Tab.2 Productive institutions of marine surveying and charting research from 1990 to 2020
2.3.3 发文期刊分布
按期刊名称分别统计了各期刊的载文数量,表3统计了1990—2020 年期刊的文献贡献分布情况,《海洋测绘》期刊的刊文数量最多为100 篇,贡献了该领域超过39%的文献,为我国海洋测绘事业的发展做出了突出贡献。
表3 1990—2020年间海洋测绘研究高产期刊Tab.3 Productive journals of marine surveying and charting research from 1990 to 2020
本文主要以1990—2020 年CNKI 核心中文文献为研究对象,对我国海洋测绘领域近30 年来的期刊文献资料进行文献统计可视化知识图谱分析。利用Cite Space 软件,绘制文献产出时间和发文量示意图,以及作者、机构、期刊、关键词时区图谱、关键词聚类图谱、关键词共现图谱等,并通过对各图谱的分析,揭示我国海洋测绘事业的发展过程,得出海洋测绘领域研究进展及研究热点。通过对1990—2020 年文献数量变化分析,发现近年来该领域的关注度随着时间的推移逐渐上升;通过对关键词分析,发现研究热点主要围绕海岸带、重力测量、无人机测绘、信息化测绘、电子海图、数字海洋、数据融合、地理信息标准、技术体系及基准等方向展开;通过对海洋测绘研究作者、机构及载文期刊分析发现,翟国君、欧阳永忠、陆秀平等作者是该领域主要核心作者,海军海洋测绘研究所、海军大连舰艇学院、山东科技大学等单位是主要研究机构;《海洋测绘》是该领域主要载文期刊,为我国海洋测绘事业的发展做出了突出贡献。
随着我国海洋强国战略的持续推进,以及现代科技的快速发展和海洋测绘理论、方法、技术、设备等的不断进步,海洋测绘必将在实现“中国梦”的进程中,受到更多关注、发挥更大的作用。