王圣洁,周立君,孙萍
中国地质调查局青岛海洋地质研究所,青岛 266237
与陆地地质相比,中国的海洋地质仍然是一门年轻的学科。杨子赓[1]在其主编的《海洋地质学》一书中指出:20世纪70年代,我国开始实施的一系列大型海洋调查计划,是海洋地质学从初创到发展的基础。到了80年代,我国海洋地质事业进入了一个蓬勃发展时期,其特点是:① 实施了一系列重大国家项目,海洋地质基础学科研究有所加强;②国际合作项目增加,涉及海洋地质学众多分支领域,进一步拓宽了我国海洋地质学的发展领域;③全面总结了20世纪50年代初创时期以来的海洋地质调查成果,形成了具有中国特色的海洋地质学方向;④ 海洋油气勘探全面突破,进入开发阶段。
萧汉强等[2]主编《新中国海洋地质工作大事记》一书,系统记录了1949—1999年海洋地质工作中出现的重大事件,为学科研究提供了宝贵的史实资料。该书对于中国的海洋地质工作,大致划分为创业、发展和深入提高3个阶段:第1阶段是建国初期至1978年,海洋地质科技工作者充分发挥聪明才智,白手起家,从无到有,逐步开辟出一片海洋地质工作的新天地;第2阶段自1978年至20世纪80年代末期,其背景是深化改革、扩大开放,促使海洋地质调查和海上油气勘探步伐大为加快,位于东海陆架的“平湖一井”钻获高产油气流,首次突破东海出油关;第3阶段自1989年至1999年,科技兴海、国际合作是这一时期海洋地质工作的鲜明特色,区域地质调查与编图、大陆架及邻近海域勘查、大洋多金属结核勘查和极地地质科学考察都取得了新的进展,使中国的海洋地质工作进入了一个更高的阶段。
上述两本著作对于20世纪下半叶的中国海洋地质进行了很好的总结,前者侧重于学科的发展,后者则是记录了海洋地质工作中的主要事件。虽然二者观察的角度有所不同,但对于中国海洋地质的起步与发展阶段却有着共同的认识:即在新中国成立的最初30年里,海洋地质经历了初创和缓慢的积累过程,直到20世纪70年代末期,中国海洋地质才开始快速进步,此后经过20年的时间,中国的海洋地质学终于成长为一门独立的学科。
王圣洁等[3]应用信息计量学方法,对中国海洋地质学的发展历程做了多方面研究。一是通过抽样统计,分析了21世纪最初10年中国海洋地质学的研究内容及学科分布,将杨子赓、萧汉强等所做总结的时间轴延伸到21世纪。二是将统计时段再次扩大,建立了长达35年海洋地质文献增长和资料增长的数学模型,发现了中国海洋地质调查研究从线性增长到指数增长之间的拐点,分别在1997年和1999年,与海洋地质相关的文献增长和资料增长发生了显著变化[4]。三是采用“大数据”和“知识体系”的概念与方法,提出了中国海洋地质知识体系“实体模型”,并对其规模进行了初步估计[5]。
21世纪的第2个10年,对于年轻的中国海洋地质学来说,又经历了一个关键发展时期[6]。一是大洋钻探(IODP)在世纪之交开启了南海之旅[7],特别是“南海深部过程演变”重大研究计划,推动实施了三次半的大洋钻探航次,使南海进入国际深海研究前列,在深海盆洋陆相互作用、边缘海盆地的板缘张裂和气候演变的低纬驱动等3方面取得了突破性进展[8]。二是首次完成1∶100万海洋区域地质调查全覆盖,形成了基于实测数据的“一图一库一报告”等实际调查成果,发现了中国东部海域“陆源条带状”和南海“多源环带状”沉积分异特点,取得“东亚洋陆汇聚带多圈层作用”和南海“弧后扩张与左旋剪切”等理论认识[9-12]。三是中国地质调查局于2017年和2020年先后2次在南海北部陆坡成功实施天然气水合物试采,标志着中国海洋地质在天然气水合物赋存状态及其资源勘查、评价、试采等方面取得长足进步[13-17],并进入世界先进行列。
综上所述,中国海洋地质学既是一门年轻学科,过去40年又经历了一段快速发展时期,在取得巨大进步的同时,人们不禁要问:这个学科快速发展的势头是否仍会延续?以往关于发展阶段的划分是否存在局限性?当前中国海洋地质学科又是一个怎样的面貌?如果要回答这些问题,需要对中国的海洋地质开展一次整体的研究,以更新对其发展历程的认识,获得学科成长的内在规律。本文结合海洋地质工作的既有经验,并应用现代信息计量学和科学图谱的模型与方法[18-19],对过去40年学科发展过程进行追踪,寻找和挖掘海洋地质研究热点及最新前沿之间的关系,以理清中国海洋地质学过去的发展脉络,展望当下与未来的走向与前景。
据统计,80%以上的科研成果是采取期刊论文的形式发布并传播的。期刊论文记录了科学的发展,因此成为学科研究的最佳素材。对于研究中国的海洋地质来说,《海洋地质与第四纪地质》是一个良好的载体。汪品先院士曾于2011年撰文指出:《海洋地质与第四纪地质》创刊于1981年9月,是我国改革开放初期的产物。虽然在严格意义上讲还不能说是改革开放的同龄人,而刊物30年来的发展,却正是改革开放以来迅猛发展的缩影。30卷的《海洋地质与第四纪地质》,就像年轮一样,记录了中国海洋地质30年的成长史[20]。如今10年过去,《海洋地质与第四纪地质》迎来创刊40周年,作为中国海洋地质领域载文最多的学术期刊[21],在时间线上又与中国海洋地质学的快速发展阶段完全同步。因此,选择这本期刊所载论文作为学科研究的文献来源,可以通过观察这个宝贵的“年轮”,去还原和分析中国海洋地质学的成长过程。
1.1.1 文献检索与数据采集
使用中国知网“中国期刊全文数据库(CNKI)”进行检索,检索范围为1981—2020年,检索条件分别采用“文献来源=海洋地质研究”和“文献来源=海洋地质与第四纪地质”对该刊曾用名和现刊名进行检索,两次检索结果合并后共获得全部记录3 896条。
对检索记录进行数据清洗,删除“简讯”“书评”“新闻报道”等非论文条目862条,保留“研究论文(Articles)”“综述与评述(Reviews)”等A/R论文3 034篇。逐篇论文采集详细信息,包括“题名”“作者”“单位”“摘要”“关键词”“资助项目”“分类号”“发表时间”“被引情况”等内容,形成用于分析的数据集合。
1.1.2 关键词处理及规范化
关键词分析是信息计量学中最主要的内容分析方法,这一分析基于以下假设:① 作者都是很认真地在其论文中选择使用专业术语;② 作者使用的关键词是能够反映论文内容,是值得信赖的指标[22]。但在实际的论文写作时,往往并不总能满足上述假设。对于长达40年的学术期刊,出版标准的变化以及学科发展过程中专业术语的更迭都会导致关键词使用不够一致,进而影响关键词分析的准确性。因此,在关键词分析前对其进行处理十分必要。
一是关键词补充标引。《海洋地质与第四纪地质》1981—1990年共有36期没有标引关键词,需要参考题名、摘要及论文内容重新选择适当的主题词进行补充标引,累积更新论文信息389篇。
二是对关键词分2次进行规范化处理,以简化关键词分析的复杂性。在所有3 034篇A/R论文中,共出现关键词13 053个,去掉重复后仍有独立关键词6 527个,数量巨大。首先对同义词和近义词进行合并,如“Mg/Ca比”“Mg/Ca比值”统一为“Mg/Ca”,“岸滩侵蚀”“岸滩沉积”“岸滩演变”合并为“岸滩”,“搬运动力”“搬运机制”“搬运作用”合并为“搬运”;另外,对个别误用的关键词进行了更正,如“古地磁飘移”修改为“古地磁漂移”,“南极普利兹湾”统一为“南极普里兹湾”。经过第1次规范化处理后,关键词数量降至3 744个。
第2次规范化处理是对关键词进一步分类归纳,并合并为4大主题39类(表1)。第1个主题是“研究区域”,按照《海洋地质与第四纪地质》期刊论文的特点细分为“中国海域及邻区”“渤、黄、东海”“渤海”“黄海”“东海”“南海”“中国沿海”“太平洋及邻近海域”“印度洋及邻近海域”“大西洋及邻近海域”“两极地区”“陆域第四纪等地质研究”“其他区域”。第2个主题是“地质年代”,划分为“人类活动与短期变化”“全新世”“第四纪”“新生代”“中—古生代”“前古生代”。第3个主题是“调查研究方法”,划分为“地球物理探测与处理”“海底观测与地质取样”“海洋遥感与动态监测”“地球化学与生物地质”“实验分析及测年”“数据处理及信息技术”“重大计划”“其他方法”。第4个主题是“学科领域”,参考杨子赓主编的《海洋地质学》一书进行划分,主要包括“地形地貌”“构造地质”“近海盆地等油气地质”“域外油气地质”“天然气水合物等新能源地质”“沉积与环境及层序地层”“海岸带、三角洲及海平面变化”“固体矿产”“地质灾害”“古海洋学”。通过对关键词进行主题分类,可以有效地对热点区域和研究前沿进行统计分析。
表1 主题分类及关键词个数Table 1 Subjects and numbers of different key words
1.2.1 关键词词频及时序变化
词频(word frequency)是指词汇在文章中出现的次数。早在20世纪40年代,美国学者齐普夫(George K. Zipf)[18]就提出了“词频分布定律”:在一个包含n个词汇的文章中,将这些词汇按其出现的频次从高到低排序,那么序号r和其出现频次f之积f×r,将近似地为一个常数,即f×r=c,(式中r=1,2,3,…,n)。“词频分布定律”描述了这样一个事实:文章中的词汇并非平均分布!由于作者往往倾向于经常使用某些词汇,导致这些词汇使用率很高,而其他多数词汇则使用次数较少。“词频分布定律”揭示的语言现象对信息计量产生深刻影响,特别是在自动标引和文献检索领域,如何选择合适词频的词汇,才能兼顾“查全”和“查准”,成为一个实用的研究课题。
不同于一般文章中使用的词汇,学术论文中的关键词是天然具有检索价值的有效词汇:① 关键词优先选用所属学科的主题词,即从自然语言中优选出来并经过规范化的、表达各种概念的语词,因此能够表征学科研究内容和主题;② 在学科发展的初期,随着论文数量增加,使用的关键词总数同步增多,到了学科发展的后期,新增关键词数量增长趋缓,可以通过这一趋势识别学科是处在“成长期”还是“成熟期”;③ 每个关键词都有其生命周期,包括“引入期”、“成长期”和“发展期”,如果追踪一组关键词的生命周期,就能够识别相关领域的发展过程(图1)[23];④ 当一段时间内众多作者选择使用相同的关键词,将出现“高频热词”,因此出现学科热点。目前,对于关键词词频变化有多种计量方法,中国学者马峥等在关键词分析中引入了“红点指标(Red Point Factor)”:首先按照词频从高到低排序,选择前1%的关键词构成“高频关键词集合”,其次统计与“高频关键词集合”相关的论文数量,并将其在所有论文中的占比定义为“红点指标”[24]。这一计量方法被用于从内容层面对期刊质量和影响潜力进行预先评估,本文在这里引申使用以描述学科热点的时间变化。
图1 关键词时序分布及演化模型[23]Fig.1 The life cycle evolution model of a key word[23]
1.2.2 共词分析与科学图谱
与词频统计相比,共词分析(co-word analysis)可以更多揭示关键词之间的关系,进而展示学科内在结构等高阶特征。早在20世纪80年代,3位法国学者Callon M、Law J和Rip A在其著作《Mapping the Dynamics of Science and Technology》中共同提出共词分析方法[25],此后,该方法在人工智能、科学计量学、信息科学和信息检索等领域得到广泛应用。
共词分析基于以下原理:2个关键词在同一篇论文中一起出现的次数越多,则表明关键词代表的主题关系越紧密。因此,通过统计主题词两两之间共同出现的频率,便可形成一个由这些词汇及其关联关系组成的共词网络,网络内节点之间的远近(共现频率)反映主题内容的亲疏关系。
共词分析的计量指标主要包括共现频率、包容指数、临近指数等[26-28],其定义如下:
(1)共现频率:假定有一个n篇文献组成的数据集,一对关键词ti与tj在所有文献中一起出现的次数Cij,则是这对关键词的共现频率。当i/j=1,2,3,…,n,则构成由所有关键词组成的n阶共词矩阵。
(2)包容指数:Iij=Cij/min(Ci,Cj)。其中,Cij是ti与tj的共现频率,Ci是关键词ti在文献集合中出现的频次,Cj是关键词tj出现的频次,min(Ci,Cj)是Ci和Cj两个频次的最小值。包容指数主要用来测量那些较高词频关键词的共现频率。
(3)临近指数:Pij=(Cij/(Ci×Cj))×n。其中,Cij、Ci、Cj与包容指数含义相同,n代表集合中文献的数量。临近指数法与包容指数相反,主要用来测量低频关键词的共现频率。
(4)相互包容指数:Eij=(Cij/Ci)×(Cij/Cj)=(Cij)2/(Ci×Cj)。其中,Cij、Ci、Cj与包容指数含义相同,Eij值为0~1。由于相互包容指数可以同时计算关键词ti和tj出现的频率,因此也被称为等价系数。
前面已有叙述,《海洋地质与第四纪地质》1981—2020年共正式出版40卷188期,载文3 896篇,其中“研究论文”“综述与评述”合计3 034篇。统计结果表明,在所有A/R论文中,共使用关键词13 053个,平均每篇论文使用关键词4.3个。进一步统计关键词数量的分布情况,论文中关键词最多使用8个,4~5个关键词论文数量最多,占比超过75%。
在所有13 053个关键词中,经去重后共有独立关键词6 527个。通过对同义或近义词进行合并,剩余关键词3 744个。再将保留的关键词进一步分类归纳,确定为4大主题39类(表1)。下面的词频统计结果均针对合并后的3 744个关键词,对于研究热点和学科结构的讨论则按照主题分类展开。
2.1.1 “高频关键词集合”
对论文中所有关键词进行排序,然后分类汇总后得到每个关键词的词频,从高到低排列可以取得排名前30位的关键词。从数量上看,这些“高频关键词”约占全部关键词的1%,将这些关键词的词频累加,则超过全部频次的21%(表2)。
具体分析“高频关键词集合”的构成,可以了解中国海洋地质的基本情况。排在第1位的“南海”一直是中国海洋地质调查研究的热点区域。类似研究区域的关键词还有排在第4位的“南黄海”、第16位的“东海”、第25位的“渤海”以及第26位的“南海北部”,表明中国近海是海洋地质工作的重点区域。此外,具有地域属性的关键词还有排在第13位的“黄河”和第27位的“长江口”,这与中国海洋地质研究长期关注海岸带及大河三角洲的态势是一致的。
“高频关键词集合”包括更多描述学科方向的关键词,如排在第2位的“地质构造”、第5位的“天然气水合物”、第7位的“沉积环境”、第12位的“环境地质”、第18位的“地球化学”等,这些关键词大多由含义相近的关键词合并而成,代表了研究领域。以“地质构造”为例,包含了“构造体系”“构造运动”“构造演化”“构造作用”“构造分区”“构造抬升”“构造沉降”等21种原始关键词,这些原始关键词的意义虽各有侧重,但都是用来描述“地质构造”的各项特征。此外,从上述合并后的关键词来看,中国海洋地质学科发展较为全面,涉及构造、沉积、资源、环境等多个领域。如果考虑到“第四纪”“全新世”“末次冰期”等高频关键词,中国海洋地质过去40年的工作以浅层居多,古气候、古环境方面的研究成果较为突出。
将40年的文献按照出版年度分为4个时期,分别统计其关键词词频,经排序后获得每10年排名前30位的高频关键词。这一结果既可表征每10年内的研究热点,也可以通过与“40年高频关键词集合”进行比较,发现各阶段的不同之处。从表2所列的结果可以看出,1981—1990年30个高频关键词中,有13个处在“40年高频关键词集合”范围之外,这些关键词表明:在中国海洋地质成长初期,利用“有孔虫”“介形虫”“磁性地层”等手段,研究近海陆架“海进海退”过程,建立“第四纪地层”层序是这一时期海洋地质最基础和先行的工作。1991—2000年的高频关键词则揭示了另外的研究特点,一是“古海洋”成为这一时期的热词;二是高频关键词中首次出现“南极”和“太平洋”,表明中国的海洋地质开始迈出走向深海大洋的步伐;三是“多金属结核结壳”研究增多,大洋矿产成为这一时期的另一热点。21世纪以来的2个10年则显示出新的研究特点:第1个10年的研究与40年的整体趋势最为一致,“天然气水合物”异军突起,成为中国海洋地质的前沿领域;第2个10年则保持了这样的趋势,“天然气水合物”上升到第3位,研究热度不减,“深水区”“中生代”成为高频关键词,代表了海洋油气调查开始进入“深水、深层”等新领域。
表2 《海洋地质与第四纪地质》载文中词频前30位的关键词Table 2 Top 30 word frequency key words in "Marine Geology and Quaternary Geology"
2.1.2 新增关键词数量及年度变化
对关键词和论文出版时间进行排序,关键词去重后按年度分类汇总,即可得到新增关键词数量的年度数据(表3)。从统计结果来看,关键词的年度增加可以分为3个阶段:① 初期的1981—1995年,新增关键词数量呈震荡增加态势,平均每年增加61个;② 1995年,新增关键词数量达到一个局部峰值后回落,此后至2007年呈现每年递增趋势,从1996年的67个增长到2007年的137个,平均每年增加95个;③ 2007—2020年,新增关键词数量再次呈现震荡增加态势,平均每年增加129个。
表3 《海洋地质与第四纪地质》新增关键词数量及红点指标统计结果Table 3 Number of new key words and Annual RPF of "Marine Geology and Quaternary Geology"
上述数据没有考虑论文数量的年度差异,而论文数量变化恰恰对新增关键词有直接影响。通过将年度数据转换为“篇均论文新增关键词数量”,可以得到更为客观的结果。从图2可以看出:① 在最初的15年,篇均论文新增关键词数量仍呈震荡增加态势,至1995年达到顶点,每篇论文出现1.9个新关键词;② 1998—2016年,篇均论文新增关键词数量震荡下滑,从1.5个下降到0.9个,下降幅度达到40%;③ 2016年后,篇均论文新增关键词数量呈现稳步增加趋势,从开始的0.9个上升为1.3个,上升幅度超过40%。
此外,通过比较论文关键词与“40年高频关键词集合”是否吻合获得年度红点指标数据。从获得的结果及图2可以看出:① 最初15年的红点指标呈现震荡下降态势,从1983年最高的83%下降到1995年最低的39%,变化幅度超过50%;② 自2000年开始,红点指标趋于稳定,大致围绕60%的均值上下波动,变化幅度小于10%。
图2 新增关键词数量与红点指标的年度变化Fig.2 Number of new key words and Annual RPF
同时考虑新增关键词数量和红点指标的年度变化,可以获得以下认识:① 过去40年,篇均论文新增关键词数量大致在1个上下波动,并未出现增长停滞等“关键词饱和”现象,这一稳定增加趋势表明:新的研究主题和方向持续出现,研究前沿相继轮替,使得中国的海洋地质长期处在一个连续快速发展阶段;② 红点指标围绕60%波动,大致代表“热点关注性研究”和“前沿探索性研究”所占的比例,二者的合理结合推动了中国海洋地质学的发展和创新;③ 从年度变化来看,虽然存在一个1995—2000年的过渡阶段,但观察其前后两个时期,篇均论文新增关键词数量和红点指标均变化不大,是否存在一个学科发展转折点仍需其他方面的证据。
2.1.3 中国海洋地质主要研究区域热点分布
根据过去40年已发表的论文,中国海洋地质研究区域主要集中在中国沿海、中国近海、大洋及两极地区(表1)。从关键词词频分布来看,中国沿海、中国近海关键词词频占比超过80%,是中国海洋地质最重要的研究区域,大洋及两极地区合计占比16.7%,在中国海洋地质研究中占有一定比重(图3)。
图3 中国海洋地质研究区域关键词词频分布Fig.3 Study area and relative key words frequency
具体分析中国近海的几个海域,与渤海相关的关键词词频最低,仅为8%;其次为黄海和东海,分别占比14%和16.6%;南海关键词个数和词频均居高位,分别为95个和36.3%,几乎是渤海、黄海和东海的总和,显示出极高的研究热度[29]。如果考虑到4个海域面积上的差别,其词频分布又反映出地球科学最基本的特点:即研究区域越大,其地质现象和科学问题越多,因此容易成为研究热点。南海的面积远超渤海、黄海和东海,无疑是深海科学的天然实验室!正如汪品先院士所述:南海最深5 000 m,水柱的压力就有500 个大气压,大洋钻探成为最重要的研究手段。中国1998年加入国际大洋钻探计划,1999 年就在南海实现了第1个大洋钻探航次,研究东亚季风。2014—2018年间,又在南海完成了4个航次探索海盆成因,在4 000 m上下的深海底里钻探基岩,使南海一举成为大洋钻探研究程度最高 的边缘海[7,30-31]。
与中国沿海和近海相比,大洋及两极地区的关键词词频较低,合计占比16.7%,反映了中国海洋地质工作以近海为主,兼顾大洋及两极地区的总体态势。具体分析各大洋的研究状况,距离中国最近的西太平洋研究工作最多,关键词词频占比达到66.6%,是中国海洋地质从近海走向大洋的重点区域。印度洋和大西洋关键词词频占比仅为7.8%和3.1%,反映了在这两个区域开展的科考航次和研究成果仍处在一个较低水平。如果观察关键词词频的时序分布,可以发现印度洋区域有明显增长趋势(图4),自2011年以来,陆续发表关于“印度洋中脊热液活动”“海盆多金属结核结壳”“天然气水合物资源估算”“孟加拉湾第四纪环境”等多篇研究论文,显示出该区域较高的关注度,相信随着海上丝绸之路沿线国家更为密切的科研合作,印度洋及相邻海域的海洋地质研究将会有持续的增长[32-33]。
图4 大洋及两极地区关键词词频时序分布Fig.4 Key words frequency relative with Ocean and polar regions
中国在两极地区开展科考和研究的时间较晚。自1983年中国正式加入《南极条约》,1984年开始进行大规模极地考察,至今已经进行了36次南极考察、11 次北冰洋科考和16 次黄河站科考。从专业领域来看,极地环境、生态与极地地质相关研究较多,在北极地区,巴伦支海、楚科奇海、白令海、波弗特海、弗拉姆海峡、斯瓦尔巴群岛是研究的热点区域,在南极地区,南大洋环流、南极冰盖动力学、冰芯古气候、海洋生物与生态等是国际上研究的焦点,南极重要的边缘海如威德尔海、罗斯海以及南极半岛是研究的热点区域[34]。
2.2.1 Top100关键词共现网络
使 用CiteSpace[35-36]对3 034篇论 文 中的关 键 词进行共词分析,计算范围选择词频最高的100个关键词,时间切片选择为10年,根据共现频率(Cosine)绘制共现网络并使用寻径算法对网络进行简化。在网络图谱中,关键词节点以年轮样式表示,其中,节点的大小代表关键词的词频,深色表示关键词出现时间较早,浅色表示关键词出现的时间较新,紫色表示节点的中心性特征,说明该节点与较多的关键词存在共现关系(图5)。从图中可以直观看出,高频关键词最为醒目,排在前3位的“南海”“地质构造”“粒度”都具有从深色到浅色的年轮结构,表明相关的研究在过去40年得以连续开展,是中国海洋地质的热点区域或热点方向,类似的高频关键词还包括“南黄海”“沉积环境”“古气候”“表层沉积物”等。与上述完整年轮结构的节点不同,“第四纪”“孢粉分析”以深色为主,表明这2个关键词相关的研究工作开展较早,而后期呈现下降趋势。值得关注的高频关键词还有“天然气水合物”“物源”,二者以浅色为主,表明其代表的研究方向较新,是当前的2个研究热点。
图5 Top100关键词共现网络Fig.5 The co-occurrence network of top 100 key words
图5中节点的大小与结构代表了关键词词频及其时序分布,因其可视化的表达形式较统计方法中的数据结果更为直观,更易发现潜在的学科研究热点。除此之外,共词分析还提供了其他重要的计算结果,主要包括节点中心性(Centrality)和突现度(Burstness)。在Top100关键词中,节点中心性最高的前30个关键词是:“珊瑚礁”“西沙”“晚第四纪”“温跃层”“地层”“地质结构”“浮游有孔虫”“海平面变化”“南沙”“氧同位素”“环境地质”“矿物学”“油气藏”“生物礁”“含油气盆地”“西太平洋”“中生代”“东海陆架盆地”“冰期/间冰期”“长江三角洲”“海岸带沉积”“第四纪”“新构造”“重矿物”“物源”“南海东部”“地震探测”“珠江口盆地”“上新世”“边缘海”,这些词汇与较多的关键词共同出现,在共词网络中起到桥梁纽带作用,代表了中国海洋地质值得注意的关键区域、关键领域或关键方法。
突变度用来测量关键词的急剧增加,其可以理解为计算时段关键词词频超出平均值的程度[37]。根据计算结果,存在突变关键词98个,排在前30位的突变关键词是:“第四纪”“天然气水合物”“物源”“有孔虫”“海进/还退”“古海洋”“晚更新世”“南海”“滨浅海”“板块俯冲”“地层”“神狐海域”“深水区”“南沙”“孢粉分析”“沉积相/旋回”“北黄海”“东海陆架盆地”“介形虫”“数字模拟”“磁化率”“古气候”“南极”“储层”“磁性地层”“海岸”“铁锰结核结壳”“珠江口盆地”“地质构造/活动”“中生代”,其中,最近10年急剧增加的关键词有“神狐海域”“天然气水合物”“深水区”“中生代”“东海陆架盆地”“珠江口盆地”“板块俯冲”等,这些关键词代表了中国海洋地质当前的研究前沿和热点(表4)。
表4 Top30 突变关键词及时间分布Table 4 Top 30 key words with the strongest bursts
2.2.2 基于主题分类的学科结构图谱
使用CiteSpace对4大主题和39种类型进行共词分析并绘制网络图谱(图6),可以获得学科结构之间的整体面貌。图6-①是4大主题共词分析结果,其中“学科领域”词频最大,累计出现2 805次,占比接近40%,“研究区域”、“调查与研究方法”和“地质年代”依次占比30%、20%和10%;此外,4大主题中仅“学科领域”占据中心位置,其他3个主题与其相关联,按关联强度进行比较,“研究区域”最为重要,其次是“调查研究方法”,排在最后是“地质年代”,这个顺序既是过去40年的数据得到的结果,也可以在未来的学科发展中予以参考。
图6-②是39种类型共词分析结果,最直观的特征是高频词同时也是中心性词汇,如词频最高的“沉积与环境及层序地层”,其中心性也最强,类似的学科分支还有“地球化学与生物地质”“构造地质”等,都是兼具较高热度的中心性词汇。只有一个例外是“海岸带、三角洲与海平面变化”,虽然词频不高,却具有很高的中心特性。“南海”是隶属“研究区域”唯一的高频词,无论是关键词分析还是主题类型分析的结果,“南海”都排在前列,再次证实“南海”是中国海洋地质的一个最热的研究热点。
图6 主题类型共现网络Fig.6 The co-occurrence network of terms and categories
主题类型共词分析同样获得突变检测结果。在所有符合突变特征的16个主题类型中,有4个突变发生在最近10年,包括“天然气水合物等新能源地质”“域外油气地质”“印度洋及邻近海域”“中—古生代”,这些学科领域、研究区域或深层系是值得注意的研究前沿。
为了更好地表示学科结构,还对7个主要领域以及调查研究中常用的3种方法进行了统计和比较(图7),根据词频大小可以划分出3个等级,①“沉积与环境及层序地层”“构造地质”“地球化学与生物地质”3类词频超过1 000次,认为是中国海洋地质最基础的研究领域;②“近海盆地等油气地质”“地球物理探测与处理”“海岸带、三角洲与海平面变化”“实验分析及测年”4类词频都在400以上,是海洋地质最为重要的研究方向;③“地形地貌”“天然气水合物等新能源地质”“古海洋学”3类词频均小于300,说明这些研究方向论文较少,其中,“天然气水合物等新能源地质”相关关键词虽然在1992年就已经出现,直至2000年以后才出现了爆发性增长,其关键词词频是平均值的2倍,这一趋势显示出“天然气水合物研究”从“前沿”到“热点”的演化模式。
图7 中国海洋地质学主要学科领域和调查研究方法雷达图Fig.7 Radar maps for major subjects and research methods of marine geology in China
选择《海洋地质与第四纪地质》1981—2020年共40年的论文数据,应用关键词词频统计和共词分析方法,对中国海洋地质学的发展历程与研究热点进行解析,得到以下结论:
(1)过去40年,篇均新增关键词数量和年度论文红点指标保持稳定,中国的海洋地质处在一个持续发展阶段,这一快速增长趋势在未来15~20年里预计不会发生改变[4]。
(2)从研究区域来看,中国海洋地质工作的重心集中在中国近海,南海是其中的热点海区;从大洋和两极地区来看,临近中国的西太平洋和远离中国的南北两极是潜在热点区域,印度洋和大西洋的研究成果较少。
(3)从关键词突现分析来看,南海北部天然气水合物、近海盆地中—古生代深层油气、西太平洋板块构造活动机制以及海上丝绸之路沿线海域是当前的前沿领域,有望成为新的热点。
以上研究基于论文关键词开展的统计分析,结合可视化图谱进行的讨论,对于中国海洋地质发展历程和整体面貌给出了自己的答案。但学科的发展除了内在规律之外,还受到国家需求、科技政策、国际合作等外在因素影响,如果能够进一步探讨推动学科发展的动力机制,就能更好地对未来进行预测。此外,加强对全球海洋地质学的计量分析,开展中国海洋地质与国际研究的对比,也将是一个有意义的研究方向。
致谢:本文为《海洋地质与第四纪地质》创刊40周年而作,通过对期刊载文进行计量分析,揭示了中国海洋地质学发展历程及其研究热点与前沿。何起祥研究员审读了论文,并提出宝贵的修改意见,对此深表感谢!