2004~2013年中国海洋科学研究热点分析
——基于期刊论文关键词的计量分析

2016-07-06 10:30孙晓燕李希彬南开大学商学院天津00071国家海洋信息中心天津00171国家海洋局天津海洋环境监测中心站天津00451
海洋科学 2016年2期
关键词:共词科学研究团体

孙晓燕, 李希彬(1. 南开大学 商学院, 天津 00071; 2. 国家海洋信息中心, 天津 00171; . 国家海洋局 天津海洋环境监测中心站, 天津 00451)



2004~2013年中国海洋科学研究热点分析
——基于期刊论文关键词的计量分析

孙晓燕1, 2, 李希彬3
(1. 南开大学 商学院, 天津 300071; 2. 国家海洋信息中心, 天津 300171; 3. 国家海洋局 天津海洋环境监测中心站, 天津 300451)

为了解近10年来中国海洋科学研究的重点和热点主题, 作者运用科学计量分析方法以及社会网络分析方法中的聚类分析、主成分分析和可视化展示等研究手段, 对主要海洋核心刊物在2004~2008 和2009~2013年两个阶段共10年间发表论文的高频关键词进行计量分析。分析和对比结果发现, 海洋生物、海洋水产养殖、海洋沉积环境和海洋环境污染这4个研究主题始终是10年来中国海洋科学研究的重点, 新阶段也出现了海洋灾害、海洋权益等新研究主题。中国的海洋科学研究紧跟形势发展, 研究主题逐渐明确, 研究内容进一步扩展, 研究方法和手段不断丰富。

海洋科学; 情报科学; 共词分析; 聚类分析; 共词网络; 研究热点; 研究主题

作者应用文献计量学对主要海洋类核心期刊在2004~2008年和2009~2013年两个阶段发表的论文进行统计, 提取高频关键词, 分析近10年来中国海洋科学研究的热点, 同时利用社会网络分析方法,探寻中国海洋科学研究主题, 通过两个阶段研究热点和研究主题对比, 总结近10年来中国海洋科学研究发展趋势, 旨在为中国未来海洋科研工作侧重点、经费投入及管理决策提供借鉴和参考。

1 数据来源和研究方法

1.1 数据来源

研究数据来自《中国学术期刊全文数据库》的主要海洋类核心期刊, 选择条件是期刊在2004~ 2013年都属于《中文核心期刊要目总览》范围内, 符合条件的期刊有9种, 对选取的9种期刊发表的论文按照2004~2008年和2009~2013年两个阶段分别进行统计, 提取关键词进行分析。9种主要海洋类核心期刊各年刊登的论文数量见表1。

1.2 研究方法

第一步对2004~2008年的6511篇期刊论文和2009~2013年的7963篇期刊论文进行关键词提取,提取书目共现分析系统(Bibliographic Item Co-Occurence Matrix Builder, BICOMB)软件可以直接处理接处理的notefirst格式数据; 第二步, 利用BICOMB软件进行关键词词频统计, 得出高频关键词列表并构建高频关键词共现矩阵; 第三步, 运用Ucinet和Netdraw软件对共现矩阵进行处理计算,并绘制高频关键词共现网络图; 第四步, 将高频关键词共现矩阵转化为相似矩阵后, 使用SPSS软件进行聚类。最后, 结合共词网络和聚类结果对两个阶段中国海洋科学的研究热点、研究主题和发展趋势进行比较和分析。

关键词词频分析法是利用能够表达文献核心内容的关键词在文献中出现的频次高低来确定该领域研究热点。关键词出现频率表明对其研究的热度, 但词频只能反应某一关键词的使用频率和受关注程度,不能反映关键词之间的相互关系, 无法揭示相关研究主题[1]。

共词分析法是通过文献中关键词共同出现的频次, 确定该文献所反映学科中各关键词之间的关系。两个关键词在同一篇文献中同时出现的次数越多,就表示这对关键词的关系越紧密。这些关键词所构成的共词网络中, 节点之间的远近反映了主题内容的亲疏关系[2-3]。社会网络分析的程度中心性反映一个节点与其他节点直接相连的次数, 体现节点地位的优越性。派别分析是通过比较子群内、外部成员之间的关系强度来区分派别。作者采用程度中心性和派别分析对论文的关键词进行共词网络的可视化展示与分析, 以揭示海洋科学的研究热点和研究主题。

表1 2004~2013年9种主要海洋类核心期刊刊登论文数量Tab. 1 Number of papers published in nine major marine core journals during the time period 2004~2013

聚类分析指将物理或抽象对象的集合分组成为由类似对象组成的多个类的分析过程。将最紧密的对象合并为一类, 直到全部对象聚成一个大类, 每个类可表达一个研究主题。作者采用层次聚类法, 对高频关键词进行聚类并与共词网络进行对比分析。

2 2004~2008年数据分析

2.1 高频关键词统计分析

利用BICOMB软件对2004~2008年间的6511篇论文的关键词进行统计分析时, 对论文使用不规范的关键词进行了规范处理, 例如将“南海”、“中国南海”和“南中国海”, 碳14和14C, 等同义词和近义词进行统一处理。得到关键词频次排列顺序表, 选择出频次排列前100位的关键词见表2。

从表2可见, 2004~2008年的5年间中国海洋科学研究的热点有以下几个方面:

海洋科学研究的重点研究区域: (1)中国近海包括南海、渤海、东海和黄海; (2)河口地区包括长江口、珠江口和黄河口; (3)海湾地区包括: 胶州湾、莱州湾和台湾海峡; (4)其他地区还包括冲绳海槽和黄河三角洲等。

海洋科学研究的主要内容: (1)海洋物理特征,如温度、盐度、潮流、波浪、风暴潮、温跃层和波浪力等; (2)海洋化学特征, 如化学成分、叶绿素a、磷, pH、稀土元素和多环芳烃等; (3)海洋环境污染方面, 如富营养化、重金属、赤潮等; (4)海洋生物方面,如生物量、生物多样性、初级生产力、群落结构、种类组成、浮游植物、浮游动物、大型底栖动物、海洋微藻等; (5)海水养殖方面, 如网箱养殖、凡纳滨对虾(Litopenaeus vannamei)、栉孔扇贝(Chlamys (Azumapecten)farreri)、中国对虾(Penaees chinensis)、大菱鲆(Scophthalmus maximus)和中华绒螯蟹(Eriocheir sinensis H.Milne-Edwards)、中肋骨条藻(Skeletonema costatum)、赤潮异弯藻(Heterosigma akashiwo)、塔玛亚历山大藻(Alexandrium tamarense)、中国明对虾(Fenneropenaeus chinensis)等; (6)海洋沉积物特征, 如沉积环境, 古环境、古气候、沉积物粒度, 元素地球化学、矿物特征、沉积物来源等; (7)海洋资源开发方面, 如富钴结壳、天然气水合物、稀土元素等; (8)其他还包括海洋工程类的海洋平台建设, 以及海洋生态环境方面, 如红树林等。

海洋科学研究的主要方法: 数值模拟、时空分布、沉积物粒度分析、元素地球化学分析、化学分析、遥感、GIS、综合评价、数学模型、序列分析、数值计算等。

2.2 高频关键词的共词网络和聚类分析

表2 2004~2008年9种主要海洋类核心期刊出现的高频关键词及其词频Tab. 2 High-frequency keywords and their frequencies appearing in the nine major marine core journals during the time period 2004~2008

表3 2004~2008年高频关键词聚类结果Tab. 3 Cluster results of high-frequency keywords during the time period 2004~2008

由表3和图1可见, 有5个团体结合的相对较为紧密, 分别为圆形、方形、倒三角形、盒子形和十字形。(1)圆形团体: 长江口、胶州湾、渤、黄、东海区域的赤潮、生物多样性、浮游植物、大型底栖动物等的生物多样性、生物生产力、时空分布、季节变化、群落结构和种类组成等内容; (2)方形团体: 海洋沉积物方面,主要是沉积环境、古环境、古气候方面的研究; (3)倒三角形团体: 莱州湾、珠江口等区域海水的富营养化、海洋环境污染方面的研究; (4)盒子形团体: 主要是海水养殖方面的内容; (5)十字形团体: 主要是为海洋工程建设服务的潮流、波浪的数值模拟、数值计算方面的研究; 从总体整体上看, 共词网络呈现的5个团体与聚类结果的前5个聚类分别有对应关系。综合共词网络和聚类分析, 可以看出2004~2008年中国海洋科学集中研究主题包括这样几个方面:

图1 2004~2008年高频关键词共词网络可视图Fig. 1 Co-word network diagram of high-frequency keywords during the time period 2004~2008

海洋生物研究方面(圆形团体、聚类1)。从共词网络和聚类结果可以看出, 近海以及海湾区域, 特别是对潮间带附近的浮游植物、大型底栖动物的生物量、丰度、种类组成、群落结构、数量分布、季节变化等是重要的研究主题, 此外还包括生物多样性、初级生产力、赤潮和叶绿素a等的研究。

海洋沉积环境方面(方形团体、聚类4)。研究重点主要涉及南海和冲绳海槽等较远海域, 主要通过沉积物粒度分析、沉积速率、元素地球化学分析等手段开展全新世以来的海洋沉积环境、古环境、古气候方面的研究; 此外还包括富钴结壳、天然气水合物等海洋矿产资源的调查、评价和分析等研究主题。

海洋环境污染方面(倒三角形团体、聚类2)。研究重点主要是三大河口地区包括: 黄河口、长江口和珠江口, 以及莱州湾地区海水的富营养化、营养盐,以及海洋沉积物中磷、重金属等的分布, 综合评价方面的研究主题。

海洋水产养殖方面(盒子形团体、聚类5)。研究重点主要集中在鱼类、虾类、贝类等的海水养殖, 胚胎发育以及生物多样性等研究主题。

海洋数值模拟方面(十字形团体、聚类3)。研究重点只要是利用数值模拟、数值计算和数学模型的方法对海水的动力环境, 如波浪、潮汐、潮流进行模拟, 对海洋工程类、海洋平台建设等服务。

此外其他一些研究主题, 还包括中国和日本关于海洋权益问题的研究, 人类活动作用于海洋对气候变化的影响, 海水的温度、盐度和pH值, 红树林生态环境, 遥感和地理信息系统等研究手段在海洋领域应用的研究等。

3 2009~2013年数据分析

3.1 高频关键词统计分析

在利用BICOMB软件对2009~2013年的7963篇论文的关键词采用与2004~2008年相同的分析和处理方法。得到关键词频次排列列表, 提取出现频次最高的100个关键词(表4)。

2009~2013年中国海洋科学研究关注的区域还是中国近海、主要河口和海湾地区, 但增加了“西北太平洋”这一研究区域, 美国取代日本成为新的重点研究对象。对于重金属的研究热度明显提高。研究内容方面出现了一些新热点, 如浒苔、溢油、石油烃、钓鱼岛、海冰、台风等。研究方法更为多元, 出现了相关分析、聚类分析、主成分分析等新方法。

表4 2009~2013年9种主要海洋类核心期刊出现的高频关键词及其词频Tab. 4 High-frequency keywords and their frequencies appearing in the nine major marine core journals during the time period 2009~2013

同样对表4中出现的高频关键词采用如上的分析方法, 分别利用BICOMB、Ucinet和Netdraw等统计得出高频关键词共现网络, 计算网络的程度中心性, 并进行派别分析, 最终得到高频关键词共词网络可视图(图2), 相同的节点形状表示其属于派别相同, 节点的大小表示其中心性程度。将高频关键词共现矩阵转换为相似矩阵后采用SPSS19.0软件进行聚类分析, 聚类结果见表5。

3.2 高频关键词的共词网络和聚类分析

由图2可见, 有5个团体结合的相对较为紧密,分别为圆形、方形、倒三角形、正三角形和十字形。(1)圆形团体: 渤、黄、东海、长江口、胶州湾、黄河口、潮间带等区域的浮游植物、浮游动物、大型底栖动物等的生物量、生物多样性等的时空分布、季节变化、群落结构和种类组成等内容; (2)方形团体: 主要是虾类、贝类和蟹类等海水养殖方面的内容; (3)倒三角形团体: 海洋沉积物方面, 主要是黄河三角洲的沉积环境研究; (4)正三角团体: 遥感和数值模拟等研究方法进行海冰、溢油等的监测研究; (5)十字形团体: 海洋灾害、海洋权益和大尺度气候变化等方面的研究。(6)盒子形团体: 海洋环境污染方面。从总体整体上看, 共词网络呈现的五个团体与聚类结果的10个聚类分别有不同程度的对应关系。综合共词网络和聚类分析, 可以看出2009~2013年中国海洋科学研究主要围绕以下几个主题:

图2 2009~2013年高频关键词共词网络可视图Fig. 2 Co-word network diagram of high-frequency keywords during the time period 2009~2013

表5 2009~2013年高频关键词聚类结果Tab. 5 Cluster results of high-frequency keywords during the time period 2009~2013

海洋生物方面(圆形团体、聚类1)。与2004~2008年相似, 近海以及海湾区域, 特别是对潮间带附近的生物群落结构、生物量分布、海洋生物分类、生物多样性等仍是一个主要的研究主题。此外还包括生物遗传多样性、克隆、基因表达等研究主题。

海洋水产养殖方面(方形团体、聚类6和9)。2004~2008年关于栉孔扇贝、凡纳滨对虾和大菱鲆等养殖问题的研究仍就是热点。此阶段也出现了如刺参(Stichopus japonicus)、三疣梭子蟹、大黄鱼和半滑舌鳎、等养殖技术、育苗技术以及基因结构等研究主题, 以及温度和盐度对水产品生长、发育和存活的影响等主题。

海洋沉积环境方面(倒三角团体、聚类7)。主要是黄河三角洲地区沉积环境、古环境的研究, 对海洋沉积物利用沉积物来源分析、相关分析、粒度分析和生物标志物分析等重建全新世以来该区域的古环境, 以及人类活动的影响。

海洋数值模拟方面(正三角团体、聚类3和8)。相对于2004~2008年, 数值模拟方法应用范围进一步扩大, 出现利用数值模拟方法对潮汐、海冰和溢油问题的研究, 此外还出现遥感和地理信息系统等新的研究手段。

海洋灾害和海洋权益问题方面(十字形团体、聚类4和10)。海洋灾害主要是台风、风暴潮、潮汐、海气相互作用事件(ENSO)等预报和理论方面的研究;海洋权益方面主要涉及中国的钓鱼岛问题, 以及美国的立场等研究主题。

海洋环境污染方面(盒子形团体、聚类2)。珠江口、黄河口以及黄、东海海域的赤潮问题研究, 溶解氧、营养盐、重金属、石油烃等的分布、来源和评价研究。

4 2004~2013年中国海洋科学研究的主题变化趋势分析

通过对两个阶段研究主题的对比可以看出, 2009~ 2013年比2004~2008年阶段中国海洋科学研究的领域进一步扩展, 紧随新的研究问题的出现, 新的研究领域的热度迅速提升, 重点研究主题的研究更为深入, 研究方法和研究手段进一步丰富, 对两个阶段研究主题进行比较, 发现有以下特点和变化:

海洋生物、海洋水产养殖、海洋沉积环境、海洋环境污染这4个大方面始终是近10年来中国海洋科学研究的主要研究主题, 这与当今形势紧密相连。当前随着全球变化加剧和中国经济的快速发展, 资源和环境成为两大制约因素, 海洋生物和海洋水产养殖等的研究可为人类提供食品资源和药用资源。同时海洋是全球气候系统的重要组成部分, 研究海洋动力过程, 以及海气相互作用机制是预估未来气候变化的重要科学依据。近年来, 海洋环境污染特别是海洋富营养化问题日趋严重, 赤潮灾害频发, 河口和海湾地区生态环境功能减退, 海水荒漠化问题突出,海洋环境污染问题的研究和治理具有重要意义。

海洋防灾减灾, 海洋权益与国家安全等研究主题成为新研究热点, 这与目前的国际国内形势密切相关。近年来, 中国海洋灾害频发, 海冰、风暴潮和台风等已经成为沿海地区经济发展主要的制约因素,海洋灾害预测和减轻灾害影响已成为重要的研究议题。在海洋权益和国家安全方面, 中国面临的形势更为严峻, 与邻国存在关于岛屿、大陆架和专属经济区划界等争议问题, 像钓鱼岛问题和南海问题等都曾一度引起紧张局势, 因此加强海洋权益和国家安全维护的研究势在必行。

研究主题更为明晰, 研究内容更为扩展。随着海洋科学研究的逐步规范和成熟, 研究主题逐渐明确,各主题围绕资源、环境、灾害、权益、污染和建设等问题开展, 海洋科学各研究领域关系国计民生,并逐渐发展稳定, 奠定并形成研究基础和理论体系,但各研究主题内容不是固定不变的, 随着新形势发展、新现象和新问题出现, 研究内容不断丰富。例如,近年来, 由于近岸水体富营养化和全球气候变化等原因, 造成大规模浒苔绿潮频发, 成为新的研究热点; 溢油事故频发也带来应对海洋环境污染的新挑战。海洋养殖方面出现刺参、三疣梭子蟹和大黄鱼等新养殖品种。海冰也成为最新关注的海洋灾害。

研究方法和研究手段不断丰富和加强。随着新技术的发展, 新的研究手段和方法成为海洋科学研究主要使用的研究方法, 数值模拟, 沉积物粒度分析、元素地球化学分析、遥感和地理信息系统、序列分析和综合评价等方法一直是海洋科学的传统研究方法。2009~2013年, 相关分析、主成分分析和聚类分析等数理统计分析方法也得到广泛使用, 表明海洋科学研究更为趋向定量化研究。此外, 随着新生物技术的发展, 生物标志物技术和分子标记技术(AFLP技术)广泛应用于海洋生物遗传育种研究。

[1] 尹相旭, 张更平, 李晓菲. 基于关键词统计的情报学研究现状分析[J]. 情报杂志, 2009, 28 (11):38-40.

Yin Xiangxu, Zhang Gengping, Li Xiaofei. A research situation analysis of information sciences based on keywords statistics[J]. Journal of Intelligence, 2009, 28(11): 38-40.

[2] 钟伟金, 李佳, 杨兴菊. 共词分析法研究(三)——共词聚类分析法的原理与特点[J].情报杂志, 2008(7): 118-120. Zhong Weijin, Li Jia, Yang Xingju. The research of co-word analysis (3)——the principle and characteristics of the co-word cluster analysis [J]. Journal of Intelligence, 2008, 27(7): 118-120.

[3] 廖胜姣, 肖仙桃. 基于文献计量的共词分析研究进展[J]. 情报科学, 2009, 26 (6): 856-858.

Liao Shengjiao, Xiao Xiantao. Research advances on the bibiometrics based on co-word analysis[J]. Information Science, 2009, 26(6): 856-858.

[4] 贺玲, 吴玲达, 蔡益朝. 数据挖掘中的聚类算法综述[J]. 计算机应用研究, 2007, 1:10-12.

He Ling, Wu Lingda, Cai Yichao. Survey of clustering algorithms indata mining[J]. Application Research of Computers, 2007, 1: 10-12.

(本文编辑: 谭雪静)

Focus of marine scientific research in China during 2004~ 2013 based on bibliometric analysis of keywords from scientific papers

SUN Xiao-yan1, 2, LI Xi-bin3
(1. Business school of Nankai, University Tianjin, Tianjin 300071, China; 2. National Marine Data and Information Service, Tianjin 300171, China; 3. Tianjin Marine Environmental Monitoring Central Station, State Oceanic Association (SOA), Tianjin 300451, China)

Sept. 5, 2014

Oceanographic science; information science; co-word analysis; cluster analysis; co-word network research focus; research themes

To understand the focus of and hottest topics in marine scientific research during the past decade, in this study, we analyzed papers published in the major marine core journals during the time periods 2004~2008 and 2009~2013 using the following methods: quantitative analysis, social network analysis, cluster analysis, principal component analysis, and visual display analysis. The results show that four research themes-marine biology, marine aquaculture, marine sediments, and marine environmental pollution-have been the focus of most marine scientific research. New research topics, including marine disasters and maritime rights and interests, have emerged during the more recent period. Marine scientific research in China has followed suit with the development of the national situation, whereby various research topics have gradually subsided, research content has expanded, and research methods and tools have been continuously enriched.

G353

A

1000-3096(2016)02-0110-08

10.11759//hykx20140905002

2014-09-05;

2014-12-03

孙晓燕(1982-), 女, 山东烟台人, 博士研究生, 副研究员,主要从事海洋情报分析、海洋信息资源管理研究, 电话: 13821806320, E-mail: luckysunxy@126.com

猜你喜欢
共词科学研究团体
中国队获第63届IMO团体总分第一名
欢迎订阅《林业科学研究》
欢迎订阅《纺织科学研究》
纺织科学研究
纺织科学研究
基于突变检测与共词分析的深阅读新兴趋势分析
基于Matlab的共词矩阵构造
中国文化在国际社交媒体传播的类型分析——基于共词聚类的研究
基于共词知识图谱技术的国内VLC可视化研究
团体无偿献血难成主流