张玲
[摘要]“南海问题”已成为国际社会关注的重要议题,“南海问题”研究涉及广泛的研究领域,近10年来,学术界产生了大量以“南海问题”研究为主题的期刊论文。“南海问题”研究论文蕴含重要的研究信息,大数据技术分析是获取这些重要信息的关键。本文从“南海问题”研究历史背景入手,对这些文献的发文情况、研究领域、核心出版物等进行深入研究分析,以期有助于“南海问题”研究论文学术价值的开发与利用,为国家重大战略提供决策支持,促进多学科协同创新研究。
[关键词]“南海问题” 大数据分析 国家战略 协同创新
0引言
“南海问题”是指由于南海周边国家围绕南沙群岛及其附近海域的主权和权益之争,以及由于美国、日本、印度等域外大国带着各自不同的战略目的介入这一问题而导致的一系列新的问题,广义的“南海问题”囊括这两大领域的问题。本文将主要运用关联分析、聚类分析、分类技术来分析“南海问题”研究期刊论文的价值。笔者于2017年3月检索国知网知识发现网络平台(CNKI),通过网络信息收集方法之网络数据库检索方法,通过检索主题、篇名、关键词、摘要涉及“南海问题”,并设定“检索年限”为:2007-2016年,共筛选出1795篇中文文献,经数据清洗后,有效文献数量1592篇;本文检索时间为:2017年3月12日。通过信息可视化,将大规模数据进行视觉呈现,有助于人们理解那些采取错综复杂而又往往规模庞大的“南海问题”期刊论文呈现出的潜在价值。
1“南海问题”研究中大数据分析的意义
1.1为国家重大战略提供决策支持
2009年以来,南海周边国家以“强化主权”来固化它们在南海的既得利益;特别是从2012年发生的黄岩岛事件,突破了中国政策和忍耐的底限,南海局势加剧紧张,“南海问题”已成为国内学者研究的重要议题,近10年来,这一研究领域的学术成果呈递增的趋势,当前继续保持高速增长。在这一背景下,运用大数据分析“南海问题”期刊论文,挖掘出具有价值的信息,对于合理解决南海争端,助力“一带一路”建设,推动中国与周边国家区域合作与发展,具有重要的意义。
1.2有助于推进国内高校世界一流大学和一流学科建设
2015年8月18日,习近平主席主持召开中央全面深化改革领导小组会议审议通过了《统筹推进世界一流大学和一流学科建设总体方案》,会议强调,要推动一批高水平大学和学科进入世界一流行列或前列。目前各学校均在启动十三五规划开展一流学科建设,而科研实力已然是衡量高校核心竞争力的重要指标之一,期刊论文是科研工作的基础和起点,也是评价科研成果的一个参照体系。通过大数据分析,对研究机构、期刊、论文以及学者进行统计分析和排序,可以追踪“南海问题”最新研究前沿,反映“南海问题”中的研究密集型和突破性领域。
1.3有助于开展协同创新合作
近年,国内各高校都在开展协同创新合作,促进资源共享,联合开展重大科研项目攻关,在关键领域取得实质性成果。例如:中国南海研究协同创新中心是国家认定的首批14家“2011协同创新中心”之一。该中心由南京大学牵头,外交部、海南省、国家海洋局三个政府部门支持,联合中国南海研究院、海军指挥学院、中国人民大学、四川大学、中国科学院、中国社会科学院等单位共同组建。运用大数据分析方法,可以揭示出合作关系分析,分析出“南海问题”研究中高被引论文的机构分布与第一作者的隶属关系,从而促进协同创新合作。
2研究方法
本文将中国期刊全文数据库(CNKI)作为国内文献统计来源,综合分析《中国学术期刊影响因子年报》、百度学术平台等这一研究领域的相关信息源,运用网络数据库检索方法,通过数据分析方法对2007-2016年间国内科研人员发表的主题、篇名、关键词、摘要涉及“南海问题”文献进行比较分析。
2.1数据采集与获取方法
笔者于2017年3月检索国知网知识发现网络平台(CNKI),通过网络信息收集方法之网络数据库检索方法,通过检索主题、篇名、关键词、摘要涉及“南海问题”,并设定“检索年限”为:2007-2016年,共筛选出1795篇中文文献,经数据清洗后,有效文献数量1592篇;本文检索时间为:2017年3月12日。
2.2数据清洗方法
通过Excel VBA技术及行业经验,运用逻辑错误清洗、非需求性数据清洗、关联性验证清洗等技术,主要对作者信息、篇名等进行数据预处理。
2.2.1作者信息清洗
作者信息清洗主要涉及将作者信息为空值、本刊评论员、本刊编辑部的字段删掉。
2.2.2篇名信息清洗
篇名信息清洗主要涉及去重,例如:含中、英双语同题名文献;一文多投现象:如“马来西亚海洋安全政策分析”与“马来西亚南海安全政策初探”、包含“总目录”、“世界大事综览”、“主编手记”、“第十届海峡两岸“南海问题”“学术研讨会”在海口举行两岸学者呼吁:加强南海合作,具有紧迫性和现实可行性等与本文研究不太相关的题名。
2.3统计方法
通过信息检索将检索结果按顺排统计与倒排统计、Top N统计、数量分布统计等统计分析方法,对结果进行深度分析。在这一过程中,融合了大数据分析的聚类分析、分类与关联分析技术。
2.4结果解读方法
通过Excel将相关信息进行可视化呈现,获得理想的数据分析结果。
3研究结果
3.1年度载文量统计
本文中的载文量是指CNKI数据库收录的2007—2016年发表的涉及“南海问题”研究作者在各种学术期刊论文的总数。2007—2016年,CNKI数据库在主题、篇名、关键词、摘要涉及“南海问题”研究文献共计1592篇,其内容覆盖科学技术、哲学、人文科学、社会科学、历史、法律、信息科技、经济与管理科学等研究领域。2007—2008年,論文数量不足100篇,“南海问题”研究处于萌芽阶段。2009—2012年,论文数量达350篇,“南海问题”研究呈现出线性增长的趋势。2012年至今,共计1055篇,“南海问题”研究呈现出指数增长的趋势。endprint
3.2科研实力情况分析
从发文学者所属机构的分布来看,排名前十位的依次是中国社会科学院(75篇)、暨南大学(53篇)、南京大学(39篇)、中国人民大学(35篇)、中国现代国际关系研究院(30篇)、解放军国际关系学院(27篇)、海南大学(24篇)和厦门大学(24篇)、复旦大学和云南大学(23篇)、上海国际问题研究院(22篇)、武汉大学、广东海洋大学、广西民族大学(15篇)。
3.3作者統计分析
以“南海问题”为题撰写论文的研究者来看,发文数量排名30位的学者中,第一名鞠海龙(暨南大学),21篇;第二名郭渊(黑龙江大学),15篇;第三名薛力(中国社会科学院),14篇;第四名金永明(上海社会科学院)和李金明(厦门大学),11篇;第五名吴士存(中国南海研究院)和杨光海(解放军国际关系学院),10篇。其他发文数量较多的还有葛红亮、黄耀东、张蕴岭、于向东、葛红亮、周士新、李晨阳、许浩、王光厚、张洁、陈向阳、朱陆民、宋燕辉、邹立刚、李益波、袁征、邵建平等学者。
3.4学科领域统计分析
从发文所属学科分布来看,“南海问题”研究主要集中在:政治学、法律、经济、科学与技术、军事、新闻与传媒、历史、社会学、管理学、教育、语言学与文学、旅游等领域,其中政治学涵盖中国政治与国际政治,科学与研究领域包含了海洋学研究、法学研究领域包含国际法研究等。
3.5期刊分析
从发文的期刊名称来看,主要集中在《世界知识》(6.85%)、《东南亚研究》与《太平洋学报》(2.14%)、《亚太安全与海洋研究》(1.88%)、《和平与发展》(1.82%)、《当代世界》与《海南大学学报》(1.57%)、《社会科学文摘》、《当代亚太》与《南风窗》(1.32%),《国际研究参考》与《东南亚纵横》(1.01%),合占发文总数的23.93%。
4结束语
“南海问题”是一个复杂的多层次议题,也是中国人必须重视的中国特色议题。本文从“南海问题”的成因、现状着手,通过对期刊、作者、科研实力、基金、学科领域、重要人物的统计分析表明,国内“南海问题”核心研究领域集中在南海资源环境与海疆权益、南海国际关系研究一中国与周边国家地缘政治与地缘经济、中美关系、中日关系、两岸关系等,“南海问题”政策与战略决策支持。
近年来,我国政府提出的“一带一路”及《统筹推进世界一流大学和一流学科建设总体方案》的倡议,这些倡议对解决“南海问题”提了新思路,也为科研人员研究“南海问题”提供了新机会。笔者希望通过本报告提供的多角度学术成果分析为参考依据,科研人员聚焦“南海问题”研究前沿学术文献,提高科研人员学术产出率,从而为我国在“搁置争议、共同开发”政策下,合理解决“南海问题”。
最后,“南海问题”研究是一个重大课题,其学术文献量庞大、涵盖范围广泛、新的研究内容不断涌现,受时间限制,笔者本报告的内容仅选取CNKI数据库中涉及这一议题的部分内容进行分析,不够全面,在今后的研究中,笔者将扩大这一领域学术文献的范围,从而使得分析结果更加客观、具有参考意义。endprint