魏薇,宋艳,胡晓强,周千荷,赵梦阳
(1.哈尔滨工程大学经济管理学院,黑龙江哈尔滨 150001;2.上海外国语大学国际工商学院,上海 200083;3.哈尔滨工业大学管理学院,黑龙江哈尔滨 150001;4. 赛迪研究院网络安全研究所,北京100846)
在2018年4月召开的全国网络安全和信息化工作会议上,习近平总书记深刻阐释了网络强国的战略思想,这是当前和今后一个时期网信工作的根本依据[1]。近十年来,有关核电项目的网络舆情问题触动了公众的敏感神经,污名行为屡见不鲜[2]。核能是一种不可替代的清洁能源。据统计共有72个国家已经或正在计划发展核电,其中在“一带一路”上的国家有41个,在“一带一路”周边,还有11个国家正在发展核电[3]。中国正加快能源低碳化的步伐,而核能是这个时代的主角之一。为贯彻实施《中华人民共和国核安全法》并帮助中国核事业安全高效地发展,生态环境部核与辐射安全中心采集有关核辐射安全的互联网公开舆情数据。2018年8月9日,国务院办公厅印发的《关于加强核电标准化工作的指导意见》,部署了进一步加强中国核电标准化工作[4]。尽管我国核电建设和运行已达到了世界领先水平,但是核电项目网络舆情的快速传播对核电项目的推进带来了巨大挑战。
本文不限检索年限,利用文献计量方法和知识图谱可视化技术对核电项目网络舆情有关研究的文献进行了整理统计和数据挖掘,通过对研究前沿和热点的追踪,揭示核电项目网络舆情的研究轨迹、特征和规律,对该领域的热点研究主题及研究演化路径进行细化梳理,并指明关注不足的子领域,以及为该领域的后续探索提供不同的研究视角。这将有助于学者更好地把握核电项目网络舆情研究的动态变化和发展趋势。
使用正确的检索方式和检索策略来获得相对全面和准确的基础数据是科学分析的关键步骤[5]。为核电项目网络舆情的相关研究文献进行全景俯瞰与热点捕捉,综合考虑文献的数量和覆盖范围,本文在中国知网文献检索中设置检索条件为“(全文=核电网络舆情)(模糊匹配)”,检索年限为不限,数据库为文献、跨库检索。截止时间为2019年7月10日,文献覆盖时间范围为2008年至2019年共12年。逐条对数据进行检查并取消无效的记录,并收集每条文献的作者、机构、摘要、关键词、年份及参考文献等信息,共得到467篇研究文献作为数据集。
本文借助引文可视化分析的Java应用软件CiteSpace对467篇文献进行计量与知识图谱分析[6~9]。具体而言,首先进行数据格式转换,Refworks功能用于对检索到的核电项目网络舆情管理领域的数据资料进行格式转化并导出CiteSpace可识别的数据格式;其次,基于关键词共现、作者共现、机构共现等统计分析与技术处理,将转化后的数据绘制科学知识图谱;最后,结合高频、高中心度关键词与突现词相关的数据资料,以及研究热点全景视图与研究时间线视图呈现对各类知识图谱进行深度分析和挖掘,探索核电项目网络舆情管理领域的热点主题和演进路径。
除非另有说明,否则本文的基本参数阈值均按本节规则进行设置:设置时间分区为2008~2019年阶段内,每一年为一个时间分区;术语来源为题名、摘要和作者关键词,同时选择术语类型为突现词;根据研究内容和目的区分分析对象,中文文献主要对关键词和作者进行共现分析;分析对象的数据筛选每年出现频次或被引频次最高的前50个变量;图谱的呈现方式选择寻径网络算法,并对每个网络和综合网络进行修剪,同时选择静态呈现全景式分析图谱。在对核电网络舆情研究关键词进行聚类时选择Log-likelihood rate算法,并根据不同的分析目的分别选择聚类视图或时间线视图。
发文数量的变化反映了核电项目网络舆情管理工作的重心变化。根据统计发现,整个核电网络舆情领域研究文献发文量呈波动上升趋势,时间跨度为2008年至今,可见在数据集中,从2008年开始核电网络舆情领域的研究才逐渐形成。根据核电项目网络舆情管理领域文献基金分布,在文献数据集中有基金支持的文献中,受国家社科基金支持的文章最多,其次为国家自然科学基金。国家社科基金与国家自然科学基金是中国支持核电项目网络舆情管理的主要渠道,大多数的文献并没有基金支持。根据核电项目网络舆情管理领域研究层次分布与学科分类分布。从学科分类分布上来看,占比最多的依次为新闻传播占比23.66%、公共管理占比21.87%、公安占比7.55%、工业经济占比6.96%以及政治占比5.77%,其他学科表现偏弱,跨学科的研究仍然不足。基础研究、政策研究与行业指导三个研究层面对核电项目网络舆情管理领域做出的贡献高达86.02%,这些层面的研究是该领域重点关注的对象,其他研究层次只占比13.98%。核电项目网络舆情管理领域65.81%的研究来自于新闻传播学科、公共管理学科、公安学科、工业经济学科以及政治学科,其中新闻传播学科、公共管理学科对该领域做出的贡献高达45.35%。应积极延展这几个学科间的合作研究以及与其他学科间的交叉研究。
对研究机构合作网络进行机构共现分析,在CiteSpace中网络节点Node Types为Institution,主题词来源Term Source为Title、Abstract、Author Keywords (DE) 、Keywords Plus (ID),时间切片Time Slicing为时间区间2008年~2019年按每6年为一段进行切割,数据抽取对象Thresholds阈值(c,cc,ccv)用户在引文数量、共被引频次和共被引系数三个层次上,按前中后三个时区分别设定阈值(1,1,20;4,3,20;3,3,20),LRF=3.0,LBY=8,E=2.0。运行后得到研究机构共现网络图谱。通过对核电项目网络舆情管理领域的研究数据进行机构共现分析,可以得出近年来该领域研究机构发文量的排序列表。从研究机构的属性来看,高校居多, 可见学术机构很重视核电项目网络舆情管理的研究,并且在核电项目网络舆情管理研究方面做出了巨大贡献,占据了非常重要的地位。
将CiteSpace中网络节点Node Types设置为Author,运行后得到无修剪处理的作者合作图谱的网络节点数N为131,连线数量E为26,网络密度Density为0.0031,表明学者之间初步形成合作网络,但联系与合作程度依然较低,在该领域研究较为独立。通过作者共被引分析以及研究内容的共性分析发现,尽管在核电项目网络舆情的研究领域学者之间形成合作网络才开始显现,但已经初步形成了一定的学术共同体。从数量上来看,在该领域研究的学术共同体规模仍然较小。
对关键词共现分析可得到核电网络舆情研究文献的关键词共现知识图谱,进而整理出关键词的频次(大于4)、中心度和关键词名称的数据表,如表1所示,可以了解到目前核电项目网络舆情领域的研究热点。在测度节点在网络中的重要性时,应该关注具有中心性不小于0.1的节点, 因为高中心性通常是连接两个不同领域的关键中枢,中心性越高, 节点处内容的重要性越大。
表1 高频关键词的中心度与词频
研究人员提取了核电项目网络舆情领域的热门关键词,并做了三点划分:一是具有高中心度的热词。如网络舆情、新媒体、邻避冲突、群体性事件、邻避效应、治理等 ,这些关键词具有明显的桥梁作用。二是具有高频次的热词。如网络舆情、新媒体、邻避冲突、群体性事件、邻避效应等。这一类热词总结并概括了该领域的知识结构,是核电项目网络舆情研究的理论基础。三是同时具有高频次和较高中心度的热词。如网络舆情、新媒体、突发事件、邻避冲突、群体性事件、邻避效应等。
由于本研究着眼于发现热点的“演化”过程,因此在CiteSpace界面中将每一年都划分1个时区(设置时间切片为1年), 时区跨度为11年 (2008~2019年),选择阈值 Top N=100,节点类型选择“Keywords”,从Title、Abstract、Author Keywords (DE)和Keyword Plus (ID)中提取术语,使用Loglikelihood rate算法抽取标签词, 对数似然率越大的词越具有对这个聚类的代表性,采用Pruning the merged network、Pruning sliced networks以及Minimum spanning tree算法进行剪枝,并进一步生成共词网络。通过分析467篇论文的参考文献,发现了热点研究主题。
依据网络结构和聚类的清晰度,模块值Q>0.3时就意味着得到的网络集群类团结构是显著的。本次聚类的Q值为0.6208,说明文献类团特征明显图谱效果较好。聚类共发现了5个类团。根据各类团聚类标签,以及类团内部关键节点文献的内容,可以总结出核电项目网络舆情研究的五个研究热点,分别为群体性事件、网络舆情、邻避效应、企业管理、应急管理。对467篇文献信息进行文本分析后,部分核电项目网络舆情管理领域研究群集展示如表2所示。
4.3.1 研究热点全景呈现
为了更直观地挖掘核电项目网络舆情管理研究领域的演化脉络和潜在热点,基于关键词共现原理,对研究热点进行全景呈现。新媒体、邻避冲突、群体性事件、邻避效应等词对应的节点也相对较大,表明这些主题也是近年来众多学者所关注和青睐的研究焦点。另外,文本挖掘、网络谣言、风险传播、风险感知、预警策略、在线信息、非常规突发事件等词对应的节点虽然相对较小,但是它们基本都处在整个关系网络的连线末端,并成为该领域未来研究前沿中的研究热点。通过跟踪分析专业术语在不同时间、区间内出现频率的突然激增,识别出代表研究前沿的Burst Term。本研究通过对467篇论文的参考文献进行共被引分析以及突变词的共现分析来发现热点研究主题。如图1、图2与图3所示的Burst系数、关键词与共引情况,可以看出在核电项目网络舆情管理领域的研究进程中,关于PHRASE突发事件(Burst=3.1729)与PHRASE影响因素(Burst=2.8536)的研究非常丰富,这两个关键词在数据集中均出现在2008年,分别在2010年~2013年,与2016年~2017年间呈爆发式增长。
表2 核电项目网络舆情管理领域研究群集展示
通过识别历史突现词发现,当前核电项目网络舆情管理领域的研究前沿与Burst突发检测的历史突现词具有较大差异,从过去的突发事件与影响因素向文本挖掘、网络谣言、风险传播、风险感知、预警策略、在线信息、非常规突发事件转变。
图1 核电项目网络舆情管理领域Burst突发检测
4.3.2 研究热点演进脉络
图2 @PHRASE突发事件Burst=3.1729[2010~2013]
图3 @PHRASE影响因素Burst=2.8536[2016~2017]
通过对核电项目网络舆情管理关键词出场与衰退的时间变迁,分析了核电项目网络舆情管理研究主题的更新与传承,运用Timeline呈现方式展示了各个子领域的演进路径与脉络,聚类内部的共被引关系与聚类之间的相互联系和相互影响关系。如图4所示,通过各时间段首次出现的关键词的连线关系,可以看出子领域之间的传承关系。最上方为聚类所代表的群体性事件子领域,该类热点的集中研究时间为2013年至2018年,节点的连线较多,传承关系较强,其中在文献数据集中2014年首次出现的群体性事件、邻避冲突,与2016年首次出现的影响因素、治理方面有重要的研究突破。第二行为聚类所代表的网络舆情子领域,时间跨度从2011年直至2017年,在2012年到2013年首次出现的网络舆情与新媒体方面取得了一系列重要的里程碑式的成果,并且与群体性事件类团的交叉研究丰富,传承关系较强。第三行为聚类所代表的邻避效应子领域,该类团的时间跨度从2010年直至2018年,且在数据集中2014年首次出现的邻避效应方面有一定研究进展。第四行为聚类所代表的企业管理子领域,时间跨度从2013年直至2014年,2014年该聚类问题孤立研究开始趋冷,关注度降低,并向邻避效应类团下的发电厂与核电站管理问题转变。第五行为聚类所代表的应急管理子领域,时间跨度从2010年直至2016年,2014年该聚类问题孤立研究开始趋冷,关注度降低,并向群体性事件类团下的公众参与、网络舆情类团下的风险沟通转变。除了类团内子领域间的密切联系之外,跨类团子领域间对核电网络舆情的研究不是孤立进行的,存在知识的跨界交流,在逐步跨界交流的过程中迸发出新的研究热点,逐渐形成了热点演进脉络。
核电项目网络舆情管理研究的发展上,将进一步把握新时代中国核电项目网络舆情管理网络用户群体的网络特征,把握新时代中国特色互联网舆论规范的政策走向,把握新技术、新应用的发展趋势,深化大数据应用、引入人工智能、多平台跨数据融合。对于未来的研究,将更倾向于文本挖掘、风险传播、风险感知、在线信息、非常规突发事件等。
图4 核电项目网络舆情管理研究时间线视图
近年来,从一些核电项目引发的网络舆情来看,运用知识图谱对核电项目网络舆情的研究热点进行可视化分析,可以帮助相关部门有针对性地展开科学研究,这对于我国核电项目的顺利开工建设,积极参与一带一路沿线国家清洁能源和环保产业建设,造福沿线国家和人民,促进人类命运共同体的构建具有一定的参考价值。