陈丽烟
(福建对外经济贸易职业技术学院 信息技术系,福建 福州 350016)
国内竞争情报研究进展的统计分析及关键词可视化
陈丽烟
(福建对外经济贸易职业技术学院信息技术系,福建福州350016)
以CNKI收录类别为CSSCI来源期刊为范围,收集2005—2014十年内竞争情报研究文献的题录信息,从统计学和可视化两个视角进行了系统综合分析。首先运用传统的统计分析方法,从作者发文量、被引频次和作者合作度等三个方面客观分析了近十年来我国竞争情报研究的现状;其次采用了可视化分析的思想,运用社会网络分析方法和Ucinet工具,对高频次关键词进行了可视化分析,从中心性和凝聚子群角度直观准确揭示出近十年来我国竞争情报的研究重点、研究热点和研究态势。
竞争情报;CSSCI;统计;社会网络分析;中心性
竞争情报作为情报学领域的一个重要概念,还没有形成统一化的明确定义。大多数学者认为,竞争情报既是一个产品,也是一个过程[1]。在20世纪50年代,美国率先开展了现代意义上的竞争情报活动[2],80年代以后,竞争情报逐步发展为一项独立职能,并向技术、方法及应用领域不断扩展。我国对竞争情报的有组织的理论与实践研究起始于20世纪90年代,众多学者开始竞争情报领域的相关研究,出现了大量的竞争情报文献。为了梳理竞争情报研究脉络,有部分学者应用文献计量学,从不同侧面对不同时期我国竞争情报研究进展进行了分析[3~7]。统计分析方法可以准确地揭示一个学科或知识域在一定时期的发展,具有较好的优越性,但是无法较为形象、准确地把握学科的研究热点和发展态势。因此为了科学揭示竞争情报研究的态势,通过从统计学和可视化分析两个角度进行系统全面分析,分析2005—2014年十年期间竞争情报研究的新进展和新情况,为后续深入研究提供参考。
以中国学术期刊全文数据库来源期刊(CNKI)为数据源,检索条件是篇名当中包括“竞争情报”,时间范围是2005—2014年(检索时间截止到2014年12月31日),来源期刊选择CSSCI。选择CSSCI来源期刊的原因是CSSCI来源期刊的遴选遵循文献计量学规律,筛选出的期刊在学术界具有较强的代表性和权威性,被CSSCI来源文献引用说明该文献具有一定的理论与实践价值[8]。利用上述检索途径,初次检索到943篇文献,文献统计分析和可视化分析的研究均基于2005—2014年这十年的统计数据。
在研究方法上主要采用统计分析方法和可视化分析方法。其主要步骤是首先对检索到的论文信息进行“导出参考文献”等规范化处理,然后把数据转换成编码为ANSI的TXT格式,以便书目共现分析系统提取。数据处理完毕,启动书目共现分析系统,新建项目,提取文档,选择相关的分析数据,提取每篇文章需要分析的信息作为分析对象,用SPSS等软件进行后续数据处理及定量分析。可视化分析方法就是将文献信息经过计算机处理过后的中间数据或者结果数据,以图形或者图像的形式比较直观的呈现出来。对竞争情报的高频次关键词的分析就是应用这种方法来分析,从而揭示出其规律。社会网络分析主要利用Ucinet6软件工具,此工具它以直观的可视化形式展示社会网络中各点之间的复杂关系,可以绘制出我国竞争情报研究的关键词共现网络图,并进行分析。
1.作者发文量分析
在科学研究当中,发文量的多少可以衡量一位学者在该领域的影响力。因此,作者发文量的分析是一个主要方向。在统计的946篇文章中,其中涉及作者1 829人,将发文量达6篇及以上的作者统计。由统计分析得知,处于金字塔顶端的核心作者如王知津,彭靖,张玉峰等均为情报学研究领域造诣较深的学者。而其中王知津教授是我国竞争情报研究领域的知名专家,同时也是情报方法论建设和应用的主要发起人。
2.被引频次分析
论文的被引用情况通常可以反映出该论文与现阶段研究热点的相关性,同时还能体现研究的严谨性,是一种尊敬前人著作权的行为。论文被引频次的多少,反映了其在同行中的影响力大小。通过统计分析得出竞争情报中被引次数排名前10名的文献如表1,其中被引次数最多的是包昌火等学者的《发展中的竞争情报系统》,被引频次高达62次,由此可以看出近年来研究基础主要为情报系统技术的开发。其次被引用较多的是彭靖里等人的《竞争情报中人际网络构建的理论研究》,被引频次为56次,这是一个新的情报研究分支,或许会成为将来的研究热点。表1中的篇名可反映出近十年来情报的相关研究多为理论性研究,而且发文年代久远,因此可以作为本领域的基础。
表1 近10年中竞争情报论文被引频次前10的统计
表2 2005-2014年中竞争情报中作者合作统计
表3 近10年竞争情报论文中关键词频次在20次以上统计
图1 共词网络图
3.作者合作度分析
随着研究的深入,作者就作者合作度和合作率两个角度进行了分析。其中,合作度=作者总数/论文总数,合作率=合作论文数/论文数*100%(这里均指一定时期内相关文献的作者数和论文数)。分析近十年来竞争情报研究领域作者的合作度及合作率(表2),合作度数值区间为1.73—2.12。平均值为1.93,并呈逐年上升趋势。合作率区间为53.03%—75.27%,平均值为63.26%,也稳步上升。这表明我国竞争情报研究领域已经形成了较为专业的研究队伍,学者之间能够良好合作。
关键词是著者为了表达文献主题而添加的自然语言词汇。关键词能够科学反映出文献的研究特征。关于同一主题领域的论文,作者会采用相同的关键词,而这些关键词同时出现在一些文献中称为关键词共现,于是众多关键词共现形成了关键词共现网络[9]。从社会网络方法的角度来看,关键词属于社会网络中的节点,关键词共现表现为节点与节点间的联系。关键词共现频次以及是否共现代表了关键词在共词社会网络中的地位和角色。因此我们可以采用社会网络分析方法(SNA)的原理和方法进行共词分析从而通过关键词间的联系,可揭示出某一领域主题研究的内涵和规律[10]。我们采用Ucinet6.0软件的绘图功能,将0—1二值矩阵转化为关键词共词网络图(如图1),在这个图中,每个节点代表一个关键词,他们之间的连线表示存在关系。
1.竞争情报研究领域的高频关键词
高频次关键词代表着关键词的重要程度越高,在其领域研究中受到的关注度也高。表3列出了近十年竞争情报领域研究中频次在20次以上的关键词。
从表3可以看出,除了“竞争情报”以外,企业竞争情报、情报研究、竞争情报系统、信息、知识频次较高,说明这些领域是竞争情报研究的重要方面。我们可以将这些关键词粗略分成如下几大类:竞争情报理论层面主要有知识、信息、专利、人际网络等,实践层面有竞争对手、反竞争情报、国家竞争情报等,竞争情报技术研究领域有竞争情报系统、数据挖掘、技术竞争、动态竞争等。高频次关键词也显示出了一些新的研究领域,如反竞争情报、产业竞争情报、图书竞争情报等。同时这些高频次关键词也说明了竞争情报的研究由理论层面逐渐向实践层面发展。
2.中心性分析
中心性分析是社会网络分析的重要方法,主要用来分析个人或组织在网络中所处的地位,它主要包括中心度和中心势两个指标。个体中心度是指个体处于网络中心的程度,是对个体行动者权力的量化分析,中心度又分为点度中心度、中间中心度和接近中心度;而中心势指数描述的是点间的差异度,是对群体权力的量化分析,中心势也分为点度中心势、中间中心势和接近中心势。我们利用Ucinet的分析功能得出竞争情报关键词网络的中心性数据(表4)。在该表中关键词的序号是根据关键词的频次来排列的。
表4 竞争情报论文高频关键词中心度和中心势
(1)点度中心度分析
社会网络中节点的点度中心度是指与其直接相连的其他点的个数,其值越大,代表该节点越接近处于“中心”地位。在高频关键词分析中,点度中心度反映的是其与其他词共现的次数,数值越大说明这个关键词与其他关键词的直接联系越紧密,越重要。通过分析发现,图书馆竞争情报的点度中心度最大,说明它在竞争情报研究领域中最活跃。结合我们的统计分析,近十年我国竞争情报领域研究,越来越多的学者开始关注图书馆在竞争情报中的作用。另外网络、可视化分析、专利、系统建设、竞争对手的点度中心度也比较高,这表示在近十年来它们相关的研究是竞争情报领域的重点内容,同时竞争情报系统、信息、知识等关键词的点度中心度较低,这表示虽然它们出现的频率较高,但是与其他关键词联系较弱,无法形成一个整体研究框架。
(2)中心势分析
中心势分点度中心势和中间中心势。其中点度中心势主要用来描述网络图的整体中心性,中间中心势表示的是在中间中心度最高节点与其他节点中心度的差距,它的数值越大,表示网络的中心势越高,也就是说这个网络可以被划分为多个小团体。如表4所示, 这些关键词的中间中心势都偏低,说明竞争情报关键词不容易形成小团体,这也进一步说明近十年来竞争情报研究的内容不集中,较为分散。
(3)凝聚子群分析
凝聚子群是指网络中某些关系特别紧密的行动者结合成的次级团体。凝聚子群分析主要研究的是在关键词网络中有几个子群以及它们之间有什么样的关系。根据节点间的这些连线,我们可以看到该网络内关键词之间的紧密度以及该网络的核心关键词及边缘关键词。凝聚子群分析利用Ucinet的n-clique工具,形成竞争情报关键词的n-clique聚类图(图2)。
图2 n-clique聚类图
n-clique是小团体内某两点之间有不大于n的距离(小于n)。利用Ucinet6软件处理图2相应的数据得n=2的5个小团。从结果看,小团体的规模相差不大。由于每两个关键词距离不同产生的结果也不尽相同,有些关键词同时出现在四个小团体中,如产业竞争情报、反竞争情报、国家竞争情报和人际竞争情报等;而案例则只出现在某些团体当中。图2可以较为客观地反映竞争情报领域研究内容之间的内在关系,如位于图2下边的系统建设、数据挖掘等,这些内容是当前竞争情报研究中最为基础的内容;而位于图2最上边的企业竞争情报、情报研究、竞争情报系统等,这些相对而言是本领域相对更深入的研究内容,而一些新型的分支可能成为将来研究的热点如人际竞争情报、人际网络竞争情报等。从下面的聚类图分析看,这些研究内容具有一定的代表性且它们之间有一定的关系。
凝聚子群密度是测量小团体现象是否严重的指标,它的取值范围为[-1,+1],越靠近1,表示小团体密度越大;越接近-1,意味着小团体密度越小;接近0,表明关系越趋向于随机分布。图2凝聚子群的密度值 -0.283,可见趋向于随机分布状态也就是说明它们之间的关系比较松散,这反映了竞争情报领域的研究内容方向性不是很强,有必要改变其分散状态使其研究更紧密。
我们分别从统计学和可视化分析两个视角系统全面分析了我国竞争情报领域十年来研究的态势。首先采用统计学的分析方法,从三个方面对竞争情报研究特征进行了描述统计分析;其次采用了可视化分析的思想,借助社会网络分析方法和工具,从高频次关键词的角度进行了可视化分析。这两个视角较为科学全面反映出了近十年来我国竞争情报研究的进展:文献数量趋向稳定,研究逐步走向成熟;发文期刊主要集中在图书情报类;竞争情报研究学者较多,研究学者之间有着较强的合作度,并且出现一批领军人物,这些学者的研究主题前沿新颖,推动竞争情报领域向纵深领域发展。同时,企业竞争情报、竞争情报系统、产业竞争情报仍然是竞争情报领域研究的主要对象。近十年来,出现了一些新的研究主题,理论层面主要有知识、信息、专利、人际网络等,实践层面有竞争对手、反竞争情报、国家竞争情报等。但是这些研究主题影响力较小,与其他主题共现较少,研究比较孤立,没有形成成熟的研究团体群。因此,竞争情报领域的研究需要改变其分散状态使其研究更紧密,加强这些层面的研究。
[1]王克平,等.竞争情报与企业危机预警[J].情报科学,2012,(3):336~340.
[2]陈远,望俊成.近年来国内竞争情报研究述评[J].图书情报知识,2005,(6):70~73.
[3]刘东晓,等.基于文献计量的国外技术竞争情报研究进展分析[J].情报杂志,2013,(5):49~55.
[4]郝屹.近五年竞争情报研究的文献计量分析[J].情报科学,2012,(12):1 907~1 910.
[5]胡笑梅,李文玉.2009—2010年国内竞争情报研究热点分析[J].情报探索,2012,(4):54~57.
[6]麦淑平,等. 2006-2010年我国竞争情报论文的计量分析[J].图书馆工作与研究,2012,(2):24~29.
[7]陈淑平.我国竞争情报研究进展的定量分析[J].大学图书情报学刊,2009,(5):89~93.
[8]李超,柯健.基于CSSCI的信息生态被引文献统计分析与评价[J].情报科学,2010,(4):554~558.
[9]魏瑞斌.社会网络分析在关键词网络分析中的实证研究[J].情报杂志,2009,(9):46~49.
[10]斯坦利·沃瑟曼.社会网络分析:方法与应用[M].北京:中国人民大学出版社,2012.10~15.
2095-4654(2016)08-0129-05
2016-05-03
福建省中青年教师教育科研项目科技A类项目(JA14402)
G350
A