刘静
(中国民用航空飞行学院外国语学院,四川广汉618307)
论CiteSpace在外国语言文字领域的应用现状
——基于CSSCI来源期刊文献的数据分析
刘静
(中国民用航空飞行学院外国语学院,四川广汉618307)
外国语言文字领域对CiteSpace的使用呈现出起步晚、数量少的特点,发文量总体保持上升势头。CiteSpace在外国语言文字领域的应用可划分为六大领域,翻译领域的使用最多。王立非教授是该领域的高产作者,《外语电化教学》尤其青睐此类文章。北京、上海和南京是CiteSpace在外国语言文字领域应用传播的三大“重镇”,其中北京居首。外国语言文字领域对CiteSpace的应用没有跟上软件更新的步伐且忽视了与同类其他可视化软件的结合,实践者对CiteSpace经典文献的知识掌握不足。
CiteSpace;CSSCI;外国语言文字;应用现状;趋势
近年来,大数据的迅速发展成为全球关注的热点,如何从海量数据中挖掘出有价值的信息给社会各界提出巨大的挑战。通过信息可视化的理论和方法研究我国人文社会科学成为应运而生的科研新领域。作为信息可视化的一个新的分支,知识图谱分析是一种极具优势的科学计量手段,能够帮助科学实践者挖掘出海量信息中的潜在含义并且追踪该领域的发展前沿。C ite S p a ce就是具有上述功能的一款信息可视化软件。
C ite S p a ce适用于各个领域,在社会科学领域和自然科学领域具有同等价值,外国语言文学领域也不例外,该领域出现了越来越多的借助C ite S p a ce软件深度分析和挖掘学术文献的科研成果。目前,针对C ite S p a ce在外国语言文字领域应用状况的综述性研究尚属空白,厘清C ite S p a ce在该领域的应用,可以更好地总结经验、评估现状、发现不足、提高该软件的使用水平,为科学研究提供更大的帮助。本研究旨在厘清以下几个问题:一、C ite S p a ce在外国语言文字领域应用的广度和深度;二、目前C ite S p a ce在外国语言文字领域应用的六大方向;三、C ite S p a ce在外国语言文字领域应用的作者、机构及地区分布信息;四、外国语言文字领域青睐此类文献的期刊;五、C ite S p a ce在外国语言文字领域应用存在的不足和需要注意的问题。
C ite S p a ce是由美国德雷塞尔大学计算与情报学院的陈超美教授基于J A V A语言开发的文献分析和可视化软件。C ite S p a ce软件最早诞生于2003年,自软件对外免费分享以来,陈超美教授不懈地对软件进行持续的更新和升级,为便于计算,以2003年年中作为C ite S p a ce问世的起点,则12年来,该软件大约每16天就更新一次[1]7。一方面可以看出陈超美教授对此软件投入了大量的精力,另一方面也可以看出,C ite S p a ce与时俱进,代表了信息可视化技术的先进水平。C ite S p a ce开发的目的是通过分析一系列相关出版物的书目记录,绘制知识图谱,厘清不同
可视化软件C ite S p a ce是目前国内外科学计量学领域兴起的一种重要研究方法和手段,并开始应用于不同的学科以及科学研究领域。为了解C itesp a ce在中文期刊文献中的应用情况,本研究将数据来源定位于由南京大学中国社会科学研究评价中心开发研制而成的“中文社会科学引文索引”(CSSC I),同时为了分析C ite S p a ce在中文期刊中应用的总体情况,全面收集包含“C ite S p a ce”一词的文献是基本的前提条件,所以本研究中的提及的CSSC I为中国知网(C N K I)数据库下的CSSC I,其收录的C ite S p a ce论文数量远远大于“中文社会科学索引”(CSSC I)数据库直接检索的C ite S p a ce论文数。数据采集日期为2016年9月21日,对CSSC I来源期刊以主题“C ite S p a ce”进行检索,得到从2007-2016年的548篇文献,分布在图书情报与数字图书馆、科学研究管理、计算机软件及计算机应用、企业经济等学科的近百种期刊中。
从检索的结果来看,C ite S p a ce在外国语言文字领域的使用只有3篇,远远不及其在图书情报与数字图书馆领域的280篇。在涉及C ite S p a ce的发文量超过3篇的期刊中外语类的只有《外语电化教学》,并且发文量只有4篇。图书情报类的期刊则包括《现代情报》、《情报杂志》、《情报科学》、《图书情报工作》等多达20种,单是《现代情报》一刊发文量就高达49篇。
图书情报学科与C ite S p a ce有着天然的联系,图情领域的学者在知识储备方面普遍比其他学科的学者占优势,这也从知识基础方面解释了C ite S p a ce目前在外国语言文字领域应用甚少的原因。在检索出的与C ite S p a ce相关的544篇文献中最早的文献发表于2007年,而外语类文章则于2014年才首次出现,相隔了整整6年时间,由此可见外国语言文字领域对该软件的使用呈现出起步晚、数量少的特点。
2.1 数据与方法
以“C ite S p a ce”作为主题词检索出来的548篇文献呈现出C ite S p a ce在中文期刊文献中的大致使用情况。为了更详尽地描述该软件在外国语言文字领域的使用情况,必须保证数据的详尽完整。笔者再次以C N K I数据库下的CSSC I作为文献来源,检索条件为“主题:(citesp a ce)或者主题:(知识图谱)或者主题:(可视化)”。学科范围限定为外国语言文字,共检索到19篇文献(表1)。
表1 外国语言文字领域涉及CiteSpace的CSSCI来源期刊文献
2.2 结果与讨论
2.2.1 论文产出的时间分布
从C ite S p a ce的论文年度分布来看,2013年发表相关论文2篇,2014年增至7篇论文,增量是前一年的3.5倍,可见C ite S p a ce的出现给外国语言文字领域的学者带来新的灵感,为做系统性的学术综述提供了一个新的工具。2015年论文数量降至5篇,下降的原因很可能是因为,使用C ite S p a ce的论文的数量越来越多,一成不变的研究目的和分析模式越来越难构成论文的闪光点,因此论文被录用的难度增大。值得欣慰的是,2016年截至到9月21日已经有5篇论文,可以预测2016年的论文数量将会超过2015年,整体上又出现上升的趋势,这说明该领域的学者找到了使用C ite S p a ce探索学术发展动态的新思路和新视角。
2.2.2 论文的关键词分析
关键词是论文内容的核心体现,可以直观呈现研究对象的分布情况。如表2所示,这19篇论文一共有50个关键词,出现8次的有1个,4次的2个,2次的7个,1次的40个。
表2 外国语言文字领域使用CiteSpace的论文关键词统计表
词频最高的关键词是C ite S p a ce,这与本文所分析的对象主题直接相关。这些应用了C ite S p a ce进行论文写作的学者,再给出关键词的时候,往往会以C ite S p a ce作为论文的关键词之一。知识图谱、可视化分析、可视化技术、文献计量学分析、谱系化等关键词反映了C ite S p a ce软件的基本特点;从设计的初衷来看,C ite S p a ce旨在挖掘引文聚类的信息,探测科学发展的前沿动态,这就解释了为什么会出现研究前沿、研究现状、研究进展、前沿热点、发展路径、研究领域等关键词,这些是应用C ite S p a ce软件要达到的基本目的;主题词、引文分析等则是C ite S p a ce软件的基本方法。这些词只是C ite S p a ce作为工具的功能描述,不能很好地反映C ite S p a ce在外国语言文字领域应用的具体情况,仍需结合其他有关理论、学科、主题的关键词进行分析。
通过梳理涉及语言学的关键词的亲疏分布,可以将C ite S p a ce在外国语言文字领域的应用划分为6大领域:
表3 CiteSpace在外国语言文字领域的应用领域划分及关键词
从各领域分布的文献数量来看,C ite S p a ce在翻译领域的研究使用最多,这可能是因为翻译学科的发展、新理论、新概念、新发现等形形色色的变化等相较于外国语言文字的其他领域而言相对频繁,内容变化幅度大,也较容易捕捉。C ite S p a ce的核心思想是突现这些变化,所以选材时自然会有这方面的考虑。语法研究、系统功能语言学等领域还未见C ite S p a ce的使用痕迹,这也给学者留下了对该领域海量学术成果进行计量评价的空间。
2.2.3 论文的其他相关信息分析
表3从作者、期刊、机构、地区、理论、软件、C ite S p a ce典型出版物的引用七个方面对C ite S-p a ce在外国语言文字领域的应用进行了梳理。从作者来看,对外经济贸易大学的王立非教授是该领域的高产作者,发文量为3篇。从期刊来看,《外语电化教学》刊文量最多,数量达到7篇,该期刊旨在探讨现代信息技术条件下的外语教学与外语研究,而C ite S p a ce正是应用信息可视化技术对外国语言文字领域进行总结、回顾和展望的利器,因此该期刊自然对此类文章尤其青睐。从机构和地区来看,北京、上海和南京是C ite S p a ce在外国语言文字领域应用传播的三大“重镇”,其中北京的机构院校数量居首,包括北京外国语大学、对外经济贸易大学、中国人民大学、北京师范大学和北京航天航空大学,西部省份没有应用大户。
值得注意的是,这19篇文章中有部分文章是由来自不同地区、不同机构甚至不同学科的学者合作完成,可见信息可视化技术已经渗透到科学研究的各个领域,并为外国语言文学研究拓宽了科研范围也挖掘出更多跨地域跨学科的合作机会。
从应用的软件来看,该领域所使用的C ite S-p a ce版本并不高。C ite S p a ce自2003年开发问世以来,通过了上百次的技术改进[1]6,使C ite S p a ce软件由C itesp a ce1.0升级到C ite S p a ce5.0(截止2016年9月21日),数据处理能力不断增强,优化了科学计量和可视化分析的基础功能,并逐步加入了新的功能,这也给外国语言文字领域的科学研究人员提出了更大的挑战,软件实践者只有不断关注陈超美教授对C ite S p a ce软件的更新,并学习掌握新增功能的使用方法,才能将C ite S p a ce的充分应用于科研实践中,取得更多的新成果。
笔者对这19篇文献中使用的C ite S p a ce版本做了统计,有7篇文献未在文中提及C ite S p a ce的版本,生成的聚类图中的参数值也被省去,因此只能用C ite S p a ce作笼统概括。除去版本不详的这7篇文献,使用次数最多的是C ite S p a ce3.7R8,涉及3篇文献,其次是C ite S p a ce3.7R1,涉及2篇文献,另外,C ite S p a ce2.2R11、C ite S p a ce3.5R3、C ite S p a ce3.5R6、C ite S p a ce3.5R10、C ite S p a ce3.7R7、C ite S p a ce3.7R8、C ite S p a ce3.8R1、C ite S p a ce 3.8R7各涉及一篇。C ite S p a ce更新速度快,更新的最新版本一经发布便可以在陈超美教授的个人主页(ht tp://cl u ste r.cis.dr e x el.e du/~cchen/ci tesp a ce/)上免费下载,截止2016年9月21日,主页上显示的最旧的版本是2015年10月14日发布的C ite S p a ce4.0.R2,而最新的版本则是2016年9月10日发布的C ite S p a ce的C ite S p a ce5.0R1。从软件版本的使用情况来看,外国语言文字领域对C ite S p a ce的应用没有跟上软件更新的步伐。陈超美教授对C ite S p a ce软件的每一次更新都是对其功能的一次优化,软件实践者只有及时掌握最新的软件版本信息和软件操作技术,才能最大化服务自己所研究的领域。
笔者还注意到,这19篇文章在进行数据可视化处理的时候,都只是单一的使用C ite S p a ce作为工具。随着可视化信息技术的发展,目前应用较为广泛的可视化软件除了C ite S p a ce还有R e f V i z、Bi b e x cel、H ist C ite、V os v ie w e r、U cinet和Paj e k等。C ite S p a ce和其他绘制科学知识图谱的软件配合使用,扬长避短,方能呈现出最好的可视化效果。
表3还列出了与C ite S p a ce相关的经典出版物,包括介绍C ite S p a ce I的C hen,C.(2004)[3],介绍C ite S p a ce II的C hen,C.(2006)[4]及中译本[5],介绍C ite S p a ce III的C hen,C.,Ib e kw e-S a n J ua n,F., H o u,J.(2010)[6],介绍结构变化分析的C hen,C. (2012)[7],介绍双图叠加分析的C hen,C.(2014)[8],两本专著C hen,C.(2003)[9]和C hen,C.(2012)[10],介绍C ite S p a ce应用案例的C hen,C.,Hu,Z.,Li u,S., T sen g,H.(2012)[11]和C hen,C.,Dub in,R.,&K im,M. C.(2014)[12]通读使用C ite S p a ce的这19篇文章的参考文献可以看出,仅仅有6篇文章引用了陈超美教授关于C ite S p a ce的经典文献,很多C ite S p a ce的使用者,并没有直接引用经典文献,有一部分引用的是使用C ite S p a ce的二次文献。外国语言文学领域的C ite S p a ce实践者,由于缺乏分析数据原理的知识储备,使用软件往往存在很多的不足,这就要求学者在学习和使用C ite S p a ce时,不能急于求成,不仅应该掌握C ite S p a ce的操作方法,还应全面系统地了解C ite S p a ce的设计灵感、理论基础和经典案例,只有这样才能真正做到将软件的作用发挥到极致,为科学研究服务。
表4 外国语言文字领域的CiteSpace论文关键词分类统计表②
陈超美教授开发的C ite S p a ce软件2003年问世,2007年一经引入国内[13],便作为一种新兴的文献挖掘软件,被广泛地应用于科研实践中,有效地促进和推动了相关科研工作的开展。知识可视化是将海量的、表面无序数据转换成直观有意义的图谱,是科学计量学的新发展,也是一种新兴的科学研究手段,C ite S p a ce形象展示知识领域随时间演进的动态过程,并通过关键节点的概念展示了学科领域知识转化和流动的关键路径以及不同聚类文献之间的逻辑关系,是国际领先水平的可视化技术,现已开始应用于各个研究领域。
图书情报与数字图书馆领域占据着C ite S p a ce应用的主导地位。在对C N K I数据库下的CSSC I来源期刊以主题词“C ite S p a ce”进行检索发现,2014年才首次出现了外语类的文章,并且远远不及图书情报与数字图书馆领域的成果丰硕。可见C ite S-p a ce在外国语言文学领域的应用呈现出起步晚、数量少的特点。在以主题词“知识图谱”和“可视化”进一步检索之后,得到19篇文献数据。这19篇论文皆是将C ite S p a ce作为文献分析的工具手段,这其中有对某一主题的研究热点、知识基础和研究前沿探索,这是C ite S p a ce的经典范式;也有对某一学科的知识演进或是某一机构或地区的科研产出的分析,研究层次和视角日益多样化。外国语言文字研究是一门开放的科学。在大科学背景下,各个研究者、研究机构、国家是如何通过科学合作进行研究的?最活跃的合作群体有哪些?最热点的合作研究领域是什么?形成了怎样的科学合作网络?该网络的结构与合作模式怎样变迁?这些是外国语言文字领域计量研究的一个重要层面,也是外语教育政策制定的一个重要依据。
正如陈悦等所言,“人们对待新鲜事物的态度往往是经历观望、追随、狂热、冷静、再回归理智的过程”[14],回顾C ite S p a ce应用已取得的成绩的同时,更当反思应用中存在的问题,切莫只是为了将有关数据展示得更加漂亮而硬使用软件,以至于论文千篇一律,甚至出现了滥用、错用软件的情况。C ite S p a ce在外语语言文学领域的应用还处在初级阶段,软件的更多高级功能尚待挖掘使用。C ite S-p a ce在不断的更新,这也给外国语言文学领域的学者提出了更高的要求,需要对科学计量学和科学知识图谱的知识有所涉猎,才能在实际研究中发挥C ite S p a ce的独特功能和优势。
目前,外国语言文字领域本身的研究多以定性研究为主,如何实现从定性研究到定量研究,再到可视化研究的跨越式发展是今后外国语言文字领域学科研究者值得关注的问题。可以预见,随着视觉思维方式的变革,C ite S p a ce在外国语言文学领域的应用将迈向新的发展阶段。
注释:
①括号里的数字表示该领域的文献数量
②括号里的数字表示相关的文献数量
[1]李杰,陈超美.C ite S p a ce:科技文本挖掘及可视化[M].北京:首都经济贸易大学出版社,2016.
[2]C hen,C.T he C ite S p a ce M a n ua l.[M/OL](2016-9-21)[2014-04-12].http://cl u ste r.ischool.dr e x el.e du/~cchen/ citesp a ce/C ite S p a ce M a n ua l.p df
[3]C hen,C.S e ar chin g f o r intel lect ua l t ur nin g points: Pr o gr essi v e k no w le dg e d om a in v is ua l i za tion[J].Pr ocee d in g s o f the Na tion a l A c ad em y o f S ciences(0027-8424),2004,101(s u ppl 1):5303-10.
[4]C hen,C.C ite S p a ce II:D etectin g a n d v is ua li z in g eme rg in g t r en d s a n d t ra nsient p a t te r ns in scientif iclite ra t ur e[J].J o ur n a l o f the A me r ic a n S ociet y f o r I n f o r m a tion S cience a n d T echnolo gy(1532-2882), 2006,57(3):359-77.
[5]陈超美,陈悦,侯剑华,et a l.C ite S p a ceⅡ:科学文献中新趋势与新动态的识别与可视化[J].情报学报,2009, 28(3):21.
[6]C hen,C.,Ib e kw e-S a n jua n,F.,&H o u,J.H.T he S t ru ct ur e a n d Dy n a mics o f C ocit a tion C l u ste r s:A M u l tiple-P e r specti v e C ocit a tion A n a l y sis[J].J o ur n a l o f the A me r ic a n S ociet y f o r I n f o r m a tion S cience a n d T echnolo gy(1532-2882),2010,61(7):1386-409.
[7]C hen,C.Pr e d icti v e E f f ects o f S t ru ct ura l V ar i a tion on C it a tion C o u nts[J].J o ur n a l o f the A me r ic a n S ociet y f o r I n f o r m a tion S cience a n d T echnolo gy(1532-2882),2012,63(3):431-49.
[8]C hen,C.,&Le yd es d o r f f,L.Pa t te r ns o f connections a n d mo v ements in dua l‐m a p o v e r l ay s:A ne w metho d o f p ub l ic a tion po r t f olio a n a l y sis[J].J o ur n a l o f the a ssoci a tion f o r in f o r m a tion science a n d technolo gy(2330-1643),2014,65(2):334-51.
[9]C hen,C.M a ppin g scienti f ic f r ontie r s[M].S p r in g e r, 2003.
[10]C hen,C.Tur nin g points:T he n a t ur e o f c r e a ti v it y [M].S p r in g e r S cience&B u siness M e d i a,2012.
[11]C hen,C.,Hu,Z.,&Li u,S.et a l.Eme rg in g t r en d s in r e g ene ra ti v e me d icine:a scientomet r ic a n a l y sis in C ite S p a ce[J].E x pe r t opinion on b iolo g ic a l the ra p y(1744-7682),2012,12(5):593-608.
[12]C hen,C.,Dub in.R.,&K im,M.C.Eme rg in g t r en d s a n d ne wd e v elopments in r e g ene ra ti v eme d icine:A scientomet r ic u p da te(2000–2014)[J].E x pe r t opinion on b iolo g ic a l the ra p y(1744-7682),2014,14(9): 1295-317.
[13]侯剑华,胡志刚.C ite S p a ce软件应用研究的回顾与展望[J].现代情报,2013,33(4):99-103.
[14]陈悦,陈超美,胡志刚,王贤文.引文空间分析原理与应用:C ite S p a ce实用指南[M].北京:科学出版社,2014:6.
AReviewof theCur rent Statusof theAppl icationof Cite Space in the Fieldof For eign Languages——On the B a siso f S t a tistics f r om CSSC I
L IU J in g
(C hin a C i v i l Av i a tion F l i g ht A c ad em y,Gua n g h a n S ich ua n618307)
T he a ppl ic a tion o f C ite S p a ce st ar ts l a te in the f iel d o f F o r ei g n L a n guag es a n d the theses r el a te d ar e w ith lo wqua ntit y bu t the g ene ra l t r en d o f w hich is on the r ise.T he a ppl ic a tion c a n b e d i v i d e d into 6 s ub-f iel d s,a mon g w hich t ra nsl a tion is the most pop u l ar o bj ect o f st udy.T he a ppl ic a tion fa ils to k eep p a ce w ith the p a ce in w hich the so f e war e is u p da te d a n d r e a ch ab et te r r es u l t th r o ug h com b ine d u se w ith othe r v is ua l i za tion so f t war es.C ite S p a ce u se r s d o not h ava a tho r o ug h u n d e r st a n d in gab o u t the cl a ssicso f C ite S p a ce.
C ite S p a ce;CSSC I;F o r ei g n L a n guag es;C ur r ent S t a t u s;Tr en d
G256
A
1672-2094(2017)03-0073-05
责任编辑:周哲良
2017-03-05
刘静(1983-),女,四川遂宁人,中国民用航空飞行学院外国语学院讲师,硕士。研究方向:词典学、文献计量学。