迟玉彤
摘 要:运用文献计量的方法对我国共词分析领域的相关文献进行多角度的定量和定性分析,分析了国内共词分析文献的作者合作情况、期刊分布等。这可以让我们明确共词分析研究领域发文年代分布、核心作者、重心研究区域等。
关键词:文献计量;共词分析;词共现
共词分析方法最早被详细描述是在20世纪70年代中后期由法国文献计量学家开始的。经过Callon、Whittaker、Courtial、Turner等大家学者的研究、修正、补充,共词分析理论逐渐完善。之后到20世纪90年代中后期,共词分析法基本走向成熟,经过30多年的发展,方法已经被广泛应用到许多领域。
掌握学科的最新研究进展是我们在研究相关领域学术问题的基础,只有时时把握研究进展,我们才能看清自己站在什么水平,我们还可以在这样的研究基础之上再做什么,应该做什么并且有意义。只有全面的了解才不会在研究时走错方向或是進行重复的工作,同时,对研究进展的分析可以帮助我们把握研究方向。
本文中,我们就通过文献计量法分析国内共词分析方法的研究进展,既可以了解相关方面的发展脉络,同时也可以借鉴各位学者的成功经验,帮助我们学习时把握方向,弥补我们的不足。
1 共词分析方法内涵
1.1概念
共词分析方法属于内容分析方法的一种。它的原理主要是对一组词两两统计它们在同一篇文献中出现的次数,以此为基础对这些词进行聚类分析,从而反映出这些词之间的亲疏关系,进而分析这些词所代表的学科和主题的结构变化。它利用大量文献中共同出现的关键词对,有效地反映文本关键词之间的关联强度,减少了关键词的空间,用一套结构图有效地展示了关键词之间的关联。
1.2共词分析成立的前提假设
共词分析方法的实施是要在理想化的状态下开展的,也就是说,共词分析方法和经济学一样,它是在假设前提成立的情况下才有意义。其中,前提有以下几点:
1)文章的关键词和题名等术语是经过文章作者深思熟虑、认真严密选择的, 能够反映当前该领域的发展。
2)如果不同的术语出现在相同的一些文章中,则这些术语之间有一定的关系。
3)如果有足够多的作者承认这些术语间的关系,则在这些作者关心的领域,这些术语间的关系非常有意义。
4)共词分析是建立在“词”的基础之上的,经过培训的标引者选择出来的用来描述文章内容的关键词,事实上是相关科学概念可以信赖的一个指标。
经过这样的研究、质疑、修改之后,最终形成了以上四点假设,共词分析方法就是基于这样的一些假设而成立的,在假设成立的情况下,共词分析方法利用文章中词语对的共现频次来反映包含在文章中的概念结构就会成为可能。
2 文献计量学
文献计量学是借助文献的各种特征的数量,采用数学与统计学方法来描述、评价和预测科学技术的现状与发展趋势的图书情报学分支学科。这一术语最早是1969年由英国人A.普里查德提出的。
3 国内共词分析研究的文献计量分析
通过分析国内共词分析法的相关论文量,我们可以了解国内该方法的研究现状。
本文的研究是基于中文论文(期刊),数据来源是CNKI中国知网,目的在于用文献计量方法分析国内共词分析文献的分布特点和研究现状,为我们的学习和科研活动提供借鉴。
3.1选取数据来源
本部分选取的中文论文(期刊),数据来源是CNKI中国知网。
首先,以“共词分析”和“词共现”为检索词,检索词内容特征为主题;范围选择了中国学术期刊网络出版总库,年限选为1990-2008年。经过搜索及人工处理,得到的有效文献数为93篇。接下来,我们将以检索到的结果来分析我国的共词分析法研究状况。
3.2研究论文的文献计量分析
1)文献的年代分布
共词分析在我国起步比较晚,不过发展的也非常快。我们将检索到的文献按年代分布的状况列出得出结果发现,我国的共词相关文献呈逐渐增长态势,特别是2001年后,趋势更加明显。2001年及以前,我国的共词分析文献数量较少,说明20世纪共词分析法在我国还没有引起人们的足够重视,该方法也就没有形成大的气候。2001年后,该方法在我国得到了快速的发展。
2)文献著者统计分析
在93篇文章中,有30篇论文只有一位作者,其他都是合著完成的。文献量和作者人数间的关系,其中同一位作者在统计年限内只算一次,
篇均作者数是指: 一定时期内,某期刊、某学科的每篇论文的平均作者数;合著率是指: 在一定时域内,某期刊、某学科多著者论文数与总论文数之比。篇均作者数、合著率与学科的综合性、研究的难易程度有关,虽然社会科学文献的合著程度小于自然科学,但其合著率也正在逐步提高。篇均作者数与合著率可以反映论文作者的合作程度,进而反映本学科的研究深度以及本学科和其他学科的交叉情况。相比2000年之前,2000年后,作者数呈增加趋势,篇均作者数和合著率总体呈上升态势。
3)核心作者的确定
这一部分是通过计算作者的贡献率来确定该领域的核心作者。由于第一作者和第二作者等的贡献不等,在这里需要对作者所在的不同位置给定权重。我们按照娄策群教授设计的等级分配法,即按合著文献中每个作者的排名先后递减分配其权数,各作者权数之和为1。
在CNKI检索文献时,可以根据文献被引率来排序,然后我们发现,以共词分析为检索词,检索出的文献按被引率排序后,排名前10 的文献作者大部分是我们总结的该领域核心作者。这就可以说明,我们核心作者的分析确定是合理正确的。进一步分析还可以发现,这些作者不是研究语言学的,就是在图书情报领域工作的,而且这些作者普遍所受的教育程度很高。这说明,我国共词分析的研究及应用重心主要就在这两个领域。并且,共词分析法已经为众多学者所熟知。因此,我们就更加有理由相信,共词分析法在未来有更广泛、更深入的发展和应用。
4 总结
在共词分析方法中,研究者利用共词方法基本原理概述研究领域的研究热点,横向和纵向分析领域学科的发展过程、特点以及领域或学科之间的关系,反映某个专业的科学研究水平及其发展历史的动态和静态结构,拓展信息检索领域以求帮助用户检索信息等等。到目前为止,共词分析方法产生了大量的应用成果。
本文通过文献计量对国内共词分析文献的研究,可以看出我国共词分析领域的研究进展是处于上升趋势的,通过分析,我们有充分的理由相信, 作为科学计量领域的一个重要并实用的方法, 共词分析在未来将会有更宽广的展示舞台。
参考文献
[1]娄策群. 社会科学评价的文献计量理论与方法.华中师范大学出版社,1999
[2]李长玲,化柏林. 我国网络计量学研究的文献计量分析.图书情报工作,2006,50(9)
[3]钟伟金,李 佳. 共词分析法研究(一)--共词分析的过程与方式. 情报杂志,2008(5)
[4]李 颖,贾二鹏,马 力. 国内外共词分析研究综述. 新世纪图书馆,2012(1)
[5]王燕平. 基于文献计量的我国搜索引擎研究现状和热点分析. 现代情报, 2012,32(7)
[6]崔 雷. 专题文献高频主题词的共词聚类分析. 情报理论与实践,1996,19(4)