档案学研究中计量法运用的计量分析

2014-06-11 12:26王新才文振兴
档案管理 2014年3期
关键词:计量法档案学

王新才++文振兴

摘 要:计量学作为定量分析的重要部分,近年来在档案学领域内日渐兴盛。本文以CNKI期刊导航中的27本档案学期刊为统计源,对运用计量法研究的学术论文进行统计,从年度分布、期刊分布、作者情况、研究机构、被引频次、计量单元以及论文主题7个方面对运用计量法的研究论文进行了分析,以期为学科的发展与后来的研究者提供一定的参考价值。

关键词:档案学;计量法;文献计量法.

Abstract: Based on the 27 archival science journals in CNKIs Journals navigation, this paper makes a statistics analysis of articles related to the metric methods. Combined with the methods of the bibliometric, this article reveals the characteristics of research from the point of annual distribution, journal distribution, high yield of the core units and core authors, citations, metering units as well as research subjects.

Keywords:Archival Science;Metric Methods;Bibliometricals.

定量研究与定性研究是社会科学领域内的两种研究范式,前者以概率论、统计学为基础,后者以历史学、逻辑学为基础,在档案学领域内,定量研究远不如定性研究取得的成果丰硕。但不可否认,定量研究对学科的完善是十分重要的,计量法就是其中的一种,广义计量法的计量对象十分广泛,狭义的计量法更多关注文献情报的量化统计,本文采用狭义的计量法概念,就计量法的方法体系而言,目前在档案学领域内运用较多的有统计分析、引文分析、词频分析、共现分析与聚类分析5种方法。本文以文献计量法为研究方法,对计量法在档案学领域的运用做了统计分析。

1 数据获取与数据处理

本文选取CNKI“中国学术期刊网络出版总库”作为数据源,期刊涵盖CNKI期刊导航中档案学领域的27本期刊。由于运用计量法在档案学领域所产生的研究成果不是很多,为获得更全面的数据,从以下两个方面进行数据检索,一是关键词全文检索,检索式为“全文=计量 or 全文=引文分析 or 全文=词频分析 or 全文=共现分析 or 全文=聚类分析 or 摘要=统计分析”,其中,关键词“统计分析”不具专指性,因而进行摘要检索;二是综述性文章间接获取,以“综述”、“评析”、“述评”与“评述”四个词语进行题名检索,原因在于很多关于某一主题的综述性文章较多地使用了计量法来进行定量分析。通过以上两个步骤在尽量保证数据检全率的基础上,再结合论文的摘要剔除大量的不相关数据保证数据的检准率,但对仅仅提及文献数量的论文排除在数据筛选范围之外,两类检索经过数据相加去重后得到论文286篇。

2 数据统计与分析

2.1 年度分布。论文年度分布可以反映主题研究的发展态势,截至当前,2013年与计量法相关的论文有48篇,其余年度分布见图1,可以看出,国内档案学研究对计量法的运用可以追溯到1988年,有两篇文章[1][2]。从曲线波动情况来看,2000年以前,论文数量总体不多,只有32篇,但在1994年前后出现了一个小波峰,这得力于四川涪陵地区档案局罗力的研究贡献,在1994年前后共发文9篇。2000年以来,发文量逐渐增加,合计254篇,占了总论文量的88.81%,特别是2009年以来,几乎呈现直线增长,2009年至2013年的发文量就达到了208篇,占了72.73%,由此可见,目前,计量法在档案学研究中的运用已逐渐成为一个热态。

图1 年度分布

表1 期刊分布

2.2 期刊分布。由于部分期刊的名称有变动,例如,《档案管理》的曾用刊名为《河南档案》,为便于统计,笔者将曾用刊名一律统计于现用刊名,结果见表1。整体来看,排名前10的期刊占了论文总量的90%,其余的17本期刊则不到10%,且有5本期刊目前没有计量论文,而频次在20次以上的期刊论文占了论文总量的75%以上,说明计量类论文的期刊分布很集中。

2.3 作者情况。在1999年以前的32篇论文中,作者有22人,其中有16人发文1篇,发文量最高(9篇)的是四川涪陵地区档案局的罗力。2000年以后,发文3篇以上的作者有19人,比上个世纪要多。整体来看(表2),论文作者共计304人,频次共计427次,根据普赖斯定律,高产作者约为17人,由于3篇的有10人,因此3篇及以上的21位作者均列为档案学领域计量研究的高产作者,此外,只发文1篇的有235位,占了作者总量的77.3%。

表2 作者情况

合作发文能充分开发集体智慧,利于研究进展。在286篇论文中,共有304位作者,其中合作论文有119篇,根据合作度与合作率的测算公式,得到合作度为1.06(作者总数/论文总数),合作率为41.61%(合作论文数/论文总数)。将该数据与已有研究的统计数据,比如综述[3]、档案法[4]等相比,合作率要高,原因之一在于计量研究需要利用跨学科的知识,其二,对大量数据的统计工作需要合作完成。

2.4 研究机构。研究机构按照一级名称进行统计,比如,将武汉大学信息管理学院统一为武汉大学,对独立作者附两个单位的情形按第一单位统计,此外,同一机构内合作文章存在单位名称1次或多次注明的情况,按1次统计。除了早期5篇论文的5位作者无法查找单位外,统计到的研究机构共有91个,频次共计300次,其中排名前10 的单位占了总量的50%以上,见表3,其中,四川涪陵地区档案局是20世纪90年代的高产单位。

表3 核心单位分布

另外,按照单位的性质对论文进行归类,分为政府(含事业单位)、高校与企业,在附有研究机构的162篇非合作文章中,高校132篇,政府29篇,企业1篇。在119篇合作论文中,同一机构内合作的有98篇,其中高校96篇,政府与企业各1篇,跨机构研究论文有21篇,其中,跨高校的有12篇,高校与政府合作发文7篇,高校与企业合作发文2篇,可以看出,独立发文是主流,合作论文中以同一机构内的合作为主,跨机构的合作暂时不多。

2.5 被引频次。被引用频次共计553次,其中2013年度的论文仅有1篇有1次被引,由于论文被引需要一定时间才能实现,因此2013年的48篇文章排除在分析之外。在余下的238篇论文中,被引频次共计552次,平均被引频次为2.32次,该数据表明计量论文的学术价值相对较高,由表4可知,有96篇文章的被引频次为0,占了40.34%,表明档案学领域内的计量文章约有2/3的论文能被引用,不小于10次的高被引用论文数量有15篇,其中,7篇分布在《档案学通讯》上,5篇分布在《档案管理》上,另外还有2篇《档案学研究》的论文及1篇《档案》上的论文。

表4 被引频次分布

2.6 计量单元。计量法的特征之一是对文献的特征进行分析,不同计量单元可以提供不同信息,在统计到的34个计量单元中,频次在1次以上的有19个,见表5。从论文计量单元的数量来看,在286篇论文中,计量单元不小于6个的有22篇(7.7%),在4个~6个间的有101篇(35.31%),在2个~3个间的有113篇(39.51%),但还有50篇论文只有1个计量单元,占了17.48%,这部分文章多为综述性文章与热点分析论文,前者很多仅对年度做了统计与分析,后者多运用自动化软件对关键词进行分析。从表5也可以看出,排名前7的计量单元基本上属于传统的统计分析,除了关键词,其余的计量单元大多属于引文分析。值得一提的是,表中的“栏目”是期刊栏目的计量单元,包括栏目的设置及各栏目的载文量等。频次为1次的计量单元主要有两方面,一是期刊,包括摘要、目录、封地排印等,二是网络引文,包括域名、访问性等。

表5 计量单元频次统计

3 论文主题分析

划分主题可以把握计量法在档案学中的运用现状,为后来的研究者提供参考价值。笔者参照《档案学基础》[5]的内容体系结构,将一级主题设置为档案本体、档案工作、档案事业与档案学科,但将电子文件、文献遗产、政府信息、知识管理四类较为新颖的主题单列出来,此外,由于期刊统计也是计量热点,将之独立出来。值得说明的是,论文在主题划分时可能存在主题交叉的情况,以“人事档案”为例,既可以归入不同类型的档案中,又可以归入档案工作中,根据主要内容而定,结果见表6。

表6 主题划分

3.1 期刊统计是计量法运用最早的主题。根据表6,关于期刊统计的论文有57篇,国内关于该主题的计量研究起步很早,早在20世纪八九十年代的32篇论文中,就有20篇是与该主题相关的。关于期刊统计主要有两个方面,一是对期刊在一段时间内的载文、引文进行计量,有6本期刊有2篇及以上这样的论文,并且基本上呈现分析时段不重叠且保持连续的特点。另外一个是对作者进行专门分析,分析活跃作者群与合著情况。

3.2 档案事业是计量法运用最弱的主题。论文数量只有23篇,是计量法运用最弱的领域,但年度均集中分布在2007年以后,特别是在2012年,就有10篇文章,几乎占了该主题论文数量的一半。从论文主题来看,有12篇与档案馆、文件中心等档案机构相关,但对企业档案馆及其他的计量研究还是空白,另外,在档案事业的人才培养上,关于档案职业与教育已有计量研究,但档案教育有3篇论文是从研究生的角度出发的。

3.3 档案学科是计量法运用最活跃的主题。在57篇论文中,有31篇论文分布在2011年~2013年间,其中,对档案研究现状的计量研究是最活跃的,占了26篇,该主题的研究思路比较统一,基本上采取词频统计、聚类分析、主题划分等方法或者直接利用可视化软件构建知识图谱等来对档案学的研究进展以及研究热点进行分析。但对国外档案学与关联学科的计量研究是薄弱环节,随着近年来跨学科研究的兴起,对关联学科的研究将是未来本领域内的一个计量热点。

3.4 档案种类与档案法规是计量法运用较多的二级主题。对不同类型档案的计量研究有26篇论文,涉及15种档案,该统计不考虑档案种类的划分标准,其中,声像档案、民族档案与人事档案数量最多。档案法规的计量研究有13篇,除了1篇在《档案学研究》中,其余的12篇均在《档案管理》上,从主题来看,关于档案法“操作性”有3篇,“软法”说2篇,其余的大多与执法相关。

4 思考

计量学在图书馆学中的运用已经很成熟,在情报学中又在不断地拓展加深,当前,在图书、情报、档案一体化与学科交叉发展的形势下,档案学通过对同族学科研究方法、研究理念的借鉴或移植,可以有力地推动本学科的发展。从图1可以看出,计量法在档案学研究中的运用有成为热点的迹象,已呈现出“运用范围广、研究主题多”的特点。计量研究能为研究者把握学科的发展现状,提供热点、冷门领域信息,为后来研究者的研究选择提供情报参考价值,这是计量论文高被引的原因之一。

但在相关论文急遽增长的形势下,也不乏学术研究的跟风现象,这应当引起学术研究者的注意与思考。当下的学术研究强调科学、实证与数据,而理论与逻辑基础均为实证主义的定量研究[6]很契合该理念,笔者认为这是计量法在档案学术领域中逐渐盛行的原因之一。但计量法的运用应建立在已有研究的基础之上,并不是所有的主题都适合进行计量分析,在运用计量法研究之前,至少应有三道论证程序,一是“Why”,即为什么要计量研究,主题是否适合运用计量法。二是“What”,即计量单元有哪些,计量分析的预期结果是什么。三是“How”,怎么运用计量法,现有的条件与能力是否能保证计量研究的科学性及学科代表性。这三道程序并不是孤立的,而是在前者的基础上反复地论证研究的科学性、合理性。而当前,计量法在档案学领域中的运用还存在着以下几个值得思考的地方:

第一,统计分析之外的研究方法运用少。计量学的方法体系众多,除了统计分析外,还有引文分析、聚类分析等,但档案学领域中运用最多的还是传统的统计分析。未来计量学的发展趋势之一是信息化,即计量单元将会深入到内部知识单元和相关信息中,而最简单的统计分析已无法满足该要求。[7]此外,图书馆学、情报学中的计量研究已较多地使用可视化软件、共词分析等自动化工具,学习运用这些工具可能会费时费力,这是聚类分析、词频分析等方法体系在本领域运用较少的原因之一,也是未来档案学研究者需要克服的困难之一。

第二,研究内容不关注理论贡献,停留在数据罗列的层面。科学的重要特征之一是客观,定量研究旨在通过数据描述客观事实,但正如砖头非房子一样,数据罗列也构不成理论,因而定量研究无法展现更为深层次的信息,但定性研究可以弥补这一缺陷,通过思辨、总结,挖掘出事物背后的深层次原因[8],这是理论贡献最重要的组成部分,但当前档案学内的计量研究在内容分析上有待加强。此外,如前所述,还存在计量单元少的问题,计量单元在3个以内的有163篇,占了56.99%,大多是年度、期刊与主题划分的组合。

第三,研究过程有趋于流程化、公式化的倾向,给人以只在验证某些已有结论的印象[9],文献计量学有很多定律,比如布拉德福定律、洛特卡定律、普赖斯定律等,这些定律均是前人在对大量文献研究的基础上发现的,时间长、样本多是其本质特征,但档案学中的计量分析却存在“数据少、时间跨度短”的现象,特别是期刊载文、引文分析,有的时间跨度仅为1年~2年,在此基础上基于文献计量学的定律所确定的核心作者、高被引论文,并不合理。

第四,研究主题上有避重就轻、趋易避难的迹象。从主题频次分布来看,数据获取渠道相对容易的中文期刊载文、引文分析与国内档案学研究进展、研究热点是计量法运用最活跃的领域,但是对于关联学科、国外档案学等不容易直接检索数据或渠道受限的研究则很少,这需要引起档案学领域内计量研究者的思考。

无可否认,定量研究对一个学科的发展完善是十分重要的,未来的档案学研究在运用计量法时,需要逐渐扩大计量样本与时间跨度,纳入更多的方法体系,同时端正学术研究行为,更多地关注有价值的计量主题,进而推动档案学科的发展。

参考文献:

[1]吴剑梅.从《全国报刊索引》看文献信息学科的发展[J].档案与建设,1988(05):13~16.

[2]冬牧.《四川近代史》档案引文分析[J].档案工作,1988(10):25.

[3]张恺.2001年~2010年我国档案学核心期刊综述类文献的计量分析[J]. 档案学通讯,2011(05):17~22.

[4]王新才,文振兴.我国档案法研究综述[J].档案学研究,2013(03):21~25.

[5]朱玉媛.档案学基础[M].武汉:武汉大学出版社,2008.

[6]沃野.关于社会科学定量、定性研究的三个相关问题[J].学术研究,2005(04):41~47.

[7]范全青,郭维真,凤元杰. 我国文献计量学研究30年之发展[J].情报资料工作,2009(03):30~33+60.

[8]李强.完善社会学的定性研究与定量研究[N].中国社会科学报,2009-10-08.

[9]马费成,H.R.西蒙. 文献计量学的现状与趋势[J].情报科学,1992(05):7~17+79.

(作者单位:武汉大学 来稿日期:2014-02-18)

第一,统计分析之外的研究方法运用少。计量学的方法体系众多,除了统计分析外,还有引文分析、聚类分析等,但档案学领域中运用最多的还是传统的统计分析。未来计量学的发展趋势之一是信息化,即计量单元将会深入到内部知识单元和相关信息中,而最简单的统计分析已无法满足该要求。[7]此外,图书馆学、情报学中的计量研究已较多地使用可视化软件、共词分析等自动化工具,学习运用这些工具可能会费时费力,这是聚类分析、词频分析等方法体系在本领域运用较少的原因之一,也是未来档案学研究者需要克服的困难之一。

第二,研究内容不关注理论贡献,停留在数据罗列的层面。科学的重要特征之一是客观,定量研究旨在通过数据描述客观事实,但正如砖头非房子一样,数据罗列也构不成理论,因而定量研究无法展现更为深层次的信息,但定性研究可以弥补这一缺陷,通过思辨、总结,挖掘出事物背后的深层次原因[8],这是理论贡献最重要的组成部分,但当前档案学内的计量研究在内容分析上有待加强。此外,如前所述,还存在计量单元少的问题,计量单元在3个以内的有163篇,占了56.99%,大多是年度、期刊与主题划分的组合。

第三,研究过程有趋于流程化、公式化的倾向,给人以只在验证某些已有结论的印象[9],文献计量学有很多定律,比如布拉德福定律、洛特卡定律、普赖斯定律等,这些定律均是前人在对大量文献研究的基础上发现的,时间长、样本多是其本质特征,但档案学中的计量分析却存在“数据少、时间跨度短”的现象,特别是期刊载文、引文分析,有的时间跨度仅为1年~2年,在此基础上基于文献计量学的定律所确定的核心作者、高被引论文,并不合理。

第四,研究主题上有避重就轻、趋易避难的迹象。从主题频次分布来看,数据获取渠道相对容易的中文期刊载文、引文分析与国内档案学研究进展、研究热点是计量法运用最活跃的领域,但是对于关联学科、国外档案学等不容易直接检索数据或渠道受限的研究则很少,这需要引起档案学领域内计量研究者的思考。

无可否认,定量研究对一个学科的发展完善是十分重要的,未来的档案学研究在运用计量法时,需要逐渐扩大计量样本与时间跨度,纳入更多的方法体系,同时端正学术研究行为,更多地关注有价值的计量主题,进而推动档案学科的发展。

参考文献:

[1]吴剑梅.从《全国报刊索引》看文献信息学科的发展[J].档案与建设,1988(05):13~16.

[2]冬牧.《四川近代史》档案引文分析[J].档案工作,1988(10):25.

[3]张恺.2001年~2010年我国档案学核心期刊综述类文献的计量分析[J]. 档案学通讯,2011(05):17~22.

[4]王新才,文振兴.我国档案法研究综述[J].档案学研究,2013(03):21~25.

[5]朱玉媛.档案学基础[M].武汉:武汉大学出版社,2008.

[6]沃野.关于社会科学定量、定性研究的三个相关问题[J].学术研究,2005(04):41~47.

[7]范全青,郭维真,凤元杰. 我国文献计量学研究30年之发展[J].情报资料工作,2009(03):30~33+60.

[8]李强.完善社会学的定性研究与定量研究[N].中国社会科学报,2009-10-08.

[9]马费成,H.R.西蒙. 文献计量学的现状与趋势[J].情报科学,1992(05):7~17+79.

(作者单位:武汉大学 来稿日期:2014-02-18)

第一,统计分析之外的研究方法运用少。计量学的方法体系众多,除了统计分析外,还有引文分析、聚类分析等,但档案学领域中运用最多的还是传统的统计分析。未来计量学的发展趋势之一是信息化,即计量单元将会深入到内部知识单元和相关信息中,而最简单的统计分析已无法满足该要求。[7]此外,图书馆学、情报学中的计量研究已较多地使用可视化软件、共词分析等自动化工具,学习运用这些工具可能会费时费力,这是聚类分析、词频分析等方法体系在本领域运用较少的原因之一,也是未来档案学研究者需要克服的困难之一。

第二,研究内容不关注理论贡献,停留在数据罗列的层面。科学的重要特征之一是客观,定量研究旨在通过数据描述客观事实,但正如砖头非房子一样,数据罗列也构不成理论,因而定量研究无法展现更为深层次的信息,但定性研究可以弥补这一缺陷,通过思辨、总结,挖掘出事物背后的深层次原因[8],这是理论贡献最重要的组成部分,但当前档案学内的计量研究在内容分析上有待加强。此外,如前所述,还存在计量单元少的问题,计量单元在3个以内的有163篇,占了56.99%,大多是年度、期刊与主题划分的组合。

第三,研究过程有趋于流程化、公式化的倾向,给人以只在验证某些已有结论的印象[9],文献计量学有很多定律,比如布拉德福定律、洛特卡定律、普赖斯定律等,这些定律均是前人在对大量文献研究的基础上发现的,时间长、样本多是其本质特征,但档案学中的计量分析却存在“数据少、时间跨度短”的现象,特别是期刊载文、引文分析,有的时间跨度仅为1年~2年,在此基础上基于文献计量学的定律所确定的核心作者、高被引论文,并不合理。

第四,研究主题上有避重就轻、趋易避难的迹象。从主题频次分布来看,数据获取渠道相对容易的中文期刊载文、引文分析与国内档案学研究进展、研究热点是计量法运用最活跃的领域,但是对于关联学科、国外档案学等不容易直接检索数据或渠道受限的研究则很少,这需要引起档案学领域内计量研究者的思考。

无可否认,定量研究对一个学科的发展完善是十分重要的,未来的档案学研究在运用计量法时,需要逐渐扩大计量样本与时间跨度,纳入更多的方法体系,同时端正学术研究行为,更多地关注有价值的计量主题,进而推动档案学科的发展。

参考文献:

[1]吴剑梅.从《全国报刊索引》看文献信息学科的发展[J].档案与建设,1988(05):13~16.

[2]冬牧.《四川近代史》档案引文分析[J].档案工作,1988(10):25.

[3]张恺.2001年~2010年我国档案学核心期刊综述类文献的计量分析[J]. 档案学通讯,2011(05):17~22.

[4]王新才,文振兴.我国档案法研究综述[J].档案学研究,2013(03):21~25.

[5]朱玉媛.档案学基础[M].武汉:武汉大学出版社,2008.

[6]沃野.关于社会科学定量、定性研究的三个相关问题[J].学术研究,2005(04):41~47.

[7]范全青,郭维真,凤元杰. 我国文献计量学研究30年之发展[J].情报资料工作,2009(03):30~33+60.

[8]李强.完善社会学的定性研究与定量研究[N].中国社会科学报,2009-10-08.

[9]马费成,H.R.西蒙. 文献计量学的现状与趋势[J].情报科学,1992(05):7~17+79.

(作者单位:武汉大学 来稿日期:2014-02-18)

猜你喜欢
计量法档案学
历史追溯与革新路径:中国档案学基础理论研究的特征阐释
中华人民共和国计量法
计量检测技术在质量技术监督工作中的探索实践
关于档案学会工作的几点思考
历史主义是档案学不变的灵魂和宗旨
——《魂系历史主义——西方档案学支柱理论发展研究》述评
农村环境治理的研究综述与发展态势分析——基于文献计量法
基于文献计量法的名师工作室研究统计分析
省档案学会六届二次常务理事会议在南京召开
计量法修订草案已报国务院
浅谈档案学的研究对象与任务