占春莲+刘宇+杨智勇
摘 要:为了揭示我国档案学知识生产的范式转型,发掘档案学研究在新世纪前15年的阶段性特征,本研究采用词频分析和共词分析两种研究方法,选取档案学权威期刊《档案学通讯》为样本,以5年为时间切片对2000年~2014年的载文进行统计分析;研究发现我国档案学研究从侧重历史档案的保护和开发向数字档案的开放利用转变,整个档案学科的研究范式也在由人文历史范式向管理范式转变。
关键词: 档案学研究范式;人文历史范式;管理学范式;词频分析;共词分析
1 研究问题的提出
“我国古代档案学,是以历史主义思维,在史料学的基本预设下展开的,而当代档案学则是侧重信息资源管理的思维,在管理学的基本预设下展开的。”[1]新旧范式的分野,在我国档案学学科制度建设上有明显的体现,即我国档案学教学单位的机构归属存在两种基本模式:一是档案学归属于“信息资源管理”或“信息管理”相关院系,和图书馆学、情报学等相关学科进行整合,属于管理学范式;二是档案学归属于历史学院或文学院等相关院系,和历史学、文学等进行整合,沿袭人文历史主义范式。这两种范式的研究视角也有很大的不同:管理范式强调信息技术对档案工作的冲击和改造,构建以应用信息技术改造档案工作为主要内容的档案学研究;人文历史范式则坚持档案资料的历史凭证价值,构建基于档案信息内容整理和史料整理为主要内容的档案学研究。
随着档案工作信息化的不断深入,信息技术对档案学的研究内容和知识生产方式都产生了巨大的影响。卢小宾对国外档案学研究热点分析发现,档案学研究倾向于应用性,研究的热点主要集中在两类,一是档案材料的保护和修复,二是档案管理与文件管理。[2]这两类研究主题,都明显属于的技术驱动型的管理学范式主题。耿志杰对外国档案学研究主题的关联网络分析发现,“档案学与历史学颇有渊源,在档案信息化的潮流下,国外档案工作者并没有一味地追随潮流,仍然对‘历史相关主题进行了大量研究,另外诸如‘古文研究材料、‘文化遗产等研究主题的度值也较大”。[3]
新世纪以来,信息技术对国外档案界也产生了巨大的影响,以至于很多档案学研究人员形成一个大致的主观印象:随着传统档案工作的信息化不断推进,管理学范式的档案学研究日益强势,人文历史主义范式的档案学研究逐步式微。当代档案学的知识生产存在一个范式转换的现象。这种范式转换是否真实存在,或者我国档案学研究在多大程度上完成了这一范式转型,正是本文要验证和讨论的核心问题。本研究意义在于提供经验资料展示档案学研究的范式转换过程,可以更为清晰地展示信息技术对档案学研究的具体影响,以便更好展现档案学研究的未来趋势。
2 资料来源
《档案学通讯》(以后简称《通讯》)是由教育部主管、中国档案学会和中国人民大学联合主办的中央级权威学术期刊,是我国中文社会科学引文索引(CSSCI)来源期刊,《中文核心期刊要目总览》确定的档案学、档案事业类的首位核心期刊,是档案学界唯一一家“国家社科基金资助期刊”,堪称我国档案学领域最具权威的学术期刊。[4]因此,《通讯》是一个管窥我国档案学研究发展的代表性窗口。基于此,本文以2000年~2014年《通讯》15年的发文为分析对象,采用词频分析和共词分析挖掘档案学的研究热点和前沿,从宏观角度总结档案学研究在这15年间的演变。数据来源选择CNKI总库,检索文献来源为“档案学通讯”,精确匹配,发表时间为2000年1月1日至2014年12月31日。累计得到2608条记录,剔除通知等非研究性文献,共得到研究性文献2585篇,每年的发文量如图1所示。
由图可知,刊物的发文量呈现出比较明显的线性下降趋势,R平方的值为0.383。在刊物每期印张保持不变的情况下,发文量减少意味着单篇论文篇幅的上升。因此,可以在一定程度上推定,每篇论文拥有更多的空间对所研究的问题进行更为细致深入的论述,这也意味着论文的深度和水平都在不断地提高。
3 研究方法和工具
本文使用的主要数据分析方法是词频分析和共词分析,并通过可视化软件展示分析结果。词频分析法是利用能够揭示或表达文献核心内容的关键词或主题词在某一研究领域文献中出现的词频的高低来确定该领域研究热点和发展动向的文献计量方法。[5]在通常情况下,文章的关键词或主题词是文章核心内容以及作者学术观点、思想的高度概括;在某一领域一个时期的期刊发文中,某一关键词或者主题词反复高频出现,可以反映说明该关键词或主题词所表征的研究内容是研究热点。共词分析(Co-Word Analysis)是一种内容分析技术,主要是分析一对词两两在同一篇文献中出现的次数,以此为基础对这些词进行分层聚类,揭示出这些词之间的亲疏关系,进而分析它们所代表的学科和主题的结构变化。[6]
本文主要使用刘启元开发的文献题录信息统计分析工具(Statistical Analysis Tool for Informetrics,SATI)对题录数据进行提取,采用Excel、Nodexl等软件进行统计分析和可视化展示。为了体现出《通讯》在时间维度上的变化,本文将15年的数据分为三个5年度的切片,分别对2000年~2004年、2005年~2009年、2010年~2014年三个切片的文献外部特征进行比较分析,揭示15年来《通讯》的研究内容演变过程,以此管窥中国档案学研究在新世纪头15年发展历程。
4 基于词频分析的档案学研究热点演变
使用Sati的关键词提取统计输出功能,以5年为一个时间段将《通讯》2000年~2014年载文中出现的关键词进行提取,统计结果见表1。表1数据显示,三个时间段中,2000年~2004年的关键词数量和总词频数远远高于后两个时间段,2005年~2014年10年间的关键词数量和词频总体保持比较稳定的态势。这一方面可能是由于2000年~2004年档案学界对关键词的理解和界定不够成熟,关键词标引不准确所致;同时,也有可能是由于这5年是处在学科范式转型的突进期,多元研究范式并发活跃所致。
图2~4展示了15年间关键词的词频分布特征。由图可知,关键词的词频分布符合幂律分布,而且R平方的值都在0.8以上。2010年~2014年的R平方值达到0.9以上,这体现了《通讯》载文的关键标引越来越趋于成熟、稳定,也从一个侧面可以反映出档案学研究的内部一致性越来越高,新的学科范式可能正在形成。
表2以5年为时间段,分别列出三个时间段中词频排名前20的高频关键词。由于时间段不同,其绝对出现词频不具有可比性,但是我们可以通过关键词排序位置的改变,考察档案学研究关注焦点的细微变化。分析近15年的高频关键词不难发现,这些关键词基本上都属于管理学范式的档案学研究。“档案工作”“档案信息”“档案利用”“档案管理”“数字档案馆”“电子文件”等主题在三个时间段重复出现,一直保持着持续的研究热度,这些研究主题是档案学领域近15年的重点。但是,一部分关键词的排序位置有明显的升降波动。比如“档案工作”呈现出明显的持续下降趋势;而“电子文件”“数字档案馆”等关键词的位置明显持续上升。有些主题随着时间的推移逐步退出了人们的视线焦点,如在2000年~2004年时段出现的高频关键词“国家档案局”“国家档案馆”等;也有些主题的重要性开始被学者们关注。如2005年~2009年时段“电子政务”成为热点,这与政府上网工程的不断发展紧密相连(电子公文归档管理暂行办法),在之后的时段淡出了热点区域;2010年~2014年时段“社会记忆”“档案文化”等主题成为档案学界关注的焦点;2005年~2009年时段出现的“档案开放”问题,在2010年~2014年时段演变成“公共档案馆”这一主题。随着政府信息公开的推进和发展,有理由相信档案信息开放、公开将继续成为档案学者研究的重点。
总体看来,计算机与信息技术的发展,对传统以纸质为主要载体的档案工作产生了重大冲击和改造,电子文件、数字档案馆的建设等基于信息技术驱动的管理学范式的档案研究已经成为档案学知识生产的主流。档案信息化建设仍有很大的发展空间,因而可以认为档案信息化建设的相关主题仍将是档案学界今后或者很长的一个时期的研究热点。
5 基于共词分析的档案学研究热点演变
为了在类的层次上展现档案学研究的主题集中与分散程度,本文采用共词分析揭示关键词之间的内在关系,以便进一步揭示档案学研究主题的内在关联性和学科领域的中观结构。和词频分析的思路保持一致,根据图2~4三个时间段关键词的幂律分布,2000年~2004年的分布拐点是20,因此在共词分析时本文选择词频在25次以上的88个关键词构建88×88的共词矩阵;同理,得到2005年~2009年出现频次在6次以上的73个关键词构建73×73的共词矩阵,2010年~2014年出现频次在5次以上的81个关键词构建57×57的共词矩阵。由于档案学者在使用关键词时有一些不规范的现象,本文采用人工方式对关键词进行了清理,去除没有检索意义的关键词:“中国”“研究”“档案”“信息” “对策”“管理”“服务”“保护”“建设”“问题”“策略”“特点”“模式”“进馆”“中国档案”“学术研究”“理论与实践”;合并了一些关键词:将“档案数字化”和“数字化”合并为“数字化”,“档案专业”和“档案学专业”合并为“档案学专业”。经过清洗后,2000年~2004年时段保留了78个关键词,比原始矩阵少了10个关键词;2005年~2009年时段保留了56个关键词,比原始矩阵少了17个关键词;2010年~2014年时段保留了53个关键词,比原始矩阵少了4个关键词。由此可见,在2010年之前,档案学者给论文赋予关键词时不够规范,在2010年之后这种情况有了很大的改观。
用Nodexl软件导入共词矩阵,采用Wakita-Tsurumi算法对关键词进行聚类,三个时间段的聚类图见图5~7所示。图中节点的大小由该节点在网络中的中心度大小决定,中心度越大表明和该节点链接其他节点的书目越多;节点之间连线的粗细由两个节点之间的共现次数决定,共现次数越多,连线越粗。从整体聚类效果来看,2000年~2004年时段的高频关键词形成9个类簇,2005年~2009年时段、2010年~2014年时段都只形成7个类簇。这在一定程度上表明档案学的研究重点逐渐趋于集中,学科研究范式趋于稳定。
类簇G1三个时间段的变化趋势显示:由单纯的档案教育和简单的档案学基础理论研究逐渐转向融入国家和社会发展背景的档案文化和社会记忆研究;类簇G2三个时间段的变化趋势显示:由研究基础的档案馆自身进行档案信息开发利用转向研究通过建设数字档案馆、档案网站等网络手段进行档案信息资源开发利用;类簇G3三个时间段的变化趋势显示:由过去档案行政管理体制下的档案管理研究转向去行政化的档案理论与实践研究;类簇G4三个时间段的变化趋势显示:由档案信息管理转向档案知识管理和信息安全管理;类簇G5三个时间段的变化趋势显示:由档案职业工作研究转向档案教育工作和文化事业研究;类簇G6三个时间段的变化趋势显示:由侧重科技档案管理研究转向较为广泛的档案文化服务研究;类簇G7三个时间段的变化趋势显示:由侧重以历史档案为对象的档案保护研究转向以数字档案为对象的档案开放和安全研究。
总体看来,在国家文化事业建设、互联网技术以及信息技术的影响下,档案学研究对象正在从传统的纸质档案向现代的电子档案转变,研究内容正在从以保护和管理为主向开发和服务转变,研究范畴也在从侧重历史档案的保护和开发向数字档案的开放和利用转变,整个档案学科的研究范式也在由人文历史主义范式向信息管理范式转变。
6 结语
通过对《通讯》15年的载文进行词频分析和共词分析发现,管理学范式的档案学研究已经居于档案学研究的指导地位;虽然社会记忆、档案文化等研究主题属于人文历史范式的档案学研究,但是从整体上看该范式的研究居于学科研究的边缘地位。词频分析和共词分析是一种常用的有效揭示学科研究主题的结构和发展动向的研究方法,在各个学科中都有所使用,[7]但是这种分析方法却以损失词与词之间的关系信息为代价,[8]因此其分析结果不可能与所有情况完全吻合。除此之外,本文只采用了《通讯》一种期刊作为数据来源,样本空间还有进一步扩展的空间,待以后的研究中加以完善。
参考文献:
[1]丁华东,李珍.范式转换:档案学学术分期的新视点[J].浙江档案,2008(7):14~17.
[2]卢小宾,高欢.基于Web of Science的档案学研究热点分析[J].档案学通讯,2015(3):35~38.
[3]耿志杰,颜祥林,王婷婷.国外档案学研究主题的关联网络分析——基于LISA数据库[J].档案学通讯, 2012(1):68~72.
[4]王云庆,徐芳.从作者分析看我国档案学研究队伍的状况——基于2001-2010年《档案学通讯》论文的统计分析[J].档案学通讯,2011(4):19.
[5]马费成,张勤.国外知识管理研究热点——基于词频的统计分析[J].情报学报,2006,25(2):163~165.
[6]张红春,卓越.国内社会保障研究的知识图谱与热点主题——基于文献计量学共词分析的视角[J].公共管理学报,2011(8):111~121.
[7]梁立明,谢彩霞.词频分析法用于我国纳米科技研究动向分析[J].科学学研究,2003,21(2):138~142.
[8]万昊,谭宗颖,鲁晶晶,等.2001-2014年引文分析领域发展演化综述[J].图书情报工作,2015,59(6):120~136.
(作者单位:上海大学图书情报档案系 来稿日期:2015-10-08)