基于共词聚类的我国档案网站研究热点分析

2020-08-12 07:22薛卫双
图书馆学刊 2020年7期
关键词:信息服务建设

薛卫双

(山东管理学院图书馆,山东 济南250357)

自1998年北京市档案馆正式建立我国第一个档案网站以来,我国档案部门便开启了档案网站建设的热潮,利用档案网站这一平台对传统服务进行拓展和创新。经过20 余年的发展历程,我国档案网站数量已初具规模,网站建设水平逐渐提高,网站应用价值不断提升。与此同时,学术界就档案网站的应用和发展展开了深入研究并取得了众多研究成果。如钱澄等[1]对2000—2011 年档案网站研究论文的关键词进行了词频统计并构建了高频关键词共现网络图,通过节点中心性分析和多维尺度分析方法指出了档案网站的研究热点和不足。宣莲等[2]运用文献调研法对1996—2016 年我国档案网站研究的主要内容进行了总结和评析。为深入揭示当前我国档案网站领域的研究热点和发展态势,笔者试图采用共词分析法,借助SPSS 软件进行因子分析和聚类分析,并在此基础上梳理和解析档案网站的研究主题,为该领域未来的研究方向提供数据支撑和理论支持。

1 数据来源及研究方法

1.1 数据来源

为研究档案网站理论的热点和现状,笔者以CNKI期刊数据库中的核心期刊文献和CSSCI期刊文献为数据统计来源,时间不限,检索日期为2018年11月10日,并以“档案网站”为主题词进行精确检索,经人工排检,剔除征稿通知、论坛讲话等非学术性论文及不相关文献,共得到有效期刊论文393篇,以此作为我国档案网站研究的分析样本。

1.2 研究方法

笔者采用的主体研究方法为共词分析法。共词分析法是内容分析法的一种,主要原理是对一组词两两统计其在同一篇文献中出现的次数,以此为基础进行聚类分析,从而反映这些词之间的亲疏关系,进而分析这些词所代表的学科研究热点、主题结构变化和转移趋势[3]。笔者主要运用Bi⁃comb2.0 和Excel 软件,统计了我国档案网站研究文献的关键词并构建高频关键词共词、相关、相异矩阵,借助SPSS20.0 软件进行因子分析和聚类分析,然后划分聚类结果,确定不同的研究主题并进行解析。

2 数据处理

2.1 关键词提取

笔者使用书目共现系统Bicomb2.0 提取文献关键词并进行词频统计,经过数据清洗,合并和剔除意思相近或无实际意义的词,最终在393篇论文中共得到有效关键词1412个。将这些关键词按频次降序排序,确定频次≥5 的43 个高频关键词(如表1所示)。表1显示,我国档案网站研究围绕“档案网站”产生了“网站建设”“档案信息资源”“档案馆”“档案信息服务”“档案信息化”“资源整合”“网站设计”等一系列关键词,频次越高,说明对其的研究越深入。随着我国档案信息化建设工作的全面开展和推进,档案网站建设作为其中的重要内容逐渐成为档案界乃至社会各界关注的焦点。档案馆作为服务性机构,在信息服务、资源整合、网站设计等方面面临着巨大的考验,档案网站建设正推动着档案馆服务方式与手段的变革。

表1 我国档案网站研究论文高频关键词

2.2 高频关键词共词矩阵构建

虽然高频关键词的频次在一定程度上可以反映出档案网站领域的研究热点,但不能反映这些主题词之间的关系,也难以精确地概括该学科的研究热点领域,需采用共词分析法进一步挖掘关键词之间的关系。笔者使用Bicomb2.0 软件对我国档案网站研究的43 个高频关键词两两统计,构建43*43的关键词共词矩阵,如表2所示。共词矩阵为对称矩阵,对角线上的数值表示该关键词出现的总频次,如“网站建设”在393篇文献中共出现78 次,它与“档案信息资源”在同一篇文献中共同出现14次,与“档案馆”共同出现8次。

2.3 标准相关相异矩阵转化

为消除关键词频次悬殊造成的影响,笔者引入Ochiia 系数[4]将共词矩阵转化为相关矩阵,用以反映高频关键词之间的实质性关联程度。因相关矩阵中0 值较多,为进一步减小误差,更好地进行后续的因子分析和聚类分析,用“1”减去相关矩阵中的各数值得到高频关键词相异矩阵,如表3 所示。相异矩阵中的数值在0-1 之间,数值越小,表示两个关键词之间的距离越近,关联程度越强,反之其距离越远,关联程度越弱。

表2 我国档案网站研究论文高频关键词共词矩阵(部分)

表3 我国档案网站研究论文高频关键词相异矩阵(部分)

3 数据分析

3.1 因子分析

因子分析是研究从变量群中提取共性因子的统计技术,进行因子分析的目的就是用尽可能少的因子去描述众多指标或要素之间的联系,从而使相关问题研究更加深入透彻。笔者将相异矩阵导入到SPSS20.0软件中,利用主成分法、协方差矩阵和最大方差法进行因子分析,并在“输出”选项中选择“碎石图”,得到的碎石图如图1所示。根据因子分析理论,公共因子特征值>1 且因子解释贡献率必须达到全部信息的60%以上。结果表明有15 个因子被提取,其累积方差贡献率为72.179%。也就是说,将档案网站研究的43 个高频关键词划分为15 个类别,就可以解释该领域72.179%的信息。但15个类别过于分散,根据碎石图可知,前7个因子曲线较陡,因此从高频关键词中提取7个因子较为合适,为聚类分析提供依据。

图1 因子个数碎石图

3.2 聚类分析

聚类分析是按照距离的远近将众多数据划分为若干个类别,将距离较近的数据聚集起来,形成一个个概念相对独立的类团,使得类团内数据的差异尽可能小,不同类团间的差异尽可能大。将档案网站研究论文高频关键词相异矩阵导入SPSS20.0软件中进行系统聚类分析,类间距的计算方法选择组间联接法,变量距离的测度方法选择平方Euclid⁃ean 距离,标准化选择全距从0 到1,生成聚类树状图,如图2所示。图2将我国档案网站研究热点分为7类,分别为档案网站建设现状调查研究、高校档案网站建设研究、档案信息资源整合与组织、档案网站评价、档案网站设计与构建、档案网站技术与服务、国外优秀档案网站的分析与借鉴。

图2 我国档案网站研究论文高频关键词聚类结果树状图

4 档案网站研究热点分析

基于高频关键词的因子分析和聚类分析,并系统研读和分析我国档案网站研究领域的相关文献,笔者对7个热点研究主题进行详细解析。

4.1 档案网站建设现状调查研究

此热点由“对策、问题、现状、档案网站、网站建设、调研、中国”等关键词组成,主要从宏观和微观两个角度出发对档案网站的建设情况展开了全面调研,并取得了丰硕的研究成果,研究步骤大致为“现状调研—问题分析—对策建议”。宏观角度方面,学者对档案网站建设的整体状况进行调研分析。微观角度方面,学者对档案网站建设的某项功能、服务或栏目展开调研,内容主要涉及对档案网站的互动功能、在线服务功能、查阅功能、检索功能、信息公开服务、咨询服务、资源建设、信息化水平等的现状调查与分析。卫军朝对我国33个省级档案网站的基本信息、网站信息资源与服务、业务建设功能等方面进行了调研,发现存在网站信息更新慢、网站信息资源建设的数量和质量有待加强、网站功能有待完善等问题[5]。刘帅伟等在对上海市17 个区县档案网站建设的基本情况、内容信息、功能与服务等方面进行调研的基础上,针对存在的问题提出加强网站的标准化建设、加强网站信息资源建设、完善网站服务功能等相应对策[6]。学者们通过系统、周密、详实的调查分析,指出了档案网站建设过程中存在的诸多问题并提出可行性建议,为未来档案网站的建设与发展指明了方向。

4.2 高校档案网站建设研究

此热点由“档案”“高校”“档案馆”“档案信息化”等关键词组成。高校档案网站是高校师生了解档案工作、查阅档案信息、获取档案服务的重要平台,在高校档案信息化建设中发挥着重要作用。目前该主题研究主要集中于国内外高校档案网站建设的对比、我国高校档案网站建设的现状、网站建设中存在的问题及对策等方面。边文婧等从内容设置、检索工具、网站形式3 个方面对哈佛大学档案网站与北京大学档案网站进行了对比分析,发现我国高校档案网站建设与国外相比存在明显差距,提出从树立正确的功能定位、丰富网站信息容量、优化网站检索工具、增强与用户的交流功能等方面来加强我国高校档案网站建设[7]。张晓等从内容建设、建设技术、网站的管理与维护方面分析了高校档案网站建设存在的诸多问题,提出从加强网站内容建设、增强网站服务功能、建立高校档案网站评价指标体系等方面来促进高校档案网站建设的发展和完善[8]。

4.3 档案网站资源建设

此热点由“资源整合、综合档案馆、档案信息资源、网络环境、资源开发”等关键词组成,主要探讨了在网络环境、大数据、Web2.0等新环境与新技术背景下档案网站信息资源的整合和组织问题。吴建华等在明确档案网站信息资源范围的基础上对档案网站信息资源整合和组织的内涵进行了深入探讨,并将档案网站信息资源整合和组织与传统档案管理工作进行了比较分析,认为档案网站信息资源整合和组织是网络环境下传统档案管理工作的有机融合和发展[9-10]。王斌等提出了跨库整合方法、元数据库方法、实体仓库方法和信息抽取方法4种不同的档案网站信息资源整合方法,并对档案网站信息资源整合方案进行了设计[11]。金凡从面向信息资源、面向信息交流过程、面向信息用户3 个角度对档案网站资源整合模式展开了探讨[12]。从现有文献来看,该领域的研究成果不多,仅有十余篇文献,且我国档案网站在资源建设方面存在可用资源乏善可陈、资源深层开发不足等诸多问题,国内档案界学者应加强对档案网站资源建设的研究力度,从多个角度探讨如何推动网络环境下档案网站资源建设的发展。

4.4 档案网站评价

此热点由“网站评估、网站集群、评价体系”等关键词组成。对档案网站进行客观和科学的评价,可以全面了解档案部门在网站建设方面的优势和劣势,从而有针对性地提高我国档案网站建设水平。档案网站评价在理论方面主要涉及评价对象及主体、评价方法、评价指标及指标体系的构建等内容。傅荣校等从档案网站的宣传、服务和交流三大功能角度出发,构建了一套档案网站的三级评价指标体系[13]。陈玲霞等从感官体验、交互体验、情感体验、浏览体验和信任体验5 个维度构建了档案网站用户体验二级指标体系[14]。档案网站评价在实践方面主要是第三方评价机构或学者对省级档案网站、市级档案网站及地方档案网站的测评和分析。中国人民大学档案网站调查和测评项目组以我国省级档案网站为测评对象,于2007年、2011年和2015年分别对测评对象的资源服务、业务建设和网站设计方面的建设情况进行了综合测评。通过比较分析多期省级档案网站的测评结果发现,近年来我国省级档案网站的建设有了长足进步,在档案信息建设、功能设置、网站设计、用户满意度、网站的规范与维护等方面都有了明显提升。陈忠海等从内容建设、功能设置和规划设计3个维度对中原经济区部分地市的档案网站建设情况进行了评估与分析,结果显示,山西省的各省地市档案网站建设已达合格或基本合格水平[15]。除此之外,河南、云南等省参照“地市级档案网评估指标体系”对省内市级档案网站的发展情况进行了评估分析,发现问题并提出优化建议。

4.5 档案网站设计与构建

此热点由关键词“定位、功能、网站设计、网站内容、国家档案馆”等组成。根据档案网站建设的一般流程,可将该主题研究归纳为3 个研究热点:一是网站的定位与功能。档案网站建设首先应准确把握档案网站的定位及其拟发挥的功能。档案部门应根据政治、经济、文化等宏观环境和自身职能认真研究自己的网站定位,并根据网站运行状况及工作目标和重点的变化,对网站定位不断地加以改进和完善。档案网站的功能是在对网站定位的基础上提出的,一般应具备宣传功能、服务功能、教育功能和交流功能。二是网站的规划设计。学者通过对档案网站的建站方案、入网程序、组网模式、视觉设计、域名规范、内容建构、组织架构等内容的探讨来实现档案网站的构建。三是网站的管理与维护,主要涉及网站的维护与更新、宣传与推广、安全管理等内容。档案网站建立后,需要精心管理与维护才能为用户提供及时、有效的服务,从而树立网站的良好形象。

4.6 档案网站技术与服务

此热点由“高校档案馆”“档案编研”“服务”“资源建设”“Web2.0”“网站技术”“网站构建”等关键词组成。该主题包含两个研究热点,一是新技术与新理念引入档案网站建设的探讨与实践。随着网络技术的迅猛发展以及用户需求的不断提升,档案网站的发展遇到诸多挑战,如何利用新技术和新理念为广大用户提供个性化服务和更友好的交互方式成为网站建设过程中面临的重要问题。学者主要探讨了Web2.0技术与信息构建理论等新概念给档案网站建设带来的机遇和挑战。崔伟指出,Web2.0 技术在应用形式上会使档案网站页面更加丰富、服务功能更加多元,更重要的是,Web2.0 在实践中重视提高网路用户的使用意愿、参与意识和分享精神[16]。于淑丽将信息构建理论融入到档案网站建设中,运用该理论对我国档案网站的设计理念、导航系统、搜索系统、组织系统和标识系统进行了考察,结合档案网站存在的问题提出了信息构建理论对档案网站建设的启示[17]。二是档案信息服务研究。档案网站的开发与应用为档案部门信息服务提供了新的模式与手段,在推动档案部门服务创新的同时也引发了业界学者的广泛探讨,主要涉及服务质量、服务方式、服务策略、服务功能及服务模式构建等内容,这些研究有力地推动了档案部门信息服务向智能化、个性化方向发展。

4.7 国外优秀档案网站的分析与借鉴

此热点由“档案利用”“档案展览”“特色”“美国NARA 网站”“美国”“档案检索”“档案系统”等关键词组成。在我国档案网站建设的整体水平与欧美等发达国家相比有较大差距的背景下,通过分析国外优秀档案网站的特色与优势,可以为我国档案网站建设的实践提供参考和借鉴。祝洁对美国国家档案与文件署(NARA)网站信息服务的现状进行了考察和分析,发现其具有根据用户职业分组提供服务、以功能强大的在线数据库和丰富的资源为支撑、全面利用政府信息资源、强调用户参与等特点,对我国档案网站信息服务质量的提升具有重要的借鉴意义[18]。冯怡等从日本国立公文书馆网站的设计、内容、检索、互动功能和人性化服务等角度分析了该网站各方面的建设情况,提出我国档案网站建设可借鉴其“以人为本”的服务理念、丰富的数字化馆藏、强大的检索功能等宝贵经验[19]。张妍妍着重分析了澳大利亚国家档案馆(NAA)网站在档案著录和检索方面建设的优势。NAA网站采用多级著录的方式,分别制定出数据库结构、档案信息内容、档案结构形式等著录标准来推进档案著录工作的标准化进程,并提供基础检索、高级检索、人名检索、照片检索等多种检索途径来满足用户多方面的检索需求[20]。

5 结语

笔者以我国档案网站研究论文的高频关键词为数据基础,通过运用词频统计和共词分析等方法对该领域研究热点进行分析,发现我国档案网站研究集中于现状调查、高校档案网站建设、资源建设、网站评价、网站设计与构建、网站技术与服务、国外优秀档案网站的分析与借鉴7个方面。总体来说,我国档案网站研究存在如下问题:众多研究成果侧重于理论探讨,而对于网站开发建设的实践研究却很少;研究力度不均衡,研究集中于现状调查研究以及国外优秀档案网站的分析与借鉴等方面,而在高校档案网站建设、资源建设、网站评价、网站技术与服务等主题上研究内容不够深入和细化;研究视野局限,缺乏对档案网站建设过程中涉及的法律问题的研究;学科交叉研究较少。未来国内档案界学者应继续深化和扩展档案网站理论与实践研究,建立、健全档案网站管理与维护的长效机制,不断学习和借鉴其他国家或行业网站建设的先进经验,根据用户需求及实际需要不断完善我国的档案网站建设。

猜你喜欢
信息服务建设
自贸区建设再出发
服务在身边 健康每一天
服务在身边 健康每一天
服务在身边 健康每一天
基于IUV的4G承载网的模拟建设
《人大建设》伴我成长
保障房建设更快了
招行30年:从“满意服务”到“感动服务”
订阅信息
展会信息