科技档案的研究演进与知识图谱

2023-10-18 12:53王雅琼
兰台内外 2023年26期
关键词:知识图谱

摘 要:科技档案作为珍贵的科学技术资源,在研究过程中呈现出了差异化特征。本文基于CiteSpace对该领域近三十年的发展脉络进行可视化呈现,重点从代表学者、关键词呈现、突现词分析以及其在歷时层面呈现出的变化进行探讨。结果发现,在1993年至1998年期间相关研究最密集,后逐渐趋于平稳;代表性学者影响力较大,但范围较小;突现词随时间变化呈现出鲜明的时代特征,1993年围绕“市场经济”研究较多,2016年后“大数据”“信息化”逐渐成为该领域研究的相关热点。

关键词:知识图谱;科学计量学;科学档案;演化路径

科技档案的研究经历了半个多世纪的发展,不同研究者从各自的知识体系和文化背景出发形成了不同的现实观照和理论关怀。该领域的研究者想获得对其整体知识图谱、演进脉络以及关键发展转折方面观察,存在较大的梳理难度。CiteSpace等计量工具的出现对研究者进行相关文献的可视化研究提供了可能。

CiteSpace是基于java语言开发的可视化软件,可通过特定算法将该领域在历时层面的演化路径和发展关键节点、研究热点变化整体呈现出来。目前,该软件存在一定局限,当相关课题研究内容不足时,其可视化呈现的数据比较片面,不利于做整体计量。但有关科技档案的发文历时较长,相关研究较多,本文选择该软件进行知识图谱演化具有可行性。

一、数据来源与参数设置

1.数据来源

本文以知网作为数据源,数据采集时间范围是从1993~2023年以“科技档案”作为主题检索,筛选“CSCI”“CSSCI”“CSCD”“SCI”“EI”等重要期刊共3789条。

2.参数设置

本文在使用CiteSpace进行知识图谱分析时,各参数阈值按以下标准进行(无特殊说明情况下):(1)导入文献数据库生成数据,研究时段在“时间分区”中选取1993至2023年(数据截至2023年6月10日);主题词来源默认全选,主题词类型中选取BurstTerms(突现词),用于观察不同时间段出现和被引频次快速变化的变量。

在选取节点上,软件共有7种抽取标准,本文节点抽取标准设置为“topN”,选择不同时间段内出现频次最高的N个节点为分析对象。

二、研究结果

1.代表性学者分析

科技档案领域的代表性学者起着推动学科发展的重要作用,作者共同被引用分析可作为测定某学科或领域关键性学者的重要标准。该指标具体指两个作者共同被文章引用的现象,可用于揭示科技档案领域的科学共同体。

本文将“YearsPerSlice”的切分值设为1,节点类型选取了“top30”,利用CiteSpace获得科技档案领域作者共被引用图谱。由图1可知,霍振礼、吴品才、宗培岭和吴建华等是作者发文中的关键节点,发文频次高,影响力较大。其中,节点外的连线代表与其关联数量,证明互引频繁,关系较紧密,如霍振礼、丁海斌和潘亚男。

霍振礼是科技档案领域研究成果丰富的代表性学者,他主要研究领域在三个方面:(1)科技档案的理论基础梳理。在前人研究的基础之上,进一步阐述区分科技档案的概念,并在实物档案、电子档案以及发展规律方面做了细致介绍。(2)对美国和中国档案事业进行了横向对比。具体从档案性和交流性方面进行工作探析。(3)基于工作经验对行业发展进行回顾与总结不足。

丁海斌侧重档案史的研究,研究领域主要集中于科技档案和中国古代史,从史料出发将科技档案的概况、发展进行了对比。尤其是在名称更迭中体现文化变迁,如“文书”“公文”到“文件”“档案”的生成演变。

潘亚男对科技档案在新时期的变化和先进技术保存方式研究较多,为科技档案发展提供了量化思维。在数据保存方面,他对数据化存储进行了细致介绍,具体包括磁光电混合存储、区块链等。在法律意识方面,他论述了科技档案中的知识产权保护。在科技档案的未来展望与发展方面,他从管理、变化、技术等领域对未来发展进行了研究。

2.关键词共现分析

关键词一定程度上体现了该领域发展的关键节点,在生成的网络中具体指将连接两个或两个以上聚类的节点。CiteSpace中的节点类型设置为“Term(关键词)”,节点选取标准设定为“TOP20”(见表1),学界关于科技档案的关注热点多偏向应用,出现频次在50以上的大多和档案工作相关,集中于单位、内容以及学科。其他高频词也包括强调科技档案工作的重要性及具体分类,如“技术档案”“保管期限”“档案人员”等。

通过对关键词聚类,本文将若干关键词通过机器聚类为10类,位于中心的为“文书档案”,其辐射的边最多,与“技术档案”“市场经济”“文件运动”紧密联系。由图2可见,科技与经济发展紧密相连。在1993年,科技档案相关研究中“市场经济”的出现频次突增,证明该领域相关研究与国家政策背景相关性高。与科技档案相关度极高的“文书档案”,一般是在科技档案发展较盛时期用于区分和划分具体范畴的关键词,也侧面证明了科技档案地位的提高,学界对其认识不断加深,对区分档案范畴中的各门类有了进一步发展,进而在单位档案整理过程中解决此类业务问题。

从时间分布上看,在CiteSpace中的“TimeSpan (时间范围)”分别设定为“1993~1995”“1995~2000”“2005~2010”“2010~2015”等6个区间,每个区间的“Years Per Slice”的值设定为1,节点类型设定为“Term (主题词)”,节点选取标准设定为“Top30”,运行软件获得相应时段主题词共现网络图谱。

3.突现词分析

突现词是指随时间变化,不同阶段以较高频次突然出现的研究热点。具体指“一组突现的动态概念和潜在的研究问题”,可以对研究前沿进行探测。本文选取了近30年的数据进行突现词分析。在CiteSpace中的“TimeSpan (时间范围)”为“1993~2023”,区间的“Years Per Slice”的值设定为1,节点类型设定为“Term (主题词)”,运行软件获得相应时段主题词。

结果发现,1993~1995年发文频次最高,科技档案相关研究达到高峰,突现词围绕“市场经济”“技术”“社会主义”以及档案的单位和分类标准等与国家政策发展紧密相关的内容,且逐渐从描述性介绍(专业、单位、学会)转向更具体的档案发展要求(人员、凭证),并且开始有较完整的文献综述,见图4.

1995~2013年期间,发文数量趋于平稳,开始重视该领域相关学者及法律意识,如“依法治档”“文件运动”等,尤其注意了对科技档案在意识形态方面重视程度的体现。从上一阶段的系统性介绍逐渐向思想领域的重视过渡,见图5。

在范围上体现了由点到面的扩散,在1995年前科技档案研究主要讨论范围集中在“北京”(见图4),而1995年后,科技档案相关研究开始出现“村级档案”,包含范围更广,也更加重视全国各地,尤其是基层的科技档案管理工作。其中,对“实物档案”和“照片档案”进行了具体研究,从广度和深度上将科技档案的重要性再提升了一个台阶。

2003~2013年科技档案的研究趋势趋于下滑,这个时期的相关研究集中于解决当前困境,从“方法”“高校”“管理”等方面进行了探讨和革新,尤其重视了高校的学科建设和人才培养。2013年后至今,有关科技档案的研究骤减,但在方法上进行了极大创新。2013年后的突现词主要集中为“大数据”“信息化”,深刻体现了国家在科技和技术领域的变革,对于科技档案的管理和存档不仅局限于现实,通过大数据和网络的收集整理,更大程度上保障档案管理工作顺利进行。近30年,关于科技档案突现词的变化直接体现出学界对该领域的研究趋势变化,当前对科技档案的研究重点又回归到“档案史”的研究当中。

三、结论与讨论

本文呈现了1993~2023年期间科技档案领域的研究热点及发展脉络,具体包括代表性学者、关键词的共现分析以及近三十年来突现词的历时变化,揭示了科技档案研究的兴衰和规律。目前,该领域研究主要集中在:第一,前期大量研究集中于概念辨析和梳理,对其分支和区别性定义进行厘清。同时,对于制度、内容和要求做了讨论;第二,中期在实践中总结经验,突出人才和教育的重要性,对于实践中存在的问题进行总结和改进;第三,当前研究热点集中于互联网时代的科技档案保存,具体运用信息化和大数据手段对数量庞大且实物易损的内容进行讨论。整体研究趋势呈抛物线状,20世纪90年代达到高峰,后续研究逐渐减少。但科技档案弥足轻重,尤其是在技术不断革新的当下,当前的文献研究还存在重视程度不足、研究学者较单一的情况。随着全球化进程不断深入,对不同国别的科技档案研究也大有可为。

参考文献:

[1]刘光阳.CiteSpace国内应用的传播轨迹——基于2006—2015年跨库数据的统计与可视化分析[J].图书情报知识,2017(02):60-74.

[2]刘 静,翟亚丽,朱 琳,张晓宇.我国科技期刊融合出版研究现状——基于CiteSpace的知識图谱分析[J].中国科技期刊研究,2019,30(05):487-493.

[3]赵丹群.基于CiteSpace的科学知识图谱绘制若干问题探讨[J].情报理论与实践,2012,35(10):56-58.

作者简介:王雅琼(1992—),女,汉族,山西长治人,本科,馆员,研究方向:科技档案管理学。

猜你喜欢
知识图谱
国内外智库研究态势知识图谱对比分析
国内信息素养研究的知识图谱分析
国内图书馆嵌入式服务研究主题分析
国内外政府信息公开研究的脉络、流派与趋势
基于知识图谱的产业集群创新绩效可视化分析
基于知识图谱的产业集群创新绩效可视化分析
基于知识图谱的智慧教育研究热点与趋势分析
国内酒店品牌管理研究进展的可视化分析
从《ET&S》与《电化教育研究》对比分析中管窥教育技术发展
专家知识图谱构建研究