我国高校图书馆科学数据服务研究进展、热点与展望∗

2024-01-03 12:05宁袁羽墨
高校图书馆工作 2023年4期
关键词:数据服务数据管理发文

●祁 宁袁羽墨

1.沈阳建筑大学图书馆,沈阳,110168

2.沈阳建筑大学计算机科学与工程学院,沈阳,110168

引言

科学数据是国家科技创新和经济社会发展的重要基础性战略资源[1],科学数据的收集整理、分析挖掘和共享利用已成为世界范围内学界和业界的研究热点。 随着大数据时代的到来和数据密集型科学环境的发展,世界范围内的科学数据总量不断激增,我国科学数据也呈现出“井喷式”增长。 高校图书馆作为支持科研创新和服务高层次人才培养的学术性机构,有必要结合科学数据环境,根据科研人员的需求提供精准化的科学数据服务。 2011 年,杨鹤林将美国高校图书馆的数据监护服务引入国内,率先开启了高校图书馆界对科学数据服务领域的关注和研究[2]。 2014 年复旦大学、北京大学和清华大学等9 所高校图书馆共同成立了“中国高校研究数据管理推进工作组”,合力推进国内高校研究数据管理事业发展[3]。 2014—2022 年各成员馆以自身的发展重点和优势为突破点,开展不同方向的研究和实践工作,目的是共同推动研究数据的政策制定与实施,提升馆员与科研人员的数据素养,推进研究数据的收集与存储、重用与共享,并为高校图书馆研究数据的管理和建设提供参考方案。

目前,国内针对高校图书馆科学数据服务领域的综述类论文仅10 余篇,分为国内和国外两个方向。 第一,国外高校图书馆科学数据服务的综述研究。 肖潇等[4]从未来规划、角色定位、技术与合作、科学数据素养教育4 个方面,对国外图书馆的科学数据服务进行归纳总结;杨文建等[5]对国外高校图书馆开展的科学数据管理服务进行梳理,对比国内在该领域存在的不足,在服务环境、合作交流、服务需求、人才培养和素养教育方面为我国提出参考建议;夏琬钧等[6]从国外区域性实践调查入手,对高校图书馆科学数据服务的进展进行总结,为我国高校图书馆科学数据服务实践提供借鉴;蔡韶莹[7]从理论、政策和实践3 个方面对国外高校图书馆科学数据服务进行梳理,并从政策监管、创新模式、馆员角色、服务平台4 方面提出启示;严珊[8]对国外高校图书馆科学数据素养教育进行综述研究,从培养科学数据人才、丰富教育模式、完善法律体系3 方面为我国提供启示。 总体来看,国内学者对国外该领域综述性的研究多集中于基础理论、发展政策、建设策略、实践启示等方面的梳理和总结,缺乏研究趋势预测。 第二,国内高校图书馆科学数据服务的综述研究。 陈媛媛等[9]从理论、实践、政策和教育等角度对国内外高校图书馆科学数据服务研究的总体情况进行了梳理;李金建[10]对高校图书馆科学数据服务研究现状进行了分析,但文献计量分析不够深入;陈晋[11]从统计分析视角,对我国科学数据管理服务进行现状分析和主题归纳,但缺少知识图谱的展现;刘敏[12]对我国图书馆科学数据素养研究态势和特点进行分析,包括发表期刊、基金和词频等,但没有对核心研究作者、团队和机构进行分析;陈薇[13]对我国图书馆科学数据管理研究现状进行了梳理和述评,但没有知识图谱分析。 总体来看,针对国内该领域的综述性研究或是系统性文献梳理,或是对态势与特点进行的简单计量分析,缺少文献计量方法与知识图谱相结合的可视化研究与分析。

为了全面、系统掌握我国高校图书馆科学数据服务的发展脉络、研究热点及趋势预测,本文结合文献计量学方法,综合应用CiteSpace、SPSS、Excel 等软件进行文献可视化分析,为相关领域的研究与实践提供参考借鉴。

1 数据来源与研究方法

以中国知网(CNKI)为检索数据库,构建“SU%=(‘科研数据’+‘科学数据’+‘科技数据’)∗服务AND SU %=(‘高校图书馆’+‘大学图书馆’)”检索式进行专业检索,检索日期截至2022 年12 月31日,共获得816 篇文献。 经过人工筛选,剔除无关文献后,最终获得相关文献522 篇。 本文结合文献计量方法,采用Excel 和SPSS 软件对相关文献的发文量、核心研究作者、核心研究团队、核心研究机构等进行文献计量分析;并将CiteSpace6.1.R6 软件作为可视化分析工具,对相关领域的研究进展、热点演化、主题分布及未来趋势进行可视化知识图谱分析。

2 我国高校图书馆科学数据服务研究进展

2.1 发文量分析

年度发文趋势可以用来判断研究领域在某一时间段的发展现状与研究历程,对明晰高校图书馆科学数据服务领域的概况具有辅助作用。 根据相关文献的年发文量与年累计发文量,本文运用Excel 制作了我国高校图书馆科学数据服务领域发文趋势及拟合曲线图,如图1 所示。 年发文量曲线显示,相关领域的研究文献最早发表于2011 年,前3 年年均发文量不超过10 篇,2011—2013 年的总体发文量偏少、增长缓慢。 从2014 年开始,发文量快速增长。此外,国务院在2015 年和2018 年分别发布了《促进大数据发展行动纲要》与《科学数据管理办法》,进一步促进了科学数据的规范管理与开发利用,并且使科学数据逐步上升为支撑国家科技创新和社会经济发展的战略资源,相关研究开始趋于稳定发展。

图1 我国高校图书馆科学数据服务领域发文趋势及拟合曲线

从图1 可以看出,年累计发文量曲线的走势较为稳定,其数值呈现规律性变化,形成的曲线可以用函数或参数方程进行表示,因此可参照规律曲线的变化进行发展预测。 本文以发文年份和年累计发文量建立数据关系,采用SPSS 回归分析中的二次函数进行曲线拟合[14],来预测我国高校图书馆科学数据服务领域的未来发文走势。 图1 中的虚线即拟合曲线,R2=0.990 8,拟合效果较为理想,同时得到我国高校图书馆科学数据服务研究领域文献增长的预测模型,拟合方程为:F(t)= 3.072 7t2+12.073t-34.659,其中F(t)为年累计发文量,t为发文年份,如表1 所示。 根据虚线的走势,本文预测我国高校图书馆科学数据服务领域的研究总量还将在虚线附近稳定出现,虚线也表明未来几年的相关研究仍然呈现增长趋势。

表1 我国高校图书馆科学数据服务领域二次函数拟合曲线汇总

2.2 核心研究作者分析

筛选出的522 篇文献,共计有720 位作者,其中张群以11 篇的发文量排名第一。 根据普赖斯定律,首先,确定核心研究作者最低发文量的公式,即M=0.749,其中M为论文数量,Nmax为所统计作者的最大发文量。 将该领域作者的最大发文量11代入公式可得,M≈3.317,因此发文量在4 篇及以上的作者可以被列为该领域的核心研究作者候选人。 其次,被引频次是确定核心研究作者的另一重要因素,由普赖斯定律得出最低被引频次的公式,即Mc=0.749,其中Mc为核心作者累积最低被引频次,Ncmax代表该领域内单篇论文被引频次最高值。 经检索,孟祥保和李爱国发表的《国外高校图书馆科学数据素养教育研究》一文,被引频次达到219次,代入公式可得Mc≈11.08,说明发文累积最低被引频次达到11 次及以上也可被列为核心作者候选人。 经统计,满足上述两项指标的作者共有16 人。

最后,运用综合指数评价法对核心研究作者进行准确判断,先确定与评价对象有关的重要指标,再计算指标数值,并将其转换为指数、确定指标权重,然后再设定阈值并计算综合指数。 本文结合专家访谈法对评价该领域核心研究作者的重要指标及指标权重进行调查,最后得到4 个评价指标,分别为相关领域发文总量(A)、相关领域论文总被引频次(B)、第一作者身份相关领域发文量(C)、作者相关领域的H 指数(D)[15],其权重分别为30%、30%、20%、20%。 根据普赖斯定律对发文量和被引频次进行限定,即需同时满足“A≥4,B≥11,C>0,D>0”4 个条件的作者才能成为核心研究作者候选人。 根据上述统计得到符合条件的16 位核心研究作者候选人,核心研究作者综合指数Wi的计算公式为:

i=1,2,3,4,…,16

经计算,核心研究作者候选人各项指标的平均指数为:A均=5. 63,B均=173. 13,C均=3. 69,D均=3.81。 将各项指标的平均指数代入公式后得到Wi=100,将此数值认定为核心研究作者的阈值,阈值大于100 的候选人可被认定为该领域的核心研究作者,按照综合指数进行降序排序,得到表2。

表2 作者综合指数统计

经综合指数计算,国内该领域共产生10 位核心研究作者。 首先,孟祥保在发文量和被引频次方面均排名靠前,尤其是被引频次远超于其他研究者,其综合指数排名最高;张群在该领域的发文量排在首位,超半数文章为第一作者,说明其对该领域研究的贡献度较高。 两位作者的综合指数均超过平均值两倍,说明其是我国高校图书馆科学数据服务研究的领军作者,其发表的论文具有极高的参考价值。 其次,胡卉、吴鸣、杨鹤林、刘桂锋和沈婷婷5 位作者的发文量和被引频次较高,说明其研究成果能够充分反映该领域内的前沿水平,具有一定的代表性,能够帮助研究者快速明晰该领域的研究内容和总体发展方向。 最后,邓李君、陈媛媛和叶兰发文量较少,但叶兰的论文被引频次较高,3 位作者在该领域的不同方向上进行深层次的研究,为该研究领域向纵深方向发展起到推动作用。

2.3 核心研究团队分析

通过CiteSpace 进行作者合著情况的可视化分析,生成作者合著共现图谱。 图谱中的节点代表作者,节点面积与作者的发文量呈正相关,节点之间的连线表示二者之间存在合作关系,如图2 所示。

图2 作者合著共现关系

图2 显示共有4 个合著团体,首先是孟祥保、叶兰、常娥团队,其研究成果主要聚焦于高校图书馆科学数据联盟建设与数据素养培养方面,属于跨校合作团体;其次是刘桂锋、卢章平和刘琼团队,其主要研究方向为国内外研究数据管理与治理、数据管护等,属于校内合作团体;再次是吴鸣、胡卉和陈秀娟团队,其属于导师与学生合作的关系,主要研究方向为数据素养教育、图书馆科学数据服务等;最后是崔海媛、罗鹏程、李国俊和朱玲团队,其主要研究开放数据平台和图书馆研究数据管理,研究领域较为专一,属于部门内部合作团体。 以上4 个团队合著发文量相对较多,合著较为紧密,说明其已初步形成较为稳定的作者合著团体。 此外,图2 的网络密度为0.003 7,表明作者之间的合作关系较为松散,单一作者仍占据主要地位。 这也说明作者之间的合作意识不够强烈,还应不断加强学术交流与合作,以此拓宽我国高校图书馆科学数据服务领域的研究深度和广度。

2.4 核心研究机构分析

核心研究机构因在某些研究领域中具有人才支撑、资源保障和技术护航等多重优势,其相关的科研成果更具竞争力和影响力。 本文利用综合指数评价法进行核心研究机构判定,设计两个评选指标,分别是机构发文总量(X)、论文总被引频次(Y),因X和Y之间存在较强的正相关关系,因此将二者权重均设置为50%[14]。 根据普赖斯定律对核心研究机构进行限定,公式为Mi=0.749,其中Mi为核心机构数量,Nimax是机构最高发文量。 经统计,中国科学院文献情报中心与中国科学院大学是我国高校图书馆科学数据服务领域发文量最高的机构,发文量为16 篇,代入公式可得Mi≈2.996,即发文量在3 篇以上的机构可以作为核心候选机构,共有35个机构入选。 因此,核心研究机构综合指数Zi的计算公式为:

i=1,2,3,…,35

经计算,核心研究机构各项指标的平均指数为:X均=5.14,Y均=121,将各项指标的平均指数代入公式后得到Zi值为100,该数值即可被认定为判定核心研究机构的阈值,根据综合指数进行排序,得到表3。

表3 研究机构综合指数统计

根据表3 的结果,可以得到该领域共有12 个核心研究机构。 高校图书馆有7 所,占核心研究机构的大部分。 其中东南大学图书馆位列首位,其发文被引频次在平均值的5 倍以上,说明该机构的研究成果受到学者最多的关注,在该领域具有较高的影响力和权威性。 另外,黑龙江大学信息管理学院的综合指数在非核心研究机构中排列最高,与平均值的差距较小,表明该机构若在此领域继续深入研究,提高科研效率与产出质量,将会在不久后跃升至核心研究机构行列。

再利用CiteSpace 对我国高校图书馆科学数据服务领域研究机构进行可视化分析,生成该领域研究机构共现网络知识图谱,见图3。

图3 研究机构共现网络

结合研究机构共现知识图谱,可以看出共有4个研究机构合作网络,均是由核心研究机构带领形成的合作网络:一是由中国科学院文献情报中心、中国科学院大学、中国科学院成都文献情报中心、中国科学院计算机网络信息中心等形成的研究机构合作网络,其中中国科学院文献情报中心和中国科学院大学在核心研究机构中发文量最多;二是由上海大学图书馆、上海大学图书情报档案系、武汉大学信息管理学院形成的研究机构合作网络,在核心研究机构中发文量紧随其后;三是由东南大学图书馆、中山大学图书馆和中山大学信息管理学院形成的研究机构合作网络;四是由北京大学图书馆、北京大学信息管理系与中国科学技术信息研究所形成的研究机构合作网络。 核心研究机构带领下合作网络的形成,说明高校图书馆之间、高校图书情报专业相关学院之间,以及高校图书馆与图书情报专业相关学院之间的合作研究,有利于推动该领域理论与实践相结合,促进研究方向的多元化发展,其产生的成果也对高校图书馆的科学数据服务具有参考价值。

3 我国高校图书馆科学数据服务研究热点

基于上述分析,本文对我国高校图书馆科学数据服务领域的研究热点、演化过程和主题分布进行探讨。 关键词是对论文主题与核心内容的高度概括与总结,通过对关键词进行可视化分析,能够快速了解某研究领域在不同时期的研究热点、研究视角和研究变化。 因此,本文利用CiteSpace6.1.R6 软件生成关键词共现图谱和关键词突现图谱,分析该领域的研究热点和变化;同时生成关键词时间线图谱和关键词聚类图谱,分析该领域研究主题的演化和趋势。

3.1 研究热点

通过关键词共现分析,我们能够掌握某领域的研究热点。 如图4 所示,每个节点均代表一个关键词,节点大小与关键词的频次有关,频次越高节点越大,节点之间的连线代表两个关键词曾在同一篇文章中出现。 关键词的中介中心性代表其在共现图谱中的关键程度及与其他节点之间的相关性,一般认为中介中心性≥0.1 的节点在图谱中的位置相对重要,说明该关键词在本研究领域中的代表性较强。科学数据(91 次,0. 3)、科研数据(72 次,0. 21)和图书馆(56 次,0.3)是图4 中或频次最高,或中介中心性最大的3 个节点,表明其是该领域研究的核心关键词。 数据管理(52 次,0.13)、数据素养(42 次,0.2)、数据服务(38 次,0.11)和大数据(29 次,0.11)是图4 中频次较高、中介中心性>0.1 的4 个节点,表明其是该领域的主要研究热点,体现了该领域的主要研究方向。 而数据馆员(24 次,0.09)、数据监护(21次,0.06)和学科服务(17 次,0.06)虽然频次相对较低、中介中心性<0.1,但其也是该领域内的重要研究热点,与该领域研究的发展方向密切相关。

图4 关键词共现网络

突现词分析能够将研究领域某一时段的高频关键词突显出来,我们以此辨识研究趋势和前沿动态。如图5 所示,2011 年“数据监护”概念被引入国内高校图书馆领域,热度持续了近4 年;2012 年E-science 环境下的数据长久保存与整合加工受到广泛关注,推动了高校图书馆对数据监护服务的发展,“数据监管”成为最强的突现词,热度持续时间超过4 年。 此后,“开放获取”“学科馆员”“服务”等关键词在2014—2016 年相继突现,说明E-research 理念推动数据资源的高效整合与开放共享,高校科学数据的开放获取助推了图书馆学科服务与数据服务的融合发展。 “开放数据”“科研支持”“服务体系”“数字学术”等关键词在2017 年突现,突出了科学数据服务内容的广泛发展与交叉融合。 “启示”一词在2018 年突现,热度持续4 年,说明国内外高校图书馆科学数据服务发展的启示受到学者的广泛关注。 “数据服务”和“数据馆员”出现较早,但到了2019 年和2020 年才开始被学术界重点关注并持续至今,说明高校图书馆数据服务与数据馆员是近年来发展和研究的重点。

图5 关键词突现

3.2 热点演化

笔者利用CiteSpace 软件中的Timeview 模块绘制关键词时间线图谱,将时间跨度设为2011—2022年,得到关键词演进时间线图,该图谱可以直观地展示该领域研究主题的变化情况和发展趋势。 根据图6,可以将我国高校图书馆科学数据服务的研究历程划分为3 个阶段。

图6 关键词演进时间线

第一阶段为我国高校图书馆科学数据服务的起步期(2011—2014 年)。 这一阶段我国高校图书馆科学数据服务研究的发文数量由少至多,呈现上升趋势,同时时间线图谱中涉及的关键词逐步增多,关键词和聚类开始发生初步演化,研究方向由图书馆、科学数据、数据监管研究发展到数据馆员、数据管理和数据服务等的研究。 相关文献主要是围绕数据监管、数据馆员、数据管理的基本概念,国内高校图书馆科学数据服务的存在问题及其带来的启示等主题内容进行研究和论述,为后续研究奠定了坚实基础。

第二阶段为我国高校图书馆科学数据服务的上升期(2015—2020 年)。 这一阶段我国高校图书馆科学数据服务相关的发文量较前一阶段有大幅上涨,涉及的关键词和聚类数量增多,同时该阶段呈多元化特点,涉及的主要关键词包括数据素养、学科馆员、开放数据、人才培养、开放科学和科研支持等。这表明我国科学数据服务的发展与高校图书馆的基础保障、资源建设、人才队伍、服务模式等密切相关,该阶段的研究对后续发展起到引领作用。

第三阶段为我国高校图书馆科学数据服务的深化期(2021—2022 年)。 这一阶段我国高校图书馆科学数据服务研究的发文量较上一阶段有所下降,但在前期研究的基础上,该阶段的研究成果在研究内容和范式上发生新变化,如区块链、智慧环境等新技术手段的应用和实证研究、框架体系等新研究范式的涌现。 同时,数字技术的快速发展与应用推动了我国高校图书馆科学数据服务的发展,拓展了其研究范围,未来可能引发更多学者进行相关主题的研究。

3.3 主题分布

在对关键词共现的基础上,笔者运用LLR 计算方法进行关键词聚类,共得到11 个聚类模块,其中聚类模块值Modularity Q =0.872,聚类平均轮廓值Silhouette S =0.973 7,结果显示聚类结构显著、聚类结果可靠。 研究共得到:数据素养、数据馆员、信息服务、高校、数据分析、数据管理、科研数据、科研支持、数据共享、服务、数据服务11 个聚类结果,如图7 所示。

图7 关键词聚类图谱

为了进一步梳理我国高校图书馆科学数据服务领域的热点研究主题,将聚类结果按照高校图书馆的管理、服务、教育、保障等职能归纳为4 个大类,即科学数据周期管理、科学数据服务模式、科学数据素养教育和科学数据基础保障。

3.3.1 科学数据周期管理

高校图书馆的管理功能可分为科学研究数据的收集与整理、保存与共享、数据监护3 方面。 相关研究深入探讨科学数据管理的各个阶段,对科学数据收集的发展特征[16]、科学数据共享的功能作用[17]、科学数据开放共享服务模式[18]与科学数据监护的监管模式[19]、实施要素[20]、模型设计[21]等方面展开深入研究,丰富了我国高校图书馆科学数据周期管理的实施流程与具体运作的实践经验,对加快科学数据平台建设具有重要的推动作用。 高校图书馆对科学数据进行系统化、规范化的周期性管理,能够为高校科学数据的存储与管理提供便利,同时也为推动国家实施数字强国战略与科技创新发展提供数据保障。

3.3.2 科学数据服务模式

国内多位学者通过借鉴国外高校图书馆科学数据服务的先进经验,构建本土化的科学数据服务模式,或从用户需求、政策支撑和人员配置等方面构建嵌入科研过程的科学数据管理服务模式[22],或结合本馆科学数据服务进行理论验证,搭建基于流程端、服务端和支持端的本土化服务模式[23],为国内高校图书馆提供服务模式参考。 此外,还有学者借鉴国外的实践经验,从科学数据的咨询型服务和技术型服务两方面提出服务策略。 咨询型服务以科学数据的管理计划、发现和引用、存储和共享、保护与培训等多方面的咨询为主,或基于信息生态学理论为高校图书馆构建数据管理计划服务框架体系[24],或从合作方式、管理技能、服务内容、管理培训等角度提出咨询服务策略[25]。 技术型服务包括科学数据的应用与推广,从数据的标识、更新、创建及元数据更改等技术支持[26]到区块链技术保障科学数据的安全性、可靠性和稳定性,并辅助构建贯穿科研周期的科学数据管理系统[27]。

3.3.3 科学数据素养教育

科学数据素养教育是高校图书馆教育职能的重要体现,其相关理论的研究主要从数据意识、知识和技能、数据分析和处理3 个层次来归纳总结科学数据素养的概念[28]。 经过进一步细化,有学者提出数据素养是数据行为主体在满足社会伦理和道德伦理的基础上,能够辩证、科学、正确地认识、操作和管理数据,进而有效利用数据并发挥其最大价值[29],该定义扩展了科学数据素养的内涵与外延。 对于科学数据素养教育相关教学模式的探索,有学者从教学主体、教育阶段、教学动因、教学内容和实施方式等方面构建了高校图书馆科学数据素养教育体系“5W”模型[30]。 而对于科学数据素养教育相关教学实践的发展,有学者从教育内容与模式、教育主体的关注点和参与维度等方面提出科研人员的数据素养教育中的关键问题[31];有学者从基本能力、应用能力和意识形态3 个层面搭建图书馆员科学数据素养能力的框架[32];也有学者以双生命周期为理论视角,构建了研究生数据素养评价体系[33]。 科学数据素养教育以科研人员、图书馆员和研究生群体为对象,丰富了教学内容与实践形式。

目前,我国正处于实施创新驱动发展和建设科技强国的关键时期,为保障战略的稳步推进,高校图书馆的科学数据素养教育应进一步提质提量,努力协调各利益主体,实现从理论研究到模式探索再到教学实践的高质量飞跃。

3.3.4 科学数据基础保障

高校图书馆以各级政策为导向,以数据馆员的专业能力为支撑,构成科学数据服务的基础保障。相关研究从国家政策层面和高校政策层面出发,探讨中美两国科学数据政策的侧重点[34],建议参照荷兰高校图书馆的科学数据管理政策,实施“校+院”两级分级管理的政策模式[35],弥补我国在科学数据政策指导方面的时间落差。 国内外高校图书馆科学数据的比较分析和国外高校图书馆科学数据管理的参照研究也逐渐成为我国高校图书馆科学数据服务领域的研究热点。

此外,围绕数据馆员专业支撑的研究主要是从馆员素养提升的多重要素出发,对数据馆员的角色定位和发展特点[36-37]、岗位职责划分与服务内容[38-39]、技能体系与素质能力[40-41]等展开深入探讨。 基于数据馆员多维度的支撑研究,更有利于我国高校图书馆形成明确角色定位、规范岗位职责、协同能力建设三方联动的基础能力保障体系。

4 我国高校图书馆科学数据服务研究展望

随着数字化社会的发展,政府机构、高等院校、图书馆、数据出版商、数据用户和行业协会等科学数据生产、保存和使用的不同利益主体之间相互关联、相互影响,高校图书馆需要在科学数据服务中明确角色定位、参与环节、参与方式和建设重点。 为进一步加快高校图书馆科学数据服务的创新发展,本文从以下5 个层面提出建设重点与研究展望。

4.1 以国家政策为导向:推动科学数据管理精细化

2018 年国务院印发《科学数据管理办法》,从国家层面加强和规范科学数据管理制度,对科研院所、高等院校和企业等责任主体提出新要求,明确提出要健全管理制度、科学收集整理和保存数据、保障数据安全、推进数据共享服务[42]。 高校图书馆应积极开展规范合理的科学数据监护服务,有效辅助科研人员进行科学数据的周期性管理,提高科学数据的利用效能。 未来可重点对数据监护各个环节进行细化研究,专注于数据的采集、存储、处理、共享和销毁等各环节的实施标准与政策研究,也可从个人隐私数据的流程化管理与安全监管角度进行相关研究。同时,随着国家《“十四五”数字经济发展规划》的推进,数据要素成为数字经济的发展核心,高校图书馆也可积极发挥数据赋能作用,助力国家经济社会的数字化发展。

4.2 以高校发展为前提:促进科学数据开放与共享

2019 年中国科学院发布《中国科学院科学数据管理与开放共享办法(试行)》,在科学院层面强化科学数据管理与开放共享服务,推进了科学数据的可持续发展[43]。 我国在科学数据开放共享方面仍处于起步阶段,未来可与高校优势学科发展相结合,充分发挥高校科学数据的规模和场景优势,开放机构知识平台,不断推动跨学科的融合发展。 我国应从不同利益相关者视角出发,开展数据开放政策、数据交流安全审查机制、评价机制、激励机制等的深入研究。 同时,还需融入先进的数字技术和智能技术,包括元宇宙、区块链、大数据、人工智能等,拓宽科学数据开放共享在创新与实践方面的广度和深度。

4.3 以支撑科研为目的:构筑科学数据服务新路径

美国大学与研究型图书馆协会发布的《2020 年学术图书馆发展趋势》提出大学与研究型图书馆科研数据服务应积极应对伦理问题[44]。 2021 年中国高校研究数据管理推进工作组会议召开,强调高校图书馆应注重科学数据素养培训与科学数据管理,这说明科学数据管理与服务实践将成为未来高校图书馆发展的重要内容和新增长点[45]。 面向未来,我国要加快创新科学数据服务实践的体系建设,联合利益相关主体,由图书馆、数据中心、科研机构、学术出版机构等机构联合探索构建差异化服务模式。 此外,还应借鉴国外高校图书馆科学数据服务的内容框架,依据服务对象特征设计层级化服务体系。 例如,面向本科生开展数据意识与实践能力培养;面向研究生开展科学数据需求调研、能力评价体系构建和影响因素分析;面向科研人员提供科技政策、科学数据知识产权与科研诚信等深层学术支持。 以支撑科研为目的,通过上述两种方式构筑全方位、多层级、个性化的科学数据服务新路径。

4.4 以创新服务为核心:赋能科学数据服务多模式发展

美国发布的《新媒体联盟地平线报告:2017 年高等教育版》曾预测科研数据管理服务将成为图书馆未来服务发展的新方向[46];美国大学与研究型图书馆协会《2021 环境扫描》报告又提到,在开放科学生态系统中,高校图书馆应将开发数据管理作为研究支持服务的重点[47]。 这说明在图书馆服务层面,创新科学数据服务模式已成为领域重点实践方向之一。 我国未来利用数据要素赋能图书馆科学数据服务的多模式发展,可从虚拟服务和实体服务两方面入手。 一是基于资源整合视角,研究科学数据资源一站式平台模式,倡导多部门联合协作,鼓励用户进行在线学习。 二是基于空间再造视角,再造数据科学空间,运用AI、AR、VR 等技术打造智能化数据服务,实现跨学科协作服务模式。 同时,丰富科学数据培训模式,以数据可视化课程、学科实践活动、专项基金项目为突破口,建立融入科研全程的精细化服务模式,进一步优化科学数据服务培训体系。

4.5 以馆员能力为抓手:优化数据馆员团队引领力

高校图书馆的数据服务已经引起了业界的关注,馆员的多元数据素养能力培养将成为图书馆提升服务效能的新增长点。 教育部高等学校图书情报工作指导委员会《大学图书馆现代化指南针报告》指出,图书馆应结合自身优势加快建设有助于科研管理和科技创新的数据管理服务等项目,并组织高素质的数据馆员队伍,不断强化业务能力,推动科学数据服务高质量发展[48]。 美国大学与研究型图书馆协会《2023 环境扫描》报告指出,学术馆员需要掌握数据分析、数据服务研究等技能,随着其技术水平和技能的提升,可以引领研究数据领域的未来发展[49]。 我国未来应重点关注本土数据馆员的需求情况、岗位能力、晋升机制以及职业发展前景,还需兼顾其数据伦理与道德意识的塑造。 同时,面向全体馆员开放专业数据科学与技能培训课程,重点培养与提升其数据技能。

5 结语

目前我国高校图书馆在科学数据的周期管理、服务模式、素养教育和基础保障4 个方面的研究已陆续展开并取得初步成效,但在政策建设、数据共享、模式创新、服务发展和馆员能力提升等方面仍发展缓慢。 清华大学图书馆党委书记蒋耘中在“2021中国高校研究数据管理推进工作组会议”上提出,高等学校是国家科技创新的重要基地,其生产的大量研究数据对国家科技创新和经济社会发展都具有非常重要的意义。 采集、保存、管理和使用这些数据,最大限度地发挥数据效能,是高校图书馆的使命,也是未来高校图书馆的发展方向[45]。 高校图书馆开展科学数据服务,能够加强各方利益主体间的协同交流,形成数据管理与服务合力,为高校科学数据的存储、管理、共享和重用提供有力支持与保障。

猜你喜欢
数据服务数据管理发文
地理空间大数据服务自然资源调查监测的方向分析
企业级BOM数据管理概要
定制化汽车制造的数据管理分析
海洋环境数据管理优化与实践
CTCS-2级报文数据管理需求分析和实现
10条具体举措! 山东发文做好返乡留乡农民工就地就近就业
校园拾趣
爷孙趣事
以牙还牙
如何运用税收大数据服务供给侧结构性改革