学术图书馆数据文化建设的思考与探讨

2023-05-13 19:38刘细文涂志芳
大学图书馆学报 2023年6期
关键词:驱动图书馆服务

□刘细文 涂志芳

文化(Culture)通常被视为一种社会惯例、虚拟环境以及无形资产、软实力等。从重要性看,文化发展是国家发展的重要组成部分,“文化强国”战略是实现中华民族伟大复兴的基础[1];从内涵看,文化是精神生活、社会生活和物质生活等的综合;从本质看,文化是“人的生活样式”,包括“人化”和“化人”的双向互动[2]。文化包含丰富的内容,如实践、规则、制度和核心价值等不同层面的具体内容,其中实践层面包括器物、饮食、服饰、宗教、艺术等日常生活的具体表现,规则层面包括社会惯例、道德规范、组织规章等,制度层面包括法律法规、政策体系、监督机制等,核心价值包括道德、规则、制度体系形成的文化导向。

文化存在于人类社会发展的不同阶段和形态,如原始社会、农业社会、工业社会、信息社会等,相应形成了部落文化、城市文化、互联网文化、信息文化、数字文化等;文化也同样存在于不同的领域、行业和组织机构之中,如企业文化、政府文化、图书馆文化等。以图书馆文化为例,图书馆文化(Library Culture)本质上是图书馆的发展样式,同样体现在实践、规则、制度和核心价值层面。其中,实践层面包括私人藏书、开架阅览、图书分类、目录工具、检索系统、阅读推广、数字化服务等,规则层面包括图书分类规则、目录编制规则、典藏管理规则、读者服务规则、知识组织体系等,制度层面包括图书馆法律、图书馆宣言、图书馆公约等;核心价值层面包括用户导向、价值中立、信息自由等。

1 数据文化

随着科学研究转向数据密集型研究范式[3],以及社会经济逐渐进入数据要素驱动的增长模式[4],数据的作用渗透到科学技术、经济社会和生产生活的方方面面,并被提升到前所未有的战略地位。伴随着数据驱动科学发现、数字经济、数字社会、数字政府等[5]数字化和数据化新内容的出现,数据文化也随之兴起。

1.1 数据文化的定义

数据文化(Data Culture)作为一个相对新兴且复杂的、不断动态生长的概念,尚未有明确的统一定义。根据不同的研究目的和应用场景,不同机构和个人对数据文化理解不同,从内容、层次、场景、粒度等不同角度加以阐释。

从关联概念的角度,数据与信息既密切关联又相互区别,信息文化(Information Culture)是“关于信息的一种文化”(A Culture of Information),那么数据文化则是“关于数据的一种文化”(A Culture of Data)[6]。基于“数据”与“文化”的互动关系,王家耀[7]认为数据活动过程离不开一定的文化背景,数据活动过程同时也影响文化面貌,数据文化可视为“数据”和“文化”的交集。以基本要义为切入点,涂子沛[8]认为数据文化是以“实事求数”“实数求是”为内核的尊重事实、强调精确、推崇理性、遵循逻辑的文化。

以商业决策为背景,基伦(Kee-Luen)等[9]认为数据文化是数据能力的重要组成部分,数据文化是基于现有数据和证据分析客观地做出决策的文化,并且是价值创造的一项基础条件;戈帕尔(Gopal)[10]在《数据文化如何为数据驱动型组织创造价值》白皮书中将数据文化描述为企业建立的一种在决策中优先考虑数据的文化。以高等教育为背景,拉法格利(Raffaghelli)等[11]将数据文化视为一种情境性的集体表达,包含与数据相关的专业角色、政策和具体做法等;拉萨特(Lasater)等[12]采用列举式方法将数据文化的主要范围界定在以下几个方面:对数据使用的清晰愿景和明确期望、允许教师访问和理解数据的资源与系统、围绕数据的协作、与数据使用相关的信任感和安全感、共同承担发展学校的责任、对学生学习的高期望、学校领导层对数据使用的支持等。

从数据生命周期的角度,奥尔伯里(Albury)等[13]以社交App的使用为场景将数据文化定义为数据生产文化、数据培育文化、数据化(Datafication)文化、数据使用文化,奥利弗(Oliver)等[14]在综合不同观点的基础上,进一步将数据文化定义为影响或决定数据在个人、组织、政府和社会中的生产、生成、获取、培育、使用、管理、保护、分享和重用的社会、技术、文化特征以及价值观和实践。

1.2 数据文化的内容

数据文化包含丰富的内容,奥利弗(Oliver)等[14]基于范围性综述方法(Scoping Literature Review)提出,数据文化主要包括但不限于数据相关技能与态度文化、数据共享文化、数据使用与重用文化、数据伦理与治理文化、本土视角(Indigenous Perspectives)的数据文化等5个方面,为相关研究者和实践者理解数据文化的范畴和内涵提供了良好基础。同时,数据文化存在于社会、领域和行业、组织和机构等不同单元之中,对应于社会中的数据文化、领域和行业中的数据文化、组织和机构中的数据文化等不同层次[9];根据数据文化产生的不同场景,可分为企业数据文化[9]、政府(公共部门)数据文化[15]、校园数据文化[12]等不同类别;根据数据文化的规模,可分为元(Meta)、宏观(Macro)、中观(Meso)、微观(Micro)、微纳(Nano)等不同粒度[16]。

1.2.1 数据相关技能与态度文化

数据相关技能与态度是数据文化形成的基础前提,数据相关知识、态度、技能和实践要求机构和个人对数据较为熟悉,通常集中表现为数据素养(Data Literacy)及数据流畅度(Data Fluency)[14]。其中,数据素养在信息素养、数字素养等基础上发展而来,用于描述使用数据做出判断和决策并解决现实问题的一系列能力[17]。数据素养最初多用于高等教育、科学研究场景之中,后被引入学习、工作、生活等多种场景以及更广泛的社会实践[18]。数据流畅度被描述为选择合适的数据分析软件工具的能力和信心,是数据素养达到较高程度的一种状态,如提出明确的问题并做出高效的数据驱动的决策[19]。

1.2.2 数据共享文化

数据共享文化是数据文化建设的核心内容,主要包括数据共享态度和意愿、行为和实践以及与之相匹配的数据共享政策、标准规范、基础设施、软件工具等。目前数据共享主要包括研究数据和政府(公共)数据开放共享,商业数据、机构数据、个人数据等的共享尚未成为主流。就研究数据共享而言,根据Digital Science公司的调查,80%的科研人员赞成将研究数据开放共享作为常见做法,但同时也有75%的科员人员表示共享数据得到的回报(如引用、致谢等)较少,另外考虑到数据共享可能带来的数据滥用、敏感信息、版权和许可问题等风险,大部分科研人员对共享自己的研究数据仍持犹豫和观望态度[20-21]。就政府数据共享而言,根据开放数据晴雨表(Open Data Barometer)的监测,全球100多个国家和地区对开放政府数据采取了积极行动,并在实现负责任的、创新性的、有影响力的开放政府建设方面取得了不同程度的效果[22]。

1.2.3 数据使用与重用文化

数据使用与重用文化是数据文化实现的关键步骤,在具备数据相关技能、践行数据开放共享的基础上,进一步实现广泛的数据使用与重用,才能真正发挥数据的价值。数据使用(Use)源于特定人员因特定问题或需要而收集特定数据,并对其进行单次或多次使用;当该数据被其他人员发现并使用,则称之为数据重用(Reuse)。数据重用是两者之中更为重要的方面,通常用于支持科研人员进行原创性研究和验证已有研究,以及公众参与更广泛的社会经济活动[23]。

1.2.4 数据伦理与治理文化

数据伦理与治理文化是数据文化可持续发展的可行路径,良好的数据伦理规范和健全的数据治理机制能够预防或解决数据素养、数据共享、数据重用中存在的问题和困难,并推动数据文化系统的可持续发展。数据伦理主要涉及数据相关过程中的伦理问题,如数据引用规范、数据隐私、数据安全等;数据治理是建立健全数据生产和流通全过程的体制机制,明确各参与方的权责关系,以实现数据价值的最大化[24]。

1.2.5 本土视角的数据文化

如前所述,不同社会发展阶段和形态、不同领域和行业以及不同组织机构有不同的文化以及数据文化,因此立足本土视角和具体场景理解和建设数据文化具有现实意义。例如,当前处于数据全球共享、自由流动的发展环境,这需要以国家安全和数据安全为前提,因此,在国家安全和数据归属视角下,数据主权(Data Sovereignty)也是数据文化的重要内容,包括法律、技术、贸易等维度的数据主权[25]。

2 学术图书馆数据文化

2.1 图书馆数据相关技能与态度文化

图书馆数据相关技能与态度文化包括两个维度的内容:一是图书馆自身的数据技能与态度,二是图书馆帮助用户提升数据技能与态度。一方面,图书馆具有收集、组织和保存各类文献、信息、数据、知识资源以及据此向用户提供相应服务的职责和使命,因此图书馆自身的数据技能与态度包括但不限于:确立数据成为图书馆发展的核心要素的理念、组织建设各类数据资源的能力、提供数据驱动的决策咨询服务和科技知识服务的能力等[26]。另一方面,图书馆帮助用户提升数据技能与态度,集中表现为图书馆面向用户开展的数据素养教育及相关服务[27]。

2.2 图书馆数据共享文化

共享是图书馆文化建设理念的根基。图书馆数据共享文化包括图书馆共享自己的数据以及图书馆帮助用户共享数据两个方面。就图书馆共享自己的数据而言,图书馆数据包括馆藏资源数据以及业务、管理与服务数据,前者如元数据(实体文献书目数据、数字资源元数据)、对象数据(摘要数据、索引数据、全文数据)等,后者如业务数据、服务数据、管理数据、用户数据等[28],图书馆可在一定范围和程度上合理共享自己的数据,促进资源价值的最大化和服务质量的最优化。就图书馆帮助用户共享数据而言,除数据素养教育及相关培训以外,还包括建设数据共享工具、提供数据发布和出版相关服务等,如开发数据管理计划工具,建设机构、学科或综合数据知识库,提供数据期刊导航和数据论文发表咨询服务等[29]。

2.3 图书馆数据使用与重用文化

在整个数据文化系统之中,图书馆数据使用与重用文化同样包括图书馆自身使用与重用数据以及图书馆帮助用户使用与重用数据。就前者而言,图书馆一方面可以使用自身的馆藏资源数据,对其进行细颗粒度的组织并转化为服务;另一方面还可以使用自身的业务、管理与服务数据,对其进行深度分析和挖掘利用,提供更加精准和高效的服务;此外,图书馆还可以重用外部数据(如开放获取资源数据),扩大资源覆盖范围、提高用户服务能力[28]。就后者而言,图书馆除提供数据素养教育、咨询和培训等服务以外,可以开发数据管理与集成、数据检索与发现、数据分析与可视化等系列工具供专业使用,以工具与业务流程构建推动图书馆数据文化的确立。此外还可以合作者身份与用户共同开展研究或解决实际问题。

2.4 图书馆数据伦理与治理文化

图书馆数据伦理与治理文化包括图书馆自身的数据治理以及图书馆参与更大范围(如行业、国家)的数据治理。图书馆自身的数据治理以图书馆自身的数据使用与重用为基础,进一步建立健全图书馆数据资源管理的标准规范和体制机制,如数据模型构建、数据流程管理、数据质量控制等[30]。同时,图书馆作为数据的重要利益相关方之一,需要积极主动参与社区、行业、国家、社会等更大范围的数据治理并发挥作用。

2.5 图书馆特色数据文化

较之于企业、学校等主体,图书馆具有用户导向、价值中立、公益服务等特征,因此图书馆数据文化较之于企业数据文化、学校数据文化等也具有秉持价值中立[31]、追求社会效益[32]、崇尚社会包容[33]、追求信息自由[34]等特点。再者,大部分图书馆都拥有丰富的数据资源,是数据密集型机构,应当在树立数据驱动发展的理念,组织数据形式的资源,开发数据化工具、数据管理工具、数据服务工具,提供数据驱动的服务以及建设良好的数据文化等方面率先行动。

3 学术图书馆数据文化建设路径

图书馆数据文化建设是在各部分内容基础上的有机融合和综合行动,主要包括数据驱动研究、数据驱动服务、数据驱动管理、数据驱动决策等路径,国内外图书馆(尤其是学术图书馆)在探索数据文化建设方面已有有益尝试。战略规划(Strategic Plan)是一个组织机构制定的中长期目标并将其付诸行动的纲要性文件,最佳实践(Best Practices)是被事实证明或同行认可的有效做法,以下从战略规划和最佳实践两个维度剖析代表性图书馆的做法和经验,以期为更多图书馆和信息服务机构提供参考借鉴。

3.1 战略规划层面,重点构建新型数据驱动服务机制,固化数据驱动服务模式

美国国立医学图书馆(National Library of Medicine,NLM)在支撑并开展数据驱动的研究方面具有代表性。NLM于2017年12月发布最新战略规划(2017-2027),将其定位为“一个支持生物医学发现和数据驱动健康信息服务平台”,通过提供数据驱动的研究工具,加速生物医学知识发现并促进人类健康,培养适应数据驱动的科学研究和健康服务的人才队伍;同时通过整合数字资源、建设计算基础设施、提升新生力量的数据素养等行动计划推进该战略规划的实施[35]。

香港城市大学图书馆在数据驱动服务、数据驱动管理、数据驱动决策等方面均有规划和探索。在香港城市大学致力于成为世界一流的研究和教育机构的战略目标之下,香港城市大学图书馆通过对校内学者的研究成果进行内容管理并登记为机构数据,加强机构数据资产管理;通过妥善收集图书馆服务数据、运营成本数据、用户行为数据和用户满意度数据并进行统计分析,加强趋势识别和需求预测并支撑数据驱动的管理决策和服务规划;通过提供开放获取出版和研究数据管理服务,参与并推动更大范围的研究数据开放共享;通过提供专业的文献计量和数据分析服务,支持数据驱动的科研评价和管理决策[36]。

3.2 最佳实践层面,建设数据全价值链管理工具,构建数据文化的物质基础

美国加州州立大学圣马科斯分校(California State University San Marcos,CSUSM)图书馆在机构数据管理、数据驱动决策等方面已有行动。2015-2020年,CSUSM持续收集、组织并分析图书馆各类数据用于改进服务和管理,同时开发了数据驱动决策的模型以更好地挖掘利用图书馆数据,将图书馆利益相关方(如用户、社区、基金会等)的需求和期望纳入服务和管理流程[37]。

加州大学数字图书馆(California Digital Library,CDL)在建设数字科研工具、构建图书馆数据管理与服务生态系统等方面取得了明显成效。在数据收集方面,CDL提供一项名为AGUA的网络服务,旨在为加州大学图书馆系统“共享印本馆藏计划”(Shared Print Initiative)提供关键馆藏数据,基于馆藏数据分析为相关图书馆进行馆藏选择提供决策参考[38]。在数据描述方面,CDL开发了创建全球唯一标识符的工具EZID(取Easy ID的谐音,意为容易构建),用户可使用EZID为文本、数据集、术语等各类内容创建标识符并提高可发现性和可共享性[39]。在元数据管理方面,CDL开发了Zephir系统用于抽取、存储和管理来自HathiTrust(全美大型研究图书馆的数字存储库)贡献者的数字内容(如书目元数据)并将其引入HathiTrust数字图书馆[40];在研究数据管理方面,CDL开发了数据管理计划工具DMPTool,帮助科研人员创建满足资助机构要求的数据管理计划[41]。在数据发现方面,CDL基于Ex Libris公司的Alma/Primo VE系统开发了集中式图书馆管理和发现系统(SILS),SILS整合了整个加州大学系统的印本馆藏和数字资源,提供一站式检索和发现服务[42]。在数据存储与共享方面,CDL建设了数字存储库Merritt,为加州大学系统提供数字内容的管理、存储和共享服务[43];此外,CDL还与Dryad合作开发并提供数据共享与出版服务[44]。

3.3 中国科学院文献情报中心数据驱动理念的确立与探索

中国科学院文献情报中心(以下简称“文献中心”)制定的数据驱动、任务导向的“十四五”规划及其行动在国内学术图书馆行业具有代表性。

文献中心“十四五”规划的制定以数据和数据化建设为起点,着力重构数据驱动的文献情报工作价值链,最终形成数据积累和系统闭环[45],为国家、中国科学院、相关部委及其所属机构(国家发展和改革委员会、科学技术部、国家自然科学基金委员会等)及创新主体提供信息监测、情报挖掘和科技决策支撑服务。“规划”主要内容包括建设支持管理和宏观决策的知识服务体系、支撑高水平科技创新的学科知识服务体系、建设新一代科技知识服务系统、科研论文和科技信息高端交流平台等4个主攻方向,以及开展智慧数据体系与智能情报模型研究、可信数字学术环境构建与服务研究、科技文献智慧数据驱动方法研究等3个前沿方向[46]。

在“十四五”规划实施过程中,文献中心配套建设智慧数据中心,制定数据管理办法与细则,设立数据馆员岗位,以数据资产化模式夯实数据资源底座,实现数据共建共享。具体而言,建立的数据相关制度包括《数据管理办法》《数据资产登记汇交实施细则》《数据馆员制度实施细则》《数据安全管理实施细则》《论文、报告关联数据管理与开放共享实施细则》《数据体系的数据架构与数据标准实施细则》等;组织承担国家重点研发计划项目,多维度开发数据管理工具、基于数据的服务工具,建设数据资源平台、数据管理平台、数据化检索服务与查新工具,例如包括科技大数据知识发现平台(https://scholareye.cn/)、科技文献知识AI引擎(SciAIEngine)、科情数据(https://smartdata.las.ac.cn/)、PubScholar公益学术平台、代表作学术贡献引用评价工具CiteOpinion、自动科技查新平台innoFinder等。

4 挑战与展望

总结现状,图书馆数据文化建设的数据驱动流程构建处于试验探索期,还面临来自数据安全、知识产权等方面的风险,以及数字技术开发与应用、能力建设与人才培养、外部竞争等方面的挑战。需要重点在关键方向构建文化形成机制:第一,在数据相关技能方面,图书馆管理层需要树立数据驱动决策的理念并提升相应能力,图书馆员需要提高数据驱动研究的意识并提高自身数据素养和为用户提供数据素养服务的能力。第二,在数据共享方面,图书馆面临数据采集、存储和传输过程中的网络基础设施安全风险。第三,在数据使用与重用方面,图书馆面临分析和使用用户数据方面的个人隐私保护风险。第四,在数据伦理与治理方面,图书馆面临数据资源挖掘和整合过程中可能的伦理道德和知识产权风险。第五,在特色数据文化建设方面,图书馆面临来自大型出版社、学术搜索引擎等外部信息服务机构的挑战。第六,在数据文化建设的可持续发展方面,图书馆需要应对不断发展迭代的数字技术带来的挑战、数据基础设施的安全风险、与工业界竞争数字技术人才以及内部人才培养的压力。

展望未来,图书馆可以从以下方面加强数据文化建设:第一,在理念方面,树立数据驱动发展的理念,明确数据的核心要素地位,提高数据驱动研究、数据驱动服务、数据驱动管理、数据驱动决策的意识。第二,在能力建设方面,通过教育、培训、终身学习等多种手段提升图书馆员数据素养,加强对数字工具的开发和应用,提高数据服务能力。第三,在数据人才培养方面,充分发挥图书馆作为公共资助的、持续稳定的信息服务机构的特点,通过招聘外部人才、培养内部人才、补充兼职人才等方式,加强人才培养和储备。第四,在应对过程风险方面,图书馆需增强法律意识、数据安全意识,加强对知识产权法、数据安全法等相关法律法规和规章制度的研究与掌握。在应对外部挑战方面,图书馆需充分发挥保存文明、传承文化的社会功能,展现社会包容、平等服务等公共价值。

猜你喜欢
驱动图书馆服务
基于模糊PI控制的驱动防滑仿真系统分析
屈宏斌:未来五年,双轮驱动,砥砺前行
轨旁ATC系统门控柜接收/驱动板改造
服务在身边 健康每一天
服务在身边 健康每一天
服务在身边 健康每一天
图书馆
招行30年:从“满意服务”到“感动服务”
飞跃图书馆
基于S3C6410的Wi-Fi驱动移植实现