冯 平
(南京晓庄学院,江苏 南京211171)
笔者对江苏省内11 所“985 工程”及“211 工程”重点建设高校的在校师生数、图书资源等进行了统计(截至2018 年年底数据)[1],统计结果如表1 所示。
表1 部分高校读者及图书馆资源统计
这些高校图书馆(以下简称图书馆)纸质书刊均采用图书管理系统管理,绝大多数高校还采用了门禁系统、座位预约管理系统、自助文印系统、研讨空间管理系统、电子资源管理系统、查新管理平台等管理系统,开通了微信微博平台、新闻平台、移动图书馆、图书馆贴吧、图书馆论坛等宣传、交流平台。 这些馆藏数据、业务管理数据、服务管理数据及交流管理数据构成图书馆自身大数据,如何处理这些大数据对提高图书馆资源利用、提升读者服务的广度和深度、规范图书馆整体工作有着重要而积极的意义。
《普通高等学校图书馆规程(修订)》 (教高〔2015〕14 号)中明确提出,图书馆是学校的文献信息资源中心,是为人才培养和科学研究服务的学术性机构,是学校信息化建设的重要组成部分,是校园文化和社会文化建设的重要基地。 图书馆的建设和发展应与学校的建设和发展相适应,其水平是学校总体水平的重要标志。 加强图书馆自身大数据管理有着重要的现实意义。
党的十九大对建设现代化经济体系做出重要部署,提出建设网络强国、数字中国、智慧社会,推动互联网、大数据、人工智能和实体经济深度融合,为新时代实施大数据战略行动指明了方向。高校是社会比较重要的“细胞”,它有着人才培养、科学研究、社会服务、文化传承创新的职责和功能,要为社会培养适应社会发展的优秀人才。 因此要培养优秀的、高素质的专业人才,要具有实施大数据战略的能力和意识,更要加强和注重自身大数据的管理。
图书馆是高校的“三大支柱”之一,是高校发展的一个缩影。 图书馆是学校文献信息资源中心,支撑着学校的教学与科研,承载着全校信息资源的需求与信息素养教育。 学校的发展需要图书馆专业的资源空间服务,需要图书馆专业的学科分析,需要图书馆专业的查新和专利服务。 这就需要图书馆不断加强自身管理,提高管理效能,更好地成为学校的学习中心、研究中心和文化中心。
由表1 可以看出,经过多年的积累,各高校均拥有了丰富的纸质资源和电子资源,而且逐年以10 余万的速度递增。 如何用好这些大数据,发挥资源优势,用科学的数据进行决策,提升服务效能、创新发展,为学校、社会做好服务,成为各图书馆重要的工作之一。 虽然各高校为此均应用了各种各样的管理系统进行管理,但还处在“各自为政、散兵游勇”的状态,难以形成“合力”,不利于发挥资源的效能、提升服务质量。 如纸质资源管理均采用图书管理系统管理,通过该系统可以完成图书馆日常图书及连续出版物的采、编、流业务管理及统计工作,对于纸质资源管理与利用而言是功能比较强大、适用,但对于图书馆另一种重要的资源——电子资源而言,采用电子资源管理系统管理同样能够实时监控数据库点击量、下载量等使用信息。 同为图书馆重要的资源,两种不同的形式采用不同的管理系统管理缺乏必要的“纽带”,无法形成优势互补,造成“重复购置”或凭“经验购置”的现状。
大数据是什么? 神策数据创始人和CEO 桑文锋把大数据概念总结为4 个字:大、全、细、时。 大,是Big 不是Large,强调的是抽象意义的大,有可能数据只有MB 大小。 全,而不是抽样,大数据时代有了更好的数据采集手段,让获取全量数据成为可能。 现有的采集手段能够实现从多个维度获取数据,再进行后续分析的时候,就能对这些维度加以利用,这就是“细”。 时,就是强调实时收集数据和实时分析数据[2]。 图书馆是高校的文献信息中心,本身就是一个庞大的数据源。
由东南大学图书馆官网记载,截至2018 年12 月31 日,累计馆藏纸质文献436.51 万册,中外文纸本期刊4 134 种;中外文数据库平台131 个,含电子图书近200 万册,电子期刊6.36 余万种,电子学位论文近900 万册。 在对这些文献资源的管理过程中,已经具有大数据的特征,这些数据涉及每种资源的相关信息,以及借阅信息、网上预约、续借、异地委托借阅、订购征询、资源荐购、网上催缺、预约到书、优先阅览等服务信息,图书馆在进行图书信息的管理过程中,需要对信息资源进行整合,而在巨量信息的整合中,就体现了大数据的基本特征。
从苏州大学官网可以了解到,截至2017 年,苏州大学在校教职工5 197 人,学校设有26 个学院(部),拥有全日制本科生27 136 人,全日制硕士生11 959人,在职专业学位硕士1 726 人,全日制博士生1 788人,临床博士2 146 人,各类留学生2 207 人。 2018年,苏州大学图书馆主页访问量2 793 450 人次,纸质书刊借阅量为288 013 册,原文传递2 620 篇,电子数据库仅中国知网(CNKI,包括中国期刊网)的访问量高达416 104 次[3];河海大学2018 年仅江宁校区图书馆进馆人数达2 424 578 人次[4]。 他们在利用图书馆资源、享受图书馆服务、提出自己需求的同时,产生了大量的数据。
图书馆不仅提供文献资源的日常服务,还为学校的科研、决策及管理提供了强有力的支撑。 开展学科文献调研与前沿跟踪、专题定制与推送、查收查引和查新等信息服务,将学术成果进行收集、整理,形成了机构知识库、硕博士学位论文库等。 为学科的发展提供学科态势分析、学科竞争力分析、科研及人才绩效评估等深层次学科服务,并为学校的教学创新建设、学科发展规划、人才队伍管理提供了重要依据。 每一次学术成果的跟踪、每一个学科的分析、每一篇查新报告的“出炉”,都蕴含着大量的数据。
随着图书馆互联网技术的应用,新媒体成为图书馆、读者沟通、交流的重要渠道。 每个图书馆不但有自己独立的官网,还拥有移动图书馆、官方微信、官方微博、图书馆论坛、图书馆贴吧及QQ 等网络社交媒体平台,另外有的图书馆还开通了网络虚拟学习空间及研讨空间,并逐渐成为图书馆及读者发布、传播和获取信息的主要媒介。 这些平台及空间中汇聚了大量的读者关系数据和信息传播数据,将成为图书馆大数据另一个重要的来源。
任何形式的管理均须基于现实,各大图书馆目前具备了大数据管理的基础,丰富的馆藏资源和业务管理数据、多元的读者需求数据、海量的学科分析数据等均具备大数据管理的特征。 将目前这些“条块分割”的、但应该是相互关联的数据,采用大数据管理模式进行管理、分析,必将促进图书馆各项业务融合,提升数据的统一管理;实现图书馆海量数据的有效存储和系统数据的高效利用;提高读者服务广度和深度,增强用户黏性。
基于图书馆大数据的现实管理架构,如图1所示。
图1 基于图书馆大数据的现实管理架构
大数据管理是一项有序的、动态的、可持续发展的系统工程,必须搞好顶层设计,建立良好的运行机制,以促进管理过程中各个环节的正规有序,推进图书馆各类资源、服务和网络资源整合,建立长效的馆员、部门、图书馆及学校之间的信息共享机制,提高协同管理和综合服务能力[5]。
应制定关于图书馆、学校各类数据的产权归属、保护以及数据采集、存储、加工、传递、检索、授权应用等的法律法规,建立数据保密与风险分级管理机制,厘清读者的隐私权和知情权的界限,合法应用用户数据,做到大数据管理有法可依,让数据开放和数据挖掘走向法制化。
舍恩伯格指出:“执迷于精确性是信息缺乏时代和模拟时代的产物。 只有5%的数据是结构化且能适用于传统数据库的。 如果不接受混乱,剩下95%的非结构化数据都无法利用,只有接受不精确性,我们才能打开一扇从未涉足的世界的窗户”。 也就是说,在大数据时代,思维方式要从精确思维转向容错思维,当拥有海量即时数据时,绝对的精准不再是追求的主要目标,适当忽略微观层面上的精确度,容许一定程度的错误与混杂,反而可以在宏观层面拥有更好的知识和洞察力[6]。
数据的积累要基于实际工作、有效环境,要有相关关系,要有利于工作效能的提升,有利于工作的创新、发展,切不可为大数据而积累数据。 正如著名经济学家路德维希·冯·米塞斯曾提醒过的那样:“就今日言,有很多人忙碌于资料之无益累积,以致对问题之说明与解决,丧失了其对特殊的经济意义的了解。”
正如《纽约时报》2012 年2 月的一篇专栏中所称,大数据时代已经降临,在商业、经济及其他领域中,决策将日益基于数据和分析而作出,而并非基于经验和直觉。 图书馆作为人类知识的宝库、知识的前沿,更应该掌握和运用大数据,不断提升自身的竞争力,为社会、学校、学科的发展提供决策支撑。