文/上海交通大学医学院 唐杰
在网络信息技术、物联网、互联网等新型服务迅速发展的时代背景之下,数据信息的种类形式、数量规模,正以前所未有的速度扩大。大数据时代已来临,数据不再是单独的代码和处理对象,而是成为基础性资源,被社会各界广泛使用,影响着我们的生活方式和习惯。作为信息资源集散中心的高校图书馆也受惠于大数据。在高校图书馆知识服务的工作内容中,对大数据信息的充分解析和最大价值利用是非常重要的部分,它能为用户提供更加优质的知识化服务,完善并提高高校图书馆的综合服务水平。
(一)大数据基本概念。数据是信息的表现形式,它主要以数字化的方式存储,是一种比较笼统的概念。而大数据是基于计算机和网络信息技术、智能化终端设备、各种类型的应用系统在日常活动中被广泛应用,在这种开放的、多源的渠道中,数据以爆炸性增长的态势产生的。大数据有以下5个特征,即Volume(数据量大:大数据的获取、计算、储存的数量非常之大)、Velocity(速度:数据的增长、获取、处理都极快)、Variety(多样性:数据类型和来源非常之多样,如互联网日志、音频文件、视频文件、图片文件等)、Value(低价值密度:如同大浪淘沙、百炼成钢,在海量的数据之中,仅有部分有价值的信息)、Veracity(重要性:数据的质量)。
(二)大数据与高校图书馆服务融合的必要性。21世纪,数据已经成为各行各业的重要战略资产和竞争要素,及时获取、有效分析各种类型和规模的数据信息,将数据的最大价值深挖出来,并能够运用到实处,发挥明显的、有益的效果,已成为度量一个组织或单位竞争力的重要标志。借助大数据,提升高校图书馆服务已经成了大势所趋。有了大数据支持的高校图书馆服务,解决了传统图书馆对于用户获取数据的时间成本高、准确性低、受益面窄等弊端。
虽然对于图书馆而言,会出现前期录入数据繁琐、数据信息量巨大且复杂的情况,但是随着对数据信息的日积月累和深入研究,它所带来的情报价值,将会极大地提高用户的体验,方便用户快速地获取信息、存储加工信息,同时图书馆所能提供的服务效率也将会变得更高,管理变得更便捷、方式变得更灵活、内容变得更丰富、涉及的服务面变得更广泛。
(一)高校图书馆服务模式的转变。高校图书馆核心的要素是用户和资源。借助大数据的支持,传统图书馆将逐步转变成更加智慧型的图书馆,改变过去被动式服务和等待式服务的模式。智慧型图书馆可为用户提供自主化服务,如利用智能感知技术,分析用户行为特征,为其提供智能指引;如利用人工智能、AI定位技术,完成自助借还书及上下架的一体化流程,实现图书馆实体信息资源的自动化处理。不仅如此,在大数据技术的加持下,图书馆还可扩展主动式服务,如分析用户的知识活动路径,给用户提供准确的信息推送,如用户近期关注的内容的最新热点或可能感兴趣的热点事件等。
(二)高校图书馆资源整合。高校图书馆所涉及的知识和信息数据具有复杂、多样、多变等特点。在大数据加持之下的图书馆服务,应用内容不断丰富,数据类型种类多样,不同的数据类型处理的方式各不相同。
1.数据采集的多样性。大数据数量规模之大,其形式种类不易划分与统一,具有多样性的特点,由此,大数据极具复杂性。图书馆的信息采集一般可以通过射频识别(RFID)、传感器收取、终端设备记录、视频监控等技术,将用户在图书馆内所留下的基本信息及属性,如检索痕迹、借阅信息、行走路径、下载内容等行为信息及现有的资源、业务、设计、用户等数据,通过合理合法的方式进行实时收集和科学整理,对于结构复杂不易统一的数据,可人工辅之,保证数据得到充分和完整地采集,从而提高数据信息所能挖掘的最大价值,为图书馆的管理工作和服务内容提供有价值的依据。只有保证数据的多样和可靠,才能真正丰富图书馆的资源库,扩大图书馆的资源性服务范围,最终提高图书馆服务的综合水平。
2.数据存储的完整性。数据存储是数据分析重要的前提条件。数据的完整性则是数据存储的核心。倘若数据不完整,即使是极其微小的差异,都将直接影响分析结果。因此,为实现数据存储的完整,应使用专业的数据库和存储设备进行存储,对于非结构化的数据,可以对其转化为结构化的数据后再存储,避免数据存储过程中发生错误或损坏。完整的数据存储对数据分析和处理、后期价值挖掘起到了非常重要的保障。
3.数据处理的及时性。数据处理的及时性是数据分析和挖掘的重要前提因素。在数据分析的环节中,收集到的数据与实时变化的新数据交替非常快速,数量非常广大,如果对已有的数据没有及时进行处理,很有可能新一轮的数据与前一轮收集的数据,其内容已产生较大差异。在这种情况下,数据的价值效益将降低,有些差异性较大的数据,可能已不同于实际,其价值将大打折扣,甚至不具备参考价值。因此,数据的及时处理是保证数据分析发挥最大价值的必要手段。
应用是高校图书馆使用大数据的根本目标。通过对大数据的分析和挖掘,从而进行分析、预测用户的行为需求,对其进行有针对性的服务。从图书馆已有数据中挖掘潜在价值,提供科研指导、教学指导等服务。
(一)基于数据挖掘的个性化服务。大数据在高校图书馆中最大优势是根据收集到的用户信息,能智慧化地对其进行数据分析和行为预测,将虚拟数据转化成具有可视化性、可操作性的具体服务。图书馆借助大数据技术获得用户在图书馆网络中的足迹、点击历史、浏览历史、借阅历史、信息反馈等数据信息,借助这些关键信息刻画出虚拟的用户画像。用户画像能直观地展示出用户的特征,如用户的性格特点、偏好、意愿等相关信息。利用这些用户画像的信息,图书馆能够更精确、更高效地为用户提供创新性的个性化服务,满足用户的需求。不仅如此,大数据还有利于细化用户的需求,催化高效的知识服务以及挖掘图书馆未来的发展形式。
(二)基于数据挖掘的科研创新支持服务。高校科研工作的重要阵地之一就是高校图书馆,以数据为重要基础,科学的数据信息分析为依据,向科研人员提供合理的决策建议。早期信息的分析主要依靠工作人员的专业背景和从业经验,数据信息解读的过程往往需要依靠大量的人力,以专业知识、经验能力去处理分析,并进一步通过对其解读、分析、归纳、总结和推理,最后获得有用的信息研究结论。但随着知识产业的不断发展进步,跨学科知识越来越广、种类分支越来越多、子类别分化越来越细、专业化程度越来越高、信息分析面临的数据量也越来越庞大而复杂。当下,每天全世界的文献数量以成千上万的速度增长着,仅仅依靠人力,难以支撑起信息分析的工作,根本无法在有限的时间内完成如此庞大的工作量。
在大数据技术的加持下,数据信息分析已经越来越多地依靠以计算机为代表的新一代信息化技术。高校图书馆结合自身资源的优势,对行业内数据信息进行深度分析和挖掘,为科研人员提供更高效、更精准的前沿学科分析、技术演化、领域研究及趋势分析等知识服务,帮助科研人员了解相关技术领域的具体研究状况和趋势。不仅如此,依托大数据挖掘,还能帮助科研人员明确并判断出该成果在国内外是否有同类或相似的研究,对课题的创造性、科学性、实用性进行评估,辅助科研人员决策。
大数据为高校图书馆带来了全新的知识创新体系及知识服务模式。高校图书馆应加强对于大数据的利用,借此进一步挖掘图书馆积累的数据资源,让数据的价值得到充分体现和发挥,逐步转变为自主化服务模式和主动推荐式服务模式,进一步完善创新图书馆的综合服务体系,体现出图书馆的价值和意义。可以说,大数据分析、挖掘将会成为未来高校图书馆数据资源应用的重要方式之一。