于 欢,孙 青,易 静,路 青,孙红亮
(河北医科大学 图书馆,河北 石家庄 050017)
随着智能及信息技术的快速发展,智慧图书馆的理论研究和实践成果也在不断发展,适应大数据环境下用户信息需求的不断升级,提供全新的智慧服务模式是其发展的必然趋势。信息泛化的时代,图书馆提供服务的各类设备、文献系统、服务及社交平台积累了海量资源和用户行为数据,依靠信息识别、数据采集等技术将这些数据有效整合,深入挖掘空间、资源与人的内在关联,能够最大程度地发挥数据价值,突破时空局限,打造实时、优质、精确、专业的智慧服务体系,从而帮助用户实现知识增值,提升知识服务内涵[1-2]。
先进的信息技术及智能化的设备是图书馆提供智慧服务的基本技术保障,通过RFID、GPS、物联网等智能感知技术,结合图书馆集成管理系统、各类空间资源、虚拟服务平台及资源信息系统等多种途径将空间、信息资源与用户等多元异构数据建立关联,形成图书馆的大数据,以此为基础实现馆内资源的互联互通与信息共享,提高馆员工作效率及用户体验。
图书馆蕴含着大量的文献资料、用户行为数据及业务流程数据,使用大数据技术能够动态串联这3类数据,然后通过数据挖掘、聚类分析、用户画像等技术,对用户喜好与需求进行全方位分析,深入挖掘出数据的潜在交叉价值,发现用户的隐性需求,进而构建精准、智慧的个性化服务,实现空间、资源与人三者之间的持续化融合。
信息爆炸的时代,图书馆应坚持以用户体验为中心,以大数据为驱动,深化图书馆服务层次,拓展图书馆服务功能及服务范围,以优质的服务体现图书馆的存在价值。目前,图书馆基于大数据开展的个性化推荐服务主要集中在信息检索及资源推荐,图书馆未来应逐步实现知识咨询、阅读推广、空间使用等全领域、全要素智慧化、个性化服务;除此之外图书馆还应借助大数据技术,打破数据壁垒,积极探索跨领域、跨区域的融合发展路径,借助外部力量拓展图书馆的服务功能,形成内外部环境立体交互、实体与虚拟服务融合的泛在服务空间。
依据大数据的数据采集与存储、数据治理与建模和大数据应用的技术使用流程,借鉴计算机软件设计中的3层体系结构,构建基于智慧数据层、智慧业务层和智慧应用层的3层框架结构,如图1所示。
(1)智慧数据层:汇总图书馆各终端、应用系统及服务平台,采集用户、用户行为及资源3种不同维度的数据,并对数据进行清洗和预处理,在这个过程中一方面要对数据进行填补、降噪等处理,另一方面也要注重建立各异构系统数据间的关联模型,形成标准、干净、实时、连续的大数据资源,构建图书馆智慧大数据中心。
(2)智慧业务层:完成了元数据的标准化仓储,需要对数据进行统计、特征提取、聚类分析,通过用户画像技术构建馆藏资源画像、用户个人画像、用户群体画像,建立资源与用户、用户与用户、用户与机构或群体间的关联度模型,为智慧检索、智慧推荐等服务提供数据支撑。智慧业务层具有承上启下的作用,它接收智慧应用层的计算请求,并依此向智慧数据层发送数据请求,然后进行数据处理,最终将计算结果反馈至智慧应用层。
(3)智慧应用层:智慧应用层直接面向用户,为用户提供智慧服务。各高校图书馆依据办学层次、学科类型、发展理念不同为用户提供的各项服务也不尽相同,笔者以仅跨系统的大数据技术应用为前提,将智慧服务归纳为智慧检索、智慧推荐、智慧学科及智慧互动4个场景。
2.2.1 数据清洗技术
图书馆的大数据采集自不同终端及系统,不可避免地存在数据重复、数据缺失、数据污染等各种类型的脏数据。因此需要通过数据的清洗与预处理完成数据的统一标准化,确保数据格式一致,提升大数据价值密度和可用性。对于重复数据一般采取主键去重策略;对于缺失数据,则需要根据不同情况,采取不同策略;对于无效、低价值、弱相关的缺失值可采取直接删除的策略;对于高价值、高相关的缺失值则可酌情采取人工填补、均值填补、预测值填补等方式完成清洗。除此之外,还应特别注意异常数据和噪声大数据的清洗,可以通过建立规则库、分箱处理、聚类算法、构造回归函数等方式完成数据清洗[3]。
2.2.2 数据挖掘技术
通过数据挖掘技术能够了解、分析用户行为,从而为用户提供优质的个性化服务。常见的数据挖掘技术包括关联分析、序列分析、聚类分析、协同过滤等技术。关联分析即分析不同数据、表单的关联性,挖掘隐藏信息,最常使用的算法是APRIOR算法[4]。通过关联分析,能够获取用户访问不同数据资源间的关联性;序列分析即将用户行为与时间进行关联,获取在一定时间间隔内某事件发生的变化规律,可以对某一段时间内图书馆各个空间使用情况进行分析,并依此调整图书馆空间服务策略;聚类分析是首先抽取对象特征,然后判断不同对象间特征的相似性,依据相似性实现数据分类集合,通过聚类分析,能够获取用户的行为知识及兴趣模式;协同过滤技术即利用集体智慧,分析不同用户之间的项目信息并筛选出他们兴趣的相似之处,一般用于推荐系统[5-6]。
2.2.3 用户画像技术
通过用户画像技术构建馆藏资源画像、用户个人画像、用户群体画像,建立资源和用户间的关联度模型,是智慧服务实现的前提和保障。用户画像创建流程大致可分为数据采集、数据处理及数据应用3个阶段[7]。其中的标签模块是整个流程中的核心模块,其模型的合理性直接影响用户画像的精确度。一般来说用户标签体系的构建需要使用多种算法完成,例如使用K-means聚类算法在用户基本数据及海量的用户行为数据中获取相似用户及其特征,实现用户的分群处理;使用RFM、TF-IDF算法完成代表用户选取和关键词的权重赋值过程[7];使用机器学习算法完成行为建模;使用协同过滤、回归预测等方法计算用户或馆藏资源的相似度,实现相似用户的行为预测及个性化推荐服务[8]。
2.3.1 智慧检索服务
相比传统检索服务,智慧检索以大数据为基础,通过用户画像与资源画像关联度模型的构建,能够使检索结果更为精准化、智能化、个性化。目前,我国高校图书馆智慧检索服务仅有一定程度的实现倾向,其提供检索功能的栏目导航大致可以分为:馆藏目录、中文发现、外文发现、联盟资源、学术搜索、馆内电子资源、数据库、站内搜索8种,多数图书馆同时提供其中几种检索功能,不同栏目导航的检索范围有所重合,但检索侧重点略有不同。这就可能带来一定的矛盾与问题:一方面,用户依据自己需求选择合适的搜索栏目能够快速获得信息;另一方面,在用户对各检索栏目不甚了解的前提下,过多的选择可能会给用户带来困惑。为解决这一问题,部分高校图书馆,如清华大学、北京大学图书馆将纸质资源与电子资源进行了充分整合,实现了跨资源类型的一站式检索,并提供智慧筛选及排序功能,形成了智慧检索的雏形。但图书馆智慧检索系统在检索速度、界面可读性及检索功能的丰富程度上与互联网其他搜索引擎还存在一定差距,一些先进技术如基于移动视觉的搜索模式,尚未得到有效利用。
2.3.2 智慧推荐服务
智慧推荐服务是图书馆主动服务用户的重要形式,通过大数据技术分析用户的行为特征和兴趣属性,将所获取的信息与对应的服务信息进行匹配,并及时推送给用户,能够满足用户个性化需求。我国高校图书馆智慧推荐资源类型和范围还存在局限性,主要集中在基于信息检索的文献资源推荐及依赖于OPAC系统的馆藏资源推荐,其中动态非个性化推荐占主流,如“借阅排行”“热门推荐”等,只有少数高校图书馆,如重庆大学、华东师范大学提供了“猜你喜欢”“与你相似的读者也喜欢”这样基于用户借阅历史、浏览记录、用户群体分析等能够体现用户偏好及需求的动态个性化阅读推荐。由此可见,我国高校图书馆智慧推荐服务无论从广度还是从深度上都难以满足用户需求,推荐场景单一、类型单一。因此未来的智慧推荐应立足大数据技术,跨系统收集用户行为、用户情景及用户位置信息,与社交网络及移动互联网相融合,全方位获取用户信息,建立完备的用户知识库,拓展智慧推荐类型及手段,如依据用户当前位置、用馆习惯、用户群体分类等信息,通过短信、微信、站内信等形式实时向用户推荐空间、文献、图书、设备等所有图书馆可用资源,并进一步加强推荐服务精确度。
2.3.3 智慧学科服务
学科服务是图书馆的核心业务,大数据背景下,高校图书馆应坚守以用户为核心的服务理念,积极运用各类智能、信息技术,探寻学科服务创新路径,为用户提供智慧、泛化、主动、精准、专业的学科信息和知识服务。学科服务平台是高校图书馆智慧学科服务的新模式,它依托计算机与信息技术,整合了丰富的学科资源,提供了多种学科服务功能,是用户和学科馆员交流、互动的平台。我国高校图书馆学科服务平台搭建方式大体可分为基于LibGuides平台、基于维度信息管理平台、基于学科门户网站、基于超星学科知识支持服务平台4种模式,学科服务平台整体建设程度不高,且存在发展不均衡、使用效率低下等问题。因此,积极强化用户认知,整合技术资源,挖掘数据价值,以大数据技术为驱动,拓展学科服务平台的智慧功能,在学科服务平台中嵌入智慧检索、智慧推荐、智慧学科社区、个性定制等深层次服务内容,为用户提供自动化、智能化的体验,用精准、个性化的服务提高用户使用黏性是学科服务发展的必然趋势。
2.3.4 智慧互动服务
智慧互动是图书馆提供泛在服务的重要手段,高校图书馆应通过构建图书馆日常知识库、智慧社交平台与智能咨询机器人,创建实时的参考咨询服务平台,及时准确地处理用户的各种服务需求,使用户获得良好的知识获取体验。目前一些高校已经开通了智能咨询机器人服务,减少了馆员的工作量,提高了用户咨询效率,符合图书馆24小时服务用户的理念,给用户带来了良好的体验。准确无误地解决用户问题,是智能咨询机器人的最终目标,但在实际应用过程中仍存在答非所问、个性化需求无法满足等情况。针对这样的情况,可从人员和技术两方面入手:一方面,在智能咨询机器人中增加“转人工”服务,满足用户个性化需求;另一方面,强调大数据技术的使用,在构建完备的图书馆日常知识库的基础上,建立用户画像、用户画像与资源画像关联度模型,在用户发出信息之前,了解用户基本行为特征,然后结合语义分析,使智能咨询机器人获取用户真实意图,最终将最优解决方案反馈给用户。
高校图书馆的智慧化建设离不开现代信息技术,开放的智慧服务中心更需要高科技、智能化的硬件设施作为支撑。RFID、AI机器人、3D打印机、智能书架、3D人脸识别、VR/AR、5G等技术和智能设备的使用,不仅能够增强用户的视听体验,依托这些传感设备,通过数据的对象识别、信息采集与数字管控,能够实时获取图书馆的场馆、空间、设施设备等信息,并依此进一步优化图书馆的智慧服务。例如,通过3D人脸识别、RFID自助借还、空间预约、门禁等业务系统的互联,可为用户提供无感知服务,即用户只需要在入馆时通过人脸识别进行身份验证就可以无障碍地享受图书馆的借阅、空间使用等服务。
高校图书馆的大数据具有系统多样性、分布异构性的特点,因此必须加强资源整合,实现数据统一组织管理。为提高数据整合效率,可在采集终端对海量的原始数据进行初步过滤及整合,消除部分冗余和噪声数据,减少数据传输数量,减轻网络拥塞。对于图书馆不同业务平台数据,需借助于语义网和关联数据技术,完成数据和资源的语义标注、链接,使其成为具有逻辑意义、能够相互关联的知识对象,创新数据价值。除此之外,图书馆还应注重与其合作的第三方数据的整合,从长远发展的角度,综合考虑大数据平台的集成框架、采集技术、可扩展性及安全性。
智慧馆员是提供智慧服务的主体,是实现智慧图书馆的关键。因此高校图书馆必须加强馆员人才队伍建设,可从以下3方面展开:第一,完善图书馆员准入制度,制定科学合理的招聘标准;第二,构建长效的培训机制,定期开展系统的、有针对性的培训,并鼓励馆员投入智慧图书馆的建设中来;第三,构建动态的智慧馆员职业能力评估体系,优化绩效考核,提升馆员职业能力水平。
我国图书馆智慧服务仍处于起步探索阶段,大数据技术在图书馆领域的应用尚未全面展开,图书馆门户网站、集成管理系统、各类服务及应用系统仍存在各自为政的局面。因此,在未来的智慧图书馆建设过程中,必须树立大数据意识,深入挖掘数据内蕴含的知识与智慧,构建图书馆的大数据中心,以此提升图书馆服务的智慧化、主动性、个性化及准确度。