陈亮
(上海图书馆上海科学技术情报研究所,上海200030)
当前,人工智能、无线网络和大数据均获得了极为快速的发展,人们的工作、生活均发生了一定改变。在大数据等先进技术的影响下,丰富的网络资源得到了整合与优化配置,无论信息的更新与传递速度有多快,人们总能够便捷地通过各种途径获得所需要的信息和资料。传统图书馆的发展在此背景下受到了越来越严峻的挑战,作为文献信息的中心,图书馆应该如何将海量的、庞杂的网络信息进行整合与精准推送成为其必须要思考的问题。
基于用户行为的精准化推送服务平台在构建时必须要将大数据作为基础的理论,在大数据的支撑下实现复杂网络资源的整合与优化,继而满足大众的个性化信息资源获取与利用需求。
大数据亦称为巨量资料,主要是指其所涉及的资料量的规模十分巨大,已经无法通过目前所能够接触和应用的主流软件工具进行测量。与此同时,大数据亦是只在合理的时间内通过对先进技术加以科学应用后,促使人们更加便捷的获取、管理与处理的资讯信息。
大数据的特点主要包括四个方面,即大量(Volume)、高速(Velocity)、多样(Variety)和价值(Value)。其中,大量主要是指大数据中存在着巨大体量的数据,能够从TB的级别升级到PB的级别;高速则主要是指数据的处理速度比较快,基本上为1s定律;多样主要是指,大数据的类型十分繁多,包括网络视频、网络图片、网络日志、网络地理位置信息等内容;价值主要是指大数据具有比较低的价值密度,亦具有比较高的商业价值[1]。图书馆基于用户行为并应用大数据技术,将能够更加科学地构建并运行精准化推送服务平台,为大众创造更多便利的获取资料信息的条件。
图书馆中资源发现过程与揭示过程均与元数据之间存在密切的关联,建设元数据库即元数据仓储系统,更加有有利于整合并存储各类型的元数据,为大众进行一站式检索提供便利条件。基于用户行为的精准化推送服务平台构建中进行元数据库的建设,其数据的采编具有工作量大、长期等特点,且来源比较分散,主要包括互联网、购置的电子数据库和馆藏数据等。
基于用户行为的精准化推送服务平台进行个人特征数据库的建设和完善,将可以进一步提高个性化服务的质量,保证数据具有更高的精准性。创建个人特征数据库时必须要求初次使用该平台的用户进行信息录入,包括姓名、身份证号、职业等,图书馆内部平台便根据该部分信息进行用户注册,将相同类别的用户进行划分,从而形成集成注册用户的资料信息痕迹[2]。在此基础上,完善个人特征数据库时必须要对用户个体的阅读行为加以分析,包括参与活动情况、借阅历史、检索方向等内容,以便更进一步地挖掘用户个性化需求,保证精准化推送服务平台的相关资料信息与需求之间产生更高的密切度。
基于用户行为的精准化推送服务平台属于现今图书馆个性化服务的重要组成部分,其主要根据用户的个人特征数据库相关信息对用户的个性化偏好、需求等做出准确的分析,并且科学地应用数据挖掘技术准确向用户推送相关资料信息。在此方面,图书馆必须要进行精准推送模型的建设。精准推送模式主要包括基于相关用户文献推送和基于相关文献的推送两种[3]。以第二种为例进行精准推送模型的建设,首先要进行题目、关键词、摘要、期刊等相关影响因素的选定;其次要对评估值P进行计算,P值越大代表各项影响因素与用户需求信息的相似度越高,该P值的计算公式为式(1);最后,进行各项影响因素得分的计算。
该公式当中,ωi代表第i项影响精准化推送服务的因素权值,Fi则代表了第i项影响精准化推送服务因素的得分。根据上述计算最终可以得出相对精准的,符合用户需求的,基于大数据技术的文档。
图书馆进行基于用户行为的精准化推送服务平台构建后,必须首先确定开发平台方能够展开进一步的实行。该平台当中应该包括基于主题的网络爬虫技术数据采集程序、基于移动端的应用系统和基于PC段的WEB应用系统。同时,该平台需要将Boot Strap不同终端良好兼容性、Easy UI多控件和丰富功能等长处进行有效结合,继而确定采用C#开发语言以及微软开发的SQL Server 2008 R2数据库作为整个精准化推送服务平台实现的平台支持[4]。
图书馆基于用户行为的精准化推送服务平台实现中亦需要展开功能设计。该平台的使用人员包括了图书馆馆员以及面向社会各界的大众,其中,图书馆馆员主要负责审核注册用户信息,统计系统自动采集数据并分析、提取精准化推送信息。社会各界大众则需要通过PC段的WEB应用或者移动端应用进行资料、信息的浏览、下载、收藏等。整个服务平台的功能基本上如图1所示:
图1 基于用户行为的精准化推送服务平台功能
在上述功能当中,应用服务平台服务的对象为普通大众,审核管理平台面向的为图书馆馆员,数据采集服务为一组数据采集程序,后台服务程序则按照数据采集服务获得的信息为用户进行信息需求分类与精准化推送。
综上所述,现代信息技术的快速发展为人们的工作和生活均提供了越来越便利的条件。同时,各个领域均逐渐渗入了以人为本的思想,均希望能够制定个性化的发展方案。对于图书馆而言,其更需要在大数据技术与互联网技术背景下积极构建基于用户行为的精准化推送服务平台,通过建设元数据库,个人特征数据库和精准推送模型,科学地确定开发平台并展开平台功能设计,为广大平台用户提供更加精准化的推送服务,促使图书馆事业得到健康可持续发展。