张铭丽
(广州市黄埔区图书馆,广东 广州 510530)
进入大数据时代,发展个性化信息服务模式是公共图书馆读者服务发展的必然方向,这既是满足读者需求的有效手段,也是推动图书馆运营管理模式创新发展的关键。不过在实践中发现,个性化服务模式的构建还存在着一些不容忽视的问题,导致实际服务效果并不能达到预期,因此需要尽快采取相关措施加以优化和改善。
随着时代的发展以及读者需求的变化,个性化信息服务逐渐成为公共图书馆读者服务中广受关注的部分。尤其是在信息化时代快速发展的大背景下,信息量的飞速增长给读者获取所需有效信息带来了不小的影响。如果图书馆依旧坚持传统的共享信息服务模式,只关注所有读者群体的整体需求而忽视部分乃至个别读者的个性化需求,将会导致读者体验大打折扣,不利于图书馆职能的充分发挥以及长远发展。个性化服务要求做到服务目的准确、内容丰富、专业性强、水平高、方式多样、时间灵活,而且必须准确了解读者的实际情况,既要关注读者的实际需求,也要针对读者行为提供更具前瞻性、引导性的优质服务。公共图书馆读者数量多,要想实现个性化信息服务难度较大,而传统信息技术对海量读者数据的处理能力较弱,无法满足个性化发展需求。而大数据技术、云计算技术等先进技术在图书馆中的普及与应用,从技术层面解决了这一难题,通过对海量数据的高效处理,支持个性化信息服务功能的有效实践。在大数据技术的支持下,个性化定制服务、个性化信息资源管理服务、个性化信息推送服务、个性化互动式服务、个性化信息素养教育服务以及其他个性化服务都具有高度的可实践性,真正做到满足所有读者的实际需求,提供高质量的个性化服务[1-2]。
对公共图书馆而言,要想发展个性化信息服务必然需要打牢信息技术基础,从技术层面为服务体系的构建奠定根基。大数据背景下,实现个性化信息服务需要用到的先进技术较多,包括云存储技术、虚拟化技术、数据挖掘技术、智能搜索技术、智能Agent技术等。然而部分图书馆受限于管理层意识、资金投入、技术人才等因素,信息技术基础建设不到位,整体服务水平偏低,对各种先进技术的应用更是较为缺乏,无法从技术层面支撑个性化信息服务的构建与落实。
对读者情况进行充分把握,是开展个性化信息服务的必要基础。大数据背景下,数据挖掘技术是图书馆对读者行为特征进行分析并掌握读者基本情况的关键技术。然而部分图书馆在实际运用该技术时存在不少问题,导致该技术的优势与作用无法得到充分发挥,无法为个性化信息服务工作的开展提供有力支持,容易出现读者行为特征分析不够全面甚至出错的情况。首先,图书馆读者行为特征分析中数据挖掘技术的应用范围覆盖不全。要借助数据挖掘技术实现对读者行为特征的全面分析,需要针对读者各方面的行为数据信息进行全面挖掘与分析,包括读者访问时段、互联网访问特征、访客地域、访客特征构成、新老读者比例、读者忠诚度、电子资源监控统计等。然而部分图书馆在运用数据挖掘技术时,并没有全面覆盖这些内容,只是针对其中部分数据信息进行挖掘和分析,自然难以全面、准确获取读者行为特征,不能为个性化信息服务提供可靠依据。其次,分析标准与规范不科学、不合理。针对不同的读者行为特征指标,需要采取科学、合理的方式加以分析,方能保证分析结果的可靠性。然而部分图书馆尚未形成符合自身实际情况的分析标准与规范,使得分析结果和实际情况存在一定偏差。
基于大数据实现图书馆个性化信息服务,需要构建相应模型,借助模型实现对数据的标准化、统一化、规范化处理,进而为相应服务模式的构建奠定基础。但是部分图书馆在构建模型时没有基于科学方法进行分析处理,或者没有充分考虑自身实际情况而盲目照搬其他模型,导致模型的构建存在一定缺陷。尤其是在基础的读者群体需求模型、结构性数据分类模型、图书资源个性化服务推送模型都存在问题的情况下,将会造成难以预估和调整的数据错误,进而导致个性化信息服务所依托的基础数据出现问题,使得服务质量大受影响,无法精准有效地为读者提供令他们满意的优质个性化服务。
大数据为个性化信息服务的实现提供了技术支持,同时也使得读者的隐私保护面临着巨大风险,稍有不慎就会造成隐私数据泄露问题,严重威胁到读者的隐私安全,更会对图书馆读者服务质量造成巨大打击。就目前来看,在基于大数据的个性化信息服务中,公共图书馆读者隐私数据的泄露主要有三种形式。其一,非授权访问和收集数据。不管是图书馆应用大数据技术为读者提供服务,还是不法分子试图获取读者隐私数据信息,都可能出现对读者数据进行非授权访问与采集的情况。图书馆若没有严格按照相关法律、章程、规范进行操作,在进行读者数据访问和收集时越权违规处理,对非授权数据进行采集,会直接侵犯读者隐私。而不法分子通过各种非正常手段获取读者智能终端的访问权限,也会对读者隐私造成严重威胁。其二,信息载体泄露。大数据时代数据的采集、传输、存储、管理等环节较为复杂,也存在不少漏洞,很容易在数据处理过程中出现数据被泄露、窃取的情况。其三,基于隐私推理的攻击。基于大数据的个性化信息服务本就是基于数据挖掘、数据分析、需求推理和预测而展开的,而通过隐私推理的方式展开攻击,将会严重侵犯和威胁读者隐私[3]。
个性化信息服务模式的构建离不开技术支持,需要全面落实技术引入与应用。大力发展云存储技术,与云计算商家展开合作,通过成熟的云平台进行数据库的构建与管理,确保海量图书馆运行管理相关数据能够被有效存储。同时,需要大力发展虚拟化技术,从而实现对数据资源的统一访问、管理与维护,促进硬件资源虚拟化,在提高信息资源易用性的同时还能提高硬件资源使用效率。当然,数据挖掘技术是最基础也最关键的技术,需要通过数据准备、规律寻找、模型构建三大阶段对数据进行有效挖掘与分析,从而实现对读者行为特征与需求的准确分析。目前常用的数据挖掘方法包括分类、聚类、回归分析、关联规则、神经网络等,具体需要根据图书馆实际情况进行灵活选择。智能搜索技术能够实现对大数据的智能化搜索,这是传统搜索技术所不具备的基础功能,主要包括分布式处理、并行处理、网格计算、云搜索等多种方式。至于智能Agent技术,则是典型的人工智能技术,能够支持图书馆信息化系统实现自主学习、智能交互、自主管理,从而模仿人对数据信息进行综合化处理。
公共图书馆需要对读者行为数据挖掘与分析进行合理优化,从而保证数据分析的可靠性,为个性化信息服务提供有效依据,促进服务水平显著提升。着重围绕读者访问时段、互联网访问特征、访客地域、访客特征构成、新老读者比例、读者忠诚度、电子资源监控统计等数据信息进行合理分析,规范相应的数据挖掘与分析程序、标准,实现较为全面而准确地对读者行为特征进行有效分析。其中,对读者访问时段的分析可基于监控智能统计以及网络访问量等基础数据展开;互联网访问特征分析需要对网络访问来源数据信息进行分析;访客地域分析需要准确识别网络读者IP地址以及读者借阅证注册信息;访客特征构成分析需要对读者的性别、年龄、职业、学历、兴趣、爱好、专业、从事课题、图书借阅情况等加以分析;电子资源监控统计分析则需要对电子资源的访问量、使用量等进行分析。
对个性化信息服务模型进行合理构建,是保证数据挖掘分析可靠性的关键,同时也是保证服务质量的要点。公共图书馆需要全面落实相应的模型构建工作,严格按照科学方法进行处理,并根据自身实际情况优化模型。其中,读者群体需求模型的构建需要对纸质图书借阅记录、电子图书借阅记录等数据进行分析,从而判断读者群体需求,并基于此重构知识库,优化推送引擎;结构性数据分类模型的构建需要围绕专业学科类数据、考试类数据、多媒体类数据、通识类数据等展开分析;图书资源个性化服务推送模型需要围绕周期性推送、新书匹配推送、历史信息推送、个性化定制推送、图书事件推送等加以构建。
大数据环境下,图书馆发展个性化信息服务模式面临着严峻的读者隐私泄露问题,并且广泛体现在数据处理的各个环节。不论是出于保护读者权益的考虑,还是出于保障图书馆持久、良好运营发展的考量,图书馆都必须积极落实相关措施,全面加强读者隐私保护,为个性化信息服务模式的创新优化提供可靠保障。图书馆需要对个性化信息服务中的五大数据处理环节进行重点分析,找出其中存在的读者隐私泄露风险,并针对性地落实相应隐私保护措施。
首先是数据采集环节。大数据背景下,对于读者数据信息,基本上是基于信息化系统进行自动化、智能化采集,而读者对相关事宜的了解往往不足,导致部分读者的隐私数据被非授权采集,而读者却处于不知晓的状态。因此,在这一环节应当给予读者足够的自主性,建立信息开放的数据采集模式,实现读者自主可控。
其次是数据存储环节。大数据时代数据信息的共享性极强,云存储、分布式网络系统、虚拟化技术虽然为数据存储提供了基础支撑,但也使得数据存储访问的控制难度加大,容易导致读者隐私数据泄露。在这一环节,需要加强对云存储和虚拟资源池的访问控制,深化图书馆与云计算提供商的合作,制定科学、合理而有效的权责机制,严格按照数据存储访问机制进行数据处理,进而保护读者隐私数据安全。
然后是数据挖掘环节。在数据挖掘过程中,对已经采集的读者数据进行分析和隐私推理,基于读者兴趣模型构建和读者描述文件对数据进行处理,很容易侵犯读者隐私。尤其是当建模方式与读者认知和需求存在差异时,读者很容易产生不信任感,认为自身的隐私被窥探和泄露。公共图书馆应当高度尊重读者意愿,并着力从技术层面构建读者自主控制与图书馆引导控制相结合的读者兴趣模型,允许读者自行对自身相关数据信息进行处理,尤其体现在将不想被掌握或匹配的数据信息剔除,同时给予读者自由了解自身相关数据信息以及变更兴趣模型的权利,从而减少数据挖掘环节中读者隐私数据的泄露情况。
接着是数据传输环节。在数据传输过程中,分布式网络系统本身的特点与缺陷使得相应的数据信息容易被窃取和泄露。大数据技术与5G通信技术、互联网技术、云计算技术等密切关联,相互之间有着强烈的联系,而各项技术在分布式网络中的应用都可能导致相应的信息安全问题。特别是在分布式网络自身的开源性、公开性、共享性等特性的影响下,读者行为数据等隐私数据很容易泄露。公共图书馆必须加强数据信息安全保护,积极应用加密技术等加强数据传输阶段的读者隐私数据保护。
最后是数据推送阶段。数据推送是个性化信息服务的重要环节,不仅决定了读者对个性化服务的认知与体验,也影响着整个服务活动对读者隐私的全新保护情况。这一阶段会对读者数据信息进行访问以及控制,稍不注意就可能造成隐私侵权问题。公共图书馆需要加强读者访问控制以及读者角色控制,同时充分运用读者密钥管理技术、人工智能技术等先进技术,在为读者提供个性化服务的同时保护读者隐私权益[4-5]。
大数据时代公共图书馆要想高水平开展个性化信息服务,必须克服各方面的困难与障碍,从多个方面探索行之有效的策略与措施,持续优化服务。以落实信息技术软硬件建设为基础,加强人才队伍培养,优化结构体系与管理制度,全面加强技术应用,始终将读者的需求放在首位,致力于在不断发展的过程中探索和完善个性化信息服务模式。