大数据时代图书馆信息资源个性化服务模式研究

2014-11-19 00:34蔡新红
科技创新导报 2014年17期
关键词:个性化服务信息资源服务模式

蔡新红

摘 要:普遍认为,大数据具有结构化、半结构化和非结构化数据等类型,以其容量大、类型多、高时效、低密度和难分辨等特征。该文通过对大数据含义分析,认为大数据时代用户对信息需求具有时效性、精确性、全面性和数据内容针对性。根据大数据时代信息特点和用户信息需求,提出通过建立个性化引擎、开展云搜索服务、进行云推荐与推送服务和建立个性化用户分析系统等方法,建立用户个性化服务模式。

关键词:大数据时代 信息资源 个性化服务 服务模式

中图分类号:G252 文献标识码:A 文章编号:1674-098X(2014)06(b)-0195-02

近年来,云计算、物联网等技术的推动下,特别是2012年3月22日,奥巴马政府宣布投资2亿美元,主要用于研发采集、组织和分析大数据的工具及技术,并拉动大数据相关产业发展,将“大数据战略”上升为国家战略,这意味着一种全新的致富手段摆在我们面前,它的价值堪比石油和黄金,有人将“大数据战略”比之为克林顿政府1993年推出的“信息高速公路”计划,从此,全球真正步入了“大数据”时代,大数据(Big Data)成为当下热点问题。在大数据时代中,数据作为一种资源如何加以高效利用并开发出其中的价值,这已成为政府公共管理部门和企业界、投资者普遍关注的问题。

1 大数据时代读者需求

对图书馆而言,其创新变革经历了数字图书馆(DL)、信息共享空间(IC)、IFRD、机构知识库存(IR)、移动图书馆(ML)、云计算等,数字资源的积累经历了传统的数字化到原生数字资源的发展过程。可以说,到目前为止,中文纸质图书、期刊、学位论文等文献类型,已大部完成数字化转换。英文及其它文种的纸质资源正在进行大规模数字化。事实上,传统资源只占数字资源的很小部分,而原生资源(Born-digital resources)在每台终端机、每个用户都不断地产生信息。可以说,未来图书馆大数据主要来自数字图书馆、RFID射频数据、传感器数据、社交网络交互数据和移动互联数据等。而对用户,其大宗旨就是如何利用相关数据技术的从海量、多样性的数据中,即省时又省钱,并精确、全面、快速获得有价值的信息。

1.1 对数据时效性要求

互联网上每天都产生大量数据,这些数据都是以无序化、多样化等形式出现的,如果用户没有相当的时间去归纳、整理是很难组织适合自己的信息,这后知后觉意味着损失先机、价值和效益。因此,图书馆如何通过数据挖掘技术,为用户迅速从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,组织、提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息推送技术推送到用户手中。

1.2 对数据精确性与全面性要求

云华时代智能科技有限公司董事长郭昕认为,大数据不仅改变了我们的思维方式,而且改变了我们的生产方式和生活方式,我们的精神世界和物质世界都将构建在大数据之上,大数据不仅仅是一门技术,更是一种全新的商业模式,它与云计算共同构成了下一代经济的生态系统。而图书馆数据从形式上分包含购置的资源、嵌入到图书馆相关资源、社交网络资源、移动互联网资源和图书馆一些传感器所产生的资源等;从数据结构上包含结构性数据、半结构性数据和非结构性数据。因此,无论在数据结构和数据容量上来看,大数据如果缺少必要的技术手段,人工的搜索或者浏览都无法全面了解数据全貌。用户由于对数据处理及数据挖掘技术掌握的不够,影响数据的完整性、准确性和全面性,必将影响对事物的正确判断,使其嗅觉变得迟钝。在这个意义上,图书馆工作人员无论从事实要求和社会要求,都要求转变职能,以大数据的思维出发提高服务水平,从联机编目、馆内借阅、馆际互借,转而对各种数据提供精细分析和信息进行实时分析,提供精确性与全面性的数据。

1.3 对数据内容要求

客观地说,用户利用信息资源的动机一般由需要、认知、学习等内因和文化、社会、家庭、小群体、参考群体等外因共同决定,一方面每个用户,其因知识背景、学科专业、科学研究方向决定其利用信息资源的层次、范畴和内容,对数据要求不同。另一方面由于不同的数据有不同的结构形式,不同的网站界面风格设计;其数据利用和定制途径也不一样,如果要使数据用户根据自己所需,就要在用户与数据之间建立一种关系,这种关系是对应关系,是通过开通网络全覆盖进行内容定向和行为定向服务。

2 大数据时代读者个性化服务模式

大数据时代的图书馆用户数据需求,不再局限于简单层次的信息查询与反馈,而是转向广阔的信息源,用户对信息产品的需求,不是简单查找相关文献来源与出处,而是要求提供综合度高、附加值大的信息产品。不仅是要信息咨询人员提供图书馆现有数据库、书目数据等结构性数据,同时还要查询互联网上非结构性和半结构性数据。为更好地利用这些数据,图书馆员就要掌握一些数据挖掘工具与技术,根据用户利用信息资源的历史记录,掌握其学科专业背景、学术研究方向和阅读兴趣,对海量数据之间的关联进行分析,挖掘出隐藏其中的规律信息,形成满足用户需求的深层次信息产品;主动定制书目数据、文献资料等专题信息,并定期进行推送,真正实现个性化信息服务。

2.1 建立个性化引擎

众所周知,在搜索领域Google、百度等已被用户所熟悉,其强大的搜索功能赢得广大用户的青睐。针对图书馆而言,建立个性化的发现机制,能对各种数据进行表述、分类及评价。这样的个性化推荐系统必须能够基于用户信息需求提供相关的精确的推荐,而且这种信息需求收集是较全面的。推荐的结果必须能够实时计算、运用,并能及时的对推送结果作出反馈。当然建立用户个性化推荐机制的形式各有不同,一般是基于图书馆网站内容,利用读者的信息行为和信息源,为读者进行个性化信息推荐,其推荐行为是根据用户行为数据记录和历史信息需求进行。

2.2 开展云搜索服务

一般认为,云搜索是指可定制的、智能化站内搜索。其核心价值诉求是保证所有资源利用者都能根据自己的数据需要找到相应的信息,提高用户的满意度。站内搜索支持所有论坛、CMS和手机终端应用,其目的是节省服务器资源,不需限制搜索;搜索结果更精准;筛选方式更多样;更迅速得出结果,提供搜索效益;通过云搜索可根据网站不同数据类型定义搜索条件,打造各种定制搜索需求,通过精准内容推荐,提升网站流量,增加用户粘性,强化搜索范围、索引管理、语词(关键词)管理等。endprint

在开展云搜索服务过程中,其主要内容包括:拥有站内搜索功能、划词搜索、帖子页推荐、弹窗推荐、refer推荐和首页热词分析等,其中站内搜索是云搜索服务的基本搜索功能,可根据用户信息需求,定制结构化数据,并进行定时数据更新;首页热词是云搜索服务的运营助手,可根据信息流量动态伸缩信息资源;其他项目是云搜索服务的基本服务内容推荐。

2.3 进行云推荐与推送服务

各个商业网站或信息专业网站常用Refer进行云推荐服务。Refer推荐服务需要与搜索引擎关键字匹配,并从所有的搜索引擎(百度、google、云搜索)到达的页面(可能是帖子页、可能是首页、板块页等),当其搜索关键词被激活时,页面弹出具有更多相关内容的弹出框;从而使外部搜索引擎到达站点的用户看到站内更多相关内容,对站点产生信任感。云推送服务的优点在于,云推送服务支持推送给一个人、一群人和所有人,单一终端多个应用共享一个服务进程和一条 TCP 长连接,从而有效降低手机的耗电量和数据流量,使用云推送服务用户可使用“无账户登录”。这样,一是增强用户粘性,通过云端之间的长连接,可以实时的推送消息到达用户端。保持与用户的沟通,大大提升用户活跃度和留存率;二是节约成本,在省电省流量方面远超行业水平,基础的消息推送服务永久免费,大大节省开发者推送的成本;三是稳定安全的推送,强大的分布式集群长期为百度各大产品线提供推送服务,保证消息推送服务的稳定、可靠。

3 大数据图书馆个性化服务系统

以资源为核心的数字化图书馆建设到以读者为核心的大数据图书馆,最重要的就是针对不同读者全面解决用户个性化信息需求。而大数据的应用就在于加强用户研究与交互数据的利用,并基于对用户数据的分析,提升个性化服务的水平,开展定题跟踪服务、精准提供服务、定制知识关联服务和信息推送服务。图书馆面对快速增长的大数据,从中提取有价值信息,建立个性化用户分析模型,针对不同用户快速提供全面、准确的信息资源,满足其个性化服务需要,提高信息服务层次与服务质量。为满足大数据对图书馆的要求,需要在以下几个方面进行突破。

3.1 数据挖掘技术

数据挖掘技术是大数据应用的核心。数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程,该过程也被称为数据考古(Data Archaeology)、数据模式分析(Data Pattern Analysis)或功能相依分析(Functional Dependency Analysis)。个性化图书馆首先要求文献资源的个性化,使有限的经费、宝贵的空间添置读者真正需要的文献,提高文献资源的利用效率,并根据学校的专业设置及教学科研情况分配文献购置费,使各种文献载体形式之间达到平衡。图书馆每天产生大量可以对采购工作产生指导作用的数据,如自动化系统的流通数据、图书馆的历史采购数据、查询系统的各种查询数据等。利用模糊聚类分析技术,通过对图书馆业务系统的借阅、流通状况、检索请求及馆藏书目库进行分析挖掘,以此分析出文献的利用率,及时补充短缺的文献,剔除过时的文献或减少部分文献的采购复本量。运用关联分析技术,对用户每次借阅的文献进行关联分析,发现各类文献间的关联规则或比例关系,可为各学科文献的采购工作提供分析报告和预测报告,优化馆藏结构。

3.2 用户行为分析系统

用户在借阅过程中,产生大量的借阅数据,图书馆一方面通过对用户的学科、专业背景以及其相关领域科研动向进行宏观分析,洞察用户最新的科研走向,结合用户相关历史借阅数据,推断其借阅习惯与借阅趋势,利用数据挖掘技术,定制与其借阅相关联的文献资源,并通过推送技术,把相关联的文献资源推荐给用户,提升了图书馆在科研领域中的作用,为科研工作者提供了更多有价值的信息,提高服务的针对性、有效性和质量。另一方面根据用户借阅数据分析,判断用户图书借阅的总体趋势、各类借阅图书分布、近期借阅热门图书,对图书馆馆藏图书进行有效评估,预测出读者关注的热点,并根据图书资源评价意见,有效评估图书馆已有文献的质量以及读者对未购买文献的需求,合理采购文献资源和电子资源,让购买的资源更好地满足读者的需要,提高图书馆信息资源的利用率。

3.3 定题跟踪服务系统

大学图书馆的一个重点工作是对重点学科开展定题跟踪。定题跟踪服务是指高校图书情报部门针对某一特定课题的研究需要由图书情报人员主动地、及时地、连续地为科研人员提供文献资料,搜集情报信息和数据,最大限度地满足科研人员文献信息需求的全程式服务。定题跟踪服务采用Web挖掘技术,对文档进行分类、自动摘要、页面过滤、网页聚类以及趋势预测等。目前研究者从不同角度已经提出了很多行之有效的文本分类方法,这些方法大多是基于机器学习方法的,根据其分类原理的不同分为线性分类器、统计学习分类器、基于实例的分类器、决策树方法、神经网络方法、支持向量机方法等。

3.4 信息推送服务系统

信息推送服务是基于推送技术发展而出现的一种新型服务,它运用推送技术来实现个性化的主动信息服务,信息推送服务不仅能够做到了针对用户的需求快速查找信息,而且保证了所提供信息对用户的有用性,做到了信息服务的个性化,是近年来图书馆信息服务重要发展方向。随着无线通讯技术的发展,手机作为信息终端已经成为现实,在信息推送技术中,除了传统的WWW、E-mail推送服务,手机信息推送APP已经成为目前研究的热点。

参考文献

[1] 张文彦.大数据时代的图书馆初探[J].图书与情报,2012(6).

[2] 百度百科:大数据.http://baike.baidu.com/view/6954399.htm.

[3] 百科名片:大数据时代.http://baike.baidu.com/view/9424571.htm.

[4] “大数据时代”来临[N].北京晚报网,2012-06-15.

[5] 新华网,大数据时代的中国机遇——访IBM中国研究院院长沈晓卫. http://news.xinhuanet.com/fortune/2013-04/30/c_115597780.htm.

[7] 大数据时代的中国机遇.文摘36,2013-05-30].

[8] 舒宗瑛.图书馆信息管理中数据挖掘技术的应用[J].甘肃科技纵横,2009,38(2).

[9] 龚军慧.高校图书馆拓展与深化科研定题跟踪服务的最佳实现途径[J].情报探索,2012(11).

[10] 李沛.个性化信息推送服务及其在图书馆中的应用[J].河南图书馆学刊,2010,30(5).endprint

猜你喜欢
个性化服务信息资源服务模式
互联网思维下数字图书馆个性化服务建设研究
需求理论在高校图书馆就业服务中的应用研究
关于构建党校图书馆中信息资源的共建与共享方案
文化馆总分馆制服务模式的实施探索
谈云计算与信息资源共享管理
基于网络的信息资源组织与评价现状及发展趋势研究