陈则芝,张友梅
(合肥职业技术学院,安徽 合肥 230031)
在生活中,小到个人,大到企业、行业乃至整个社会,时时刻刻都在产生着数据。这些数据有可用二维表结构表示的结构化数据, 也有类似XML、HTML 的半结构化数据,而成为主流的是诸如文档、图片、音频、视频等非结构化数据。 这些数据不仅数据量大,还具有种类繁多、增长迅速、价值密度低等特点。 许多企业借助大数据技术对这些数据进行收集、存储、管理和分析,从中挖掘出有用的信息,为生产生活服务。 如:提供产品或服务的企业可以利用大数据进行精准营销;中小企业利用大数据进行服务转型等。 我们的生活正因为大数据的运用发生了翻天覆地的变化,大数据逐渐改变我们的生产生活方式。
随着计算机技术和网络技术的发展, 读者对图书的需求也发生了变化, 特别是数字化阅读需求呈上涨趋势。为了迎合了这个需求,作为承担着教育职能的各大高校不断探索数字图书馆的建设路径,纷纷将图书“搬上”了网络平台,利用现代化的数字技术,生成数字化的馆藏文献,让读者借助互联网不受时间地点限制地查询信息, 从而更好地为教学科研服务。
为了更好发挥数字图书馆的功能, 各高校加大建设资金的投入, 不断完善数字资源, 收录中国知网、万方、CSCD、维普、Springer、EBSCO 等数据库。一些高校建立了内部数据库以收录学生论文、 教学参考书等,搭建起为师生服务的数字服务平台。
大数据时代的到来, 将促进数字图书馆数据的管理、分析、使用及服务的深层次变革,为高校数字图书馆的建设提供了条件, 也对高校数字图书馆的发展提出新的挑战。 目前高校数字图书馆建设中仍存在以下几个问题。
高校数字图书馆中有大量的结构化和非结构化数据, 数字图书馆需要通过某种数据处理技术对数字资源进行收集、 转换和存储, 建立起相应的数据库。收集数据时所采用的技术不同,造成数据格式不同,如:有的数字资源是借助物联网和RFID 标签技术对纸质文献进行扫描获得的; 有的数字资源是通过现成的数据库获得的。 由于缺乏统一的数字资源标准,势必增加资源整合的难度[1]。
高校数字图书馆虽然实现馆藏文献的数字化,但对数字资源的数据挖掘能力不足, 数据配置未尽合理,如:重视论文期刊的收录,忽视音频、视频等资源的收录;近期的图书收录率高,时间较远的著作收录率较低;中文文献的收录比较多,外文文献收录比较少等。 由此可见, 高校数字图书馆的数字资源与读者的需求之间还存在相当大的差距, 读者很难从高校数字图书馆中获取足够的资源[2]。
不同高校考虑到各自的社会效益和经济利益,不愿意开放数字图书馆数据库的端口, 致使每个高校的数字图书馆的建设相对独立, 从而形成了一个个数据孤岛。 这样一方面导致很多数字资源重复建设,文献资源库中存在着重复交叉的问题;另一方面造成数字图书馆之间很难实现资源共享,如:有的高校投入大量精力建设重点专业和学科, 建立起自己的特色数据库, 但由于缺乏共享, 导致读者能够检索到的数据量较少, 降低了数字图书馆服务水平和质量。
很多高校的数字图书馆基于校园网开展数字资源的存储、 管理和检索等服务。 一旦学校网络出现故障,则数字图书馆的各项工作就会受到影响,导致信息资源的收集和存储无法进行。 同时学校网络的带宽也会导致数字化图书馆访问速度过慢, 无法满足读者需求,读者体验变得越来越差[3]。
部分图书馆在建设数字化图书馆时没有意识到读者数据对其发展的重要性, 没有获得有效的读者需求信息资源。 虽然可以向读者推荐一定的信息资源,但是缺少对读者浏览及检索行为的了解和掌握,无法根据读者阅读爱好及习惯提供精准的个性化服务,这些问题制约了图书馆数字化建设的发展。
虽然各个高校或多或少建立了数字图书馆,拥有一定的数字资源,但是存在只管建不管用,只管用不管如何用,只管如何用不管用的好不好等问题,这样就造成资源的利用率并不高[4]。
随着我国对知识版权愈加重视, 版权问题成为数字图书馆发展过程中的一大难题。 在信息资源个性化服务中,需要对信息资源进行分类、整理之后提供给读者利用。 虽然这种对信息资源的分类整理是对原始文献的创造, 但对这些信息资源进行归类整理之后, 以专题的形式借助数字化信息资源进行再编辑和出版,将直接关系到原著的演绎权,这可能涉及版权问题。
大数据环境下, 高校数字图书馆的资源繁杂多样,数量呈几何级增长,面对不同平台且数量众多的异构信息资源, 要充分利用大数据相关技术对图书馆信息资源进行挖掘整理, 构建基于大数据的数字图书馆服务体系,如:信息服务、文献检索服务、个性化服务、微平台服务等。
在大数据背景下,各高校图书馆应同心协力,利用大数据技术合理解决好各数据库之间的兼容性问题,不断拓宽资源整合范围,从资源层、数据处理层、应用层、 用户交互层四个层次来构建数字图书馆信息服务系统, 有效实现各个图书馆之间的数据资源共享共建,防止图书馆数字资源的重复建设。也可分利用大数据技术研发有声数字、 立体阅读等新型数字资源,将服务范围进行延伸和扩展。
每所高校都有自己的特色专业和重点学科,当然会有与之相关的特色资源。各高校应高度重视特色资源的开发与运用,在进行资源整合时,互相取长补短,联合开发特色数字资源库,为读者提供特色服务。
另外,高校数字图书馆应通过数字平台,围绕教育方针政策及社会热点,开展各种学术活动如讲座、专家论坛等,从而提升读者的数字阅读体验。
传统图书馆的资源共享是通过借阅来实现,而现在的高校数字图书馆则是通过访问资源数据库来实现。
高校数字图书馆一般都会购买中国知网、 维普期刊网、万方等多个数据库的使用权,若建立跨数据库的统一的检索平台, 让读者在一个检索界面进行检索,不仅避免一一登录这些平台的麻烦,还大大提高检索效率。
为帮助读者从海量的资源库中快速、 准确地获取所需要的资源, 高校图书馆不断完善图书馆检索系统, 提供精确检索与模糊检索两种关键词检索方式。在精准检索中设置多个检索选项,可以帮助读者精准地检索到所需要的信息资源。 在需求不太明确的情况下,通过模糊检索,可以获得与检索关键词相关的多个文献资源。
在大数据环境下, 可利用大数据技术对数据资源进行采集、筛选、分类、聚类等处理,智能理解、识别检索关键词, 借助于网络资源抓取功能对资源内容进行抓取,自动跟踪分析读者行为,在掌握读者偏好的基础上,为读者提供更加精准的服务。
传统的高校数字图书馆将读者当作被动接受的主体,为读者提供资源的检索、借阅、论文下载等服务。
在大数据背景下, 高校数字图书馆应注重读者信息行为数据的利用,加强对读者阅读需求的研究,主动为师生推送信息资源,进行个性化服务推荐,构建个性化信息服务的系统模型。
大数据环境下, 数字图书馆不仅要记录基础服务数据, 充实馆藏数据, 更要建立完善的读者信息库。 读者信息库除了记录读者姓名、专业方向、联系方式等个人特征信息外,还应利用大数据技术,从海量的借阅、搜索、浏览痕迹等行为信息中提取有价值的信息。
高校数字图书馆可利用协同过滤、 基于内容过滤等推荐技术等对读者的浏览与搜索行为进行挖掘与研究,建立与读者需求匹配的资源库,从海量信息中筛选个性化内容。在读者登录数字图书馆时,根据读者的行为数据,在页面主动向读者进行图书推荐,或通过邮件、 微信等方式向读者进行个性化阅读资料推荐,极大提高读者的阅读兴趣[5]。
随着移动互联技术的发展,使得手机、手持阅读器等设备走进我们的生活。利用移动终端,人们只需通过无线网络就可以在任何时间、 任何地点获取所需要的信息。
高校图书馆也要与时俱进, 拓展数字化阅读平台,将数字图书馆引入移动平台,借助新媒体技术,建立移动数字图书馆APP 或开通图书馆微信公众号。
在移动数字图书馆APP 或在微信公众号中提供个人中心、动态信息、图书借阅、资源检索、阅读推广、读者交流等服务,及时把信息动态、个性化推荐等信息传递给读者, 使移动设备成为高校数字图书馆为读者提供服务的重要场所。
读者在手机、平板等移动客户端上登录成功后,可以了解图书馆的相关信息,随时进行图书预约、在线浏览资源, 也可借助语音识别等技术与读者进行资源共享。
借助移动数字图书馆APP 或在微信公众号,可以挖掘读者隐性的信息需求,结合在线分享功能,主动将图书馆资源、服务和活动等信息推送给读者,促进图书馆的服务升级[6]。
高校图书馆要充分意识到建设数字图书馆的重要性,加大资金的投入,引进先进设备和技术,对基于不同网络下的异构数据资源进行数字化管理及分布式管理,实现数字化资源的革新,确保读者能及时检索到自己需要的信息资源。
目前, 数字化图书馆的建设中主要的硬件投入是服务器,可以借助HDFS 分布式存储相关技术,对图书馆的服务器、数据库等多个方面进行整合,构建数字图书馆的运行环境, 用于电子图书的存储、搜索、下载等服务。 为防止数据丢失和突发故障,需建立一个基于NAS 的异地备份系统,提高数字图书馆的健壮性,从而保证数字图书馆的稳定及高效运行。
为更好地提高数字图书馆的服务质量, 各高校之间应联合起来建立一个统一的管理制度, 对接相互之间的数据平台,开放端口和数据库,统一调度图书馆信息资源,使读者不管从哪个数字图书馆登陆,都可以方便地查询、检索自己感兴趣的信息,真正实现各个图书馆之间的资源共享和合作。
在高校数字图书馆建设中, 从信息平台的搭建到软件的开发与应用,从信息资源的收集到存储与传播等环节都存在安全隐患,这些势必将影响系统的顺利运行。
高校图书馆应必须建立、健全相应的法律法规,采取多种防护措施,以保障数字图书馆系统的安全运转。如:依据文献资源的重要性对其设置不同的访问权限;加强防火墙的建设,提高预警系统的防范能力;对访问IP 进行检测,屏蔽非法的访问;及时修复存在的漏洞等[7]。
在新的数字图书馆服务模式中, 图书馆人员的业务水平有待提高。 图书馆人员要转变服务理念,树立起为读者服务的思想,不仅要熟悉传统的工作流程和模式,还要熟练掌握与数字图书馆相关的操作技术。 因此,高校图书馆应定期组织馆员进行相关培训,以提升图书馆人员的综合素质,满足当前高校数字图书馆不断发展的需要。
大数据应用的普及为高校数字图书馆的建设带来了新的契机。 高校图书馆应紧随时代的步伐,以满足读者需求为目标,注重研究与创新,探索新的服务模式,扩大服务范围。加大建设资金的投入,有效整合高校数字图书馆的馆藏资源,借助统一的资源检索平台, 实现高校图书馆之间的资源共享。挖掘读者行为数据, 为读者提供个性化推荐服务。同时制定合理的图书馆管理制度,提升个性化服务意识,以提高数字图书馆个性化信息服务的水平和质量。