计算机自动注解技术在图书馆社会化阅读中的运用探讨

2024-05-27 13:43陈晓秦何怡
科技资讯 2024年1期
关键词:图书馆

陈晓秦 何怡

关键词: 计算机自动注解技术 数字化阅读 社会化阅读 图书馆

中图分类号: G252 文献标识码: A 文章编号: 1672-3791(2024)01-0204-04

1 国内图书馆数字化阅读现状

1.1 “ 互联网+”催生数字化阅读

“根据第二十次全国国民阅读调查数据显示,2022年,我国成年国民数字化阅读方式的接触率为80.1%。2022 年有77.8% 的成年国民进行过手机阅读。手机和互联网成为我国成年国民每天接触媒介的主体”[1]。这也可以证明,数字化阅读是阅读领域的一个亮点,在“互联网+”时代背景下,数字阅读已是一种不可逆转的阅读趋势。

1.2 图书馆数字化阅读平台的不足与应对举措

美国人本主义心理学家马斯洛在20 世纪40 年代提出了需要层次理论,他认为人有生理、安全、归属和爱(即社交)、尊重、自我实现这五种基本需要。王海燕[2]认为,“从创建网站和数字图书馆、引入电子书和电子阅读器到开通微博、微信公众号和使用独立App,大部分高校图书馆和公共图书馆都已经参与到社会化阅读中。”但是,目前图书馆的社会化阅读建设存在轻用户参与问题,大部分处于封闭状态,鲜与社交网络平台进行合作,读者在获取信息资源方面便利性不足。目前,图书馆在线阅读系统还没提供文本批注、笔记、分享、评分、留言、精准推送等功能,未能提供精细化的读书服务,不利于社会化阅读的形成。

1.2.1 构筑个性化服務模式

图书馆将电子书等数字阅读信息资源借助互联网技术加载到手机、平板电脑和电子阅读器kindle 等移动终端设备中,以创新移动图书馆数字阅读的新媒体服务模式。目前个性化与精品化的数字阅读已成为读者的更高追求,这就要求图书馆必须注重数字信息资源的质量并不断提供更高品质的服务[3]。图书馆的数字阅读服务应为读者提供更多个性化、差异化与精品化的阅读内容,读者才能获得更多更好的数字阅读服务与体验,从而更愿意利用图书馆数字化阅读系统获取自己想要的内容。图书馆应充分利用互联网新兴技术,加强数字阅读的优质服务和共建共享,进一步探索和创新服务内容和服务模式,为读者提供更多的便利和乐趣。

1.2.2 提升社会化阅读功能

社会化阅读是阅读主体自我生成内容并与其他读者分享、互动、传播信息的行为。特别是在网络环境下,社会化阅读愈来愈成为读者日常生活中常见的阅读形态[4]。面对现代读者新的阅读行为,图书馆如何应对社会化阅读带来的挑战也日益紧迫起来。特别是公共图书馆,应充分利用移动阅读App,将阅读嵌入社会网络,实现社会化阅读的升级并不断提升各项功能,真正发挥公共图书馆对读者阅读的正向引导作用,促进读者良好阅读习惯的养成。

1.2.3 尝试跨媒体阅读模式

该模式的核心要素是打破原有的阅读观念,倡导开放式的阅读。这种开放式的阅读要求我们从各种传播媒体各自为战、互相封锁的割据状态中走出来,充分发挥传统媒体和新兴媒体各自的优势,寻求一种或多种交叉融合的阅读模式[5],增强各种传播媒体之间的整合和互动,从而使得获取信息更加便捷化、立体化、全面化。跨媒体阅读是未来阅读的方向,图书馆资源丰富、资源类型多样,具有实现跨媒体阅读的先天优势[6]。若能克服资源整合、成本预算、法律法规和技术标准等一系列问题,开拓新的跨媒体阅读模式,将让图书馆更具竞争力。

2 计算机自动注解技术的实现

研究表明:很少有读者会在线对电子文档做注解或者评论,从而导致社交阅读影响非常有限[7]。为了加强电子文档的可读性以及内容的丰富性,国内外的研究学者纷纷提出采用先进的文档自动注解技术来丰富电子读物的内容,基于自动注解技术的数字阅读系统因此也成为非常火爆的研究热点。

在分析了图书馆数字化阅读存在的不足、面临的挑战和应对举措后,本文主要研究将计算机自动注解技术应用于图书馆数字阅读系统,探讨该系统实现读者个性化、差异化与精品化的社会化阅读的可行性。

2.1 计算机自动注解技术概述

首先,该系统的功能包含了一些传统社交阅读系统的功能,例如:用户可以注册、登录、点赞、评论、在线阅读等。在线阅读的过程中可以满足人们的一些社交需求,比如关注和被关注、给自己喜欢的书籍进行点赞和评论等,通过这样的社交互动人们可以与他人交流分享自己的读书体会,以获得更愉快且更有质量的阅读体验。其次,系统增加了计算机自动注解功能,用户可以直接查看计算机提供的注解,从而避免自己查阅相关信息的麻烦,也可以克服传统阅读系统缺少注解和评论的不足。

系统的实现主要分为3 个模块:首先,对图书馆数字阅读系统中的电子读物内容进行分词并提取书中的关键词;其次,根据提取到的关键词去抓取百度百科上的相关页面,生成电子读物上面关键词的相关注解,并在图书馆数字阅读系统前端将关键词与注解的对应结果可视化;最后,对电子读物中所有的关键词之间是否具有联系做出判断,并对关键词之间的联系情况可视化,将其用力导向图的形式展示出来。

2.2 自动注解技术在图书馆数字阅读系统中的实现效果展示

本文基于开源框架Drupal 来设计和实现一个图书馆数字阅读系统(以下简称LibReader)的原型。根据图1 可知,基于Drupal 构建的图书馆数字阅读系统核心模块主要包含自动注解模块、用户模块、书库模块、评论模块和关注模块。

2.3 自动注解模块的设计

自动注解模块主要为用户提供分页分段的书籍文本内容以及相应的所抓取的百科关键词的注释信息(具体注释内容包括关键词摘要summary,关键词图片picture 以及关键词百度百科链接LearnMore)。同时,设置相应算法实现分页书籍文本内容的关键词查找与高亮,只显示第一个出现的关键词。自动注解模块具体功能如图2 所示。

2.4 自动注解模块的实现

系统运行后,自动注解模块效果分为3 个区块。左边区块显示分页后的电子读物内容,右边区块显示电子读物页面中的关键词对应的自动注解信息,包括从百度百科爬取回来的相关的图片、摘要文本和链接信息等。下方区块左右箭头分别表示往前翻页和往后翻页。当点击右边区块的相关注解上面的加粗关键词时,左边区块会对应高亮并加粗第一个出现的对应关键词。当点击右边区块的“LearnMore”链接时跳转到对应关键词的百度百科原始页面(用户可以查看关键词对应的更多相关内容)。显然,用户不需要自己采用传统的信息检索手段到百度等搜索引擎检索关键词相关的信息,本系统的自动注解功能可以利用计算机的爬虫自动模拟人工搜索过程,实现相关信息的自动注解。这样,读者就可以很方便地在图书馆数字阅读系统中直接读取到关键词对应的相关信息和注解,无须再花费时间进行人工搜索和信息筛选。

2.5 用户模块的设计

根据系统对权限管理的要求,进行用户管理和角色权限管理。用户管理主要用来对用户资料的创建、认证和删除。角色权限管理结合不同用户分配不同角色,使之具有不同的访问权限,从而保证平台的正常运行。不同管理对应数据库中不同的用户表、角色表、权限表、用户角色映射表。

对于一个图书馆的数字阅读系统,读者需要先注册和登录系统,在系统中关联个人信息。这样系统才能向读者发送一些个性化信息和推荐读物。

2.6 书库模块的设计

作为一个图书馆的数字阅读系统,书库书籍信息不可缺少。书籍信息主要包含书籍名称、作者、字數、图片、文件等。用户可以查看书籍信息,查看最新更新书籍信息,收藏书籍,查看收藏书籍等。

2.7 评论模块的设计

评论模块主要分为两部分,一部分是针对书籍发表的评论,一部分是针对已发表评论进行的再评论。为了满足社交阅读平台推荐化需求包含了最新评论。同时可以喜欢评论并显示所喜欢的评论,显示我收藏的书、所发表的最新评论动态。

2.8 关注模块的设计

关注模块包括关注用户,查看我的关注与我的粉丝。其中我的关注指我关注的用户,具体显示为包含头像和昵称的列表;我的粉丝指关注我的用户,具体显示为包含头像和昵称的列表。

3 LibReader 图书馆数字阅读系统优点

综上所述,本文基于Drupal 开源框架设计并实现了LibReader 图书馆数字阅读系统,以读者的实际需求为出发点,分析了不同用户对进行电子阅读的需求以及对社会化阅读的需求,设计和实现了图书馆数字阅读系统的总体框架以及具体的功能。首先,该系统包含了传统社交阅读系统的功能,使得读者在电子阅读的过程中可以通过一些社交互动与他人交流分享自己的读书体会,从而获得更愉快且更有质量的阅读体验。此外,该系统还基于第二章调研的计算机自动注解技术,设计了数字阅读系统的自动注解模块并实现了相关的功能,读者可以通过查看计算机提供的注解来理解正在阅读的电子读物,既避免了自己查阅相关信息的麻烦,又克服了传统阅读系统缺少注解和评论的不足。

3.1 提升读者阅读幸福感

电子书在线阅读已成为人们主要的阅读方式。在英文阅读领域,已经有较为成熟的自动注解系统,为所阅读文本中的一些关键词汇自动提供注解。而反观中文在线阅读领域,在自动注解方面却鲜有成果。若将自动注解子系统运用于图书馆在线阅读资源,点击选择一本书进入阅读页面,该页面会展示书本内容和自动注解,包括词名、解释和图片等,点击LearnMore 可跳转到相应词语的百度百科页面进一步查看解释,将极大地便利读者进行在线阅读,提升用户阅读愉悦度和幸福感。

3.2 打造深度社会化阅读平台

若将自动化注解系统运用于图书馆数字化阅读,打造出类似LibReader 的图书馆社会化数字阅读系统,对图书馆来说将是一次脱胎换骨的技术革命。如果每个图书馆拥有一个统一的阅读社区平台,无论用户从哪个资源入口进入,都转到同一个界面获取资源、参与评论分享、发布用户生成信息,这样用户就会由分散走向集中,形成规模,无形中增加了用户黏度。平台的自动注解和社交性能够延伸读者的阅读领域,同时达到深度社会化阅读成效。

4 自动注解技术在图书馆的运用愿景

自动注解技术为图书馆提升图书馆社会化阅读提供了技术支持,图书馆可利用门户网站、微信、微博及“掌上*图”App 构建社会化阅读平台,实现社会化阅读线上和线下的跨域融合。除了本文中提到的自动注解功能的优势以外,这里进一步提出将来进行优化和提高的研究方向。

4.1 实现个性化注解功能

个性化注解可以通过采集用户的网站浏览历史、个人阅读数据、历史注解来分析用户的阅读偏好,根据用户的个人偏好模型优化自动注解结果。通过个性化注解功能可以实现用户基于个人阅读偏好的自动注解功能,使用已知的个人阅读偏好对本系统的自动注解结果根据用户的个人需求进行进一步的优化排序,生成一个最适合该用户的个性化的注解结果。

4.2 实现线下App 语音搜索注解功能

该功能可直接搜索用户语音输入的内容,节省用户的时间,也可以解决只知其音不知其字而无法搜索的问题。当用户在线下阅读纸质书籍时,遇到不懂的内容,可以打开图书馆数字阅读系统对应开发的App,用语音进行提问,App 可以解析用户语音的提问内容并搜索图书馆数字阅读系统计算机生成的自动注解,从而在App 前端将搜索返回的注解内容可视化给用户进行查看。

4.3 实现浏览器插件搜索注解功能

该功能可直接为用户浏览器提供个性化搜索插件,即用户在浏览器阅读在线文档时,遇到不懂的内容,可选出需要注解的内容进行在线注解,并存入该插件中,下次浏览时同时展示其历史注解内容,且历史注解内容将作为分析个人阅读偏好的基础数据来分析个人偏好。当插件处于激活状态时,无论用户是否使用插件进行搜索,该插件会在浏览器展示开始将网页内文档自动增强,进行个性化搜索和个性化排序功能,以便用户在使用该插件进行右键搜索时,能够直接展示搜索内容,减少用户等待插件搜索的响应时间,实现搜索的便捷性、实用性与快捷性。

猜你喜欢
图书馆
去图书馆坐坐
图书馆
图书馆里送流年
图书馆
夜间的图书馆
图书馆里的小惊喜
图书馆 Library
时间重叠的图书馆
图书馆
飞跃图书馆