岳琳 王战林 刘江宁
(1.东北师范大学信息科学与技术学院,长春 130117;2.新疆师范大学图书馆,乌鲁木齐 830001)
电子图书指以数字代码方式将图、文、声、像等信息存储在磁、光、电介质上,通过计算机或其他终端设备供用户使用,并指可复制发行的图书、期刊、报纸及软件读物等,包括印刷型书刊的数字化和数字化出版的书刊。智能手机、电子书阅读器和平板电脑等是配备电子阅读器软件的手持电子设备,可阅读各种电子图书和其他数字化的文献。其中,一些文档格式是独立的,而另一些则会把用户阅读喜好存储于正式记录的系统中(如学习管理系统)。为满足用户日益增长的电子阅读需求,出版商和科技公司提供越来越多的电子图书和电子阅读设备。出版商对数字格式内容的接受程度和受欢迎程度的提高,以及学术界电子内容使用量的大幅增加,对教育生产力产生重要影响。
电子阅读平台包括电子阅读器和平板电脑,已经被大学生广泛使用[1]。尽管数字书籍和高等教育的数字化教学被认为是有利的,但由于大多数高等教育受教育者要为所学内容付费,因此,寻找相应的互动平台用于知识获取、学习和传播,更有助于提高信息利用率。
学者们对移动学习环境下电子阅读平台的功效展开了相关研究。Braun[2]发现Kindle电子阅读器有助于鼓励协作,用户可以利用该设备突出特定段落,并让其他用户看到评论。
电子书具有可移植性、存储性、交互性及快速发布和更新等特征[3]。William[4]研究表明,电子教科书对学术成果的取得有积极影响。Tonkery[5]提出当下学生更倾向于通过电子设备,如利用电脑或平板电脑等搜索参考资料,而不是到图书馆进行研究。一些电子文档和书籍以可移植的文档格式呈现,另一些则被称为图书应用程序,其功能较多,可增强用户体验,特色包括嵌入视频、自我检查测验、互动填字游戏,以及推荐其他与兴趣相关的资源[6]。这些特色中,视觉吸引力能达到传统印刷书籍所不可能达到的效果。
电子教科书和教学辅助工具正迅速发展,而不仅局限于现有印刷产品的数字版本。电子教科书整合视频、图表、动画的特征并具有交互功能。教师意识到这可以为学生提供一种完全不同的阅读体验,而这些体验与建构性学习技术更紧密地结合在一起。电子阅读平台的建构与支持性的学习环境和活动有关,这些活动可以为学生提供接触数字化学习资源的机会[7]。Lamb[8]认为采用电子阅读平台进行阅读对学生是一种完全不同的体验,有别于传统教科书的阅读。阅读电子文本不是简单地理解文字,如在学生阅读课文时帮助其构思新情节,这些新情节可能会有不同的结果而不仅是一种线性结果。电子格式的文本阅读需要学习新的操作方法,如数字笔记、高亮显示、搜索、虚拟书签和词汇表、屏幕分辨率设置、页面重置、文字大小设置及文本朗读等。由于许多电子文本中嵌入了多媒体功能,教师的目标更多地将课件整合到多模态的学习模式中以供学生使用。印刷文本主要侧重视觉化,而电子文本具有更多的学习方式(包括听觉和动觉),从而加强学生的参与度和强化回忆。
目前,对电子阅读平台的研究有很多,侧重于两个主要驱动因素:电子书的使用如何帮助提高教学效率;通过提高阅读理解能力,提高学生的积极性和参与度。多数学者侧重于研究电子内容对基本学术成就的影响[9-12]。Horne[13]发现,阅读理解与电子阅读平台的使用存在正相关关系。尤其当图书可在移动设备进行交互式阅读时,包括文本、插图、叙述,可增加学生的积极性及参与度。Huang等[14]发现,在使用智能手机、电子阅读器和平板电脑时没有互动功能,对学生的阅读理解没有显著影响;同时也发现如果电子阅读平台能够跟踪学生的学习过程,为学生设计更好的干预措施,那么电子阅读平台将是有益的。在教育研究中,学习动机和学术成就存在积极关系,尽管还需要更多的研究来探讨电子阅读平台使用和过度使用的直接联系。
Stephens[15-17]介绍试点项目:将Nook分配给50名学生分别使用一个学期,以研究《神曲》和其他公共领域的主题。对学生们使用设备的调查结果表明,学生们喜欢这些设备,由于设备可以存储多个主题,因此可以减少去图书馆的次数。学生对这些设备的反馈非常积极。Mcclanahan等[12]对一名患有自闭症的学生进行案例研究,发现利用平板电脑进行阅读干预,使学生在六周的时间里获得的阅读理解效果相当于普通用户一年的进步。虽然仅通过该案例不能得出所有患有自闭症或其他疾病的学生都能受益于此结论,但可以看到具有多媒体功能的电子书,可以帮助教师提供多样的干预手段,用于特殊学习者。
电子阅读平台面临的基本挑战包括:电子阅读平台上的内容有可能使学生承担获取阅读资料的经济成本,特别是在公共领域和版权允许范围外的资料;硬件设备和平台的采购成本可能会让教育机构望而却步;当前不同类型的移动设备和内容提供商的文献格式多样且互不兼容;电子文献需要不侵犯知识产权和克服无可用性障碍等。但真正制约电子阅读平台发展的核心挑战在于以下方面。
(1)用户偏好问题。平台的兼容性、不侵犯知识产权及无可用性障碍,须依赖硬件的升级、法律法规的健全及行业统一标准的制定。从技术角度来看,平台创建者和内容提供商必须首要解决用户偏好问题,才能将恰当的电子内容推送到信息资源获取者手中,使其在学习和教学实践中发挥更大的作用。社会化搜索基于Web 2.0,强调用户的参与,是社会化网络带来的一项变革。社会化网络的出现为用户带来了更加丰富多样的信息资源(如博客、微博、论坛等),如何充分分析资源并获得用户偏好,为用户提供更加优质的服务应引起学术界和商家的高度关注。
(2)智能化搜索问题。工业4.0发展时期,智慧图书馆强调信息处理的智能化,其通过物联网、搜索技术及AI实现智慧化的服务和管理,改变传统图书馆的服务方式。随着用户对搜索引擎依赖性的增强,必将促进电子阅读平台的不断发展,由此引发相关产品的不断更新换代,搜索技术也必将成为电子阅读平台发展中最具竞争力的增长点。因此,如何利用用户“痕迹”,进行智能化分析,以更精准地服务用户,显得更加重要。
电子阅读平台在给用户提供丰富信息内容的同时,也为用户带来信息选择困扰,使用户陷入“信息过载”和“资源迷向”的困境。用户不再满足于传统电子阅读平台提供的检索结果,而是转向结构化、细粒度、精准化的信息检索需求,因此,出现了社会化搜索。社会化搜索可以使用户在特殊的语境下深入地、精确地搜索,还可以从社区中学习,使搜索结果与用户的兴趣更加匹配。
社会化搜索概念目前还没有统一的权威定义,学术界存在不同理解。一种是从群体智慧角度出发,认为社会化搜索是人的因素体现在网络用户在信息检索过程中的行为。维基百科将社会化搜索定义为用户使用提问回答。百度百科直接将其描述为通过搜索形成有共同爱好的人际圈,继而搜索每个用户的爱好和收藏情况,为用户提供更准确的信息。Sherman[18]将社会化搜索定义为“依据人类判断的互联网查询方法,这些判断以标签、点击,搜索历史及其他动作为因素”,协同搜索从该角度研究社会化搜索[19]。另一种从专家智慧角度出发,认为社会化搜索是基于社会网络的、对具备某种特性的用户进行搜索[20-21]。20世纪60年代末的六度分割实验就是基于社交网络对用户的搜索[22-23]。
从学术界的理解看,社会化搜索强调信息搜索中的用户因素,包括任何具有相关用户活动的应用,有效地整合了搜索和社区,形成新的信息交流平台。为使电子阅读平台更好地为用户服务,使用户摆脱“信息过载”的困扰,进一步对社会化搜索进行分析,认为与用户使用电子阅读平台相关的内容主要包括社区问答、社区协同搜索和人物社会关系搜索。
社区问答系统使用论坛技术创造网络社交空间,用户以问答的方式交换知识和经验。在线环境下,分享共同兴趣的用户可以进行交互,形成虚拟用户群组(即社区)。问答社区具有临时性,加入社区不必通过正式机制。在问答社区中,用户通过问答分享知识,目的是集结用户的经验和专长,使用户找到满意答案。社区问答系统作为一种新兴的知识共享模式,其具有的交互性、开放性、灵活性特点吸引大量用户参与,且存储大量已经解决的问题,能够更好地为用户提供个性化信息服务,这对于满足用户进一步的信息需求,实现用户之间的知识共享具有重要意义。
电子阅读平台中增加社区问答模块,以新的途径获取用户需求或兴趣信息,从而针对性地提供内容推荐服务。构建初始模型可利用用户兴趣模型刻画和存储用户兴趣,然后分析用户在社会化搜索系统中的行为活动信息,丰富用户兴趣模型。首先,对用户的提问、回答、收藏和评价的答案使用分词工具进行分词和词性标注,并抽取实意词(特别是领域概念),将其表示为文本向量;其次,使用层次聚类算法,以用户的提问、回答、收藏和评价的答案为语料,借助通用本体,构建用户兴趣专用本体;最后,使用用户兴趣专用本体,丰富用户兴趣模型。
社区问答系统主要包括用户行为分析、问题推荐和答案检索。社区问答子框架如图1所示。首先,以三元组资源描述方式存储数据,完整保存数据资源的语义信息,以准确分析用户行为,构建用户兴趣模型和权威度模型;其次,运用语义网技术从知识层面进行推荐;最后,利用通用本体解析查询语义的方法,在已解答数据库中寻找与之相似的问题,并依据问题相似度、回答者的权威度和用户评价等因素将排序答案返回给用户,完成答案检索,最终实现基于群体智慧的知识共享平台。
图1 社区问答
利用一般搜索引擎进行关键字匹配得到的信息中存在大量冗余和不精确信息,而反馈信息的不精确很大程度上是由于没有加入用户领域信息。为有效快速地从互联网中获得精确信息,在搜索过程中加入用户意愿成为必需。协同Web搜索是近年来在搜索引擎快速发展、用户数量高速增长、用户产生信息不断增多及用户搜索任务交流频率增大等驱动下,形成的一个新的信息检索研究方向。社区协同搜索建立在对互联网用户信息查询活动记录的基础上,首先规范查询关键字,并将规范后的查询式提交给大型搜索引擎,对返回结果进行排序,与此同时,分析用户查询活动记录,得出用户的领域信息和兴趣偏好,使排序结果能够更符合用户的查询需求,达到有效快速提取信息的目的,实现网页搜索的个性化服务。
结合社区协同搜索,首先分析社区中的用户行为,得到社区模型;然后对查询进行解析、重构和分发,从而改进查询处理;最后,依据用户兴趣及用户行为对查询结果进行处理,以得到更准确的查询结果。具体如图2所示。首先,通过社区挖掘算法,挖掘有共同兴趣的用户,再从收藏列表和点击历史数据库,获得社区内每个用户的收藏列表和点击历史,将其整合以实现用户行为建模;其次,根据每个搜索引擎调用的API(URL形式)写好模版,查询提交时,系统根据模版提供组合后的URL,调用各底层搜索引擎,进行查询分发;最后,对各成员搜索引擎的返回结果进行整合,依据社区点击矩阵、社区收藏矩阵和网页噪声因素,结合算法对结果进行重新排序。
图2 社区协同搜索
为充分分析用户兴趣需求,电子阅读平台还应从海量互联网信息中获取并分析用户社会关系。互联网正逐步渗透到人们的社会活动中,如何快速、准确、方便地从海量互联网信息中自动抽取人物社会关系是当前社会化搜索研究的重点问题之一。人物社会关系搜索力争在全面分析互联网用户的社会活动信息的基础上,揭示用户间关系的动态结构图景,从而为用户观察和认识社会的关系结构和运行状态提供新视角。人物社会关系搜索的创造、发展与完善,必将有效地帮助用户认知现实社会中人与人的关系,人与人的关系所决定的社会运行的主流动态,人在社会普遍联系结构中的位置,整个社会联系与运动的过程对个人的自身利益和命运的影响。这种致力于揭示用户之间关系的社会化搜索技术,能够对人物进行全方位的把握,使网络世界对现实社会的描绘与解读更加客观、清晰、生动与深刻。因此,人物社会关系搜索的研究对于探索现实社会中人与人的复杂关联具有重要意义。
人物社会关系搜索如图3所示。首先,采用主题爬虫和本体技术,抓取Web网络和社会网络中的人物相关信息,通过识别语义块提取人物社会信息的正文;其次,识别人物实体,判别同一性,融合人物信息片段,并利用语义网信任推理机制准确识别人物社会关系;再次,利用图层分类准确定位任意人物间的关系链路,构建关系索引,提高搜索效率;最后,采用“图层”和“时间隧道”在时间维度对人物、事件进行可视化显示,并追踪不同时期人物关系的动态演化。
图3 人物社会关系搜索
本文介绍了电子图书的基本背景,移动学习电子阅读平台及其被广为采用的原因,采用电子阅读平台面临的挑战。在此基础上,介绍解决主要挑战的困扰,进一步介绍与用户使用电子阅读平台相关的社会化搜索内容,包括社区问答、社区协同搜索和人物社会关系搜索。社会化搜索属于全球社会计算领域的科技创新和产业创新,可充分利用社会网络资源,拓展搜索范畴,提高搜索的精准度和权威性,并实现个性化信息推送,为用户提供全新的搜索体验。