孙雨生 汪怡敏 李万蓉
(1.湖北工业大学经济与管理学院 武汉 430068)
(2.湖北工业大学湖北农村社会管理创新研究中心 武汉 430068)
(3.南昌大学管理学院 南昌 330031)
(4.首都师范大学管理学院 北京 100048)
伴随移动互联网发展、社会化媒体环境形成,作为新型网络服务载体的数字图书馆资源爆炸式增长且海量复杂异构特点日趋明显,但限于认知能力,用户获取有效信息的认知负荷加剧、效率降低并致使数字图书馆信息资源难充分利用。为解决该问题,数字图书馆利用信息可视化技术,从用户角度出发高效组织、分析和形象直观揭示信息及其关系,挖掘潜在信息,激发用户能动性、灵活性高效检索信息并辅助其更好接受、理解信息,从而满足用户个性化信息需求并提升其使用体验;通过人机交互界面可视化显示信息检索结果、过程与馆藏资源,形象化并智能化数字图书馆信息资源,提升信息检索精度并降低其成本,提高信息资源处理效率及利用程度。因此,有必要系统研究数字图书馆信息可视化核心问题。
本文全面检索、清洗知网、万方及维普数据库中相关文献,共得109 篇有效文献;详读全部文献并从中精选39 篇作为参考文献,最后,遵循信息可视化参考模型,从可视化表征、可视化机制、信息资源组织三方面阐述国内数字图书馆信息可视化核心内容研究进展。
主要从信息浏览、信息检索及信息资源组织三方面研究数字图书馆信息可视化表征内容、形式及实现技术、方法与工具,详见表1。
表1 数字图书馆信息可视化表征
数字图书馆信息可视化表征内容主要有信息浏览可视化(可视化操作,促进人机交互)、信息检索可视化(可视化检索过程、结果,以便引导用户检索并支持其决策)、信息资源组织可视化(可视化馆藏、网络资源内容与分布以便用户理解)。
2.2.1 信息浏览可视化
黄田青[1]、冯双玲[2]、孙倩[3]、孙雨生[4]认为信息浏览主要表征为颗粒图[1~2,4](文档在三维空间内按字顺以颗粒排列,通过空间位置表示文档间关系(颗粒间作用力使相近度高者靠近、低者远离),常用于多维可视化)[1]、主题地图[1~2,4](表达主题词间关联度,单击可放大查看源文档)[1]、鱼眼图[1~2,4](基于逐点详述原理,支持概览完整信息概念时交互细览所选数据,通过鼠标悬浮方式(视角不变)按需放大画面局部区域细节视图(周围变为可见背景))[1]、拓扑图[3~4](匹配连接不同国家规范文档,显示相应匹配方式及标识号,帮助用户整体感知规范文档并有效选择数据)[3]、热力图[3~4](动态演示某类文献历史演变进程)[3]、时间轴[3~4](互操作性时间标尺,提供整体概览同时细分各类文献并结合图文,使用户直观了解所需文献馆藏布局与历史发展进程,简化文献资源检索过程)[3]等。
2.2.2 信息检索可视化
1)检索结果可视化表征形式
黄田青[1]、孙倩[3]、刘莹[5]认为检索结果主要表征为文档透镜(将多页一维文档数据映像成三维物体,可直接查阅某页)[1]、场景图(树形结构图,根节点表示场景,节点表示场景各成分并由相应对象实现,对象几何属性聚合成三维用户界面“物理”模型)[1,5]、互动式地图(交互显示地域资源,清晰显示世界范围内文献资源分布以便跨区域、国家共建共享资源)[3]等。
2)检索过程可视化表征形式
黄田青[1]、冯双玲[2]认为检索过程主要表征为刷图(选中点阵图中某区域一子集,可同时选中刷图事件、属性相同的数据)[1]、表透镜(浏览大数据表并径向分离出需细览子表)[1]、主题词云图(在网状结构概念空间内合理布局由线连接的主题词,多用二维树状结构图示(复杂度随节点数增加而增大)表示用户检索主题词(用节点表示,其大小、颜色分别表示含主题词的书目信息量、用户访问历史)与系统返回结果,其字体大小、节点间物理距离表示检索主题词与各主题词相关度(字体越大、距离越近则相关度越大),随用户所点击主题词变化动态调整主题词间空间关系并变换颜色显示主题词属性,用图示引导用户检索行为(点击放大检索结果图示可从中抽取所需结果))[1]、透视墙(将二维转为三维墙,用投影将对象贴图到墙上,在透视区观察细节、水平旋转浏览信息以扩大可视范围并提供流畅视觉过渡,实现时空维浏览)[1]等。
2.2.3 信息资源组织可视化
崔晓菡[6]认为信息资源组织主要表征为平面视图(传统可视化表现形式主要有柱形图、扇形图[6]、折线图[6~8]、直方图、圆饼图[7~8]等,随社会需求、网络技术发展出现更直观的雷达图、气泡图、散点图[6]、映像图、模型图[6~8]等)、标签云(以大小、颜色深浅不同的标签排列显示关键词出现频率)[9]、时间轴和互动式地图(两者贯穿网站各维度资源显示)[3]等。
2.3.1 信息浏览可视化
1)技术
杜慧敏[10~11]、张洪敏[12]、马音宁[13]、王亚凤[14]、赵文宇[15]、孙雨生[16]认为信息浏览可视化技术主要有GIS[10~14,16](获取、存储、分析、管理、检索、可视化显示[12]地理空间信息[10~14]及其他信息[10~11,13~14]以实现空间实体定义、空间关系查询[10~11,13~14]的计算机管理系统,借助空间分析能力以图形、图像为主呈现于屏幕[4,10~11,13~14])、VR[15~16](借助计算机、三维传感技术模拟生成视觉、听觉、触觉动态交互三维虚拟世界[15],可基于远程沉浸技术[7,17]、VRML 语言[5]实现)等。
2)工具
孙雨生[16]、陈伟[18]、秦健[19]认为三维信息浏览可视化工具主要有Autodesk 公司开发的3D Max 建模(可构建三维室内外模型;设置场景动画、运动路径,计算动画长度,创建摄像机并调节动画;设计建筑材质,赋予模型表面贴图、材质,真实模拟自然界;支持CAD、SketchUp 等文件导入及3D 模型、2D平面图和AVI 格式动画等文件导出)、美国ESRI 公司开发的ArcScene 技术(ArcG1S 软件桌面系统3D分析扩展模块中核心应用,可将二维数据转换为三维GIS 数据并高效分析编辑管理、创建三维图层)[16,18]、D3.js(应用广泛的信息可视化JavaScript库,用D3(数据驱动文档)绑定数据与文档对象模型并由数据决定文档对象可视化模型,用CSS、HTML 及可缩放矢量图形可视化显示)[16,19]等。此外,ActiveX 控件通过专用标准接口用属性、方法、事件三种机制与所处环境(容器)交互[16,20]。
2.3.2 信息检索可视化
1)技术
黄田青[1]、孙雨生[16]、王曼茹[21]、李巧蓉[22]、杜鹃[23]、闫实[24]、颜培亮[25]认为检索结果可视化常用显示技术主要有聚焦+上下文[16,21~22,24~25](在有限可视空间内[22,24]放大聚焦节点同时缩小周边对象,离聚焦节点越远对象越小以突出重点、揭示信息上下文关系[21])、广角与聚焦技术(可视化切换总体概要信息显示与个别具体信息显示)[16,21]、径向填充[16,22,24](以圆环(将圆环划分成数个扇形区域,圆环外层局部区域和内层子节点间存在对应关系)及渐进色(颜色沿直线变换且可随意更改直线方向)分别表示层次结构信息[22,24]及连续型信息,能显示整体信息、焦点、上下文信息和局部放大信息[22,24])、树图[1,6,16,25](现代可视化表现形式,多含算法,在同一视图显示数据层次里所有单节点信息,图形大小表示树形图在整个层次中相对大小,其他属性由颜色等表示[1])、双曲线树[25](双曲线浏览[1],通过两条空间曲线显示节点,按节点到焦点距离缩小图示,以便在有限视觉范围内显示尽量多节点,可用鼠标转移焦点观察结构图示)[1]、锥形树(半透明锥形三维空间图,根节点位于锥形树顶端或空间(凸轮树)最左端,子节点均匀分布在根节点下方或右侧锥形延展部分,鼠标点击某节点可使其高亮显示并旋转锥形树使其位于图形前端)[1~2,25]、关联更新技术(两个或多个窗口数据间相互关联,其数据随相关窗口信息设置更新而改变)、空间显示技术(基于对象间相似度将对象绘制成欧氏空间内点或区域以构成散列图,揭示对象内部及相互间关系)、滤镜技术(在窗口上重叠各种效果“滤镜”,辅助实现信息交互式选择、移动过滤与分析转换)[16,21]、Web 三维显示(使用户高效检索图书实际空间地址)[23]等。
孙雨生[16]、石明芳[17]、王曼茹[21]、李巧蓉[22]、闫实[24]、颜培亮[25]、徐刚[26]、陈俊凤[27]认为检索过程可视化技术主要是降维映射技术,包含自组织特征映射[24~25](通过人工神经网络(模拟人脑处理信号特点)抽象归类录入数据或信号特征[24~25],用简单几何关系揭示拓扑结构并将非线性高维数据映射到低维空间[24])、潜在语义标引(通过统计方法寻找词内语义结构,分解奇异值,投影文档向量到较低维度空间以有效转化数据)等[16,25]、多维尺度分析[16~17,21~22,24,26~27](用非线性变换将高维数据转为低维数据并以疏密不同的散点在低维空间近似表示其关系(点间距离表示数据间相似性)[22,24])、寻径网络[16~17,21~22,24,26~27](根据经验性数据评估概念或实体间联系相似(异)性,用图论相关概念及原理得出相应网状模型[22,24])等。
2)方法
孙雨生[4,16]、闫实[24]、徐刚[26]、张继东[28]、周静怡[29]认为检索结果可视化聚类方法主要有基于分类簇图法[28](按分类标准(关联关键词、形成日期、类型等)将相似检索结果归为同簇形成虚拟节点[28],根据语义内容[26]添加标签[28],再按网状、层次结构排列簇(集)以揭示簇间逻辑关系[26])、分类文档簇法(找出共词文档并聚类包含共词最多文档于同簇,根据文档语义内容命名簇标题以便检索,同时以簇为节点用层、网状结构排列以揭示文档簇(集)间逻辑关系,缺点是准确度难保证)[16,24,26,29]、关键词词频排序树法(抽取分析用户检索所得文献关键词并得到其降序排序列表(纵向不同颜色表示关键词在该页中出现次数,横向排列小矩形根据关键词个数用纵向不同颜色区域分别表示每页各关键词词频分布信息),将文献按关键词分类,通过关键词出现频率揭示大量文献知识整体结构以便用户高效获取相关学科知识)[16,28]、Texttiling 算法[4,26](根据页、章、段将文献分为主题块[7,21,26],按用户所输关键词自动检索并用长方条(长度代表文献长度并分成多个对应文本单元块的小矩形,其颜色深浅、长度分别揭示关键词出现频率、段落长度[7,21,24,29])表示检索结果且依次按检索词组命中总页数、检索词被命中总数、基于共现频率的相似检索横向排序[26,29],用户点击对应位置[21,29]选择性浏览文献[7,21,24,29],通过检索词位置、共现情况发现隐藏信息)等。
孙雨生[16]、王曼茹[21]、朱成[30]认为检索过程可视化方法主要有动态查询与过滤技术(通过控制实时反馈、调整过滤参数、修订检索提问来过滤信息资源中不必要信息、聚焦用户兴趣)[16,21]、三维图像处理技术(简单二维图像直接显示成三维图像,复杂二维图像平滑处理(基于滤波、插值等算法[16])尖锐凸凹部分以达到理想三维图像显示效果,图像三维坐标中x、y 表示图像列、行坐标,z=f(x,y)是关于(x,y)点的函数,f 可取(x,y)像素点处灰度值、像素颜色分量、色调、饱和度等)[30]等。
2.3.3 信息资源组织可视化
1)技术
赵文宇[15]、孙雨生[16]、莫耀评[31]认为信息资源组织数据可视化技术主要有基于几何投影数据可视化技术(包括平行坐标法,用N 条平行且等间距坐标轴(对应不同维度空间)映射N 维空间为二维空间,表示为折线[15,31],具体实现工具为报表(显示动态变化数据、趋势性参数值并实现报告和表格一体化)[31],缺点是依赖屏幕宽度,存在大量数据可视化结果重叠问题[15])、面向像素数据可视化技术(颜色、窗口内像素排列、属性顺序分别反映数据某一维度信息、数据聚类及相关性、属性间依赖及相关性)[15,31]、基于图标数据可视化技术(图标属性如大小、颜色、形状等表示对应数据项维,具体实现方法主要有Chemoff-faces、Shape Coding、Stick Figures、Color Icons 等)[15,31]、基于层次数据可视化技术[15,31](分层处理数据量不大且维度不多数据集[15],理顺数据结构[31],形成树图、圆锥树[15,31]等可视化形式)等。此外,XSLT 技术可转换空间数据形成图书属性[23]。
2)方法
张琪[7]、周宁[8]、闫实[24]、陈俊凤[27]、张继东[28]、田蔚然[32]认为文本可视化方法主要有2D 法[24,27,32](节点代表文献,节点位置、颜色、大小分别揭示文献关系、类别、属性,支持动态查询、过滤、缩放[24,27,32],典型代表为可视化HTML 文件的Starfield 技术,其用节点颜色、大小分别表示文件HTTP 状态、长短[24,27])、图标映射法(构建图标集,在相关标准和图标集间构建固定映射函数,用不同图标表示不同文本以向用户展现文本信息内容,缺点是图标反映含义有限且粗糙)[28]、图符法[7~8](图符表示各分类领域具体含义[7],图符信息存储采用逻辑压缩等方法[8])、高维空间描述法(描述文献主题内容)[7~8]、群集映射法(统计文献关键词出现频率并用高频关键词构建高维信息空间,如通过转换群集映射到三维空间构建三维知识群集图)、自组织地图算法(即自组织特征映射)、上下文关联法、新闻星系法[24]等。
崔晓菡[6]认为可视化技术、方法与工具有真实可靠性和直观性(将繁杂数据(统计)转化为直观图形),可多维处理数据,用不同属性管理数据,实现数字图书馆的信息浏览、检索和资源组织可视化。
信息浏览可视化主要运用可视化工具,通过ActiveX[20]、GraphLayout[28]等组件基于后台绘制器按表征形式所做视图(文档透镜、颗粒图[1~3]等)构建人机交互可视化界面并实现缩放与旋转、导航、人机交互。此外,张棋[7]、石明芳[17]提到人机交互界面应具有直观性、吸引性、便捷性、智能性且人性化。
颜培亮[25]认为信息检索可视化通过图形或图像(如刷图、双曲线浏览[1~2]等)显示空间数据以明确数据间联系与规律、透明化信息检索过程,提供良好人机交互环境以便用户高效获取、分析、理解数据,增强用户认知能力,提高查全率和查准率。信息检索可视化涉及检索结果(聚类、显示)、过程(映射[25])可视化[16~17,21~22,24~28,33]。
3.2.1 检索结果可视化
检索结果可视化主要采用聚类分析和可视化显示技术[22,24],前者通过检索词与后台索引项链接到相关信息并对其聚类以得到初步检索结果(文献及其隐含关系),且可按检索结果与检索需求间关系优化检索式(基于可视化技术和检索词语义使用户准确表达检索需求[7]);后者根据检索过程中的聚类特点及数据集维度选择适当方式可视化显示结果集。
3.2.2 检索过程可视化
孙雨生[4]、石明芳[17]、王曼茹[21]、李巧蓉[22]、闫实[24]、徐刚[26]、陈俊凤[27]、程翔[34]认为在检索过程可视化中,首先用Shneiderman 的信息可视化分类法分析、拓展[17,22]信息空间检索路径[17,21~22,24,26~27]并根据检索过程精确测量用户行为[34],其次基于多维尺度分析、寻径网络[4,21,24,27]和自组织特征映射[4,24~25]技术通过隐性马尔可夫模型序列行为分析信息检索行为[4,26]来将理想检索路径插入隐性马尔可夫模型程序,最后在相应语义空间动态比较以形成最优路径[26,34]。
检索过程可视化引入数据映射机制,主要是映射技术,集成相应数据处理算法组织处理大数据集[33,35]并将高维数据映射到低维空间以便计算机处理[25];钱力[33]、马雨佳[35]认为数据映射机制设计过程为先根据可视化模型集成相应数据处理算法到系统中,再用可视化引擎驱动录入并根据规则算法自动处理以将原始数据转换成可视化数据格式,最后传输并显示于可视化组件。
信息资源组织可视化主要通过特征抽取资源内容特征并按数据信息选择特定技术(基于几何投影、面向像素、基于图标、基于层次等)进行处理,形成平面视图、标签云等表征形式。张棋[7]、周宁[8]、李玉萍[9]、闫实[24]、陈俊凤[27]、田蔚然[32]认为馆藏信息(空间、属性信息[27])按其表现形式分为文本、图像[9,24]、语音和视频[7~9,27,32]信息。
3.3.1 文本资源可视化
文本资源可视化分提炼文字信息(分析原始文字、忽略资源格式、剔除无用信息以提炼关键词、分析词频、总结特征)、转为图像(图像要忠于文字资源含义且符合用户审美)、人机交互(图像直观便捷、吸引用户目光,提供舒适视觉观感)三步[9]。
3.3.2 图像资源可视化
图像资源可视化分整理图像内容(涉及简单(色彩、形状等)、较复杂(所示对象等)、更高级(描述信息与所示对象关系等)内容)[9]、用数据库法[7]分类存储图像(标注图像间关系)、选择显示模式(使图像内容直观、易理解,如根据图像间联系关联图像)三步[9]。
3.3.3 语音资源可视化
语音资源可视化可用文本方式可视化[24],分音频文字性转换(采样汉语语音资源、播放语音信息、分离语音音素、基于语音音素库识别语音并转为汉字字符串、存储汉字文本信息生成汉字文本文件[7~8,32])、文字资源可视化转换(抽取、可视化内容特征(需相应图符库、词库、平台支持)[7~8,32])两步[9]。
3.3.4 视频资源可视化
视频资源可视化(有可视化特性[27,32])分抽取数字视频信息特征构建特征库[8~9](可通过MPEG-7与相关知识库[27]抽取特征内容(文本、音频与视频(分镜头、场景(关键帧、预测帧))特征[7~8],包括颜色、形状、纹理、运动、位置、栅格分布、时间系列、多视点、空间坐标等[7~8])实现)、数字化视频信息、存储到视频库[27]三步。
韩全惜[36]认为数字图书馆信息构建(结构化设计信息空间,以组织和运用有意义、清晰、直观的内容、结构表达数据内容并提供直观访问途经)应按用户需求(使用信息特点)组织信息、设计界面以提升用户体验,构建利于用户组织、导航、标引、检索的信息可视化系统以便与信息工作者互动、高效采集信息。数字图书馆资源组织涉及空间、属性数据[10~14,23,37~38]的采集、处理和存储。
杜慧敏[10~11]、张洪敏[12]、马音宁[13]、王亚凤[14]、杜娟[23]、刘丽[37]、王雅坤[38]认为空间数据(图书馆结构及馆藏布局(馆舍结构、空间布局、地理背景、图书分类等))按数据结构类型分矢量、栅格数据(通过透明格网采集、扫描输入)[14],结合GIS 数据分层组织法将图书馆空间数据存入地理背景、建筑物、楼层、阅览室、书架号、书架层等[10,12,38]等图层并逐级细化显示[10~13,23,37~38]以详细标明图书空间位置[13],具体通过扫描图纸等数字化或坐标绘图法(用计算机自动画线编程和实地采集的坐标点值保证图书馆部门间及房间设备、书架等间相对位置,确保地理图形精度[10,12,38])采集;属性数据分图书空间(对应 空 间 实 体 地 理特 征信 息[10~12,14,23,37~38]与空 间 模型[10~12,14,37~38])、文献资源属性信息(书名、作者、出版社、藏书地及关键词等),通过对书目数据、数字文献资源进行标引来完成[14],数据录入需先在ArcCatelog(地理数据资源管理器)中定义对应属性结构并检查逻辑一致性,链接图形要素、属性记录,多先以手工录入为主,后自动批量转换录入(需二次开发ArcGIS模块并与MIS数据库链接)[14]。
马晓亭[39]认为信息资源空间、属性数据预处理包括补充、剔冗、滤噪、关系描述、格式标准化与模式规范化等,通过ETL等实现数据萃取、转置、加载以在可视化精度范围内控制因采集、处理、计算、分析、可视化等阶段数据不确定性、应用过程不对称性产生并累积的误差、偏差、信息缺失比例及程度,通过随机选取、等比例调整样本规模以平衡数据集规模与清洗难度,真实、全面、准确、客观反映大数据价值和关系,提高数据价值密度、经济性、可用性和可控性。
王亚凤[14]认为ArcGIS(功能强大完备、应用广泛的GIS 软件)数据库分别用数据库实体(存储如矢量、栅格数据等数据文件)、数据库管理系统(增删改查及维护数据)两子系统(通过标识码(ID)连接,实现双向检索)存储空间(存储为线或面状实体弧段文件)、属性数据(存储于关系数据库管理系统[14],图书空间、文献资源属性信息分别存入建筑物、楼层、房间、书架等属性表[10~12,14,37~38]和文献资料、读者、设备等信息表,通过关键字与书架号链接[23]并由图书馆管理系统中SQL Server[11,37]存储管理[10~12,14,37~38])。
综上,本文从可视化表征、可视化机制、信息资源组织三方面阐述了国内数字图书馆信息可视化核心内容研究进展:可视化表征主要从信息浏览、信息检索及信息资源组织三方面研究其表征内容、形式及实现技术、方法与工具;可视化机制重点研究信息浏览(集中于可视化工具运用)、信息检索(集中于检索结果、过程可视化)、信息资源组织可视化(集中于文本、图像、语音、视频资源)具体过程;信息资源组织核心研究数字图书馆空间、属性信息资源的采集、处理和存储。接下来,笔者将尝试构建大数据环境下智慧图书馆可视化总体方案。