崔珂成 马晓悦 薛鹏珍
摘 要:[目的/意義]通过引入隐喻地图来改善之前可视化工具在统一表征应急物资需求主题结构和演化关系方面的缺陷,减少分离式表征对用户造成的认知负担。[方法/过程]设计用于表征社交媒体中应急物资需求主题的隐喻地图,并以此为基础提供了一系列交互式功能便于对信息的探索性分析和整体认知。[结果/结论]基于隐喻地图的视觉表征可以强化对于需求主题结构和演化状态的整体表征,减轻用户认知的心智负担。本研究提出了一种基于隐喻地图的应急需求主题可视化方法,为应急资源协调调度等决策提供了参考。
关键词:主题分析;应急信息管理;应急物资需求;文本可视化;数据可视化;隐喻地图;社交媒体;用户
DOI:10.3969/j.issn.1008-0821.2021.07.003
〔中图分类号〕G252.0 〔文献标识码〕A 〔文章编号〕1008-0821(2021)07-0027-11
Visualization of Emergency Material Demand Posted on
Social Media Based on Metaphor Map
Cui Kecheng1 Ma Xiaoyue2* Xue Pengzhen1
(1.Department of Information Management,Xidian University,Xian 710071,China;
2.School of Journalism and New Media,Xian Jiaotong University,Xian 710049,China)
Abstract:[Purpose/Significance]This paper introduces metaphor maps to improve the defects of previous visualization tools in the unified representation of the topic structure and evolution relationship of emergency needs,and reduce the cognitive burden caused by separate representations on users.[Method/Process]Firstly,we designed a metaphorical map to represent the topic of emergency needs in social media.Then,we provided a series of interactive functions on this basis to facilitate exploratory analysis and holistic cognition of information.[Results/Conclusion]Visual representations based on metaphor maps can strengthen the overall representation of the structure and evolution of the demand theme,and reduce the mental burden on users cognition.This research proposed a visualization method of emergency demand theme based on metaphor map,which provided a reference for emergency resource coordination.
Key words:theme analysis;emergency information management;emergency material demand;text visualization;data visualization;metaphor map;social media;user
救灾物资管理是应急管理中的重要组成部分。在应急过程中需要针对物资管理进行一系列的决策活动,包括需求(类型和数量)估计、物资的分配[1]和运输规划[2]。对于应急响应的资源调度计划和实施来说,有必要根据事件实时信息合理调配需求物资[3]。这种资源调度计划强化了组织在应急响应时的反应能力,但是考虑到应急组织的效率,事件突发性和偶然性等问题,官方组织很难及时了解个人物资需求和民间组织的响应动态,由此造成的官方获得信息的滞后和不完整性给实时物资调度增加了很大难度。面对个人物资需求被忽视和官方—民间组织联动实时信息共享不完整、不及时的问题,社交网络主题分析相关研究为收集信息反馈并分析进而解决该类问题提供了有效手段。尽管应急情境下社交媒体中关于物资需求的信息并不多,但由于其高信息密度和高价值,所以基于社交媒体应急物资需求相关文本和行为分析可以有效协助应急人员进行态势感知,进而帮助应急组织进行预防、应对和恢复[4]。但是主题分析的结果比较分散和复杂,非专业人员难以聚焦和深挖其中重要的信息,所以结果的展示通常需要借助一定的可视化手段。
如上所述,在已有研究中對于应急物资的需求分析主要是基于危机事件本身固有信息[5],这种分析基于大量经验,通常具有较高的合理性,然而缺乏一定的灵活性。为了弥补这个缺点,有一些研究对社交媒体数据进行了内容分析,通过对实时文本信息的分析可以在一定程度上提高需求分析决策的灵活性。但随着大量语义数据的出现,文本作为信息媒介已经很难满足大数据情境下信息探索的需求,因此很多研究关注于应急情境下的社交媒体数据语义和事件演化的可视化,但现有可视化方法往往聚焦于其中一种数据特征的表征,如树图用于表征社交媒体数据主题的结构、标签云用于表征主题的内容、主题流用于表征主题演化特征。而地图作为一种有效的信息多维度集成与探索的方式,可以聚焦于从需求主题内容结构和主题演变特性等多维度特征对社交媒体数据进行协调并表征,从而改善人们对于事件演化阶段与物资需求内容的整体性认知。
针对社交媒体环境中复杂的应急物资需求,隐喻地图作为对非空间信息(语义信息)的仿地图可视化表达[6],能够结合信息的语义结构和地图的可视化优势对这类信息进行交互式、精准化表征。基于以上存在的问题及非地理特征类地图解决该问题的可行性分析,本文提出了一种危机情境下基于隐喻地图的针对社交媒体中物资需求进行可视化的方法。研究中首先对社交媒体中物资需求相关数据进行了收集分类,其次基于应急事件演化分类针对不同的需求主题内容和演化阶段进行了隐喻设计,最终构建了基于社交媒体数据的应急物资需求隐喻地图。该方法通过实验评估和调查问卷的方式对其进行了验证。具体来讲,本文的研究问题主要体现在以下两个方面:
问题1:如何应用隐喻地图减少对社交媒体中的繁杂应急物资需求的认知负担。
问题2:如何应用隐喻地图实现物资需求演化过程中各阶段特征和关系的动态可视化。
本文的研究意义在于:本研究在理论上提出了一种危机情境下基于隐喻地图的社交媒体中的应急物资需求可视化方法,丰富了应急信息可视化理论和应急交互理论。在实践上该研究探索了危机情景下基于隐喻地图的可视化系统的设计,增强了用户与危机信息的互动,对于应急物资调度、应急资源协调等决策提供了参考。
本研究的目的是将隐喻地图的概念引入社交媒体数据可视化设计中,特别是危机情境下需求相关信息的可视化可以增进应急管理人员对于危机需求结构和演化的认知。本文提出的基于隐喻地图的应急物资需求可视化方法不仅可以增强用户对主题结构、内容和演化过程的整体认知,同时也探索了以隐喻地图为基础构建可视化组件改善界面交互的可行性,为文本主题类隐喻地图的构建和可视化设计提供了参考。
1 相关研究综述
1.1 应急情境下的社交媒体主题分析
随着互联网的兴起以及社交媒体迅速发展,社交媒体技术为公众提供了在危机情境下的另外一种通信方法。在突发事件期间社交媒体用户对于该类话题的关注度逐渐提升也让官方认识到了该信息渠道的价值,常见的社交媒体也因此被用来发布灾害应对相关信息[7-8]。此外对于用户发布在社交媒体上的信息进行分析也吸引了越来越多研究者的关注[9],目前已有许多研究从不同的角度对如何应用社交媒体于应急管理中进行了探索,包括社交网络结构分析、短文本情感分析、语义感知、主题演化分析等。
社交媒体主题分析是研究信息传播和应急响应的常用技术,可用来制定相关应急战略[10]和帮助识别分析公众的行为和信息特征[11]。例如在危机响应期间通过社交网络传播的信息可能包含谣言、虚假或真实但过时的信息,应急管理人员可以使用谣言检测机制帮助他们识别虚假信息[12]。有一些研究关注于社交媒体文本主题分类和演化,如应用文档聚类和主题建模技术对大量用户生成的内容进行分类、注释和理解[13],通过构建共词网络(Co-word Network)可以用来理清事件主题的演化脉络[14]。但是在搜集相关数据的过程中,社交媒体中的信息流量很大,对于特定事件,通过预定义关键字收集的消息将包含大量噪声,利用分布式学习对于从已获得大量非信息性帖子中识别出信息性帖子可以取得很好的效果[15],而在收集数据时也可利用自动关键字生成机制使管理人员较精确地沿着事件发展跟踪事件主题[16]。通过结合内容、情感和社交网络分析,社交媒体数据也可以帮助应急响应人员计划救援工作,发现需要医疗和情感援助的人员[17-18]。社交网络文本挖掘也能发现有价值的隐性信息,用于确定需要救援的区域的优先级、受影响人群正在经历的具体问题等[19]。而在危机期间如果组织管理者缺乏对如何通过社交媒体进行沟通的相关知识[20-21]可能导致危机处理不当。
1.2 社交媒体信息语义的可视化
社交媒体作为时空信息的来源,可以提供有关事件的快速、即时的实时信息,有助于提供更好的态势感知从而更好地做出决策[22]。许多社交媒体可视化应用程序依赖于地理和时间特征,地图作为有效的时空信息表征工具也在危机管理中被广泛应用[23]。随着在紧急情况下生成的大数据流的数量和种类的增加,系统支持改进的态势感知的需求也在增加,一些系统开始利用数据的语义来增强可视化,如基于危机期间相关社交媒体数据用来从多视角感知应急情况[24],可视化分析关键词和情感随时间的演变[25],树可视化显式分析节点之间的结构[26]。虽然这类分析主题或情感演变的方法描述了演变过程,但演变过程中如何兼顾对各阶段结构特征和关系的可视化而不造成沉重的认知负担仍是研究的主要难题之一。
在信息可视化中,隐喻通过映射视觉刺激与语义之间的关系可以帮助用户有效地分析和理解信息。越来越多的研究提出了隐喻在界面设计和信息可视化中的应用。如指定语义共振的颜色来表示数据(例如,蓝色表示海洋数据,绿色表示植物)[27],在软件中使用砖墙、锁的隐喻[28]设计防火墙警告,设计交通标志[29]。与它在界面图标设计中不同的是,在信息可視化中,隐喻为逻辑推理提供信息,涉及复杂的信息处理活动,如识别特定的模式[30]、做出判断[31]等。由于人们在有限的时间内处理给定信息的能力有限[32],而隐喻可以自动激活一系列可用的相关概念来使陌生的信息易于解释[33]。隐喻依赖于源概念和目标概念之间的类比。目标概念代表一些具体的、熟悉的、有形的和简单的普通知识。相反,源域(Source Domain)表示抽象、陌生、无形或复杂的引用。
地图是视觉隐喻的一个特别丰富的来源,近年来许多研究者已经考虑使用地图来描述虚拟空间和表达抽象的非空间数据[34]。人们对于空间的直接感官体验被用来帮助理解抽象的概念[35]。有研究使用Self Organizing Map(SOM)方法对语义数据进行聚类,并试图以地图的形式表示语义之间的差异[36]并讨论了将隐喻转换为非地理可视化的制图研究[37]。这种将隐喻转换为非地理可视化的制图研究已应用于网络通信分析[38]和视频内容[39]等领域。在社交媒体领域,动态地图生成方法被用来分析实时Twitter消息中的演化主题[40]。后来,研究中也提出了包括多种地图,允许用户对社交媒体上的事件演变[41-42]、用户转发行为等[43]进行多方面分析。
1.3 评述小结
在以往的研究中,对于应急物资的需求分析主要是基于已有危机事件的信息进行预测,例如根据事件类型确定物资种类,或者根据事件规模确定物资数量。然而由于应急事件的非常规性、组织间沟通不同步和协作效率等问题,官方基于经验预测统计的需求相比灾民的真正需求存在较大的误差和延时,虽然社交媒体中关于物资需求的博文并不多,但此类信息具备较高的价值和可信度,可以通过适当地分析作为实时信息反馈渠道以便于应急资源调度的调整。此外,这类数据大多繁杂混乱,对于分析结果的展现经常要借助可视化工具。但很少有研究同时关注到对各阶段需求分布结构和各阶段演化关系的可视化表征,上述问题具体体现在:①对于社交媒体中需求相关的统计分析并无对需求主题演化关系和需求内容同时进行可视化分析,信息的不完整导致相关应急人员缺乏对实际需求情况的整体性认知;②对于社交媒体中需求主题和演变过程缺乏可视化表征。以文字为主的表征方式导致应急人员缺乏对整个过程的直觉性认知,现有可视化方式也没有考虑如何兼顾具体演化关系和需求分布的整体表征。
针对以上问题,一方面,本研究以社交媒体平台中主题演化阶段的划分为基础,结合需求文本内容分析对于一般应急事件发生过程中的物资需求演化过程进行了分析,从而为应急物资管理中的决策提供参考;另一方面,研究中应用隐喻地图同时对需求内容和演变过程进行了可视化表征和相关交互设计,减轻了认知负担,增强了对应急中实际需求的理解。本研究旨在重新设计可用于隐喻地图可视化的应急需求主题阶段划分方法,并扩展基于隐喻地图的信息交互。研究中提出的基于社交媒体与隐喻地图的应急需求可视化方法,有助于提升用户对危机需求的动态变化过程的认知和辅助用户进行基于需求整体性认知的应急决策。
2 隐喻地图设计方法
社交媒体中的应急需求主题传播具有突发性、易扩散和衍生性。本节主要介绍了应急情境下的应急需求主题隐喻地图设计程序。在构建隐喻地图之前,本研究首先以建立隐喻地图可视化为结果导向对应急需求主题的演化特点进行了分析,在主题演化特点分析的基础上对隐喻地图的设计需求进行了分析,最后阐述了隐喻地图设计的基本思路。
2.1 应急需求主题演化的特点
本研究的社交媒体平台选择了新浪微博,在该平台上用户可以自主发布内容、话题,并对内容进行转发和评论。本研究对特定时间段内应急事件相关需求的微博进行了收集分析,并对数据特性以及相关主题特性进行了分析。
应急情境下微博中主题演化过程具有以下特点:
多阶段:突发事件具有明显的时序变化特性:酝酿、扩散、爆发、高潮、消退。话题随着事件的发展不断演化,反映出事件不同阶段之间渐变的过程。在每个阶段,都有需求主题和关键用户。在爆发阶段,治理主体的介入或干预,或者民众产生“情绪懈怠”,主题热度逐渐降低;另一方面由于需求的解决或其他热点话题的涌现也会让需求主题逐渐进入失焦阶段。但在这一阶段由于信息的不对称,情况的复杂性及注意力的“反弹”,需求演化过程可能出现变异。研究中改进了适用于隐喻动态表征的阶段演化的划分。异常演化的出现意味着需求主题的演化进入另一个子阶段。
关键用户(Key User)影响力较大:关键用户是指粉丝数众多,相关微博被大量转发和评论的用户。社交媒体中有较大影响力的用户可以较容易推动需求主题变化和演变。
易扩散:主题极易跨地域传播,且演化过程极大不可控。
热度和内容随时间变化:该变化的过程分为两种:①正常演化:该主题演变经历了一般出现、爆发、消亡3个阶段,无异常情形的出现;②异常演化:在突发事件总主题下出现了新的需求主题,不同需求主题的合并,单个需求主题分裂为两个或多个主题或是原来趋于消亡的需求主题热度重新上升。
微博中应急需求相关数据表现出来的特性与应急主题演化过程的特点密切相关,呈现出以下特征:
数据繁杂:针对不同的危机事件其对应的物资需求也不相同,针对一个特定的危机事件由于物品的语义表达方式和不同微博用户的表达习惯,较难对数据进行分类合并继而发现其背后的特征。
在危机事件不同阶段表现出不同的语义聚集倾向:对应于微博中主题演化过程和事件阶段分类,对数据按时间节点划分以后进行语义聚类可以得到其对应的语义特征。在事件的不同阶段,语义特征具有较大的差别。在同一阶段,需求表现出较为相近的语义特征。
2.2 隐喻地图设计要求
该隐喻地图的目的是允许交互式探索的同时,还可以分析社交媒体数据中应急物资需求主题结构、关键用户、需求主题语义的演变。研究中总结了以下关于可视化应急需求主题的演变的要求:
1)较易识别每个阶段中最重要的需求主题。如果一个需求话题有更多与之相关的微博,就被认为该物资更被迫切地需要。
2)在主题阶段划分的基础上,较易识别哪些主题正在涌现(Emerging)、结束(Ending)、继续(Continuing)或独立(Standalone)。主题流定义为主题与其相关主题之间跨越阶段的路径。这里涉及到4个术语:
涌现:上一个阶段中没有讨论的主题(即上一个阶段中没有与之类似的需求主题)。
结束:一个话题关键词不会出现在下一阶段(即在下一阶段中没有与之类似的主题)。
继续:该阶段前后均出现过的主题。
独立:与上一阶段或下一阶段中的任何主题无关的主题。
3)浏览所选阶段的详细信息。这些信息包括最频繁出现的主题词、与所选主题相关的所有微博。
4)浏览所选关键词的详细信息,通过界面交互方式等浏览与特定关键词相关的原微博。
5)用特定的词来确定该词在整个危机事件中的演化过程。用户可能对1个或多个单词在整个数据集中的显示方式感兴趣。通过识别与这些单词相关的主题,用户可以理解单词在整个数据集中是如何变化的。
2.3 主题建模和分析
本文基于事件演化的时序规律,从应急需求内容和需求关键词热度两个关键词出发,基于DTM(Dynamic Topic Model)模型对应急事件需求主题演化过程进行了分析,对于单个应急事件下的多个演化方向的应急需求按时间顺序合并为一条演化方向。
DTM(Dynamic Topic Model)动态主题模型以事件关键词会随演化过程不断变化为前提,且假设关键词变化状态依赖于前一个时间片下的关键词,可用于分析一段时间内文档主题的演变。本次实验在该模型中添加了时间标签。通过选取大小相同的时间片可以对比前后两个时间片下主题关键词的演化。应急事件下的需求主题时间跨度较小,主题内容较易识别,因此可以被應用于很好地识别应急需求主题各演化阶段。
本研究首先对获取到的数据进行清洗,之后采用增量式聚类算法Single-Pass进行主题检测,对于每次输入的数据都分别与已有类簇进行一一对比。若两者文本相似度较高,则将该微博归入已有类簇中,若该微博与已有类簇相似度均小于某一阈值,则将该微博表示到新的类簇中。在应急需求主题检测过程中,数据输入顺序的变化对检测结果产生的影响极大。Single-Pass算法根据相似度阈值来划分类簇,而动态应急情境下无法得知需求主题数目或主题数目不是固定值,比较适用于此次应急需求主题的检测。
在获取主要的主题类簇之后,通过抽取词频较高的词语对主题进行了更细粒度的描述。其中词语的关注程度的变化可以通过相隔时间段内的概率正差值进行计算,结果较低的词语被认定是应急事件演化过程中较为稳定的需求,结果较高的词语被认为是表示新需求产生或者已经被满足的需求内容。
所有围绕该可视化系统所做的工作如图1所示,通过工作流的方式展示了如何从获取的原始数据到完成基于交互探索的隐喻地图。
2.4 隐喻地图构建
系统构建分为系统构建程序和系统界面展示。前一部分阐述了如何根据获取的数据一步步构建出最后的隐喻地图,为了取得更好的可视化结果本研
究中做了哪些优化;第二部分展示了最终的可视化结果和部分交互过程。
2.4.1 系统构建程序
研究中提出的隐喻地图综合表征了社交媒体数据中危机需求相关主题结构、关键用户、主题语义。这些概念被映射到了地图上的不同隐喻。
大陆或岛屿:一整块大陆代表了同类型的需求主题,不同类型的需求主题之间有海洋相隔,陆地的面积越大代表社交媒体上有更多的用户发布关于该类型的需求。岛屿代表用户发布的需求类型较稀少,且主题语义与其他主题相差较大,难与其他类型需求进行合并。
国家(地区):地图上的大陆由多个国家(地区)组成,国家(地区)代表了同类型下每种具体物质的需求,国家(地区)占据大陆面积越大则该需求占该类型需求的比例越大,国家(地区)之间的边界用较粗的边线表示。
城镇:地图上的每一个多边形代表一个城镇。在需求主题结构中代表需求关键词相同或相似的微博用户节点,影响力较大的县以黑色边突出显示。
公路:公路代表了关键用户发布的需求微博,因为公路在地图上可以将城镇连接起来,可以使用单向公路用来代表关键用户对其他用户的影响,例如普通用户对关键用户的微博进行转发和评论等行为。公路里程越长意味着与原微博在转发或评论过程中语义差距越大。
在确定了基本的表征图像和符号以后,基于隐喻转化规则,在图2中本文展示了如何将数据集的分类结构转化为基础地图结构,而为了获得更具体合理的地图结构,本研究继续进行了地图总体布局、节点合并、布局压缩、布局调整。
在基本布局中,本研究应用了力导向布局算法。该算法应用分子力学模型,把每个顶点当作一个分子,有边的顶点之间有引力,没有边的顶点直接是斥力,力的定义符合分子间作用力的物理公式。通过不断迭代计算各个顶点的位置,最终可以得到每个顶点的能量平衡位置。考虑到该算法在本研究中的具体应用和其复杂度,本研究首先进行了多等级的语义聚类,然后先对聚类可视化,再对聚类里面的顶点可视化。
由于布局空间有限和巨大数量的节点造成了认知复杂度大大提高,本研究针对性地进行了节点合并和布局调整等工作。
1)距离超过阈值则合并节点
计算每个主题下两个点之间的距离。在对距离值进行排序之后,合并具有最小距离值的两个节点。紧接着重新计算点之间的两两距离。通过反复合并节点最终每个主题下得到了期望粒度的合并节点。
2)重新计算力使布局合理紧凑
在迭代计算与节点合并之后,为了消除节点之间的空白,本研究在分子力学模型的基础上添加引力使各个节点往中心靠近。除了消除主题内的可视化空白以外,为了提高数据墨水比(Data-ink Ratio),整个隐喻地图被再次压缩布局为矩形。
3)忽略转发量较小的节点链接
为了避免信息在展示上的混乱和突出关键用户的影响力,隐喻地图上对应用公路以表征关键节点设置了转发量阈值,只使用公路表征了其中最重要的部分。研究统计了每个主题下的信息的转发字段是否为空。当该字段不为空且超过一定阈值,则在地图上该主题对应的国家添加公路。在每个主题下可能存在多个关键节点,则代表该主题下的关键用户较多。如果一个国家内的公路较多,则代表该类型需求相关的话题发布倾向主要是由关键用户主导。
2.4.2 地图展示
为了方便直观演示研究结果,本研究以2013年发生的甘肃地震为事件源对新浪微博中相关物资需求数据进行了收集过滤(最终约2 300条博文)并生成了样例隐喻地图,如图3所示。该地图展示了各个应急物资主题的相对需求程度,每个主题(陆地)下又分为不同的物资需求类型(国家(地区)),每个主题下不同国家(地区)的面积也代表了与该类型相关的微博的数量。代表该类型需求的关键词直接叠加在对应区域上以减少用户在不同可视化元素之间进行认知切换而造成的心智负担。地图左上角展示了需求可视化现在所处的阶段,而陆地的不同颜色代表该主题所处的演变阶段。为了表征需求主题在不同阶段语义上的分布,研究在隐喻地图中对于每块陆地使用不同的颜色来表示不同需求主题在该阶段所处的演化状态:新兴、继续、结束、独立。在界面设计中研究提出了这样的配色方案:绿色、黄色、橙色、红色分别表示主题处于新兴阶段、继续阶段、结束阶段、独立阶段。通过地图左侧的选择框,用户可以选择在该阶段下想要展示的不同演变阶段的主题。用户点击陆地的不同国家(地区)的区域可以弹出模态框显示与该类型需求相关的原始微博。用户点击右上角按钮可以关闭该模态框,左下角和右下角的按鈕分别对应跳转至上一条微博或下一条微博。
1)微博列表展示
微博列表提供了所有被隐喻地图可视化的微博的列表。表头信息包括用户名、微博内容、发布事件、点赞数量、被转发数量。用户点击下方按钮可以翻页。此外,用户可以输入关键词检索与之相关的微博。
2)时间线展示
隐喻地图使用日历热力图表征了危机事件整个过程中社交媒体中需求相关主题不断演化的过程。日历热力图是一种双变量图,由时间变量和主题相关微博数量组成,其具体形式则是由小色块群有序地以日历格式组成的图表,每个小色块代表时间变量,而小色块颜色则代表相关微博数量,每个小色块都根据相关微博数量值进行颜色编码。时间轴上时间点的选择取决于社交媒体平台上关于该危机事件主题的真实时间尺度和其主题演化过程中出现的异常(例如传染病导致的危机事件常常持续时间较长,则应该选择较大的粒度)。如图4为2013年甘肃地震从爆发到结束期间物资需求相关主题的演化主题热力图。
在演化过程中地图需要确认不同语义主题与不同地图元素的映射对应,在一个阶段中生成的主题并不直接对应于另一个阶段的主题,特别是对于主题的聚合和分裂。使用余弦相似性度量主题对齐程度,该度量通常用于文本和数据挖掘领域中的文档比较或簇的内聚性。相似性超过一定阈值的主题对需要进行主题的聚合和分歧。
3 评 估
为了验证该隐喻地图对应急需求主题分析可视化的可用性,本章节通过实验对隐喻地图进行了初步的可用性研究。常见的系统有效性评测通常基于对照实验,由于国内外现并不存在通用的社交媒体中的应急需求主题可视化方式,本研究的有效性评测将基于若干评测任务,通过完成任务的时间、正确率以及受试人员的主观感受等指标来评估该可视化交互系统的有效性。
3.1 系统有效性评测
为了评估该隐喻地图,本研究首先进行了一项用户研究以调查用户对该可视化结果的理解程度。这项研究是在2020年1月1日—2月25日收集的2 347条微博数据集上进行的(搜索关键词为“雪灾”),进而对获取到的数据进行了过滤、分类并生成了对应的可视化表征。
1)实验人员
实验招募了8名参与者,年龄在23~43岁之间,所有人都有正常的色觉,均有软件操作及界面交互经验,但为了保证其在实验开始前先验知识不具有太大的差异,本研究首先进行了一项用户研究以调查用户对该可视化结果的理解程度,具体信息如表1所示。
2)实验任务
针对于不同的认知角度,按照信息结构、信息内容、对比认知等设置了不同的问题,具体的试验任务列表如表2所示。前3个问题旨在研究这种表征形式对信息结构可视化的影响,参与者需要对比不同的分类数据来回答问题;问题4~6的目的是探索隐喻地图的表征形式对于用户对信息内容造成的影响;问题7~8则调查了用户对于该表征形式和内容的整体感知情况。其中,针对用户主观满意度模块,采用5点量表打分的形式(1表示不同意,5表示同意)。
3)实验结果
实验结果表明针对实验中的评测任务,受试人员对其中大部分问题可以达到较高的正确率。有关隐喻地图对于信息结构表征影响的相关问题上,受试人员均正确回答了问题(问题1~3正确率均为100%)并花费了相对较少的时间。在研究隐喻地图对于信息内容表征影响的相关问题上,受试人员也保持了较高的正确率,但对于问题5的回答准确率较低(62.5%),这可能由于问题本身表述不准确及可视化结果对于需求“迫切”程度表征较为模糊造成。有关隐喻地图对于信息多维整体表征影响的相关问题上,Q7回答正确率87.5%,Q8回答正确率62.5%。这可能由于对比认知本身的难度较高及系统对于地图对比并没有直接简洁的界面造成的。
在耗时方面,参与者在针对单个隐喻地图获取答案时速度最快(12~35秒)。在涉及到两两对比认知的任务时受试者需要更长的时间(33~62秒)。任务8涉及到对所有阶段隐喻地图的分析,参与者在这项任务上花费了最长的时间(平均112秒)。结合用户对系统的主观满意度打分(Q9:4.012,Q10:4.017,Q11:4.136)和任务正确率可以看出,实验人员对系统较为满意。此外,较高的正确率表明系统有效性良好。
3.2 系统可用性评测
本研究邀请4位具有用户体验知识背景的评估人员对系统可用性进行测评,如表3所示SUS是一个10项问卷,采用5点量表打分的形式(1表示不同意,5表示同意)。
SUS测试量表最终分数为74,如图5通过查询对比系统可用性形容词等级,本文中的系统可以解释为可用性良好。这表明本文可视化交互方式的可用性表现良好,但仍有诸如信息排布密集、用户对比认知困难、时间线可视化仍要用户自己针对各个主题对于每阶段的隐喻地图板块进行视觉搜索对应,增加了用户的心智负担等问题。
4 结 论
本研究提出了一种基于隐喻地图的可视化方法。基于应急需求類型划分和需求主题演化的协同研究,需求关键字、需求相关话题规模、转发评论
行为被转化为隐喻地图中对应的地图特征,并进一步针对该隐喻地图进行了界面布局和交互的探索,增强其在信息表征、信息认知等方面的有效性。这篇论文的贡献主要体现在:①在理论上,针对传统应急可视化方法无法对社交媒体数据同时进行主题结构及演化过程的分析,探索一种基于隐喻地图的应急需求可视化方法,这是一种有效组织和表征应急需求主题结构和演化过程的方法;②在实践中,本文总结以往话题流、隐喻地图等可视化界面设计的经验,提出了应用于应急需求主题和演化分析的可视化系统,不仅在社交媒体中需求主题规模和类型的区分表征取得了较好的效果,而且对于演化关系如主题的聚合、分歧等的表征也进行了探索。
参考文献
[1]魏宇琪,杨敏,梁樑.基于需求预测和模块化的应急物资库库联动方法研究[J].中国管理科学,2019,27(6):123-135.
[2]Gralla E,Goentzel J.Humanitarian Transportation Planning:Evaluation of Practice-based Heuristics and Recommendations for Improvement[J].European Journal of Operational Research,2018,269(2):436-450.
[3]Safaei A S,Farsad S,Paydar M M.Emergency Logistics Planning Under Supply Risk and Demand Uncertainty[J].Operational Research,2018:1-24.
[4]Kirac E,Milburn A B.A General Framework for Assessing the Value of Social Data for Disaster Response Logistics Planning[J].European Journal of Operational Research,2018,269(2):486-500.
[5]张玲,赖芸.基于多米诺效应需求分析的应急资源配置模型研究[J].运筹与管理,2019,28(11):98-105.
[6]艾廷华.大数据驱动下的地图学发展[J].测绘地理信息,2016,41(2):1-7.
[7]Kim J,Bae J,Hastak M.Emergency Information Diffusion on Online Social Media During Storm Cindy in U.S.[J].International Journal of Information Management,2018,40:153-165.
[8]唐曉波,李诗轩,谭明亮,等.国内外政务社交媒体研究评述及展望[J].现代情报,2020,40(1):159-169.
[9]冯小东,李卓雅,史志慧.基于网络舆情热度的自然灾害影响评估分析[J].情报探索,2020,(1):16-22.
[10]Xu X,Yang X,Chen X,et al.Large Group Two-stage Risk Emergency Decision-making Method Based on Big Data Analysis of Social Media[J].Journal of Intelligent & Fuzzy Systems,2019,36(3):2645-2659.
[11]宗乾进,杨淑芳,谌莹,等.突发性灾难中受灾地区社交媒体用户行为研究——基于对“天津8.12爆炸”相关微博日志的内容分析和纵向分析[J].信息资源管理学报,2017,7(1):13-19,105.
[12]王晰巍.专题研究:社交媒体环境下网络谣言治理研究[J].情报资料工作,2020,41(2):38.
[13]刘振.社交媒体的语义标注应用现状研究[J].图书与情报,2013,(5):95-99.
[14]王艳东,付小康,李萌萌.一种基于共词网络的社交媒体数据主题挖掘方法[J].武汉大学学报:信息科学版,2018,43(12):2287-2294.
[15]Ghafarian S H,Yazdi H S.Identifying Crisis-related Informative Tweets Using Learning on Distributions[J].Information Processing & Management,2020,57(2):102-145.
[16]Zheng X,Sun A.Collecting Event-related Tweets from Twitter Stream[J].Journal of the Association for Information Science and Technology,2019,70(2):176-186.
[17]Rungsun K,Uthai T,Prabhas C.Extraction of Actionable Information from Crowdsourced Disaster Data[J].Journal of Emergency Management,2016,14(6):377-390.
[18]杨腾飞,解吉波,闫东川,等.基于深度学习的社交媒体情感信息抽取及其在灾情分析中的应用研究[J].地理与地理信息科学,2020,36(2):62-68.
[19]Deng Q,Liu Y,Zhang H,et al.A New Crowdsourcing Model to Assess Disaster Using Microblog Data in Typhoon Haiyan[J].Natural Hazards,2016,84(2):1241-1256.
[20]Ki E J,Nekmat E.Situational Crisis Communication and Interactivity:Usage and Effectiveness of Facebook for Crisis Management By Fortune 500 Companies[J].Computers in Human Behavior,2014,35:140-147.
[21]Yan J,Liu B F,Austin L L.Examining the Role of Social Media in Effective Crisis Management:The Effects of Crisis Origin,Information form,and Source on Publics Crisis Responses[J].Communication Research,2014,41(1):74-94.
[22]Guan X,Chen C.Using Social Media Data to Understand and Assess Disasters[J].Natural Hazards,2014,74(2):837-850.
[23]杜萍,劉涛,李鼎凯,等.应急场景快速制图及地图信息传输[J].测绘学报,2019,48(6):747-755.
[24]Onorati T,Díaz P,Carrion B.From Social Networks to Emergency Operation Centers:A Semantic Visualization Approach[J].Future Generation Computer Systems,2019,95:829-840.
[25]赵晓航.基于情感分析与主题分析的“后微博”时代突发事件政府信息公开研究——以新浪微博“天津爆炸”话题为例[J].图书情报工作,2016,60(20):104-111.
[26]Li G,Tian M,Xu Q,et al.GoTree:A Grammar of Tree Visualizations[C]//Proceedings of the 2020 CHI Conference on Human Factors in Computing Systems,2020:1-13.
[27]Lin S,Fortuna J,Kulkarni C,et al.Selecting Semantically-resonant Colors for Data Visualization[C]//Computer Graphics Forum.Oxford,UK:Blackwell Publishing Ltd,2013,32(3-4):401-410.
[28]Raja F,Hawkey K,Hsu S,et al.A Brick Wall,a Locked Door,and a Bandit:A Physical Security Metaphor for Firewall Warnings[C]//Proceedings of the Seventh Symposium on Usable Privacy and Security,2011:1-20.
[29]Caldas I,Moreira J,Rebelo J,et al.Exploring Visualization Metaphors in Macroscopic Traffic Simulation[C]//2018 IEEE International Smart Cities Conference(ISC2).IEEE,2018:1-6.
[30]Pramanick M,Mitra P.A Metaphor Detection Approach Using Cosine Similarity[C]//International Conference on Pattern Recognition and Machine Intelligence.Springer,Cham,2017:358-364.
[31]Alex K,Francis N,Matthew K,et al.Hypothetical Outcome Plots Help Untrained Observers Judge Trends in Ambiguous Data[J].IEEE Transactions on Visualization and Computer Graphics,2018,25(1):892-902.
[32]Caroline Z,Robert K.The Shaping of Information By Visual Metaphors[J].IEEE Transactions on Visualization and Computer Graphics,2008,14(6):1269-1276.
[33]张冬瑜,崔紫娟,李映夏,等.基于Transformer和BERT的名词隐喻识别[J].数据分析与知识发现,2020,4(4):100-108.
[34]信睿,艾廷华,何亚坤.Gosper地图的非空间层次数据隐喻表达与分析[J].测绘学报,2017,46(12):2006-2015.
[35]Skupin A.From Metaphor to Method:Cartographic Perspectives on Information Visualization[C]//IEEE Symposium on Information Visualization 2000.INFOVIS 2000.Proceedings.IEEE,2000:91-97.
[36]Skupin A.A Cartographic Approach to Visualizing Conference Abstracts[J].IEEE Computer Graphics and Applications,2002,22(1):50-58.
[37]Skupin A,Fabrikant S I.Spatialization Methods:A Cartographic Research Agenda for Non-geographic Information Visualization[J].Cartography and Geographic Information Science,2003,30(2):99-119.
[38]Fowler J J,Johnson T,Simonetto P,et al.Imap:Visualizing Network Activity Over Internet Maps[C]//Proceedings of the Eleventh Workshop on Visualization for Cyber Security,2014:80-87.
[39]Ma C X,Liu Y J,Zhao G,et al.Visualizing and Analyzing Video Content with Interactive Scalable Maps[J].IEEE Transactions on Multimedia,2016,18(11):2171-2183.
[40]Gansner E R,Hu Y,North S.Visualizing Streaming Text Data with Dynamic Graphs and Maps[C]//International Symposium on Graph Drawing.Springer,Berlin,Heidelberg,2012:439-450.
[41]Chen S,Chen S,Lin L,et al.E-map:A Visual Analytics Approach for Exploring Significant Event Evolutions in Social Media[C]//2017 IEEE Conference on Visual Analytics Science and Technology(VAST).IEEE,2017:36-47.
[42]Chen S,Chen S,Wang Z,et al.D-Map+ Interactive Visual Analysis and Exploration of Ego-centric and Event-centric Information Diffusion Patterns in Social Media[J].ACM Transactions on Intelligent Systems and Technology(TIST),2018,10(1):1-26.
[43]Chen S,Li S,Chen S,et al.R-Map:A Map Metaphor for Visualizing Information Reposting Process in Social Media[J].IEEE Transactions on Visualization and Computer Graphics,2019,26(1):1204-1214.
[44]Bangor A,Kortum P T,Miller J T.An Empirical Evaluation of the System Usability Scale[J].Intl.Journal of Human-Computer Interaction,2008,24(6):574-594.
(責任编辑:孙国雷)