(江南大学设计学院214122)
信息可视化是可视化技术在非空间数据领域的应用,可以使数据的呈现效果更加直观,方便用户的观察和浏览。可视化应用广泛,处理的信息类型丰富,相应地发展出了多种信息设计形式和风格。不同的可视化形式和风格适用于不同的信息类型与场合,但其目的都是相同的——“任何图表与可视化的首要和最终目的是作为协助我们的眼睛和大脑发掘现象背后隐藏信息的一种工具”。
信息可视化设计通过对数据进行编码、构建,对信息进行展示、比较、组织、关联,从而使读者根据信息建立心理模型,利用可视化工具对信息进一步挖掘。因此,信息可视化设计是否准确地传递了信息、合理利用了人眼和大脑的工作规律是十分重要的。由于可视化信息种类多且内容复杂,同时人接收信息过程具有一定主观性,传达效率与质量难以量化评价。针对这一问题,在此引入一个判断依据——信息密度,希望从一个侧面对信息可视化的效果进行衡量和评价。
信息密度这一概念在大众传媒的研究中早已出现,其定义为:在大众传媒这个信息群体的信息测量,即在大众传媒特定的单位传播时空中(有限的版面、页码或节目时间里)的信息容量、信息流量。将此概念引申到信息可视化设计研究中,信息密度是指在可视化单位面积(纸张的版面、显示器的屏面)内有效信息量以及可挖掘信息量,既信息密度=信息量/面积。
需要注意的是,有一个概念易与信息密度产生混淆,既Edward R.Tufte提出的数据-油墨比公式:数据-油墨比=数据编码所用的油墨量/绘制图表所用的油墨量总和。这个公式提出的目的是定义一种简洁的可视化风格,不能直接说明信息密度。相同的信息量,在不同的可视化风格下可能会有不同的设计产出,并非所有视觉元素都用于信息表达。例如,Nigel Holmes在为《时代》(Time)所设计的一张图表中,使用了女性身体曲线等丰富的视觉元素来传达钻石价格走势,是典型的低数据-油墨比图表。相对于这张图表,经过简化的折线图有着高数据-油墨比。显然,这两张图的数据-油墨比差别很大,但是第一张装饰丰富的图表与同等大小的简化图表所包含的信息量是一致的,因此信息密度相同。
确定合适的信息密度十分重要。信息密度的定位会影响到视觉设计的产出效果,关系到读者在阅读中的视觉认知过程,继而影响信息接收的效率和质量,既信息传达效果。根据人眼的生理特性——中心凹结构,人眼能够清楚分辨事物的中心凹视野范围只有2°,在进行多次扫视和凝视后才能形成视觉信息集合,因此视觉对于一定单位面积内容的获取时间相对稳定。同时根据认知原理,在大脑将图像转变成视觉工作记忆的过程中,用于信息暂存和加工的工作记忆容量与时长都十分有限,因此一定时间内能够获取的信息量存在上限。综合人眼和大脑的工作特点,在一定时间内视觉感知面积和工作记忆容量都有限。因此,单位面积内的信息量,既信息密度会直接影响到读者阅读时的认知过程,进而影响到信息传达质量。
在信息可视化设计中,信息密度太小,设计内容单薄肤浅,可挖掘空间小,浪费版面资源,并会留下轻视读者能力的傲慢印象;信息密度过大,大量数据和复杂图形超出读者的信息处理能力,势必需要更多时间针对这一面积进行信息的接收,读者会感觉到疲劳继而逃避刺激源,这种抵触心理将使信息难以顺利传达。
根据信息密度的概念公式——信息密度=信息量/面积,确定信息密度首先要确定指定面积内的信息量。在目前的可视化设计中,根据内容,信息分为以下六类:统计数据、空间类信息、时间类信息、事物自身属性信息、事物之间的关系信息和思想类信息。由于信息种类繁多,对于信息量的衡量不必也不能统一地进行精确测度,需要结合具体情况评估。在此针对信息特性探讨一个通用的评估思路。
数据是信息的表现形式和载体,数据的量化决定了信息量。数据主要有两种类型的存在:数值(value)和关系(relationship),两者共同决定了数据的体量与复杂度。
数值的量化取决于数值的数量和属性。数值的数量既数值个数的总和,显然,数值数量越大,数据量便越大。数值的属性情况则由这个数值的维度或变量决定,根据变量数,可以将数据分为单变量数据、双变量数据、三变量数据和超变量数据。数值的维数越大,信息越复杂,信息量越大。在可视化设计中,数值并不是指某个具体数字,而代表着一个信息单位。例如,在条形统计图中,一个条形数据就是一个数值,这个数值的属性则由它的坐标、色彩和说明文字共同组成;在流程图解中,一个分步图是一个数值,这个数值的属性由图形和说明文字组成,图形和文字的复杂度决定了数值的复杂度。
关系则表示了数值之间的逻辑或自然联系,表达了事物之间的相关性。组成信息图的数值之间势必存在着一定的关系需要表达。常见的信息关系有空间关系、时态关系、层次关系和网络关系。空间关系中的数值在信息关系主要体现在空间上的方位和距离,常见的空间关系图有地图,地图中的数值数量越多,空间关系越复杂,信息量越大。时态关系中的数值表示某个时间点的状态的数据,联系在一起可以表示事物随时间的发展变化过程,如卫星云图,按照时间前后可以表达一段时间内云图的变化和气象情况。时间点越多,每个时间点对应的数值越多,数值关系越复杂,信息量越大。层次关系则表现了信息之间的等级或层级关系,具有确定的层级结构,常见的层次数据图有节点连接图和树图。层次越多,子节点越多,信息量越大。网络关系的数据具有网状结构,数值之间的关系更加综合,层级关系更加复杂,信息量根据具体的结构复杂度确定。在一个可视化视图中,可能会同时出现多种信息关系,需要逐步理清,综合应用。
可视化视图的信息量一方面来自于视图所展示的信息数据,另一方面来自于视图背后需要再次进行挖掘的信息,这些信息由信息接收者自行解读和挖掘。虽然视图本身的质量会影响挖掘质量,但影响作用更大的是读者本身的知识背景、对挖掘进行的投入等无法掌控的因素。因此,最终挖掘到的信息量因人而异、因时而异、因地而异,需灵活对待。
在确定了信息量的范围之后,结合信息可视化视图的展示面积,便可衡量出指定区域内信息密度的大小。
信息可视化设计发展到今天,针对不同分支领域都有了大量研究成果和应用实例,但对于信息可视化评价的研究仍然较少,尚需对相关理论基础、方法和应用进行深入研究。结合认知科学和信息特性,本文提出以信息密度为依据的评估思路和量化方法,对信息可视化的设计传达质量进行评价。在不同学科领域的应用中,信息密度的评估方法可以再深入细化,使评估方法更加适应学科特性。同时,在可视化的设计过程中,明确合理的信息密度也有助于设计人员可视化流程进行把控调整,最终达到信息传达的目的。